Skip to content
View EKOURAOGO's full-sized avatar

Block or report EKOURAOGO

Block user

Prevent this user from interacting with your repositories and sending you notifications. Learn more about blocking users.

You must be logged in to block users.

Maximum 250 characters. Please don’t include any personal information such as legal names or email addresses. Markdown is supported. This note will only be visible to you.
Report abuse

Contact GitHub support about this user’s behavior. Learn more about reporting abuse.

Report abuse
EKOURAOGO/README.md

Emmanuel KOURAOGO

Data Analyst · Data Scientist


Profil

Data Analyst spécialisé dans l'exploitation de données massives et la modélisation prédictive appliquée à la finance et aux politiques publiques. Expérience sur des bases administratives de plusieurs dizaines de millions d'observations (CNAF, DREES). Co-auteur de 2 publications scientifiques.


Projets GitHub

Projet Description Stack
Analyse-immobilier Prime verte IDF - scraping IAD France, OLS HC3, NLP, 1 839 annonces Python Selenium Statsmodels
Bank-marketing-data-mining Prédiction souscription bancaire - EDA, Logit, RF, XGBoost, KMeans R XGBoost tidymodels
Home-credit-scoring Benchmark 7 modèles ML, CatBoost AUC 0.769 Python CatBoost LightGBM
Scoring-credit-hmeq Scoring crédit HMEQ - imputation PMM, XGBoost, validation croisée SAS R Python
Analyse-et-prediction-SPX-SP50 Prédiction S&P 500 - LSTM, Random Forest, Régression Python TensorFlow LSTM
structural-equation-modeling SEM - PLS-PM, LISREL, lavaan, RFPC, CLV sur données ECSI R lavaan plspm
Regression-pls-nipals PLS électorale - MCO, PCR, PLS1, PLS2 sur Présidentielle 2022 R pls FactoMineR
Quiz-app-streamlit App quiz OOP - Singleton, scoring proportionnel, session state Python Streamlit OOP
Scala-data-analysis Simulation tondeuses - OOP, immutabilité, pattern matching Scala sbt
unsupervised-learning-clustering-pca TPs ML - ACP, clustering KMeans & hiérarchique, KNN Python scikit--learn
EDA-ML-Process Guide EDA structuré en 10 étapes pour projets ML Python Pandas
interactive-stats-quiz-streamlit QCM Statistiques & Probabilités interactif Python Streamlit

Stack technique

Langages

Python R SQL SAS Scala Stata

Machine Learning & Statistiques

scikit-learn XGBoost LightGBM CatBoost TensorFlow statsmodels tidymodels

Méthodes statistiques

Scoring Séries temporelles PLS SEM Clustering NLP Économétrie

Big Data & Data Engineering

Spark Databricks Kafka MongoDB Redis Airflow Denodo

BI & Visualisation

Power BI Tableau Streamlit Plotly ggplot2

Outils & Environnements

Git Linux Jupyter VS Code CASD


Certifications

Coursera  ·  Mai 2025
Google  ·  Avr. 2025
Score A : 91/100  ·  Score C : 82/100  ·  Oct. 2025

Publications scientifiques

  • Hirtzlin I., Capo F., Héraut A., Kouraogo E. et al. (2026). Digital Platforms in the Field of Rare Diseases. Revue Française des Affaires Sociales, pp. 209–228.
  • Hirtzlin I., Gallois F., Kouraogo E. et al. (2024). Maladies orphelines et rares : Technologies, Information et Coordination. Centre d'Économie de la Sorbonne, CNRS-UMR 8174.

Popular repositories Loading

  1. interactive-stats-quiz-streamlit interactive-stats-quiz-streamlit Public

    Application QCM interactive sur les statistiques et probabilités - Streamlit, session_state, filtrage par thème

    Python 1

  2. Analyse-immobilier Analyse-immobilier Public

    Analyse de la Prime Verte immobilière en Île-de-France : scraping IAD France, NLP, modélisation OLS HC3 sur 1839 annonces

    Python 1

  3. Regression-pls-nipals Regression-pls-nipals Public

    Régression PLS-NIPALS en R - élection présidentielle 2022, réduction de dimensionnalité, validation croisée

    R 1

  4. Scala-data-analysis Scala-data-analysis Public

    Analyse de données avec Scala et Apache Spark - traitement de données massives, agrégations, pipeline Big Data

    Scala 1

  5. ESG_QCWorkspace ESG_QCWorkspace Public

    Forked from jsboigeESG/ESG_QCWorkspace

    Shared workspace for ESGF_School Quant Connect organization

    Python

  6. EDA-ML-Process EDA-ML-Process Public

    Guide structuré pour l'Exploration des Données (EDA) dans un projet de Machine Learning, avec des étapes détaillées et des exemples de code Python.