Data Analyst spécialisé dans l'exploitation de données massives et la modélisation prédictive appliquée à la finance et aux politiques publiques. Expérience sur des bases administratives de plusieurs dizaines de millions d'observations (CNAF, DREES). Co-auteur de 2 publications scientifiques.
| Projet | Description | Stack |
|---|---|---|
| Analyse-immobilier | Prime verte IDF - scraping IAD France, OLS HC3, NLP, 1 839 annonces | |
| Bank-marketing-data-mining | Prédiction souscription bancaire - EDA, Logit, RF, XGBoost, KMeans | |
| Home-credit-scoring | Benchmark 7 modèles ML, CatBoost AUC 0.769 | |
| Scoring-credit-hmeq | Scoring crédit HMEQ - imputation PMM, XGBoost, validation croisée | |
| Analyse-et-prediction-SPX-SP50 | Prédiction S&P 500 - LSTM, Random Forest, Régression | |
| structural-equation-modeling | SEM - PLS-PM, LISREL, lavaan, RFPC, CLV sur données ECSI | |
| Regression-pls-nipals | PLS électorale - MCO, PCR, PLS1, PLS2 sur Présidentielle 2022 | |
| Quiz-app-streamlit | App quiz OOP - Singleton, scoring proportionnel, session state | |
| Scala-data-analysis | Simulation tondeuses - OOP, immutabilité, pattern matching | |
| unsupervised-learning-clustering-pca | TPs ML - ACP, clustering KMeans & hiérarchique, KNN | |
| EDA-ML-Process | Guide EDA structuré en 10 étapes pour projets ML | |
| interactive-stats-quiz-streamlit | QCM Statistiques & Probabilités interactif |
Langages
Machine Learning & Statistiques
Méthodes statistiques
Big Data & Data Engineering
BI & Visualisation
Outils & Environnements
| Coursera · Mai 2025 | |
| Google · Avr. 2025 | |
| Score A : 91/100 · Score C : 82/100 · Oct. 2025 |
- Hirtzlin I., Capo F., Héraut A., Kouraogo E. et al. (2026). Digital Platforms in the Field of Rare Diseases. Revue Française des Affaires Sociales, pp. 209–228.
- Hirtzlin I., Gallois F., Kouraogo E. et al. (2024). Maladies orphelines et rares : Technologies, Information et Coordination. Centre d'Économie de la Sorbonne, CNRS-UMR 8174.