Salut, je suis Karl Sondeji 👋🏾
Data Engineer Passionné par l'automatisation et le traitement des données, ce site est mon premier portfolio et blog.
🗃️ Voir mes projets 💬 Me contacter📜 Mes compétences
Pipelines de données, de la modélisation à la mise en production, en lien avec les métiers.
Langages
Python, SQL, R, VBA
Pipelines & orchestration
Airflow, dbt, scripts automatisés, ETL/ELT sur Microsoft Fabric
Cloud & stockage
Azure, AWS, conception de flux fiables et observables
Visualisation
Power BI, Tableau, Quarto, dashboards
Qualité & production
Tests, documentation, RGPD, CI/CD pour la data
🗃️ Projets récents
Quelques projets sur lesquels j'ai travaillé — sécurité des données, orchestration de pipelines et machine learning.
Sécurisation d’une API vulnérable
Réduction de la surface d’attaque et bonnes pratiques sur une API exposée (durcissement, contrôles, sensibilisation aux risques).
PHP, SQL, Docker Compose, HTTPS
Code source
Pipeline ETL & Power BI (Microsoft Fabric)
Rapports Power BI alimentés et mis à jour quotidiennement ; alertes en cas de problèmes d’actualisation.
Microsoft Fabric, architecture médallion, modèle sémantique, Power BI
Code sourcePrédiction de souscription (machine learning)
Meilleure ciblage des clients susceptibles de souscrire à un dépôt à terme — précision d’environ 89 %.
R, Quarto, Tidymodels, randomForest, xgboost
Code sourceApplication Churn Teleco - Prédiction du Churn client
Meilleure ciblage des clients susceptibles de se désabonner — précision d’environ 89 %.
Python, streamlit, FastAPI, machine learning, prediction modeling, xgboost
Code source