Salut, je suis Karl Sondeji 👋🏾

Data Engineer Passionné par l'automatisation et le traitement des données, ce site est mon premier portfolio et blog.

🗃️ Voir mes projets 💬 Me contacter

📜 Mes compétences

Pipelines de données, de la modélisation à la mise en production, en lien avec les métiers.

Langages

Python, SQL, R, VBA

Pipelines & orchestration

Airflow, dbt, scripts automatisés, ETL/ELT sur Microsoft Fabric

Cloud & stockage

Azure, AWS, conception de flux fiables et observables

Visualisation

Power BI, Tableau, Quarto, dashboards

Qualité & production

Tests, documentation, RGPD, CI/CD pour la data

Découvrir mon parcours et mes expériences

🗃️ Projets récents

Quelques projets sur lesquels j'ai travaillé — sécurité des données, orchestration de pipelines et machine learning.

Aperçu — sécurisation d’API bancaire

Sécurisation d’une API vulnérable

Réduction de la surface d’attaque et bonnes pratiques sur une API exposée (durcissement, contrôles, sensibilisation aux risques).

PHP, SQL, Docker Compose, HTTPS

Code source
Aperçu — pipeline ETL Microsoft Fabric et Power BI

Pipeline ETL & Power BI (Microsoft Fabric)

Rapports Power BI alimentés et mis à jour quotidiennement ; alertes en cas de problèmes d’actualisation.

Microsoft Fabric, architecture médallion, modèle sémantique, Power BI

Code source

Prédiction de souscription (machine learning)

Aperçu — prédiction souscription marketing bancaire

Meilleure ciblage des clients susceptibles de souscrire à un dépôt à terme — précision d’environ 89 %.

R, Quarto, Tidymodels, randomForest, xgboost

Code source

Application Churn Teleco - Prédiction du Churn client

Aperçu — prédiction souscription marketing bancaire

Meilleure ciblage des clients susceptibles de se désabonner — précision d’environ 89 %.

Python, streamlit, FastAPI, machine learning, prediction modeling, xgboost

Code source

Voir tous les projets