Maîtrisez le machine learning supervisé en production grâce à ce cours expert axé sur scikit-learn, XGBoost et les meilleures pratiques industrielles.
Maîtrisez le machine learning supervisé en production grâce à ce cours expert axé sur scikit-learn, XGBoost et les meilleures pratiques industrielles. Ce programme prépare les data scientists et ML engineers à la certification **TensorFlow Developer Certificate** (Google) et au **DP-100 Microsoft Azure Data Scientist Associate** en couvrant l'ensemble du cycle de vie d'un modèle : du prototypage à la mise en production.
Ce cours s'adresse aux data scientists, ingénieurs ML, analystes data et développeurs Python ayant déjà des bases en statistique descriptive et programmation Python (Pandas, NumPy). Une familiarité avec Jupyter / Google Colab est attendue. Aucun prérequis en deep learning n'est nécessaire — le module 2 traite ce sujet.
Au terme du parcours, vous saurez construire des **pipelines scikit-learn** propres et reproductibles, entraîner et tuner **XGBoost, LightGBM et CatBoost** avec early stopping et SHAP, gérer le **déséquilibre de classes** par SMOTE et class_weight, recalibrer les probabilités via **Platt scaling**, sérialiser des modèles (joblib, ONNX), déployer en production avec **FastAPI + Docker**, monitorer la dérive (data drift, concept drift) et appliquer les principes MLOps (CI/CD pour ML, registry MLflow).
L'examen comprend 25 questions de mi-parcours (examen blanc) et 50 questions sur l'examen final, format QCM, seuil 70 %, simulant l'épreuve théorique du **TensorFlow Developer Certificate** côté ML classique. Les questions s'appuient sur la documentation officielle scikit-learn.org, xgboost.readthedocs.io et les compétitions Kaggle de référence.
La durée estimée est de **70 heures** (4 200 minutes), réparties sur 8 à 10 semaines à raison de 7 h par semaine. Le format alterne théorie (40 %), code pratique en Jupyter (45 %) et exercices Kaggle (15 %). Chaque leçon contient des snippets Python prêts à exécuter, des tableaux comparatifs de modèles et hyperparamètres, et des cas concrets issus de Kaggle Titanic, House Prices et Credit Card Fraud. Sources principales : scikit-learn.org, xgboost.readthedocs.io, "Hands-On Machine Learning with Scikit-Learn, Keras & TensorFlow" (Aurélien Géron, O'Reilly 3e éd. 2022), Kaggle Learn.
Put this course into practice with an official-format mock exam.
Choisis quels cookies tu acceptes — modifiable à tout moment.