Dernière mise à jour : 16/10/2025
Jour 1 : Fondamentaux et NumPy
• Introduction à Python pour la Data Science
• Jupyter Notebook et environnement Anaconda
• Introduction à NumPy
  o Tableaux ndarray, indexation, slicing
  o Fonctions mathématiques vectorisées
  o Opérations sur matrices, statistiques de base
• Génération de données aléatoires (simulateurs, distributions)
• Manipulation d'axes, reshape, broadcast
• Introduction aux visualisations avec Matplotlib
TP : Simulation de données + opérations statistiques sur matrices
Â
Jour 2 : Manipulation de données avec Pandas
• Séries et DataFrames : création, import/export (CSV, Excel, JSON)
• Accès aux données (loc, iloc, at, iat)
• Nettoyage : gestion des valeurs manquantes, duplication, typage
• Filtres conditionnels, tri, regroupement (groupby)
• Agrégations et statistiques descriptives
• Merge, join, concaténation de DataFrames
TP : Nettoyage et analyse d'un jeu de données (ex : Airbnb, Titanic, données RH)
Â
Jour 3 : Visualisation de données
• Visualisation avec Matplotlib : courbes, histogrammes, barres
• Introduction à Seaborn : styles, palettes, intégration avec Pandas
• Visualisation statistique : boxplots, heatmaps, pairplots
• Analyse exploratoire de données (EDA)
• Détection d'anomalies visuelles, corrélations, distribution
• Graphiques croisés dynamiques
TP : Exploration graphique d'un dataset complet (ex : santé, marketing, transport)
Â
Jour 4 : Introduction au Machine Learning avec Scikit-learn
• Introduction au Machine Learning : supervision vs non-supervision
• Séparation train/test, train_test_split, pipelines
• Modèles supervisés : régression linéaire, k-NN, arbre de décision
• Évaluation de modèle : précision, rappel, F1-score, courbe ROC
• Méthodes de validation croisée (cross_val_score)
• Feature scaling, normalisation
TP : Prédiction d'un score (ex : prix d'un logement, revenu, classification binaire)
Â
Jour 5 : Atelier projet & approfondissements
• Feature engineering : création de variables, encodage
• Algorithmes avancés (Random Forest, SVM – introduction)
• GridSearch et tuning des hyperparamètres
Docaposte Institute propose plusieurs dispositifs pédagogiques adaptés aux apprenants :
En amont de la formation
Â
Tout au long de la formation
Â
A la fin de la formation