Formation Python pour la Data Science, Le Langage Python - PY3 Mixte : présentiel / à distance

Dernière mise à jour : 27/01/2026

Pré-inscription

Ajouter au panier

Présentation

Spark est un des principaux frameworks d’analyse de données Big Data. Il est massivement déployé sur les infrastructures de type
Data Lake, soit directement, soit au travers d’autres outils tels que Dataiku DSS. PySpark est une bibliothèque permettant d’utiliser ce
framework en Python.
Cette formation est un prolongement de la formation « PY2 – Exploration de données en Python ». Elle aborde principalement la
manipulation de données dans un contexte Big Data, et plus spécifiquement le traitement de données distribuées sur un cluster
de calcul avec la bibliothèque PySpark. Elle s’adresse donc à des personnes ayant suivi la formation PY2 ou ayant déjà une bonne
compréhension des bases de la manipulation de données en Python avec Pandas.
Les supports de formation sont rédigés en anglais, toutefois les sessions sont données en français.

Objectifs

  • Reconnaître les spécificités du traitement de données en environnement Big Data.
  • Savoir expliquer les notions principales liées au traitement de données distribué sur un cluster de calcul
    Spark :
    - Driver, master, exécuteur
    - Partitionnement, shuffle
  • Appliquer les principaux types de manipulation de
    données avec la bibliothèque PySpark

Public visé

Toute personne ayant un profil technique ou ayant validée la formation « Le langage Python – PY1 » et

souhaitant s'initier à la manipulation et à l'exploration de données en Python.

Prérequis

• Toute personne ayant déjà manipulé des données en Python notamment avec la bibliothèque Pandas et désirant transposer ces traitements avec PySpark.
• Lecture de l'anglais technique
• Utilisation de Python, des Notebooks Jupyter et de la bibliothèque Pandas ou avoir suivi la formation « Python pour la Data Science : L'exploration de données en Python - PY2 »

Programme

visuel • Big Data & Spark clusters
• Lecture et écriture de données (partitionnement)
• Exécution paresseuse et récupération de données
• Spark Dataframes et manipulation de données de base
• Structure d'une application Spark (Jobs, Stages, Tasks) +notion de shuffle
• Spark UI
• Group by et Jointure
• Spark et SQL

Modalités pédagogiques

Docaposte Institute propose plusieurs dispositifs pédagogiques adaptés aux stagiaires :

  • Formation en présentiel
    • En groupe (inter-entreprises ou intra-entreprise)
  • Formation en distanciel
    • Distanciel synchrone
    • Distanciel asynchrone

Moyens et supports pédagogiques

  • Exposé théorique sur le langage et exercices pratiques
  • Fil rouge autour d'un projet concret
  • Utilisation des cahiers (notebooks) Jupyter pour rassembler supports et exercices pratiques dans un même document

 

  • Apports didactiques pour apporter des connaissances communes.
  • Mises en situation de réflexion sur le thème du stage et des cas concrets.
  • Méthodologie d'apprentissage attractive, interactive et participative.
  • Equilibre théorie / pratique : 70 % / 30 %.

 

  • Supports de cours fournis au format papier et/ou numérique.
  • Ressources documentaires en ligne et références mises à disposition par le formateur.

 

  • Pour les formations en présentiel dans les locaux de Docaposte Institute, les stagiaires sont accueillis dans une salle de cours équipée d'un réseau Wi-Fi, d'un tableau blanc ou paperboard. Un carnet de notes est offert. Un ordinateur avec les logiciels appropriés est mis à disposition (le cas échéant).

Modalités d'évaluation et de suivi

En amont de la formation

  • Recueil des besoins des apprenants afin de disposer des informations essentielles au bon déroulé de la formation (profil, niveau, attentes particulières...).
  • Auto-positionnement des apprenants afin de mesurer le niveau de départ.

 

Tout au long de la formation

  • Évaluation continue des acquis avec des questions orales, des exercices, des QCM, des cas pratiques ou mises en situation...

 

A la fin de la formation

  • Auto-positionnement des apprenants afin de mesurer l'acquisition des compétences.
  • Evaluation par le formateur des compétences acquises par les apprenants.
  • Questionnaire de satisfaction à chaud afin de recueillir la satisfaction des apprenants à l'issue de la formation.
  • Questionnaire de satisfaction à froid afin d'évaluer les apports ancrés de la formation et leurs mises en application au quotidien.

Informations sur l'admission

Nous consulter.

Modalités d'admission

  • Admission sans disposition particulière

Accessibilité

Nos formations peuvent être adaptées à certaines conditions de handicap. Nous contacter pour toute information et demande spécifique.

Accessibilité à nos formations

Si vous êtes en situation de handicap, contactez-nous avant le début de votre formation pour que nous puissions vous orienter efficacement et vous accueillir dans les meilleures conditions.

Inscription possible jusqu'à 10 jours avant le démarrage de la formation

Prochaines Sessions

  • Cette formation n'est pas programmée pour le moment.

    Contactez-nous pour planifier une session ensemble !

Catalogue de formation propulsé par Dendreo,
Plateforme dédiée pour les OF