Big Data | Python pour l'analyse de données Mixte : présentiel / à distance

Dernière mise à jour : 21/12/2023

Bannière visuelle de présentation de la formation

Présentation

Cette formation vous enseignera les fondamentaux du traitement des données en Python, de la collecte de données brutes au nettoyage et à la mise en forme de celles-ci afin de les exploiter pour créer de modèles prédictifs, établir des statistiques et des indicateurs, et bien plus encore.

Informations éligibilité financement Actions Collectives

Formation pouvant être prise en charge à 100% dans le cadre des Actions Collectives.

Pour en bénéficier, contactez-nous à hello.institute@docaposte.fr et complétez votreinscription sur campusAtlas

https://www.docaposteinstitute.com/wp-content/uploads/2023/08/Eligible-actions-co-1.png

Objectifs

  • Comprendre les principes de la modélisation statistique,
  • Savoir utiliser les principaux outils d'analyse et de traitement des données de Python,
  • Extraire des données d'un fichier,
  • Savoir appliquer les bonnes pratiques pour nettoyer et préparer les données avant analyse,
  • Créer des modèles d'apprentissage simples,
  • Choisir entre régression et classification en fonction du type de données,
  • Évaluer les performances prédictives d'un algorithme,
  • Créer des sélections et des évaluations dans de grands volumes de données pour identifier les tendances.

Programme

Introduction à la structure des données en Python

  • Python pour les manipulations de données
  • Listes, ensembles, strings, tuples et dictionnaires

 

Opérations avancées sur la structure de données intégrée

  • Structures de données avancées
  • Opérations de base sur les fichiers en Python

 

Introduction à NumPy, Pandas et Matplotlib

  • Les tableaux NumPy
  • Les DataFrames Pandas
  • Statistiques et visualisation avec NumPy et Pandas
  • Utiliser NumPy et Pandas pour calculer des statistiques descriptives de base sur le DataFrame

 

Data Wrangling avec Python

  • Définition et processus
  • Sous-ensembles, filtrage et regroupement
  • Détection des valeurs extrêmes et traitement des valeurs manquantes
  • Concaténer, fusionner et joindre
  • Les méthodes utiles de Pandas
  • Compréhension avancée des listes et fonction zip
  • Formatage des données

 

Scraping de données avec Python

  • Définition du scraping
  • Les différents niveaux de difficulté sur plusieurs supports
  • Lecture de données provenant de différentes sources textuelles, et non textuelles.
  • Outils de scrapping
  • Introduction à BeautifulSoup
  • Introduction à CSS Select

 

Scraping avancé et collecte de données

  • Les bases du Web scraping, bibliothèques BeautifulSoup
  • Python comme solution ETL
  • Formats de données structurées : CSV, flux XML et JSON
  • Lire et écrire des fichiers
  • Exploiter des données de fichiers provenant de différentes sources
  • Fonctions pour l'accès et le chargement de données en blocs de lignes

 

Implémenter un scraper

  • Scraper simple avec les requêtes GET et les pages séquencées
  • Identification de la stratégie de navigation sur le site pour trouver les données
  • Construction de l'algorithme du scraper
  • Scraper complexe : envoi de données à un site Web, obtention de résultats plus complexes
  • Requêtes POST et GET
  • Parcourir un site pour trouver les données
  • Identifier la stratégie à adopter
  • Coder le scraper

 

Application dans la vie réelle et conclusion du cours

  • Appliquer vos connaissances à des tâches de data wrangling et data scraping de la vie réelle

Public visé

  • Développeurs en Python,
  • Responsables Infocentre,
  • Développeurs de logiciels,
  • Programmeurs,
  • Data analysts,
  • Data scientists.

Modalités pédagogiques

Docaposte Institute propose plusieurs dispositifs pédagogiques adaptés aux apprenants :

 

  • Formation en présentiel
    • En groupe (inter-entreprises ou intra-entreprise)
    • En individuel (monitorat)
    • En journée ou en cours du soir (sur demande spécifique)
  • Formation en distanciel
    • Distanciel synchrone
    • Distanciel asynchrone

Prérequis

  • Connaissances de base en Python et statistiques.

Moyens et supports pédagogiques

  • ·       Apports des connaissances communes.
  • ·       Mises en situation sur le thème de la formation et des cas concrets.
  • ·       Méthodologie d'apprentissage attractive, interactive et participative.
  • ·       Equilibre théorie / pratique : 60 % / 40 %.
  • ·       Supports de cours fournis au format papier et/ou numérique.
  • ·       Ressources documentaires en ligne et références mises à disposition par le formateur.
  • ·       Pour les formations en présentiel dans les locaux mis à disposition, les apprenants sont accueillis dans une salle de cours équipée d'un réseau Wi-Fi, d'un tableau blanc ou paperboard. Un ordinateur avec les logiciels appropriés est mis à disposition (le cas échéant).

Modalités d'évaluation et de suivi

En amont de la formation

·       Recueil des besoins des apprenants afin de disposer des informations essentielles au bon déroulé de la formation (profil, niveau, attentes particulières...).

·       Auto-positionnement des apprenants afin de mesurer le niveau de départ.

Tout au long de la formation

·       Évaluation continue des acquis avec des questions orales, des exercices, des QCM, des cas pratiques ou mises en situation...

A la fin de la formation

·       Auto-positionnement des apprenants afin de mesurer l'acquisition des compétences.

·       Evaluation par le formateur des compétences acquises par les apprenants.

·       Questionnaire de satisfaction à chaud afin de recueillir la satisfaction des apprenants à l'issue de la formation.

·       Questionnaire de satisfaction à froid afin d'évaluer les apports ancrés de la formation et leurs mises en application au quotidien.

Accessibilité

Nos formations peuvent être adaptées à certaines conditions de handicap. Nous contacter pour toute information et demande spécifique.

M'inscrire à la formation

Valider la pré-inscription
Inscription possible jusqu'à 10 jours avant démarrage formation

Prochaines Sessions

  • Désolé, cette formation n'est pas programmée pour le moment.

    Si vous êtes responsable formation, vous pouvez faire une requête pour l'organiser en INTRA dans votre entreprise.

Catalogue de formation propulsé par Dendreo,
Plateforme dédiée pour les OF