Big Data | Python pour l'analyse de données Mixte : présentiel / à distance

Dernière mise à jour : 21/12/2023

Bannière visuelle de présentation de la formation

Présentation

Cette formation vous enseignera les fondamentaux du traitement des données en Python, de la collecte de données brutes au nettoyage et à la mise en forme de celles-ci afin de les exploiter pour créer de modèles prédictifs, établir des statistiques et des indicateurs, et bien plus encore.

Informations éligibilité financement Actions Collectives

Formation pouvant être prise en charge à 100% dans le cadre des Actions Collectives.

Pour en bénéficier, contactez-nous à hello.institute@docaposte.fr et complétez votreinscription sur campusAtlas. 

https://www.docaposteinstitute.com/wp-content/uploads/2023/08/Eligible-actions-co-1.png

Objectifs

  • Comprendre les principes de la mod√©lisation statistique,
  • Savoir utiliser les principaux outils d'analyse et de traitement des donn√©es de Python,
  • Extraire des donn√©es d'un fichier,
  • Savoir appliquer les bonnes pratiques pour nettoyer et pr√©parer les donn√©es avant analyse,
  • Cr√©er des mod√®les d'apprentissage simples,
  • Choisir¬†entre r√©gression et classification en fonction du type de donn√©es,
  • √Čvaluer les performances pr√©dictives d'un algorithme,
  • Cr√©er des s√©lections et des √©valuations dans de grands volumes de donn√©es pour identifier¬†les tendances.

Programme

Introduction à la structure des données en Python

  • Python pour les manipulations de donn√©es
  • Listes, ensembles, strings, tuples et dictionnaires

 

Opérations avancées sur la structure de données intégrée

  • Structures de donn√©es avanc√©es
  • Op√©rations de base sur les fichiers en Python

 

Introduction à NumPy, Pandas et Matplotlib

  • Les tableaux NumPy
  • Les DataFrames Pandas
  • Statistiques et visualisation avec NumPy et Pandas
  • Utiliser NumPy et Pandas pour calculer des statistiques descriptives de base sur le DataFrame

 

Data Wrangling avec Python

  • D√©finition et processus
  • Sous-ensembles, filtrage et regroupement
  • D√©tection des valeurs extr√™mes et traitement des valeurs manquantes
  • Concat√©ner, fusionner et joindre
  • Les m√©thodes utiles de Pandas
  • Compr√©hension avanc√©e des listes et fonction zip
  • Formatage des donn√©es

 

Scraping de données avec Python

  • D√©finition du scraping
  • Les diff√©rents niveaux de difficult√© sur plusieurs supports
  • Lecture de donn√©es provenant de diff√©rentes sources textuelles, et non textuelles.
  • Outils de scrapping
  • Introduction √† BeautifulSoup
  • Introduction √† CSS Select

 

Scraping avancé et collecte de données

  • Les bases du Web scraping, biblioth√®ques BeautifulSoup
  • Python comme solution ETL
  • Formats de donn√©es structur√©es : CSV, flux XML et JSON
  • Lire et √©crire des fichiers
  • Exploiter des donn√©es de fichiers provenant de diff√©rentes sources
  • Fonctions pour l'acc√®s et le chargement de donn√©es en blocs de lignes

 

Implémenter un scraper

  • Scraper simple avec les requ√™tes GET et les pages s√©quenc√©es
  • Identification de la strat√©gie de navigation sur le site pour trouver les donn√©es
  • Construction de l'algorithme du scraper
  • Scraper complexe : envoi de donn√©es √† un site Web, obtention de r√©sultats plus complexes
  • Requ√™tes POST et GET
  • Parcourir un site pour trouver les donn√©es
  • Identifier la strat√©gie √† adopter
  • Coder le scraper

 

Application dans la vie réelle et conclusion du cours

  • Appliquer vos connaissances √† des t√Ęches de data wrangling et data scraping de la vie r√©elle

Public visé

  • D√©veloppeurs en Python,
  • Responsables Infocentre,
  • D√©veloppeurs de logiciels,
  • Programmeurs,
  • Data analysts,
  • Data scientists.

Modalités pédagogiques

Docaposte Institute propose plusieurs dispositifs pédagogiques adaptés aux apprenants :

 

  • Formation en pr√©sentiel
    • En groupe (inter-entreprises ou intra-entreprise)
    • En individuel (monitorat)
    • En journ√©e ou en cours du soir (sur demande sp√©cifique)
  • Formation en distanciel
    • Distanciel synchrone
    • Distanciel asynchrone

Prérequis

  • Connaissances de base en Python et statistiques.

Moyens et supports pédagogiques

  • ¬∑¬†¬†¬†¬†¬†¬† Apports¬†des connaissances communes.
  • ¬∑¬†¬†¬†¬†¬†¬† Mises en situation sur le th√®me de la formation¬†et des cas concrets.
  • ¬∑¬†¬†¬†¬†¬†¬† M√©thodologie d'apprentissage attractive, interactive et participative.
  • ¬∑¬†¬†¬†¬†¬†¬† Equilibre th√©orie / pratique : 60 % / 40 %.
  • ¬∑¬†¬†¬†¬†¬†¬† Supports de cours fournis au format papier et/ou num√©rique.
  • ¬∑¬†¬†¬†¬†¬†¬† Ressources documentaires en ligne et r√©f√©rences mises √† disposition par le formateur.
  • ¬∑¬†¬†¬†¬†¬†¬† Pour les formations en pr√©sentiel dans les locaux mis¬†√† disposition, les apprenants¬†sont accueillis dans une salle de cours √©quip√©e d'un r√©seau Wi-Fi, d'un tableau blanc ou paperboard. Un ordinateur avec les logiciels appropri√©s est mis √† disposition (le cas √©ch√©ant).

Modalités d'évaluation et de suivi

En amont de la formation

·       Recueil des besoins des apprenants afin de disposer des informations essentielles au bon déroulé de la formation (profil, niveau, attentes particulières...).

·       Auto-positionnement des apprenants afin de mesurer le niveau de départ.

Tout au long de la formation

¬∑¬†¬†¬†¬†¬†¬† √Čvaluation continue des acquis avec¬†des questions orales, des exercices, des QCM, des cas pratiques ou mises en situation...

A la fin de la formation

·       Auto-positionnement des apprenants afin de mesurer l'acquisition des compétences.

·       Evaluation par le formateur des compétences acquises par les apprenants.

·       Questionnaire de satisfaction à chaud afin de recueillir la satisfaction des apprenants à l'issue de la formation.

·       Questionnaire de satisfaction à froid afin d'évaluer les apports ancrés de la formation et leurs mises en application au quotidien.

Accessibilité

Nos formations peuvent être adaptées à certaines conditions de handicap. Nous contacter pour toute information et demande spécifique.

M'inscrire à la formation

Valider la pré-inscription
Inscription possible jusqu'à 10 jours avant démarrage formation

Prochaines Sessions

  • D√©sol√©, cette formation n'est pas programm√©e pour le moment.

    Si vous êtes responsable formation, vous pouvez faire une requête pour l'organiser en INTRA dans votre entreprise.

Dans la même catégorie

Catalogue de formation propulsé par Dendreo,
Plateforme dédiée pour les OF