Formation Moyens et solutions pratiques pour le Big Data Analysis Mixte : présentiel / à distance

Dernière mise à jour : 27/01/2026

Pré-inscription

Ajouter au panier

Présentation

Cette formation vous permettra de comprendre les enjeux et les apports du Big Data ainsi que les technologies pour le mettre en œuvre. Vous apprendrez à intégrer des volumétries massives de données structurées et non structurées via un ETL, puis à les analyser grâce à des modèles statistiques et des dashboards dynamiques.

Objectifs

  • Comprendre les concepts et l'apport du Big Data par rapport aux enjeux métiers
  • Comprendre l'écosystème technologique nécessaire pour réaliser un projet Big Data
  • Acquérir les compétences techniques pour gérer des flux de données complexes, non structurés et massifs
  • Implémenter des modèles d'analyses statistiques pour répondre aux besoins métiers
  • Appréhender un outil de data visualisation pour restituer des analyses dynamiques

Public visé

  • Dataminers
  • Chargés d'études statistiques
  • Développeurs
  • Chefs de projet
  • Consultants en informatique décisionnelle

Prérequis

  • Connaissances de base des modèles relationnels, des statistiques et des langages de programmation
  • Connaissances de base des concepts de la Business Intelligence

PRE REQUIS TECHNIQUES

  • Apache Hadoop : Une plateforme open source pour le stockage et le traitement distribué de grandes quantités de données.
  • Apache Spark : Un Framework open source qui permet le traitement rapide des données en mémoire, idéal pour les analyses en temps réel.
  • Elasticsearch : Un moteur de recherche et d'analyse de données distribué, conçu pour la recherche et l'analyse en temps réel.
  • MongoDB : Une base de données NoSQL qui permet le stockage et le traitement de données non structurées pour des applications d'analyse en temps réel.
  • Tableau : Un logiciel de visualisation de données puissant et convivial qui permet de créer des tableaux de bord interactifs et des analyses visuelles.
  • Splunk : Une plateforme d'analyse des données en temps réel qui permet de collecter, indexer et analyser des données à partir de différentes sources.
  • SAS : Un logiciel d'analyse avancée qui offre une large gamme d'outils pour l'exploration, la modélisation et la visualisation des données.
  • R : Un langage de programmation open source populaire pour l'analyse statistique et la visualisation des données.
  • Python : Un langage de programmation polyvalent avec de nombreuses bibliothèques et packages pour l'analyse des données, tels que Pandas et NumPy.
  • IBM Watson Analytics : Une plateforme d'analyse cognitive qui utilise l'intelligence artificielle pour analyser les données et fournir des insights.
  •  

Programme

Comprendre les concepts et les enjeux du Big Data

  • Origines et définition du Big Data : la BI face à la croissance et à la diversité des données
  • Les chiffres clés du marché dans le monde et en France
  • Les enjeux du Big Data : ROI, organisation et confidentialité des données
  • Un exemple d'architecture Big Data

 

Les technologies du Big Data

  • Description de l'architecture et des composants de la plateforme Hadoop
  • Les modes de stockage (NoSQL, HDFS)
  • Principes de fonctionnement de MapReduce
  • Présentation des distributions principales du marché et des outils complémentaires (Hortonworks, Cloudera, MapR, Aster)
  • Installer une plateforme Hadoop
  • Présentation des technologies spécifiques pour le Big Data (Talend, Tableau, Qlikview …)
  • Exercice : installation d'une plateforme Big Data complète via Cloudera et ses composants.

 

Les méthodes d'analyse des données pour le Big Data

  • Les méthodes d'exploration
  • Segmentation et classification
  • Estimation et prédiction
  • L'implémentation des modèles
  • Exercice : mise en place d'analyses avec le logiciel R

 

Gérer les données structurées et non structurées

  • Principes de fonctionnement de Hadoop Distributed File System (HDFS)
  • Importer des données externes vers HDFS
  • Réaliser des requêtes SQL avec HIVE
  • Utiliser PIG pour traiter la donnée
  • Utiliser un ETL pour industrialiser la création de flux de données massives
  • Présentation de Talend For Big Data.
  • Exercice : implémentation de flux de données massives

 

Les méthodes d'analyse des données pour le Big Data

  • Les outils de restitution du marché
  • Méthodologie de mise en forme des rapports
  • Apport du Big Data pour le « Social Business »
  • Mesurer l'e-réputation et la notoriété d'une marque
  • Mesurer l'expérience et la satisfaction clients, optimiser le parcours client

Modalités pédagogiques

Docaposte Institute propose plusieurs dispositifs pédagogiques adaptés aux apprenants :

 

  • Formation en présentiel
    • En groupe (inter-entreprises ou intra-entreprise)
    • En individuel (monitorat)
    • En journée ou en cours du soir (sur demande spécifique)
  • Formation en distanciel
    • Distanciel synchrone
    • Distanciel asynchrone

 

 

Moyens et supports pédagogiques

  • Apports des connaissances communes.
  • Mises en situation sur le thème de la formation et des cas concrets.
  • Méthodologie d'apprentissage attractive, interactive et participative.
  • Equilibre théorie / pratique : 60 % / 40 %.
  • Supports de cours fournis au format papier et/ou numérique.
  • Ressources documentaires en ligne et références mises à disposition par le formateur.
  • Pour les formations en présentiel dans les locaux mis à disposition, les apprenants sont accueillis dans une salle de cours équipée d'un réseau Wi-Fi, d'un tableau blanc ou paperboard. Un ordinateur avec les logiciels appropriés est mis à disposition (le cas échéant).

Modalités d'évaluation et de suivi

En amont de la formation

 

  • Recueil des besoins des apprenants afin de disposer des informations essentielles au bon déroulé de la formation (profil, niveau, attentes particulières...).
  • Auto-positionnement des apprenants afin de mesurer le niveau de départ.

Tout au long de la formation

 

  • Évaluation continue des acquis avec des questions orales, des exercices, des QCM, des cas pratiques ou mises en situation...

A la fin de la formation

 

  • Auto-positionnement des apprenants afin de mesurer l'acquisition des compétences.
  • Evaluation par le formateur des compétences acquises par les apprenants.
  • Questionnaire de satisfaction à chaud afin de recueillir la satisfaction des apprenants à l'issue de la formation.
  • Questionnaire de satisfaction à froid afin d'évaluer les apports ancrés de la formation et leurs mises en application au quotidien.

Informations sur l'admission

Nous consulter.

Modalités d'admission

  • Admission sans disposition particulière

Accessibilité

Nos formations peuvent être adaptées à certaines conditions de handicap. Nous contacter pour toute information et demande spécifique.

Accessibilité à nos formations

Si vous êtes en situation de handicap, contactez-nous avant le début de votre formation pour que nous puissions vous orienter efficacement et vous accueillir dans les meilleures conditions.

Inscription possible jusqu'à 10 jours avant le démarrage de la formation

Prochaines Sessions

  • Cette formation n'est pas programmée pour le moment.

    Contactez-nous pour planifier une session ensemble !

Catalogue de formation propulsé par Dendreo,
Plateforme dédiée pour les OF