Big data | Etat de l'art Mixte : présentiel / à distance

Dernière mise à jour : 16/04/2024

Bannière visuelle de présentation de la formation

Présentation

Cette formation offre un aper√ßu des modalit√©s de planification et de mise en Ňďuvre d'une solution Big Data et des diff√©rentes technologies de gestion du Big Data. Vous rencontrerez de nombreux exemples illustrant divers syst√®mes Big Data tout au long de cette formation. Les exemples de programmation sont √©crits en Java mais l'objectif principal est de vous enseigner des bonnes pratiques que vous pourrez appliquer quel que soit votre langage de programmation. Les participants ayant un profil technique pourront avoir un aper√ßu des m√©canismes internes qui r√©gissent une solution Big Data et apprendre √† mettre en Ňďuvre ce type de solution au sein de leur entreprise. Les responsables auront une vue d'ensemble plus pr√©cise de la mani√®re dont ils pourront exploiter le Big Data pour optimiser les r√©sultats de leur entreprise.

Informations éligibilité financement Actions Collectives

Formation pouvant être prise en charge à 100% dans le cadre des Actions Collectives.

 

Pour en bénéficier, contactez-nous à hello.institute@docaposte.fr et complétez votre inscription sur campusAtlas. 

https://www.docaposteinstitute.com/wp-content/uploads/2023/08/Eligible-actions-co-1.png

Objectifs

  • Explorer les concepts cl√©s du Big Data
  • Comprendre les avantages et les limites du Big Data
  • Comprendre les enjeux √©conomiques du Big Data
  • Conna√ģtre l'√©cosyst√®me Big Data et comprendre les technologies impliqu√©es
  • Savoir anticiper son int√©gration dans les op√©rations informatiques de l'entreprise
  • Tenir compte de la confidentialit√© et de la s√©curit√© des donn√©es lors de l'extraction de Big Data

Programme

Présentation de l'Ecosystème Big Data

  • D√©finition, enjeux et perspectives
  • Qu'est-ce-que le Big Data et ses quatre dimensions : volume, v√©locit√©, vari√©t√©, v√©racit√©
  • Quels sont les enjeux soci√©taux et √©conomiques : exemples d'am√©lioration de la performance et des r√©sultats de l'entreprise gr√Ęce au Big Data
  • Mesurer l'importance du Big Data au sein d'une entreprise : les enjeux, la place du Big data dans le-commerce, le-marketing et le-r√©putation
  • R√©ussir √† extraire des donn√©es utiles
  • Int√©grer le Big Data aux donn√©es traditionnelles
  • Int√©grer les crit√®res l√©gaux et √©thiques : que peut-on collecter, stocker et analyser
  • Int√©grer les impacts organisationnels : apparition de nouveaux r√īles /m√©tiers

 

Panorama des techniques liées au Big Data

  • Acquisition de la donn√©e
  • L'encha√ģnement des op√©rations.¬†
  • Le recueil des donn√©es : crawling, scraping
  • La gestion de flux √©v√©nementiel (Complex Event Processing, CEP)
  • L'indexation du flux entrant
  • L'int√©gration avec les anciennes donn√©es
  • La qualit√© des donn√©es : un cinqui√®me V ?
  • Les diff√©rents types de traitement : recherche, apprentissage (machine learning, transactionnel, data mining)
  • D'autres mod√®les d'encha√ģnement : Amazon, e-Sant√©
  • Un ou plusieurs gisements de donn√©es ? De Hadoop √† l'in-memory
  • De l'analyse de tonalit√© √† la d√©couverte de connaissances.

 

Stockage de donnée du Big Data

  • Analyser les caract√©ristiques de vos donn√©es
  • S√©lectionner les sources de donn√©es √† analyser
  • D√©finir le r√īle et les caract√©ristiques des bases NoSQL
  • Pr√©senter un entrep√īt Big Data
  • Mod√®les de donn√©es : valeur cl√©, graph, document, famille de colonnes
  • Syst√®me de fichiers distribu√©s Hadoop (HDFS)
  • Un √©ventail de bases de donn√©es : HBase, Cassandra, BigTable, DynamoDB, MongoDB, Redis, Riak, Neo4J
  • Solution de recherche : Elastic Search
  • Comment bien choisir un entrepot de donn√©es
  • Choisir un entrep√īt de donn√©es en fonction des caract√©ristiques de vos donn√©es
  • Injecter du code dans les donn√©es, mettre en Ňďuvre des solutions de stockage des donn√©es multilingues
  • Choisir un entrep√īt de donn√©es capable de s'aligner sur les objectifs de l'entreprise

 

Traitement du Big Data

  • Int√©grer diff√©rents entrep√īts de donn√©es digitales
  • Mapper les donn√©es avec le framework de programmation, se connecter aux donn√©es et les extraire de l'entrep√īt de stockage, transformer les donn√©es √† traiter
  • Fractionner les donn√©es pour Hadoop MapReduce

 

Présentation d'autres Framework

  • SPARK: l'alternative √† Hadoop MapReduce
  • KAFKA: le middleware de message distribu√©

 

Mise en Ňďuvre et √©laboration d'une strat√©gie d√©di√©e au Big Data

  • D√©finir les besoins en mati√®re de Big Data
  • Atteindre les objectifs gr√Ęce √† la pertinence des donn√©es
  • √Čvaluer les diff√©rents outils du march√© d√©di√©s au Big Data
  • R√©pondre aux attentes du personnel de l'entreprise

 

Une méthode analytique innovante

  • Identifier l'importance des traitements m√©tier
  • Cerner le probl√®me
  • Choisir les bons outils
  • Obtenir des r√©sultats exploitables

 

Mettre en Ňďuvre une solution Big Data

  • Bien choisir les fournisseurs et options d'h√©bergement
  • Trouver le juste √©quilibre entre les co√Ľts engendr√©s et la valeur apport√©e √† l'entreprise
  • Garder une longueur d'avance

 

Mesurer les enjeux de la protection des données

  • Int√©grer le droit comme outil de valorisation des bases de donn√©es
  • G√©rer la paternit√© des fichiers et des donn√©es
  • Assurer la s√©curit√© informatique des fichiers de donn√©es
  • Assurer la s√©curit√© juridique des fichiers de donn√©es : Cloud Computing
  • √Čtude de cas : analyse de la protection des donn√©es de l'entreprise
  • Mesurer les int√©r√™ts du big data et ses interactions avec le droit
  • Les donn√©es issues de l'open data : droit sur les donn√©es, obligations et co√Ľt
  • La r√©utilisation des donn√©es de l'open data : la licence
  • √Čtude de cas : analyse de la licence propos√©e par ETATLAB
  • Identifier les sp√©cificit√©s des donn√©es √† caract√®re personnel
  • Concevoir des syst√®mes d'information et des traitements conformes (privacy by design) via l'identification des crit√®res d'une collecte et d'un traitement l√©gal des donn√©es
  • Appliquer les exigences de la qualit√© Informatique et libert√©s : proportionnalit√©, conservation, interconnexion, archivage
  • L'information des personnes et les limites du d√©tournement de finalit√©
  • Assurer le droit des personnes sur leurs donn√©es
  • Mesurer les risques pos√©s par une exploitation non conforme √† la loi Informatique et libert√©s
  • √Čtude de cas : analyse des derni√®res sanctions de la CNIL

Public visé

  • Directeurs SI,
  • Responsables SI,
  • Chefs de projets,
  • Architectes,
  • Consultants,
  • Toute personne amen√©e √† participer √† un projet Big Data ‚Ķ

Modalités pédagogiques

Docaposte Institute propose plusieurs dispositifs pédagogiques adaptés aux apprenants :

 

  • Formation en pr√©sentiel
    • En groupe (inter-entreprises ou intra-entreprise)
    • En individuel (monitorat)
    • En journ√©e ou en cours du soir (sur demande sp√©cifique)
  • Formation en distanciel
    • Distanciel synchrone
    • Distanciel asynchrone

 

 

Prérequis

  • Avoir des connaissances de base des architectures techniques et du fonctionnement d'un syst√®me de gestion de base de donn√©es (SGBD).

Moyens et supports pédagogiques

  • ¬∑¬†¬†¬†¬†¬†¬† Apports¬†des connaissances communes.
  • ¬∑¬†¬†¬†¬†¬†¬† Mises en situation sur le th√®me de la formation¬†et des cas concrets.
  • ¬∑¬†¬†¬†¬†¬†¬† M√©thodologie d'apprentissage attractive, interactive et participative.
  • ¬∑¬†¬†¬†¬†¬†¬† Equilibre th√©orie / pratique : 60 % / 40 %.
  • ¬∑¬†¬†¬†¬†¬†¬† Supports de cours fournis au format papier et/ou num√©rique.
  • ¬∑¬†¬†¬†¬†¬†¬† Ressources documentaires en ligne et r√©f√©rences mises √† disposition par le formateur.
  • ¬∑¬†¬†¬†¬†¬†¬† Pour les formations en pr√©sentiel dans les locaux mis¬†√† disposition, les apprenants¬†sont accueillis dans une salle de cours √©quip√©e d'un r√©seau Wi-Fi, d'un tableau blanc ou paperboard. Un ordinateur avec les logiciels appropri√©s est mis √† disposition (le cas √©ch√©ant).
  • ¬†

Modalités d'évaluation et de suivi

En amont de la formation

·       Recueil des besoins des apprenants afin de disposer des informations essentielles au bon déroulé de la formation (profil, niveau, attentes particulières...).

·       Auto-positionnement des apprenants afin de mesurer le niveau de départ.

Tout au long de la formation

¬∑¬†¬†¬†¬†¬†¬† √Čvaluation continue des acquis avec¬†des questions orales, des exercices, des QCM, des cas pratiques ou mises en situation...

A la fin de la formation

·       Auto-positionnement des apprenants afin de mesurer l'acquisition des compétences.

·       Evaluation par le formateur des compétences acquises par les apprenants.

·       Questionnaire de satisfaction à chaud afin de recueillir la satisfaction des apprenants à l'issue de la formation.

·       Questionnaire de satisfaction à froid afin d'évaluer les apports ancrés de la formation et leurs mises en application au quotidien.

Accessibilité

Nos formations peuvent être adaptées à certaines conditions de handicap. Nous contacter pour toute information et demande spécifique.

M'inscrire à la formation

Valider la pré-inscription
Inscription possible jusqu'à 10 jours avant démarrage formation

Prochaines Sessions

  • D√©sol√©, cette formation n'est pas programm√©e pour le moment.

    Si vous êtes responsable formation, vous pouvez faire une requête pour l'organiser en INTRA dans votre entreprise.

Catalogue de formation propulsé par Dendreo,
Plateforme dédiée pour les OF