Dernière mise à jour : 27/01/2026
Jour 1 – Architecture Hadoop avancée et écosystème Cloudera
Session du matin :
- Architecture Hadoop moderne : NameNode, DataNodes, YARN
- Présentation avancée de l'écosystème Cloudera (CDP)
Session de l'après-midi :
- Modèles de stockage et formats optimisés (Parquet, ORC)
- Exploration des services HDFS et YARN
TP / Exercice :
Déploiement et configuration initiale d'un cluster Cloudera avec paramétrage avancé.
Points clés & takeaways :
- Vision approfondie des composants Hadoop
- Compréhension des services clés de Cloudera
Jour 2 – Administration, optimisation et sécurité
Session du matin :
- Administration avancée via Cloudera Manager
- Optimisation des performances (tuning, réplication, I/O)Session de l'après-midi :
- Sécurité : Kerberos, ACLs, chiffrement
- Supervision, logs, audits et monitoring avancé
TP / Exercice :
Mise en place d'une stratégie de sécurité complète et optimisation d'un cluster existant.
Points clés & takeaways :
- Maîtrise des outils d'administration Cloudera
- Gestion de la sécurité et performances avancées
Jour 3 – Développement et exploitation Big Data avancée
Session du matin :
- Développement Big Data avec Hive, Impala et Spark
- Optimisation des jobs et workflows
Session de l'après-midi :
- Automatisation des pipelines Big Data
- Mise en production et bonnes pratiques CI/CD
TP / Exercice :
Conception et exécution d'un pipeline Big Data complet incluant ingestion, traitement et restitution.
Points clés & takeaways :
- Capacité à concevoir un pipeline complet sous Cloudera
- Maîtrise de l'intégration et de l'exploitation avancée
Docaposte Institute propose plusieurs dispositifs pédagogiques adaptés aux apprenants :
En amont de la formation :
Tout au long de la formation :
A la fin de la formation :