Dernière mise à jour : 09/10/2024
Pour faire face à un volume croissant de données à analyser, et fournir aux internautes des résultats de recherche pertinents, le framework Hadoop voit le jour au milieu des années 2000.
Devant le succès rencontré par la solution, Hadoop passera chez Cloudera qui créera alors la distribution Hadoop la plus utilisée à ce jour.
Architecture Hadoop
Système de fichiers distribués Hadoop (HDFS)
MapReduce
Entreposage de données avec Hive
Traitement parallèle avec Pig
Extraction de données avec Mahout
Recherche avec Elastic Search
Stockage de données structurées avec HBase
Base de données multi-master Cassandra
Redis
MongoDB
Kafka
Architecture Lambda
Big Data dans le Cloud
(Si le temps le permet)
Docaposte Institute propose plusieurs dispositifs pédagogiques adaptés aux apprenants :
En amont de la formation
Tout au long de la formation
A la fin de la formation