Module 1 : Introduction à Talend Open Studio
- Présentation de l'outil et de l'environnement de développement
- Architecture de Talend et composants principaux
- Types de projets et cycle de vie d'un job
Atelier
Création d'un premier projet et d'un job simple d'extraction de données
Module 2 : Connexion aux sources et cibles de données
- Connexion à des bases de données (MySQL, Oracle, PostgreSQL…)
- Lecture et écriture de fichiers plats (CSV, Excel, JSON)
- Utilisation de métadonnées et de schémas réutilisables
Atelier
Intégration de données entre une base SQL et un fichier CSV
Module 3 : Transformation et traitement des données
- Filtres, jointures, agrégations et expressions
- Mapping de colonnes et conversion de types
- Utilisation des composants tMap, tJoin, tFilterRow, tAggregateRow
Atelier
Création d'un job de transformation avec enrichissement de données
Module 4 : Gestion des erreurs et des logs
- Gestion des exceptions et des flux de rejet
- Suivi des traitements et journalisation
- Utilisation des composants tLogCatcher, tDie, tWarn
Atelier
Mise en place d'un système de gestion des erreurs avec logs détaillés
Module 5 : Optimisation et bonnes pratiques
- Réutilisation de sous-jobs et routines personnalisées
- Optimisation des performances (threads, mémoire, batch)
- Sécurisation des connexions et gestion des paramètres
Atelier
Refactorisation d'un job complexe avec sous-jobs et paramètres dynamiques
Module 6 : Automatisation et déploiement
- Exportation et exécution des jobs en ligne de commande
- Planification avec le planificateur système (cron, Windows Task Scheduler)
- Introduction à Talend Administration Center (TAC) pour les versions payantes
Atelier
Déploiement et planification d'un job automatisé