Dernière mise à jour : 27/01/2026
Jour 1 – Architecture LLM-centric, RAG avancé et prompt engineering
Session du matin :
Panorama des patterns LLM pour la data science : RAG, multi-RAG, agents, tools, function calling, guardrails
Conception d'un pipeline RAG : préparation corpus, stratégies de chunking (fixed, semantic), embeddings (choix, dimensions), index (FAISS/Chroma)
Prompt engineering avancé : ReAct, chain-of-thought (sans déverbalisation sensible), self-consistency, few-shot sélection (semantic similarity)
TP / Exercice :
Construire un RAG pour QA analytique
Session de l'après-midi :
Implémentation d'un RAG de bout en bout : ingestion, indexation, retrieval (BM25 vs vectoriel), re-ranking, fusion
Réglages d'inférence : température, top‑p, top‑k, fréquence/presence penalty, longueur de contexte et coût/performance
Observabilité et sécurité : traces, guardrails (schémas, listes contrôlées), gestion de PII et conformité
TP / Exercice :
Construire un RAG pour QA analytique
Description : créer un corpus, tuner chunking/embeddings, comparer retrieveurs, intégrer un re-ranker et évaluer precision@k et exact match. Livrable : notebook avec pipeline RAG, métriques et justification des choix.
Points clés & takeaways :
Savoir concevoir et évaluer un pipeline RAG robuste
Maîtriser prompts et paramètres d'inférence pour la stabilité et les coûts
Jour 2 – Agents outillés, LLMOps et évaluation des systèmes
TP / Exercice : Orchestrer un agent analytique outillé
Agents et tools pour la data science : planification, exécution outillée (SQL, Pandas, API), function calling/schema-guided
Contrôle d'hallucination et robustesse : verification steps, tool-use first, constrained decoding, régles/guardrails
Évaluation : métriques extrinsèques (task success, latency, coût), métriques intrinsèques (faithfulness, groundedness), evals par LLM et tests de régression de prompts
Session de l'après-midi :
LLMOps : versioning prompts/datasets, traces, monitoring, AB testing, canary, budget/cost guards
Déploiement : API, conteneurisation, secrets, gestion des clés et journalisation
Gouvernance et risques : biais, conformité, sécurité des données, policy enforcement
TP / Exercice : Orchestrer un agent analytique outillé
Description : mettre en œuvre un agent capable de répondre à des questions business via SQL/Pandas et vérification de réponses. Livrable : notebook + script d'évaluation (scénarios, métriques) et rapport d'itérations.
Points clés & takeaways :
Concevoir des agents fiables avec outillage contrôlé
Structurer un cadre d'évaluation et d'industrialisation (LLMOps)
Docaposte Institute propose plusieurs dispositifs pédagogiques adaptés aux apprenants :
En amont de la formation :
Tout au long de la formation :
A la fin de la formation :