Installer & estimer les ressources nécessaires d'infrastructure
- Allocation des shards, commandes et philosophie :
- Déploiement classique
- Déploiement multi data tiers
- Rôles des nœuds
- Savoir expliquer les allocations effectuées
- Recovery: Quand et comment les contrôler
- Explications du routing des requêtes de recherche et d'indexation
- Nœuds master et voting configuration
- Paramétrage de la mémoire
- Paramétrage du disque
- Paramétrage réseau
- Paramétrage CPU
- Avertissement sur la virtualisation
- Recette de dimensionnement
- Usage API pour lister les fonctionnalités X-Pack actives
Monitorer & réagir
- API Cluster Health, Cluster stats/state, Node infos/stats, Index _stats
- APIs équivalentes avec l'API _cat
- Connaître les tâches en attente de traitement sur le cluster (pending tasks)
- Connaître les threads les plus actifs d'un nœud (hot threads)
- Monitorer les fonctionnalités du stack
- Monitorer la mémoire utilisée
- Monitorer les file handles utilisés
- Monitorer l'occupation disque
- Monitorer la bande passante et connexions réseau
- Surveiller les indicateurs de performance : charge de travail des threads, performances d'indexation/recherche et surveillance des requêtes "lentes"
- Monitorer à l'aide des journaux applicatifs Elasticsearch
- Alerter sur la base des données de monitoring
Maintenance
- Mécanismes du Recovery
- Se mettre à l'échelle : ajouter ou retirer un nœud
- Opérations de maintenance : redémarrer un nœud ou un cluster complet
- Ré-indexer des données
- Prévenir les arrêts de services : Aliases et Rollover API
- Cas particulier d'usage des indices : les DataStreams
- Sauvegarder et restaurer des indices
- Fonctionnalité de sauvegarde automatisée (Snapshot Lifecycle Management ou SLM)
- Fonctionnalité de gestion du cycle de vie des indices (Index Lifecycle Management ou ILM)
- Utiliser l'API de dépréciation
- Préparer une montée de version
- Monter de version
Sécurité
- Périmètre et vue d'ensemble
- Filtrer les flux réseau
- Limiter les fonctionnalités de scripting
- Chiffrer les données sur disque ou échangées sur le réseau
- Authentifier les utilisateurs avec X-Pack security
- Authentifier les utilisateurs avec un reverse proxy
- Autorisations d'accès aux ressources
Cross Cluster Replication (CCR)
- Réplications entres clusters distants unidirectionnelles ou bidirectionnelles pour permettre différents cas d'usage :
- Une architecture capable un retour rapide à la normale après désastre
- Une architecture de mise à proximité données
- Une architecture de centralisation de la supervision
Optimisation & Performance
- Indexer plus rapidement :
- Bulk API
- Refresh interval
- Optimisations des mappings
- Rechercher plus efficacement :
- Contextes de filtres, de post filters, opérateurs "exact matches" et caches
- Pièges des opérateurs wildcard ou des mappings parent/child
- Agréger and trier plus efficacement : doc_values et fielddata
- Diagnostiquer le calcul de score, ou les erreurs
- Profiler ses recherches pour comprendre les temps de réponse
- Matériel & Infrastructure :
- Penser aux capacités de gestion des data tiers d'Elasticsearch
- Pas d'ingestion sans nœud dédié à cette activité
- Dissocier les clusters pour les spécialiser dans des tâches données (supervision vs métier)