-
Filière :
Gestion de données
-
Sous-filière :
NoSql & Big Data
-
Référence
DB-ES
-
Durée
3 jours (21h)
-
Prix unitaire HT
2050 €
Description
Elasticsearch est un moteur RESTful distribué de recherche et d’analytique basé sur Apache Lucene. Il vous permet d’indexer des données en temps réel venant de diverses sources pour pouvoir trouver des informations à jour à tout moment. La haute disponibilité est au coeur de l’architecture d’Elasticsearch et vois permet donc de monter en puissance en s’exécutant sur plusieurs machines à la fois pour vous assurer que vos données seront toujours disponibles.Cette formation Elasticsearch est une prise en main complète de la solution d’indexation et de recherche open-source dans sa version 2.1 et plus. Kibana et Logstash sont aussi abordés.
Objectifs pédagogiques
- Comprendre et maîtriser l’installation et le montage d’un cluster
- Etre capable de construire un index et son mapping
- Comprendre et tuner les analyzer selon ses besoins ; Savoir traiter et rechercher des documents en plusieurs langues
- Indexer des documents à grande échelle ; Utiliser le DSL pour effectuer des recherches complexes
- Comprendre l’intérêt d’outils tiers tel que X-Pack, Kibana et Logstash ; Résoudre les problèmes courants, et passer en production sereinement.
Public cible
- analystes
- developpeurs
Pré-requis
Machine de 16 Go de RAM fortement conseillée
Programme de la formation
Introduction
- Qu’est-ce qu’un index de recherche, dans quelles situations pouvez-vous l’utiliser
- Introduction à Elasticsearch
Installation
- Mettre en place un serveur, puis un cluster
- Installer des plugins, et outils de travail
Découverte de l’API
- Opérations de base (indexation et recherches simples)
- Tour d’horizon de l’API HTTP et de ses possibilités
Déclaration de mapping
- Introduction à l’analyse
- Création d’index et de plusieurs mappings
Recherches complexes
- Le Query DSL en détail
Les agrégations
- Découverte et manipulation d’agrégations
- Exemples et cas pratiques avec Logstash et Kibana
La pertinence
- Comprendre le _score et l’altérer
- Améliorer la pertinence avec un signal
- Personnalisation du champ _all
Indexer en plusieurs langues
- La problématique du multilingue dans un index de recherche
- Introduction à ICU
Mise en production
- Réindexer sans peine avec des alias
- Maintenance d’un cluster, backup et mise à jour
- X-Pack et le Monitoring
- Recommandations et configuration
Aller plus loin
- Jointures et documents imbriqués
- Indexation via stream2es et la _reindex API
- Créer un auto-compléteur
- Les suggestions de document
- La recherche géographique
- Le highlight de contenus
- Les scripts pour le score et les filtres
- Le Ingest Node pour manipuler des documents à la
volée