-
Filière :
Gestion de données
-
Sous-filière :
NoSql & Big Data
-
Référence
DB - ESIC
-
Durée
2 jours (14 h)
-
Prix par personne HT
1 520 € HT
Objectifs pédagogiques
- Situer Elasticsearch dans un écosystème Big Data
- Identifier les enjeux et les cas d’utilisation d’un moteur de recherche
- Appréhender le fonctionnement d’ElasticSearch
- Savoir installer et configurer ElasticSearch
- Indexer des volumes importants de données
- Comprendre comment administrer le système et le surveiller afin de garantir sa disponibilité
Public cible
- Administrateur système
- Architectes
- Développeurs
- Data Analysts
- Data Engineers
Pré-requis
Disposer de solides bases en administration système Unix/Linux
Modalités d’évaluation
L’évaluation des acquis se fait tout au long de la session au travers d’ateliers de mise en pratique des notions et concepts abordés pendant la formation.
Programme de la formation
Situer Elasticsearch dans un écosystème Big Data
- Positionnement d’Elasticsearch et des produits complémentaires :Kibana, Logstash, Beats, X-Pack
- Présentation des concepts clés d’ElasticSearch
- Atelier : comparaison d’ElasticSearch avec d’autres moteurs d’indexation
en fonction du cas d’utilisation
- Atelier : comparaison d’ElasticSearch avec d’autres moteurs d’indexation
Identifier les enjeux et les cas d’utilisation d’un moteur de recherche
- Présentation de la pile elastic
- Cas d’usage classiques : analyse de logs et securité, analyse de métriques, recherches web,…
- Analyse et visualisation de données
- Principes de base de l’analyse de texte, recherche dans des données structurées, recherche full text,
- Atelier : choix d’un outil d’indexation en fonction des contraintes
d’utilisation
- Atelier : choix d’un outil d’indexation en fonction des contraintes
Appréhender le fonctionnement d’ElasticSearch
- Principe : base technique Lucene et apports d’ElasticSearch. Fonctionnement distribué
- Concepts clés : index, types, documents, noeuds, clusters, shards et replica
- Notions de datatypes et mappings
- Opérations CRUD : exemples d’opérations basiques, création d’index et mappings
- Atelier : Installation d’une pile Elastic et création d’un index
Savoir installer et configurer ElasticSearch
- Prérequis techniques. Mode d’installation en grappe distribuée.
- API RESTful en HTTP . Requêtes avec Search Lite et avec Query DSL (domain-specific language)
- Atelier : premiers pas dans la console DevTools de Kibana.
Indexer des volumes importants de données
- Format et stockage des données.
- Conversion au format JSON des données à traiter.
- Structure des données. Stockage, indexation. Terminologie Elasticsearch : notions de document,index.
- Métadonnées : _index, _ID
- Choix de l’identifiant par l’application avec l’API index, ou génération automatique d’un identifiant, …
- Indexation inversée. Outils d’interrogation.
- Atelier : exemples de requêtes simples et plus complexes : recherche de
«phrases», extraction de plusieurs documents, …
- Atelier : exemples de requêtes simples et plus complexes : recherche de
- Notion de pertinence du résultat : «score»
- Utilisation de ‘filtre’ pour affiner des requêtes.
- Atelier : Mise en oeuvre d’une aggrégation de résultats.
- Ecriture de requêtes complexes.
- Notions d’agrégations,
- Atelier : préparation des données, agrégation de mesures, bucket aggregation.
- Gestion des accès concurrents
- Utilisation du numéro de version.
- Gestion par l’application : différentes méthodes selon les contraintes fonctionnelles.
- Utilisation d’un numéro de version externe.
Comprendre comment administrer le système et le surveiller afin de garantir sa disponibilité
- Flux logstash et présentation Kibana
- Traitement de logs avec logstash
- Introduction à beats, installation et configuration
- Supervision du système avec MetricBeat et FileBeat
- Atelier : recherche, visualisation, création de tableaux de bord et graphiques à partir des données fournies par Elasticsearch
Programme mis à jour le