-
Filière :
Gestion de données
-
Sous-filière :
NoSql & Big Data
-
Référence
DB-CAS
-
Durée
3 jours (21 h)
-
Prix par personne HT
2 050 € HT
Description
Cette formation présente les concepts NoSQL et leur mise en oeuvre avec la base Cassandra. Tous les aspects importants sont couverts, de l’installation jusqu’à l’utilisation avancée et l’administration.
Objectifs pédagogiques
- Connaître les apports de Cassandra
- Savoir installer et configurer Cassandra
- Maîtriser le CQL
- Administrer et sécuriser un cluster Cassandra
- Effectuer des calculs distribués avec Spark
Public cible
- Architectes
- Chefs de projets
- Gestionnaires de bases de données
Pré-requis
Connaissances SQL
Programme de la formation
Introduction
- Historique, fonctionnalités de Cassandra, licence
- Format des données, »key-value », traitement de volumes importants, haute disponibilité, système réparti de base de données, …
Installation et configuration
- Prérequis
- Plateformes supportées
- Etude du fichier de configuration : conf/cassandra.yaml
- Répertoire de travail, de stockage des données, gestion de la mémoire
- Démarrage d’un nœud et test de l’interface cliente cqlsh
CQL
- Commandes de base : connexion au système de base de données, création de colonnes, insertion, modification recherche
- Le CQL : Cassandra Query Language
- Exécution de scripts
- Comment écrire des requêtes? Approches
- Limitations du CQL
Gestion de la grappe
- Principe
- Configuration des nœuds
- Notion de bootstrapping et de token
- Paramètres de démarrage des nœuds
- Réplication : topologie du réseau et EndpointSnitch
- Stratégie de réplication
- Ajout de nœuds, suppression
- Architecture de stockage mémoire et disque dur, gestion des tombstones, bloom-filter
- Travaux pratiques : mise en place d’une configuration de production (multi-datacenters, multi-racks)
Supervision
- Prometheus : installation, lancement et découverte
- Supervision avec nodetool
- Principe des accès JMX. Exports JMX vers des outils de supervision
- Démonstration avec Prométheus et Grafana
Exploitation
- Gestion des nœuds Cassandra
- Sauvegardes, snapshots et export au format JSON
- Principe de cohérence, hinted_handoff, digest request et read repair
Support Hadoop
- Principe de MapReduce
- Implémentation Hadoop
- Intégration Hadoop/Cassandra
Support Spark
- Description rapide de l’architecture spark
- Mise en oeuvre depuis Cassandra
- Exécution d’application Spark s’appuyant sur une grappe Cassandra
Performance
- Outil de test de performance Cassandra-stress
- Mise en place d’un plan de stress et paramétrage
Sécurité
- Paramétrage, authentification, sécurisation de la base system_auth
- Gestion des rôles et des autorisations
Qualité
Cette formation est accessible aux personnes en situation de handicap, nous contacter en cas de besoin d’informations complémentaires.
Programme mis à jour le