Cassandra

Monter en charge (scale out) avec la base de données NoSQL orientée clé-valeur Cassandra

  • Filière :

    Gestion de données

  • Sous-filière :

    NoSql & Big Data

  • Référence

    DB-CAS

  • Durée

    3 jours (21 h)

  • Prix par personne HT

    2 050 € HT

Description

Cette formation présente les concepts NoSQL et leur mise en oeuvre avec la base Cassandra. Tous les aspects importants sont couverts, de l’installation jusqu’à l’utilisation avancée et l’administration.

Objectifs pédagogiques

  • Connaître les apports de Cassandra
  • Savoir installer et configurer Cassandra
  • Maîtriser le CQL
  • Administrer et sécuriser un cluster Cassandra
  • Effectuer des calculs distribués avec Spark

Public cible

  • Architectes
  • Chefs de projets
  • Gestionnaires de bases de données

Pré-requis

Connaissances SQL

Programme de la formation

Introduction

  • Historique, fonctionnalités de Cassandra, licence
  • Format des données, »key-value », traitement de volumes importants, haute disponibilité, système réparti de base de données, …

Installation et configuration

  • Prérequis
  • Plateformes supportées
  • Etude du fichier de configuration : conf/cassandra.yaml
  • Répertoire de travail, de stockage des données, gestion de la mémoire
  • Démarrage d’un nœud et test de l’interface cliente cqlsh

CQL

  • Commandes de base : connexion au système de base de données, création de colonnes, insertion, modification recherche
  • Le CQL : Cassandra Query Language
  • Exécution de scripts
  • Comment écrire des requêtes? Approches
  • Limitations du CQL

Gestion de la grappe

  • Principe
  • Configuration des nœuds
  • Notion de bootstrapping et de token
  • Paramètres de démarrage des nœuds
  • Réplication : topologie du réseau et EndpointSnitch
  • Stratégie de réplication
  • Ajout de nœuds, suppression
  • Architecture de stockage mémoire et disque dur, gestion des tombstones, bloom-filter
  • Travaux pratiques : mise en place d’une configuration de production (multi-datacenters, multi-racks)

Supervision

  • Prometheus : installation, lancement et découverte
  • Supervision avec nodetool
  • Principe des accès JMX. Exports JMX vers des outils de supervision
  • Démonstration avec Prométheus et Grafana

Exploitation

  • Gestion des nœuds Cassandra
  • Sauvegardes, snapshots et export au format JSON
  • Principe de cohérence, hinted_handoff, digest request et read repair

Support Hadoop

  • Principe de MapReduce
  • Implémentation Hadoop
  • Intégration Hadoop/Cassandra

Support Spark

  • Description rapide de l’architecture spark
  • Mise en oeuvre depuis Cassandra
  • Exécution d’application Spark s’appuyant sur une grappe Cassandra

Performance

  • Outil de test de performance Cassandra-stress
  • Mise en place d’un plan de stress et paramétrage

Sécurité

  • Paramétrage, authentification, sécurisation de la base system_auth
  • Gestion des rôles et des autorisations

Qualité

Cette formation est accessible aux personnes en situation de handicap, nous contacter en cas de besoin d’informations complémentaires.

Programme mis à jour le