Objectifs pédagogiques

Comprendre les connexions existantes entre les mondes relationnels et NoSQL en environnement Big Data
Savoir mettre en oeuvre Hive et Impala, Phoenix, les Spark Dataframes.

Public cible

Experts en bases de données
Chefs de projet
Toute personne souhaitant comprendre le fonctionnement et les apports des bases NoSQL

Connaissance générale des systèmes d’informations et des bases de données

Besoin
Adéquation entre les objectifs et les outils.
Faciliter la manipulation de gros volumes de données en conservant une approche utilisateurs.
Rappels sur le stockage : HDFS, Cassandra, HBase
et les formats de données : parquet, orc, raw, clés/valeurs
Les outils : Hive, Impala, Tez, Presto, Drill, Phoenix, Spark-sql, Spark Dataframe

Présentation Hive. Mode de fonctionnement. Rappel sur map/reduce.
Hive : le langage HiveQL. La surcouche Tez.
- Atelier : création de tables, requêtage, connexion avec Hbase.

Présentation Impala. Cadre d’utilisation. Contraintes. Liaison avec le métastore Hive.
- Atelier : mise en évidence des performances.
Présentation Phoenix. Cadre d’utilisation. Contraintes.
- Atelier : connexion et requêtage sur une table Hbase.

Cadre d’utilisation
Sources de données utilisables
- Atelier : mise en œuvre d’une requête s’appuyant sur Cassandra et PostgreSQL

Les différentes approches. Syntaxe Spark-sql, Spark/SQl. APIs QL.
Utilisation du métastore Hive.
- Atelier : mise en oeuvre d’une requête s’appusant sur une table HBase et sur HDFS. Requêtage en spark-sql sur un fichier csv.

Utilisation d’APIs JDBC, ODBC. Indépendance Hadoop.
Contraintes d’utilisation. Performances.
- Atelier : lecture de fichiers Parquets dans du HDFS, jointures, connexion et requêtage sur une table Hbase.

Cette formation est accessible aux personnes en situation de handicap, nous contacter en cas de besoin d’informations complémentaires.

Programme mis à jour le 11 avril 2025

Prochaines sessions

Toutes les dates sont disponibles en distanciel.

Date de début

23 septembre 2025

Prix par personne HT

1 600 €

En présentiel ou distanciel

Date de début

7 octobre 2025

Prix par personne HT

1 600 €

En présentiel ou distanciel