-
Filière :
IA & Innovation
-
Sous-filière :
AI Modeling, tools & frameworks
-
Référence
DB-LRA
-
Durée
3 jours (21 h)
-
Prix par personne HT
1 800 € HT
Description
Advanced R course teaches students more sophisticated R skills, including using advanced regular expressions, machine learning, random effects modeling, Bayesian Inference, advanced R time series, and much more.
Objectifs pédagogiques
- Use advanced regular expressions in R
- Apply advanced missing data techniques
- Work with advanced R time series
- Use data.table for big data
- Work with linear models
- Extend R to time to event and survival analyses
- Work with Bayesian Inference using R
Public cible
- Architectes
- Consultants
- Consultants-informatiques
- Developpeurs
- Ingénieurs
- Professionnels-de-l’IT
Pré-requis
R Programming experience or R Programming course
Programme de la formation
Organiser son travail sous R
- Travailler en projet R : notion de working directory, workspace, history
- Architecture de son projet R : data, plots, images, scripts, etc..
- Bonnes pratiques pour la création de fichiers de données
- Importation et exportation de fichiers avec le package here
- Mettre à jour ses packages
- Mettre à jour R et R Studio
Manipuler facilement ses données avec le package dplyr
- Introduction au package tidyverse et à la notion de pipe
- Filtrer des lignes avec la fonction filter()
- Sélectionner des colonnes (variable) avec la fonction select()
- Création de nouvelles variables avec la fonction mutate()
- Renommer ses variable avec la fonction rename()
- Calcul de paramètres par sous groupes : fonctions group_by() et summarise()
- Passage du format wide au format long
Manipulation des variables catégorielles avec le package forecats
- Inspecter les variables catégorielles avec les fonctions levels(), fct_count et fct_unique
- Modifier l’ordre des modalités
- Modifier le nom des modalités
Manipuler les chaînes de caractères avec le package stringr
- Détection de patterns
- Découpage
- Gestion des longueurs
- Remplacement
Manipuler des données de date : utilisation du package lubridate
- Convertir les données au format YYYY-MM-DD et HH:MM:SS
- Décomposer les éléments d’année, de mois et de jour
- Calculer des différences de dates et les exprimer en jours, ou heure
Assemblage de tables
- Les différentes jointures (par colonne): left join, right join, inner join et full join
- Assemblage par lignes
Réaliser des représentations graphiques performantes avec le package ggplot2
- Le principe des couches successives de ggplot2
- Réalisation des graphiques de base : scatterplot, barplots, line plot, boxplots
- Gestion des couleurs, titres, axes et légendes
- Représentation des séries temporelles
- Utilisation du format long et facetting
- Ajouter du texte sur un graphique (ex : équation)
- Exporter son graphique : format et résolution
- Utilisation des addins esquisse et Colour Picker
Générer dynamiquement son rapport d’analyse avec rmarkdown
- Principe, formats de sorties (html, docx, pdf)
- Les différents éléments d’un fichier Rmd : en-tête, chunk, etc…
- Gestion des éléments de texte : gras, italique, titre
- Gestion des tables
- Gestion des images
- Gestion des graphiques
- Les options des éléments de code
- Table des matières et numérotation
- Les rapports paramétrés : automatisation des rapports d’analyse par sous groupe
- Deployer son document sur Rpubs ou bookdown
Introduction à la programmation fonctionnelle avec le package purrr
- Les list
- Les fonctions map()
- Nested data
Qualité
Cette formation est accessible aux personnes en situation de handicap, nous contacter en cas de besoin d’informations complémentaires.
Programme mis à jour le