Advanced R Programming : Work efficiently with R

  • Filière :

    IA & Innovation

  • Sous-filière :

    AI Modeling, tools & frameworks

  • Référence

    DB-LRA

  • Durée

    3 jours (21 h)

  • Prix unitaire HT

    1 800 € HT

Description

Advanced R course teaches students more sophisticated R skills, including using advanced regular expressions, machine learning, random effects modeling, Bayesian Inference, advanced R time series, and much more.

Objectifs pédagogiques

  • Use advanced regular expressions in R
  • Apply advanced missing data techniques
  • Work with advanced R time series
  • Use data.table for big data
  • Work with linear models
  • Extend R to time to event and survival analyses
  • Work with Bayesian Inference using R

Public cible

  • Architectes
  • Consultants
  • Consultants-informatiques
  • Developpeurs
  • Ingénieurs
  • Professionnels-de-l’IT

Pré-requis

R Programming experience or R Programming course

Programme de la formation

Organiser son travail sous R

  • Travailler en projet R : notion de working directory, workspace, history
  • Architecture de son projet R : data, plots, images, scripts, etc..
  • Bonnes pratiques pour la création de fichiers de données
  • Importation et exportation de fichiers avec le package here
  • Mettre à jour ses packages
  • Mettre à jour R et R Studio

Manipuler facilement ses données avec le package dplyr

  • Introduction au package tidyverse et à la notion de pipe
  • Filtrer des lignes avec la fonction filter()
  • Sélectionner des colonnes (variable) avec la fonction select()
  • Création de nouvelles variables avec la fonction mutate()
  • Renommer ses variable avec la fonction rename()
  • Calcul de paramètres par sous groupes : fonctions group_by() et summarise()
  • Passage du format wide au format long

Manipulation des variables catégorielles avec le package forecats

  • Inspecter les variables catégorielles avec les fonctions levels(), fct_count et fct_unique
  • Modifier l’ordre des modalités
  • Modifier le nom des modalités

Manipuler les chaînes de caractères avec le package stringr

  • Détection de patterns
  • Découpage
  • Gestion des longueurs
  • Remplacement

Manipuler des données de date : utilisation du package lubridate

  • Convertir les données au format YYYY-MM-DD et HH:MM:SS
  • Décomposer les éléments d’année, de mois et de jour
  • Calculer des différences de dates et les exprimer en jours, ou heure

Assemblage de tables

  • Les différentes jointures (par colonne): left join, right join, inner join et full join
  • Assemblage par lignes

Réaliser des représentations graphiques performantes avec le package ggplot2

  • Le principe des couches successives de ggplot2
  • Réalisation des graphiques de base : scatterplot, barplots, line plot, boxplots
  • Gestion des couleurs, titres, axes et légendes
  • Représentation des séries temporelles
  • Utilisation du format long et facetting
  • Ajouter du texte sur un graphique (ex : équation)
  • Exporter son graphique : format et résolution
  • Utilisation des addins esquisse et Colour Picker

Générer dynamiquement son rapport d’analyse avec rmarkdown

  • Principe, formats de sorties (html, docx, pdf)
  • Les différents éléments d’un fichier Rmd : en-tête, chunk, etc…
  • Gestion des éléments de texte : gras, italique, titre
  • Gestion des tables
  • Gestion des images
  • Gestion des graphiques
  • Les options des éléments de code
  • Table des matières et numérotation
  • Les rapports paramétrés : automatisation des rapports d’analyse par sous groupe
  • Deployer son document sur Rpubs ou bookdown

Introduction à la programmation fonctionnelle avec le package purrr

  • Les list
  • Les fonctions map()
  • Nested data

Qualité

Cette formation est accessible aux personnes en situation de handicap, nous contacter en cas de besoin d’informations complémentaires.

Programme mis à jour le