STATA

Maîtriser l'outil d'analyse statistique STATA

  • Filière :

    Gestion de données

  • Sous-filière :

    NoSql & Big Data

  • Référence

    STATA

  • Durée

    3 jours (21 h)

  • Prix par personne HT

    1 900 € HT

Description

STATA est un outil d’analyse statistique offrant un environnement de travail convivial et permettant de réaliser aussi bien des analyses statistiques que des représentations graphiques complexes des données.

Objectifs pédagogiques

  • Découvrir l’environnement STATA
  • Appliquer quelques principales analyses statistiques
  • Apprendre à interpréter les résultats des analyses
  • Répondre aux questions spécifiques

Public cible

  • Data Analysts
  • Data Managers
  • Data Scientist
  • Data Warehouse Administrators
  • Data Warehouse Developers

Pré-requis

Avoir de l’expérience en Data Analyse avec R ou Python

Programme de la formation

Présentation du logiciel

  • L’environnement de Stata
  • Les différents types de fichier
  • Organiser le travail sur Stata
    • Structurer les répertoires
    • Sauvegarder le travail avec les do-files
  • Où trouver de l’aide ?

Gérer une base de données

  • Ouvrir, importer et sauvegarder une base de données
  • Analyser et modifier la structure d’une base de données
    • Visualiser et éditer le jeu de données : browse et edit
    • Décrire les variables et leur contenu
    • Réorganiser les observations : sort et gsort
    • Formats wide et long et transposition des données : reshape
    • Transformer la base : collapse
    • Tronquer la base : keep et drop
  • Gérer plusieurs bases de données
    • Empiler des bases de données : append
    • Apparier des bases de données : merge
  • Gérer les variables et leur contenu
    • Supprimer des variables : keep et drop
    • Créer de nouvelles variables : gen et egen
    • Modifier les variables existantes
    • Changer l’ordre d’apparition des variables dans la base : order

Explorer les données

  • Statistiques descriptives
    • Résumer les variables numériques : summarize
    • Résumer les variables textuelles : tabulate et table
  • Analyser les données
    • Corrélation entre les variables et alpha de Cronbach : correlate, pwcorr et alpha
    • Tests de comparaison : ttest
    • Analyse en Composante Principale (ACP) : pca
  • Graphiques
    • Graphiques unidimensionnels : graph
    • Graphiques bi-dimensionnels : twoway
    • Sauvegarder ses graphiques : graph save et graph export

Econométrie

  • Régression linéaire (MCO)
    • La commande regress
    • Gérer les variables indicatrices dans les régressions
  • Modélisation des variables qualitatives dichotomiques : logit et probit
  • Commandes post-estimation : predict et test
  • Stocker et exporter les résultats

Qualité

Cette formation est accessible aux personnes en situation de handicap, nous contacter en cas de besoin d’informations complémentaires.

Programme mis à jour le