-
Filière :
Gestion de données
-
Sous-filière :
NoSql & Big Data
-
Référence
STATA
-
Durée
3 jours (21 h)
-
Prix par personne HT
1 900 € HT
Description
STATA est un outil d’analyse statistique offrant un environnement de travail convivial et permettant de réaliser aussi bien des analyses statistiques que des représentations graphiques complexes des données.
Objectifs pédagogiques
- Découvrir l’environnement STATA
- Appliquer quelques principales analyses statistiques
- Apprendre à interpréter les résultats des analyses
- Répondre aux questions spécifiques
Public cible
- Data Analysts
- Data Managers
- Data Scientist
- Data Warehouse Administrators
- Data Warehouse Developers
Pré-requis
Avoir de l’expérience en Data Analyse avec R ou Python
Programme de la formation
Présentation du logiciel
- L’environnement de Stata
- Les différents types de fichier
- Organiser le travail sur Stata
- Structurer les répertoires
- Sauvegarder le travail avec les do-files
- Où trouver de l’aide ?
Gérer une base de données
- Ouvrir, importer et sauvegarder une base de données
- Analyser et modifier la structure d’une base de données
- Visualiser et éditer le jeu de données : browse et edit
- Décrire les variables et leur contenu
- Réorganiser les observations : sort et gsort
- Formats wide et long et transposition des données : reshape
- Transformer la base : collapse
- Tronquer la base : keep et drop
- Gérer plusieurs bases de données
- Empiler des bases de données : append
- Apparier des bases de données : merge
- Gérer les variables et leur contenu
-
- Supprimer des variables : keep et drop
- Créer de nouvelles variables : gen et egen
- Modifier les variables existantes
- Changer l’ordre d’apparition des variables dans la base : order
Explorer les données
- Statistiques descriptives
-
- Résumer les variables numériques : summarize
- Résumer les variables textuelles : tabulate et table
- Analyser les données
-
- Corrélation entre les variables et alpha de Cronbach : correlate, pwcorr et alpha
- Tests de comparaison : ttest
- Analyse en Composante Principale (ACP) : pca
- Graphiques
-
- Graphiques unidimensionnels : graph
- Graphiques bi-dimensionnels : twoway
- Sauvegarder ses graphiques : graph save et graph export
Econométrie
- Régression linéaire (MCO)
- La commande regress
- Gérer les variables indicatrices dans les régressions
- Modélisation des variables qualitatives dichotomiques : logit et probit
- Commandes post-estimation : predict et test
- Stocker et exporter les résultats
Qualité
Cette formation est accessible aux personnes en situation de handicap, nous contacter en cas de besoin d’informations complémentaires.
Programme mis à jour le