Skip to content

Abson-dev/Projet-statistique-sous-R

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

646 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

Projet-statistique-sous-R

Le cours de Projet Statistique sous R et Python est dispense par Mr Hema Aboubacar, Analyste de Recherche a IFPRI depuis 2022 aux etudiants de l'ENSAE - Dakar. Ce cours a pour but de permettre aux etudiant.e.s de maitriser l'exploration des donnees (EDA) avec R a savoir les etapes suivantes:

1 - Comprendre le probleme

 - Quel est l'objectif?
 - Quelles sont les variables clees/importantes
 - Y a t-il des contraintes specifiques?

2 - Chargement des donnees

 - Lecture du fichier (CSV, dta, Excel, SPSS, SQL, etc)
 - Apercu des premieres lignes
 - Verification de la dimension de la base
 - Informations generales sur les colonnes/variables

3 - Verification de la qualite des donnees

 - Valeurs manquantes
 - Doublons
 - Types de donnees
 - Detection de valeurs aberrantes (Boxplot, IQR, Z-score)

4 - Analyse univariee

5 - Analyse bivariee

6 - Traitement des variables

7 - Detection des valeurs aberrantes et anomalies/incoherence

8 - Gestion des valeurs manquantes

9 - Verification de la base finale

10 - Modelisation/Econometrie/etc

Encours de redaction

Data Credits

TP 1

Important: Il ne faut pas importer les donnees dans le compte github.

TP 2

TP 3

A partir de Rmarkdown, reproduisez les rapports suivants:

TP 4

En utilisant les enquetes EHCVM 2019 des pays de l'UEMOA, proposez une harmisation de ces bases de donnees au niveau administratif le plus fin (communes par exemple). Le decoupage administratif a utilise est soit HDX ou geoBoundaries

TP 5

Pour chacune des bases EHCVM 2021/2022, il faut:

  • Sortir les statistiques descriptives ;
  • Faire la jointure avec la base ménage;
  • Sortir des stats compte tenu de la jointure;
  • Sortir des résultats avec et sans poids

Important: Le TP est a faire sur Rmarkdown et l'utilisation du package gtsummary est recommande.

TP 6

Pour chacune des bases EHCVM 2018/2019, il faut:

  • Sortir les statistiques descriptives ;
  • Faire la jointure avec la base ménage;
  • Sortir des stats compte tenu de la jointure;
  • Sortir des résultats avec et sans poids

Important: Le TP est a faire sur Rmarkdown et l'utilisation du package gtsummary est recommande.

TP 7

ISEP 3

Structurer le TP 4 sous forme de livre en ligne en utilisant bookdown. Vous devriez avoir un seul lien qui regroupe toutes les etapes d'harmonisation des bases des donnees des differents pays.

Bon courage!

TP 8

Pour les ISE 1

Cartographie avec R

En utilisant les outputs du TP 4, faites des cartes en affichant des variables/indicateurs suivant:

  • les pays
  • les regions/le 1er decoupage administratif du pays
  • les departements/le 2e decoupage administratif du pays
  • les communes/le 3e decoupage administratif du pays

Echeance: lundi 10 mars 2025 a 23h59

TP 9

Pour les ISE 1 et ISEP 3

Ce TP consiste a merger les bases welfare des EHCVM 2018 ET 2021 en une seule base.

Echeance: lundi 31 mars 2025 a 23h59

TP 10

Thème 1 : Application de l'Intelligence Artificielle (IA) avec R

Thème 2 : Pratique des enquêtes avec R - High-Frequency-Checks-R

Thème 3 : Reproduire un livre à l'aide de R

Thème 4 : Suivi de la collecte des données avec R

Thème 5 : Développement d'un package sur R : Cas du package sdmApp

Thème 6 : Calcul parallèle

Thème 7 : Traitement de données avec le package tidyverse

Thème 8 : Le package janitor

Thème 9 : Tableaux avec gtsummary

Thème 10 : Le package reticulate: R et Python

Thème 11 : Développement de package sur R

Thème 12 : Questionnaire d'enquête avec R

Thème 13 : Automatisation des rapports avec R : le package rmarkdown

Thème 14 : Tableaux de bord avec R shiny

Thème 15 : Traitement des questions ouvertes: text mining

Presentation: samedi 5 avril 2025

TP 11 : Synthese des presentations

Chacun.e fera une synthese des differentes presentations

TP 12 : Examen de 4 a 5h sur table avec les ordinateurs pour les ISE 1 et ISEP 3

Vous aurez 4 a 5h pour faire votre examen final sur table avec les ordinateurs. L'utilisation de ChatGPT, Gimini ou toute IA qui vous sera utile.

License

This course material is licensed under a Creative Commons Attribution 4.0 International (CC BY 4.0). You are free to re-use and adapt the material but are required to give appropriate credit to the original author as below:

References

Additional resources

About

No description, website, or topics provided.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

 
 
 

Contributors

Languages