Analyser des données d’épidémiologie avec le logiciel R
La durée, le lieu et le programme de la formation sont fixés selon vos besoins spécifiques.
- Public : Techniciens, ingénieurs ou chercheurs ayant des bases en statistique mais ne connaissant pas forcément le logiciel R. 12 stagiaires maximum.
- 2 ou 3 journées de 7h, en salle informatique (un poste par stagiaire).
- Lieu et dates à définir
Méthode pédagogique
L’intervenante se focalisera sur la prise en main du logiciel R grâce à l’interface RCommander, puis sur l’application des méthodes usuelles en statistique sur les jeux de données proposés par les stagiaires au préalable.
Objectifs
Rappeler les principes et conditions d’applications des méthodes statistiques usuelles,
Apporter aux stagiaires les bases pour être autonomes s’ils souhaitent continuer l’apprentissage de R afin de traiter des données épidémiologiques.
Proposition de programme
Rappels théoriques :
- Notions de bases en statistique : probabilité critique, puissance de test, etc.
- Modèle linéaire :
- Modèle de l’analyse de la variance
- Modèle de régression linéaire (simple et multiple)
- Modèle linéaire généralisé (régression logistique)
- Quel modèle pour expliquer et prédire une variable du type malade/sain ?
- Sélection du meilleur modèle
- Interpréter les critères RR et OR
- Taux d’erreurs, sensibilité et spécificité du modèle, courbes ROC
Appliquer les différentes étapes pour analyser des données expérimentales :
- Présentation du logiciel R et de l’interface RCommander
- Installer et charger un package
- Importer un jeu de données
- Quelques graphiques et analyses descriptives
- Applications de la méthodologie sur des jeux de données d’épidémiologie