Formation “Analyse de données cliniques avec R” – niveau débutant

 

Dans le cadre de ses missions, le Cancéropôle Île-de-France organise une formation en statistique dédiée à l’analyse de données cliniques avec le logiciel R Studio. 

Objectifs : analyse de données cliniques avec le logiciel R Studio, niveau débutant.

Public concerné : chercheurs en recherche fondamentale, translationnelle ou clinique académiques FRANCILIENS impliqués dans un ou plusieurs projets de recherche clinique ou médicale en cancérologie.

Prochaine session : LUNDI 3 & MARDI 4 JUIN 2019

La participation à la formation complète (2 jours) est obligatoire. Une convention de formation devra être signée par votre organisme d’appartenance avant votre participation à la formation. 

Les frais de formation sont pris en charge par le Cancéropôle IDF.

M’INSCRIRE

 

La formation

Cette formation concerne l’analyse de données cliniques et médicales uniquement, l’analyse de données NGS avec R Studio sera abordée lors des formations NGS & Cancer “Analyses DNA-Seq”, “Analyses RNA-Seq” et “Analyses épigénomique”.

Formation de niveau débutant, s’adressant aux personnes découvrant le logiciel R Studio.

Pré-requis : probabilités élémentaires (discrètes et continues), statistiques de base (moyenne, médiane, variance, quantiles, principe du test sous l’hypothèse nulle, distribution d’échantillonnage), modalités de recueil des données cliniques et épidémiologiques

Objectifs

Maîtriser:

  • la gestion d’une base de données biomédicales (recodage et manipulation des variables)
  • les procédures d’aggrégation de données
  • les principales commandes graphiques
  • les procédures pour la comparaison de deux moyennes ou de proportions (tests paramétriques et non-paramétriques)

Les illustrations seront réalisées avec le logiciel R Studio. Les participants pourront travailler sur leurs données.

Programme

  • Gestion des données avec R : représentation et gestion de variables statistiques, manipulation d’un tableau de données, sélection d’observation et de variable, transformation de variables numériques et annotation de variables catégorielles
  • Représentations graphiques simples : histogramme d’effectif ou de proportion, courbe de densité, diagramme en barres, boîte à moustaches, diagramme de dispersion
  • Personnalisation des représentations graphiques : couleur, échelles, légendes
  • Statistiques descriptives : résumé numérique de la distribution d’une variable numérique à l’aide d’indicateurs de tendance centrale et de dispersion, indices de symétrie et d’aplatissement d’une distribution, tableau d’effectifs et de fréquences pour une variable catégorielle
  • Mesures d’association pour deux échantillons indépendants (odds-ratio, différence standardisée de moyennes, coefficient de corrélation)
  • Intervalles de confiance, taille d’effet, puissance statistique et calcul du nombre de sujets nécessaires (cas des moyennes et des proportions)
  • Tests paramétriques pour le croisement de deux variables (comparaison de moyennes ou de proportions pour deux échantillons indépendants ou non, analyse d’un tableau de contingence)
  • Tests non-paramétriques et tests exacts pour le croisement de deux variables

 

> Retrouvez les résultats du questionnaire d’évaluation pour la formation des 6 et 7 décembre 2018 !

Formation “Analyse de données cliniques avec R” – niveau intermédiaire

Dans le cadre de ses missions, le Cancéropôle Île-de-France organise une formation en statistique dédiée à l’analyse de données cliniques avec le logiciel R Studio. 

Objectifs : analyse de données cliniques avec le logiciel R Studio, niveau intermédiaire.

Public concerné : chercheurs en recherche fondamentale, translationnelle ou clinique académiques FRANCILIENS impliqués dans un ou plusieurs projets de recherche clinique ou médicale en cancérologie.

 

Prochaine session : LUNDI 17 & MARDI 18 JUIN 2019

La participation à la formation complète (2 jours) est obligatoire. Une convention de formation devra être signée par votre organisme d’appartenance avant votre participation à la formation. 

Les frais de formation sont pris en charge par le Cancéropôle IDF.

M’INSCRIRE

La formation

Cette formation concerne l’analyse de données cliniques et médicales uniquement, l’analyse de données NGS avec R Studio sera abordée lors des formations NGS & Cancer “Analyses DNA-Seq”, “Analyses RNA-Seq” et “Analyses épigénomique”.

Formation de niveau intermédiaire, s’adressant aux personnes qui utilisent déjà le logiciel R Studio.

Pré-requis : connaissances en Rstudio, probabilités élémentaires, statistiques de base, modalités de recueil des données cliniques et épidémiologiques, analyse de variance à un et deux facteurs et régression linéaire simple

Objectifs

Compléter l’apprentissage du logiciel R et des principales commandes graphiques

Maîtriser:

  • les modèles statistiques d’analyse de la variance et de régression linéaire simple et multiple.
  • les procédures en R pour validation et de comparaison de modèles

Les illustrations seront réalisées avec le logiciel R Studio. Les participants pourront travailler sur leurs données.

Programme

  • Rappels de gestion des données avec R : manipulation d’un tableau de données, sélection d’observation et de variable, transformation de variables numériques et annotation de variables catégorielles
  • ANOVA à un facteur, notion d’interaction et ANOVA à plusieurs facteurs
  • Représentations graphiques pour l’ANOVA à un facteur : validation graphique des pré-requis, graphiques en treillis (graphiques conditionnels avec 1 ou 2 variables illustratives), gestion et personnalisation des paramètres graphiques
  • Tests a posteriori et procédures de comparaisons multiples (contrôle du FWER et du FDR)
  • Interprétation des sorties de R, tailles d’effet, puissance statistique et calcul du nombre de sujets nécessaires
  • Analyse de variance et plans d’expérience : plans factoriels et méthode des blocs, plans fractionnaires
  • Régression linéaire simple et multiple, ré-interprétation des modèles d’ANOVA
  • Représentations graphiques pour la régression : diagramme de dispersion et courbe loess, graphiques en treillis, courbe de densité 2D, gestion et personnalisation des paramètres graphiques
  • Interprétation des sorties de R pour la régression simple et multiple
  • Diagnostic du modèle et analyse des résidus, transformation de variables