Accueil > Formations > Formation “Analyse de données cliniques avec R” – niveau débutant

Formation “Analyse de données cliniques avec R” – niveau débutant

Dans le cadre de ses missions, le Cancéropôle Île-de-France organise une formation en statistique dédiée à l’analyse de données cliniques avec le logiciel R Studio. 

Objectifs : analyse de données cliniques avec le logiciel R Studio, niveau débutant.

Public concerné : chercheurs en recherche fondamentale, translationnelle ou clinique académiques FRANCILIENS impliqués dans un ou plusieurs projets de recherche en cancérologie.

Remarque : cette formation concerne l’analyse de données cliniques uniquement, l’analyse de données NGS avec R Studio sera abordée lors des formations NGS & Cancer “Analyses DNA-Seq”, “Analyses RNA-Seq” et “Analyses épigénomique”.

 

Prochaine session : jeudi 7 et vendredi 8 juin 2018.

Inscriptions en ligne gratuites mais obligatoire. Nombre de places limité !

La participation à la formation complète (2 jours) est obligatoire. Une convention de formation devra être signée par votre organisme d’appartenance avant votre participation à la formation. Les frais de formation sont pris en charge par le Cancéropôle IDF.

Objectifs

Maîtriser :

  • les procédures d’aggrégation de données biomédicales,
  • les principales commandes graphiques,
  • les procédures de tests et les modèles statistiques courants.

Les illustrations seront réalisées avec le logiciel R Studio. Les participants pourront travailler sur leurs données.

Formation de niveau débutant, s’adressant aux personnes découvrant le logiciel R Studio. Aucun prérequis n’est nécessaire.

Programme

Gestion des données avec R :

  • représentation et gestion de variables statistiques,
  • manipulation d’un tableau de données,
  • sélection d’observation et de variable,
  • transformation de variables numériques et annotation de variables catégorielles,
  • gestion d’un dictionnaire de données

Statistiques descriptives :

  • résumé numérique de la distribution d’une variable numérique à l’aide d’indicateurs de tendance centrale et de dispersion,
  • indices de symétrie et d’aplatissement d’une distribution,
  • tableau d’effectifs et de fréquences pour une variable catégorielle

Représentations graphiques simples :

  • histogramme d’effectif ou de proportion,
  • courbe de densité,
  • diagramme en barres ou en points,
  • diagramme de type boîte à moustaches,
  • diagramme de dispersion

Représentations graphiques avancées :

  • diagramme de dispersion et courbe loess,
  • graphiques en treillis (graphiques conditionnels avec 1 ou 2 variables illustratives),
  • courbe de densité 2D,
  • gestion et personnalisation des paramètres graphiques ggplot (échelle, transformation, palette de couleur, thème graphique)

Mesures d’association pour deux échantillons indépendants

  • odds-ratio,
  • différence standardisée de moyennes,
  • coefficient de corrélation

Tests paramétriques pour le croisement de deux variables

  • comparaison de moyennes ou de proportions pour deux échantillons indépendants ou non,
  • analyse d’un tableau de contingence

Tests non-paramétriques et tests exacts pour le croisement de deux variables

Calcul du nombre de sujets nécessaires (cas des moyennes et des proportions)

Analyse de variance à un facteur et tests multiples a posteriori

Régression linéaire simple et multiple :

  • construction d’un modèle,
  • interprétation des coefficients de régression,
  • diagnostic du modèle et analyse des résidus,
  • transformation des prédicteurs

 

Inscription
© Cancéropôle Ile de France 2016