Analyse de données Exome-Seq : détection de variations ponctuelles

Ce cours vous permettra de réaliser les analyses somatiques de données de séquençage haut débit d’exomes avec l’outil Galaxy, et concerne l’analyse d’un couple de données tumorales / données constitutionnelles appariées. L’analyse d’exomes tumoraux sans données constitutionnelles appariées sont très différentes et les outils sont en cours d’élaboration.

Le tutoriel vous permettra de réaliser l’analyse de  en passant par les étapes suivantes :

  • Contrôle de la qualité des données brutes : comment utiliser des fichiers fastq dans Galaxy ?
  • Alignement des lectures et identification des duplicats : des lectures QC aux fichiers bruts BAM
  • Réalignements locaux et recalibration des scores de qualité : des fichiers bruts à des fichiers BAM prêts pour l’analyse
  • Appels de variants et visualisation : des fichiers BAM à des fichiers VCF puis IGV

Ce cours a été réalisé sur l’instance Galaxy publique de l’Institut Curie. Si vous participez à notre formation pratique en salle, vous pouvez y accéder via votre compte créé pour l’occasion. Pour suivre le tutoriel via une autre instance Galaxy, nous vous invitons à importer les données test fournies pour l’exercice via la fonctionnalité “get data”. Il vous sera également demandé d’avoir installé au préalable le logiciel IGV de visualisation de données génomiques.

Formateur : Elodie Girard et Romain Daveau, Institut Curie, INSERM U900, Mines ParisTech.

Durée : 22:53

À télécharger pour l’exercice :

 

Voir aussi…
Introduction à Galaxy Utilisation des bases de données 
– TCGA / ICGC (à venir)
cBioPortal
– ENCODE (à venir)
Visualisation de données génomiques
avec IGV
avec UCSC
© Cancéropôle Ile de France 2015