Ce cours vous permettra de réaliser les analyses somatiques de données de séquençage haut débit d’exomes avec l’outil Galaxy, et concerne l’analyse d’un couple de données tumorales / données constitutionnelles appariées. L’analyse d’exomes tumoraux sans données constitutionnelles appariées sont très différentes et les outils sont en cours d’élaboration.
Le tutoriel vous permettra de réaliser l’analyse en passant par les étapes suivantes :
- Contrôle de la qualité des données brutes : comment utiliser des fichiers fastq dans Galaxy ?
- Alignement des lectures et identification des duplicats : des lectures QC aux fichiers bruts BAM
- Réalignements locaux et recalibration des scores de qualité : des fichiers bruts à des fichiers BAM prêts pour l’analyse
- Appels de variants et visualisation : des fichiers BAM à des fichiers VCF puis IGV
Ce cours a été réalisé sur l’instance Galaxy publique de l’Institut Curie. Pour suivre le tutoriel via une autre instance Galaxy, nous vous invitons à importer les données test fournies pour l’exercice via la fonctionnalité “get data”. Il vous sera également demandé d’avoir installé au préalable le logiciel IGV de visualisation de données génomiques.
Formateur : Elodie Girard et Romain Daveau, Institut Curie, INSERM U900, Mines ParisTech.
Durée : 22:53
À télécharger pour l’exercice :
- Données test : .zip, 12,9 Mo
- Logiciel IGV : téléchargeable sur le site du développeur