Groupe de travail INTÉGRATION DE DONNÉES
Les grands centres hospitaliers, en particulier en oncologie, sont équipés d’entrepôts de données. La question du partage de ces données cliniques et omiques pour la recherche est aujourd’hui incontournable dans le domaine du cancer. Ce partage permet d’augmenter la puissance statistique des analyses, de travailler sur des événements rares et, à l’ère des méthodes statistiques et de l’intelligence artificielle, de valider des modèles construits avec les données d’un centre en les appliquant sur les données d’une institution différente, consolidant les conclusions.
En 2014, le groupe de travail Intégration de données a été constitué au Cancéropôle Île-de-France afin de travailler sur la meilleure façon de structurer l’accès à ces données pour les exploiter de manière intégrée et optimisée, et accélérer la recherche sur le cancer en faisant appel au Big Data.
De 2014 à 2017, le groupe de travail a permis le développement d’un environnement de logiciels pour la recherche translationnelle ainsi que d’un conteneur facilitant son installation, permettant aux centres l’utilisant d’interroger à distance l’ensemble des entrepôts de données du réseau. Sa mise en oeuvre à l’Institut Curie et à l’AP-HP, HEGP a permis de faire la preuve de concept de son efficacité pour faciliter la communication et le partage de données cliniques et omiques entre centres partenaires.
Depuis 2018, le groupe de travail a poursuivi son travail en s’intéressant aux liens entre les données des patients (génomiques et phénotypiques) et les données d’exposome. L’objectif du projet GEOCANCER est la mise en place d’un ensemble d’outils sur des serveurs sécurisés et spécifiques pour géocoder les données et permettre dans un second temps de corréler de manière géographique ces informations à des données environnementales. Ces outils seront mis à disposition de la communauté scientifique et pourront servir par exemple à la mise en place d’études sur les risques environnementaux de cancer.
Un partenariat noué avec Epidemium dans le cadre du projet GEOCANCER a permis le lancement, en septembre 2021, du challenge ODE, Open Data & Environnement dans le cadre de la saison 3 d’Epidemium. Ce programme d’exploration scientifique participatif et collaboratif a pour objectif la création d’une agrégation de jeux de données ouvertes, utiles et pertinentes pour la communauté scientifique dans la recherche sur le cancer.
COVID-19
Dans le contexte d’épidémie au coronavirus de 2020, les chercheurs impliqués sur le projet GEOCANCER travaillent à une transposition des solutions informatiques développées pour lutter contre l’épidémie.