Médecine de précision avec données longitudinales
Responsable(s) coordinateur(s) du projet : Stéphanie Allassonnière, Agathe Guilloux
Établissement coordinateur : Inria
Médecine de précision, données longitudinales, modèles statistiques, apprentissage automatique, apprentissage profond, statistiques bayésiennes
Les données longitudinales sont essentielles pour comprendre la progression des maladies chroniques. Elles consistent en des observations répétées des patients dans le temps. Leur analyse ouvre de nouvelles perspectives pour mieux comprendre l’histoire naturelle d’une maladie mais également pour obtenir un diagnostic plus précoce, un pronostic plus précis, ou prédire la réponse aux traitements ou la survenue d’événements indésirables. Ces données présentent différentes caractéristiques qui doivent être prises en compte : elles ont des modalités très différentes (depuis des images d’organes jusqu’aux parcours des patients), des dépendances temporelles, elles présentent des rythmes d’acquisition différents suivant les patients.
Ce projet se concentrera sur le développement de nouvelles approches mathématiques et statistiques pour l’analyse de données longitudinales. Il proposera des modèles, puis développera les algorithmes. Ces outils innovants seront enfin transférés sur une plateforme facile à utiliser et bien documentée qui permettra à des chercheurs de diverses communautés, en particulier des médecins, d’analyser leurs données.
- Un premier module de travail (WP1) sera consacré aux modèles pour les temps de survenue d’évènements. Les méthodes existantes sont souvent confrontées à une ou plusieurs limitations : les algorithmes demandent de longs temps de calcul, ne permettent pas toujours de considérer de nombreuses variables, exigent des hypothèses fortes sur le lien entre les variables explicatives et l’intensité de survenue des événements. Ce module vise à proposer de nouveaux modèles de prédiction pour la médecine personnalisée. Ces modèles de prédiction intègreront des mesures répétées (éventuellement intensives) d’expositions multiples et/ou de (bio)marqueurs, pour prédire des événements de santé complexes. Les modèles longitudinaux peuvent également inclure des dépendances spatiales ou plus généralement des informations multimodales avec des structures complexes.
- Le second module (WP2) visera à développer des modèles spatiotemporels (ST) avancés et des outils d’IA pour extraire un ensemble de caractéristiques ST pouvant être associées soit à des effets secondaires post-traitement, soit aux réponses au traitement ou à la progression naturelle de la maladie. Cela pourrait également contribuer à améliorer nos connaissances sur la sensibilité des patients au niveau individuel.
Les modèles proposés dans les WP1 et 2 peuvent souffrir de deux problèmes : le manque de données pour permettre pleinement l’estimation des paramètres et leur pertinence par rapport à une question clinique.
- Le groupe de travail 3 (WP3) proposera de nouveaux critères de sélection de modèles pour les modèles longitudinaux. Un deuxième aspect de ce module sera de travailler dans le cadre bayésien pour permettre l’intégration des connaissances a priori.
- Le groupe de travail 4 (WP4) cherchera à développer des modèles de Deep Learning interprétables pour combiner des approches basées sur des données et des modèles afin d’apprendre des paramètres permettant l’interprétation des ressorts de la progression de la maladie. Un accent particulier sera mis sur l’utilisation d’architectures d’auto-encodeurs pour l’apprentissage de représentations compactes de la dynamique régissant les relations spatio-temporelles.
Les modèles résultants et leur mise en œuvre minutieuse devraient permettre le développement d’une nouvelle génération de systèmes d’aide à la décision, qui aideront les cliniciens au chevet du patient à prendre des décisions plus éclairées. Ils devraient ainsi contribuer au développement de la médecine de précision dans plusieurs domaines clés.
Unité | Tutelles |
CRC – U 1138 Eq HEKA | Inserm, Inria, Sorbonne Université, Université Paris Cité
CHU Pitié-Salpêtrière |
LJK – UMR5224, Eq STATIFY | Université Grenoble Alpes, CNRS, Grenoble INP
Inria partenaire |
ICM U 1127 – UMR7225 – Eq ARAMIS | Inserm, Inria, CNRS, Sorbonne Université, APHP |
Centre Inria Côte d’Azur, Eq EPIONE | Inria, Université Côte d’Azur, Chaire 3IA |
LBBE – UMR CNRS 5558 | CNRS, Université Lyon 1, VetAgro Sup
Inria, Inserm, HCL partenaires |
LPSM – UMR CNRS 8001 | CNRS, Sorbonne Université, Université Paris Cité |
TIMC – IMAG- UMR 5525 | CNRS, UGA, VetAgro Sup,
Grenoble INP Partenaire |
BPH – U1219, Eq Biostatistique & CIC 1401 | Inserm, Université de Bordeaux,
ISPED, CHU Bordeaux Partenaires |