Modèles statistiques pour l’étude de données longitudinales (avec un biais riemannien assumé)

Mardi 2 juin 15:00-16:00 - Juliette Chevallier - INRIA Sophia Antipolis, Nice

Résumé : Par delà les études transversales, étudier l’évolution temporelle de phénomènes connait un intérêt croissant. En effet, pour comprendre un phénomène, il semble plus adapté de comparer l’évolution des marqueurs de celui-ci au cours du temps plutôt que ceux-ci à un stade donné. Le suivi de maladies neuro-dégénératives s’effectue par exemple par le suivi de scores cognitifs au cours du temps. C’est également le cas pour le suivi de chimiothérapie : plus que par l’aspect ou le volume des tumeurs, les oncologues jugent que le traitement engagé est efficace dès lors qu’il induit une diminution du volume tumoral. L’étude de données longitudinales n’est pas cantonnée aux applications médicales et s’avère fructueuse dans des cadres d’applications variés tels que la vision par ordinateur, la détection automatique d’émotions sur un visage, les sciences sociales, etc.
Nous proposons dans cet exposé de passer en revue quelques méthodes classiques pour l’étude de données longitudinales, et plus particulièrement dans le cas de données à valeurs sur des variétés riemanniennes. En effet, nous avons à coeur de montrer la force des études longitudinales dans le cas d’applications médicales, pour lesquelles la géométrie riemannienne se révèle un cadre d’étude tout adapté (et nous expliquerons très brièvement pourquoi). Toutefois, dès lors que les données que l’on souhaite étudier deviennent trop complexes ou trop hétérogènes, les contraintes inhérentes à la structure mathématique forte du cadre riemannien vont le rendre inopérant.
Des travaux récents suggèrent le recours au machine learning pour permettre de réduire la dimension de l’espace considéré. Notamment, les auto-encodeurs variationnels (VAE en anglais) ont d’ores et déjà montré leur force pour le traitement de données longitudinales issus du monde médical. Nous proposons donc une brève introduction aux VAE (et nous espérons ne pas faire fuir le mathématicien fondamental moyen du fait de cette introduction au deep learning !) afin de pouvoir présenter quelques retombées récentes dues à la démocratisation de leur usage.

Lieu : https://greenlight.lal.cloud.math.cnrs.fr/b/ngo-gez-aaq

Modèles statistiques pour l’étude de données longitudinales (avec un biais riemannien assumé)  Version PDF