Thèse Probabilités et statistiques

Multiple instance learning pour l'analyse de données de cytométrie appliquée à la détection de cellules tumorales

22
June 2026
logo_team
Intervenant : Pierre-André MIKEM
Directeur : Pascal MASSART Directeur : Christine KERIBIN
Heure : 14h00
Lieu : 3L15

Les technologies biomédicales modernes permettent d’observer les systèmes biologiques avec un niveau de détail sans précédent. En cytométrie en flux, des millions de cellules sont mesurées individuellement, chacune étant décrite par un ensemble de variables biologiques. Pourtant, les décisions cliniques ne sont pas prises au niveau des cellules, mais au niveau des patients. Cet écart entre des observations fines et des décisions globales soulève une question fondamentale : comment les différentes caractéristiques des cellules peuvent-elles être traduites en informations cliniques pertinentes ? L’une des principales difficultés réside dans le fait que les signaux pathologiques sont souvent subtils et portés par de petits sous-ensembles de cellules, sans annotations fiables. Dans ce contexte, le cadre du Multiple Instance Learning offre une manière naturelle de modéliser ces données, en représentant chaque patient comme un ensemble d’observations et en apprenant à partir d’étiquettes globales. Au-delà de ce cadre spécifique, ce travail met en lumière un paradigme plus large : l’apprentissage à partir de données structurées et distributionnelles. En interprétant les patients comme des distributions de cellules, il devient possible de capturer une variabilité complexe et d’identifier des motifs significatifs qui resteraient invisibles avec des approches traditionnelles. Ces idées ouvrent de nouvelles perspectives pour l’apprentissage automatique dans des applications où les données peuvent être hétérogènes, faiblement annotées et structurées à plusieurs échelles.

All (past and future) events