Thèse Probabilités et statistiques

Modélisation des données de cytométrie et classification non supervisée en dimension modérée sous l’hypothèse de structure d’indépendance

01
déc. 2022
logo_team
Intervenant : PUJOL Louis
Directeur : GLISSE Marc Directeur : MASSART Pascal
Heure : 15h00
Lieu : Amphithéâtre Yoccoz
L'objet de cette thèse est l'étude et la mise en œuvre de méthodes de segmentation automatique pour des données de cytométrie en flux.
La cytométrie en flux est une technique permettant de mesurer la présence de protéines à la surface d'une cellule. Lorsque on applique un procédé de cytométrie en flux sur un échantillon (sanguin par exemple), on obtient alors un jeu de données dont le nombre d'individus est compris entre la dizaine de milliers et la dizaine de million et le nombre d'attributs est de l'ordre de la dizaine. L'objectif biologique est de segmenter ces données pour identifier des populations cellulaires à l'aide de ces mesures.
La segmentation automatique (clustering en anglais) est une problématique classique en apprentissage machine non supervisé. Dans cette thèse, nous étudions en particulier les algorithmes qui ont été proposés dans le cadre de la cytométrie en flux et nous proposons de nouvelles méthodes, basées sur une technique originale d'estimation de densité.
Voir tous les événements