Apprentissage par renforcement: une introduction et quelques résultats

Séminaire Probabilités et Statistiques

09
April 2026

Intervenant :	Erwan Le Pennec
Institution :	Ecole Polytechnique
Heure :	14h00 - 15h00
Lieu :	3L15

L'objectif de cet exposé est de présenter le cadre de l'apprentissage par renforcement: l'apprentissage d'une bonne stratégie de décisions (politique) dans des processus de décision markovien (MDP) observés uniquement à travers des interactions. Je commencerai par une introduction à ce problème en mettant l'accent sur l'apprentissage de ces politiques et je terminerai l'exposé en présentant une application au domaine de la santé de ce principe, une technique d'approximation permettant d'accélérer des algorithmes classiques ainsi qu'une extension destinée à apprendre des politiques robustes.

Ces travaux sont les résultats de collaborations avec Stéphanie Allassonière, Rémi Besson, Hind Castel, Pierre Clavier, Orso Forghieri, Matthieu Geist, Emmanuel Hyon et Frédéric Logé.

All (past and future) events