April 2026
| Intervenant : | Erwan Le Pennec |
| Institution : | Ecole Polytechnique |
| Heure : | 14h00 - 15h00 |
| Lieu : | 3L15 |
L'objectif de cet exposé est de présenter le cadre de l'apprentissage par renforcement: l'apprentissage d'une bonne stratégie de décisions (politique) dans des processus de décision markovien (MDP) observés uniquement à travers des interactions. Je commencerai par une introduction à ce problème en mettant l'accent sur l'apprentissage de ces politiques et je terminerai l'exposé en présentant une application au domaine de la santé de ce principe, une technique d'approximation permettant d'accélérer des algorithmes classiques ainsi qu'une extension destinée à apprendre des politiques robustes.
Ces travaux sont les résultats de collaborations avec Stéphanie Allassonière, Rémi Besson, Hind Castel, Pierre Clavier, Orso Forghieri, Matthieu Geist, Emmanuel Hyon et Frédéric Logé.