Séminaire Probabilités et Statistiques
Optimisation dans les processus de décision markoviens : au-delà des espérances
15
May 2025
May 2025
Intervenant : | Aurélien Garivier |
Institution : | ENS Lyon |
Heure : | 15h30 - 16h30 |
Lieu : | 3L15 |
Les équations de Bellman permettent d'optimiser l'espérance de l'utilité dans les processus de décision markoviens. Mais comment faire si l'on souhaite optimiser d'autres fonctionnelles de l'utilité, par exemple pour des raisons de gestion des risques ? L'apprentissage distributionnel peut représenter un espoir intéressant, dans la mesure où il permet de garder une trace non seulement du comportement moyen, mais de l'ensemble de la distribution. On s'efforcera dans cet exposé de cerner quelles sont les fonctionnelles de l'utilité qui sont optimisables par programmation dynamique, et d'illustrer dans quelle mesure celles-ci répondent à la problématique de gestion des risques.