Séminaire Probabilités et Statistiques
Optimisation dans les processus de décision markoviens : au-delà des espérances
15
May 2025
logo_team
Intervenant : Aurélien Garivier
Institution : ENS Lyon
Heure : 15h30 - 16h30
Lieu : 3L15

Les équations de Bellman permettent d'optimiser l'espérance de l'utilité dans les processus de décision markoviens. Mais comment faire si l'on souhaite optimiser d'autres fonctionnelles de l'utilité, par exemple pour des raisons de gestion des risques ? L'apprentissage distributionnel peut représenter un espoir intéressant, dans la mesure où il permet de garder une trace non seulement du comportement moyen, mais de l'ensemble de la distribution. On s'efforcera dans cet exposé de cerner quelles sont les fonctionnelles de l'utilité qui sont optimisables par programmation dynamique, et d'illustrer dans quelle mesure celles-ci répondent à la problématique de gestion des risques.

All (past and future) events