Optimisation dans les processus de décision markoviens : au-delà des espérances

Séminaire Probabilités et Statistiques

15
May 2025

Intervenant :	Aurélien Garivier
Institution :	ENS Lyon
Heure :	15h30 - 16h30
Lieu :	3L15

Les équations de Bellman permettent d'optimiser l'espérance de l'utilité dans les processus de décision markoviens. Mais comment faire si l'on souhaite optimiser d'autres fonctionnelles de l'utilité, par exemple pour des raisons de gestion des risques ? L'apprentissage distributionnel peut représenter un espoir intéressant, dans la mesure où il permet de garder une trace non seulement du comportement moyen, mais de l'ensemble de la distribution. On s'efforcera dans cet exposé de cerner quelles sont les fonctionnelles de l'utilité qui sont optimisables par programmation dynamique, et d'illustrer dans quelle mesure celles-ci répondent à la problématique de gestion des risques.

All (past and future) events