Comparaison de procédures de validation croisée (V-fold) La validation croisée est couramment utilisée pour évaluer le risque d'un estimateur, ou pour sélectionner parmi une famille d'estimateurs. Par exemple, les méthodes "V-fold" sont populaires car leur complexité algorithmique, proportionnelle à V, est en général bien plus faible que celle des méthodes "leave-p-out". Mais comment choisir V? Lorsque le but est d'évaluer le risque d'un seul estimateur, il s'agit simplement de minimiser biais et variance, deux quantités que l'on peut étudier précisément dans certains cadres (par exemple, les estimateurs par projection en densité avec la perte quadratique). Lorsque le but est de minimiser le risque de l'estimateur final à l'issue d'une procédure de sélection d'estimateurs, les rôles du biais et de la variance sont moins immédiats, mais ils peuvent encore être analysés théoriquement. Nous verrons comment ceci peut étayer, dans certains cas au moins, l'heuristique classique qui est de prendre V=5 ou 10 pour avoir des performances quasi optimales. Références: http://arxiv.org/abs/1210.5830 (estimation de densité, collaboration avec Matthieu Lerasle) http://projecteuclid.org/euclid.ssu/1268143839 (survey sur la validation croisée, rédigé avec Alain Celisse) http://fr.arxiv.org/abs/0802.0566 (régressogrammes)