Séminaire Probabilités et Statistiques
Study of a well-known importance measure computed via decision trees
17
fév. 2022
logo_team
Intervenant : Erwan Scornet
Institution : Polytechnique-CMAP
Heure : 15h15 - 16h15
Lieu : 3L15

Nowadays, machine learning procedures are used in many fields with the notable exception of so-called sensitive areas (health, justice, defense, to name a few) in which decisions to be taken are fraught with consequences. In these fields, it is necessary to obtain a precise decision but, to be effectively applied, these algorithms must provide an explanation of the mechanisms that lead to the decision and, in this sense, be interpretable. Unfortunately, the most accurate algorithms today are often the most complex. A classic technique to try to explain their predictions is to calculate indicators corresponding to the strength of the dependence between each input variable and the output to be predicted. In this talk, we will focus on one measure of importance created for decision trees and we will see how the theoretical study provides explanations on its practical use.

Etude d’une mesure d’importance calculée grâce aux arbres de décisions.

De nos jours, les procédures de machine learning sont utilisées dans beaucoup de champs d’applications à l'exception notables des domaines dits sensibles (santé, justice, défense pour n'en citer que quelques-uns) dans lesquels les décisions à prendre sont lourdes de conséquence. Dans ces domaines, il est nécessaire d'obtenir une décision précise mais, pour entrer effectivement en application, ces algorithmes doivent fournir une explication du mécanisme qui conduit à la prise de décision et, en ce sens, être interprétable. Malheureusement les algorithmes les plus précis actuellement sont souvent les plus complexes. Une technique classique pour tenter d'expliquer leurs prédictions consiste à calculer des indicateurs correspondant à la force du lien entre chaque variable d’entrée et la variable de sortie à prédire. Dans cet exposé, nous nous intéresserons à un indicateur d'importance créé pour les arbres de décision et nous verrons en quoi l'étude théorique permet de fournir des explications quant à son utilisation pratique.

 

Voir tous les événements