Thèse Probabilités et statistiques

Inférence sur des données dépendantes : Contributions aux modèles de Markov cachés et de graphes à attachement préférentiel

01
Dec. 2025
logo_team
Intervenant : KADDOURI Ibrahim
Directeur : NAULET Zacharie Directeur : GASSIAT Elisabeth
Heure : 14h00
Lieu : Salle 3L15

Cette thèse est consacrée à l'étude de l'inférence statistique dans des contextes où les données sont dépendantes. Une telle dépendance peut apparaître à travers une dynamique temporelle, comme dans les modèles de Markov cachés, ou à travers une évolution structurelle, comme dans les graphes à attachement préférentiel.

La première partie porte sur le problème de regroupement dans les modèles i.i.d. et de Markov cachés. Nous analysons le risque de Bayes du problème de regroupement et le comparons au risque de classification. Nos résultats montrent que les minimiseurs de ces risques ne coïncident pas toujours, mais nous démontrons que cette distinction reste essentiellement théorique : en pratique, le classificateur de Bayes s'avère presque optimal pour les tâches de regroupement. Des simulations viennent compléter nos résultats théoriques et illustrer la quasi-optimalité de la stratégie de regroupement basée sur le classificateur de Bayes.

La deuxième partie développe une analyse plus fine du problème de regroupement pour les modèles de Markov cachés gaussiens dans le régime de lente mélangeabilité de la chaîne cachée. Nous fournissons une caractérisation précise du risque de Bayes en fonction du rapport signal sur bruit et des propriétés de mélange de la chaîne. Nous proposons aussi procédures de regroupement quasi-optimales. De manière intéressante, notre étude révèle des comportements surprenants du risque de Bayes dans certains régimes de paramètres, montrant que la dépendance temporelle peut conduire à des phénomènes non standard absents dans le cas i.i.d.

La troisième partie s'intéresse à la détection de ruptures dans des graphes à attachement préférentiel. Nous considérons le problème de la détection tardive d'une rupture qui apparaît à $ au_n = n - Delta_n$ où $n$ est la taille du graphe et $0 leq Delta_n leq n$. Formulé comme un problème de test d'hypothèses, cela conduit à des comportements très différents selon que le graphe observé est étiqueté ou non. Pour les graphes non étiquetés, nous prouvons l’impossibilité de détecter une rupture lorsque $Delta_n = o(n^{1/3})$, où $n$ est la taille du graphe, ce qui constitue un progrès vers une conjecture stipulant que la détection devrait être impossible pour tout $Delta_n = o(n^{1/2})$. En revanche, dans le cas où le graphe étiqueté est observé, nous établissons un seuil précis : la détection est possible si et seulement si $Delta_n xrightarrow[]{} +infty$.

All (past and future) events