Prochainement

Jeudi 11 mars 15:15-16:15 Paul Thévenin (Uppsala University)
Factorisations de genre fixé d’un grand cycle

Plus d'infos...

Résumé : Une factorisation d’une permutation est une façon d’écrire cette permutation comme un produit de transpositions. En particulier, l’ensemble des factorisations du n-cycle (12...n) est en bijection avec un ensemble de cartes unicellulaires à n sommets, dont le genre est donné par le nombre de transpositions de la factorisation. J’exposerai un algorithme inspiré de cette bijection et permettant de générer une factorisation quasi-uniforme du n-cycle dont la carte correspondante est de genre fixé.
Il est de plus possible de voir une factorisation du n-cycle comme un ensemble de cordes du disque unité, chaque corde correspondant à une transposition. Je montrerai comment l’algorithme précédent permet d’établir la convergence de cet ensemble de cordes, lorsque la factorisation du n-cycle est choisie uniformément au hasard parmi celles de genre fixé.
Travail en collaboration avec Valentin Féray et Baptiste Louf.

Factorisations de genre fixé d’un grand cycle  Version PDF

Jeudi 18 mars 14:00-15:00 Pierre Ablin (ENS paris)
Independent component analysis : introduction and multi-view extensions

Plus d'infos...

Résumé : Independent Component Analysis (ICA) is a powerful unsupervised data exploration tool, that is widely used in many applied sciences. In its basic formulation, it models the data as a linear mixture of independent sources. The first part of this talk will be a gentle introduction to the ICA model, its invariances, estimation techniques, and its applications with an emphasis on neurosciences. The second part of the talk will be devoted to the multi-view setting : in this case, there are several datasets, which all share some common independent sources. In particular, we introduce a model for such problem that has a simple closed-form likelihood, which allows for fast and accurate estimation of the parameters. The resulting multi-view ICA algorithm is state-of-the-art for several neuroscience learning problems.

Independent component analysis : introduction and multi-view extensions  Version PDF

Jeudi 25 mars 15:15-16:15 Edouard Strickler (Institut Elie Cartan de Lorraine)
Des distributions quasi-stationnaires à la persistance

Plus d'infos...

Résumé : Prédire l’extinction ou la survie d’une population est un des points clés des modèles écologiques. Dans certains modèles, l’extinction survient presque sûrement en temps fini (processus de naissance et mort, par exemple), leur seul état stationnaire est donc la mort. Parmi ces modèles, certains peuvent présenter un comportement métastable avant l’extinction, qui sera bien décrit par une distribution quasi-stationnaire. Dans d’autres modèles, en revanche, l’extinction est contingente et ne peut se produire qu’en un temps infini (solution d’équation différentielle ou diffusions avec des coefficients réguliers, par exemple). Certains des modèles pour lesquelles l’extinction n’arrive jamais possède une distribution stationnaire qui ne donne pas de masse à l’ensemble d’extinction, on dira qu’ils sont persistants.
Le but de cet exposé est d’étudier un processus de naissance et mort en environnement aléatoire, représentant une population de taille finie, qui converge, lorsque la taille de la population tend vers l’infini, vers un processus de Markov déterministe par morceaux (PDMP). Nous verrons que dans le cas où le PDMP est persistant, le processus de naissance et mort admet une distribution quasi-stationnaire qui converge vers la distribution persistante du PDMP.
Basé sur des travaux en cours avec Adrien Prodhomme (CMAP et Université de Tours)

Des distributions quasi-stationnaires à la persistance  Version PDF

Jeudi 1er avril 14:00-15:00 Nicolas Meyer (University of Copenhagen)
Multivariate Sparse Clustering for Extremes

Plus d'infos...

Résumé : Studying the tail dependence of multivariate extremes is a major challenge in extreme value analysis. Under a regular variation assumption, the dependence structure of the positive extremes is characterized by a measure, the spectral measure, defined on the positive orthant of the unit sphere. This measure gathers information on the localization of large events and has often a sparse support since such events do not simultaneously occur in all directions. However, it is defined via weak convergence which does not provide a natural way to capture this sparsity structure. In this talk, we introduce the notion of sparse regular variation which allows to better learn the tail structure of a random vector X. We use this concept in a statistical framework and provide a procedure which captures clusters of extremal coordinates of X. This approach also includes the identification of a threshold above which the values taken by X are considered as extreme. It leads to an efficient algorithm called MUSCLE. We illustrate our method on numerical experiments and wind speed data.
Étudier la dépendance des extrêmes multivariés est l’un des enjeux majeurs de la théorie des valeurs extrêmes. Sous l’hypothèse de variation régulière, cette structure de dépendance est caractérisée par une mesure, appelée mesure spectrale, qui est définie sur l’orthant positif de la sphère unité. Cette mesure regroupe l’information sur la localisation des événements extrêmes. Son support est souvent parcimonieux puisque de tels événements n’apparaissent pas simultanément dans toutes les directions de l’espace. Cependant, elle est définie comme limite faible de probabilités ce qui rend difficile l’estimation d’un tel support. Dans cet exposé, nous introduisons la notion de variation régulière parcimonieuse qui permet de mieux identifier la structure parcimonieuse des extrêmes. d’un vecteur X. Nous utilisons ensuite ce concept dans un cadre statistique et proposons une procédure qui met en évidence des clusters de coordonnées extrêmes de X. Cette approche inclut aussi la sélection d’un seuil au-dessus duquel les valeurs prises par X sont considérées comme extrêmes. Nous proposons alors un algorithme appelé MUSCLE et nous l’illustrons sur des données simulées et réelles.

Multivariate Sparse Clustering for Extremes  Version PDF

Jeudi 1er avril 15:15-16:15 Béatrice De Tilière (CEREMADE, Université Paris Dauphine)
A préciser


Jeudi 15 avril 14:00-15:00 Nicolas Jouvin  (Institut Camille Jordan)
Model-based hierarchical clustering with the integrated classification likelihood

Plus d'infos...

Résumé : Authors : Etienne Côme, Nicolas Jouvin, Pierre Latouche & Charles Bouveyron
This presentation introduces a new methodology for finding a set of nested partitions by maximizing a model selection criterion : the integrated classification likelihood (ICL). This methodology applies to a wide class of probabilistic clustering models such as mixture models or stochastic block models. First, we propose a new genetic algorithm for the greedy maximization of the ICL with respect to the partition. This first contribution outputs a locally optimal partition in terms of ICL, for which the number of groups K is automatically selected. Starting with this partition, we then address the problem of hierarchy construction by including a certain prior hyper-parameter $\alpha$ into the optimization problem, the latter being shown to control the granularity level of a partition. The hierarchical algorithm relies on a new approximation of the ICL which allows to define the best pair of cluster to merge at any stage of the hierarchy by decreasing $\alpha$. The output hierarchy is useful as it allows to uncover relevant hierarchical structure in a dataset, along with providing powerful visualization tools via a dendrogram representation and a pseudo-ordering of the clusters. Results on numerical simulations and real data-sets are presented, with a focus on the network clustering case with the stochastic block model. An R package implementation of this work is available on Etienne Côme’s Github (https://github.com/comeetie/greed).

Model-based hierarchical clustering with the integrated classification likelihood  Version PDF


Jeudi 22 avril 15:15-16:15 Michel Pain (Courant Institute of Mathematical Sciences)
A préciser

Passés

Jeudi 4 mars 15:15-16:15 Paul Melotti (Laboratoire de Mathématiques d'Orsay)
Combinatoire des systèmes intégrables discrets : le cas dSKP

Plus d'infos...

Résumé : Un certain nombre d’équations d’évolution, ou récurrences spatiales, sont apparues ces dernières années. On peut les voir comme des modifications locales de modèles de mécanique statistique, comme des discrétisations d’EDP classiques, ou également comme des transformations de géométrie discrète. Je parlerai d’un puzzle qui consiste à interpréter la combinatoire de ces évolutions, et notamment du cas de l’équation dSKP (un système qui apparait dans de nombreux problèmes : circle patterns de Schramm, évolution des modèles de dimères plongés, pentagram map, etc.). Une application probabiliste est l’existence de formes limites délimitant différentes phases des modèles « solutions » du puzzle.
Travail en cours avec Niklas Affolter et Béatrice de Tilière

Combinatoire des systèmes intégrables discrets : le cas dSKP  Version PDF
Jeudi 4 mars 14:00-15:00 Mahendra Mariadassou (INRAE- MaIAGE)
The Poisson-lognormal model as a versatile framework for the joint analysis of species abundances

Plus d'infos...

Résumé : Joint Species Abundance Models (JSDM) provide a general multivariate framework to study the joint abundances of all species from a community. JSDM account for both structuring factors (environmental characteristics or gradients, such as habitat type or nutrient availability) and potential interactions between the species (competition, mutualism, parasitism, etc.), which is instrumental in disentangling meaningful ecological interactions from mere statistical associations.
Modeling the dependency between the species is challenging because of the count-valued nature of abundance data and most JSDM rely on Gaussian latent layer to encode the dependencies between species in a covariance matrix. The multivariate Poisson-lognormal(PLN) model is one such model, which can be viewed as a multivariate mixed Poisson regression model. The inference of such models raises both statistical and computational issues, many of which were solved in recent contributions using variational techniques and convex optimization.
The PLN model turns out to be a versatile framework, within which a variety of analyses can be performed, including multivariate sample comparison, clustering of sites or samples, dimension reduction (ordination) for visualization purposes, or inference of interaction networks. We will presents the PLN framework and some variants and illustrate them on typical datasets. All the models and methods are implemented in the R package PLNmodels, available from cran.r-project.org.
Joint work with Julien Chiquet and Stéphane Robin

The Poisson-lognormal model as a versatile framework for the joint analysis of species abundances  Version PDF
Jeudi 11 février 15:15-16:15 Thomas Budzinski (UMPA, ENS Lyon)
Coordination sans communication en bandits multijoueurs
Jeudi 11 février 14:00-15:00 Yannig GOUDE (EDF- R&D)
Adaptive additive models for short-term electricity load forecasting during COVID-19 lockdown

Plus d'infos...

Résumé : The coronavirus disease 2019 (COVID-19) pandemic has urged many governments in the world to enforce a strict lockdown where all nonessential businesses are closed and citizens are ordered to stay at home. One of the consequences of this policy is a significant change in electricity consumption patterns. Since load forecasting models rely on calendar or meteorological information and are trained on historical data, they fail to capture the significant break caused by the lockdown and have exhibited poor performances since the beginning of the pandemic. In this paper we introduce two methods to adapt generalized additive models, alleviating the aforementioned issue. Using Kalman filters and fine-tuning allows to adapt quickly to new electricity consumption patterns without requiring exogenous information. The proposed methods are applied to forecast the electricity demand during the French lockdown period, where they demonstrate their ability to significantly reduce prediction errors compared to traditional models. Finally, online expert aggregation is used to leverage the specificities of each predictions and enhance results even further.

Adaptive additive models for short-term electricity load forecasting during COVID-19 lockdown  Version PDF
Jeudi 4 février 15:15-16:15 Lucas Gérin (CMAP, Ecole Polytechnique)
Grands cographes aléatoires

Plus d'infos...

Résumé : Les cographes sont une famille assez naturelle en théorie
algorithmique des graphes, mais ils n’ont semble-t-il quasiment jamais
été étudiés du point de vue probabiliste. Dans cet exposé, je
présenterai quelques aspects probabilistes des cographes uniformes, et
notamment leurs limites en tant que graphon (les graphons peuvent être
vus comme les limites continues de graphes finis). L’objet limite peut
en effet être décrit à partir d’une excursion brownienne.
(Travail en collaboration avec Frédérique Bassino, Mathilde Bouvel,
Valentin Féray, Mickaël Maazoun, Adeline Pierrot. Voir :
arXiv:1907.08517)

Grands cographes aléatoires  Version PDF
Jeudi 28 janvier 15:15-16:15 Hugo Duminil-Copin (IHES et Université de Genève)
Rotational invariance of the planar random-cluster model

Plus d'infos...

Résumé : In this talk, we prove that the random-cluster model on the square lattice with cluster-weight q in [1,4] exhibits rotational invariance at large scales. This covers the case of Bernoulli percolation on the square lattice as an important example. Joint work with Karol Kajetan Kozlowski, Dmitry Krachun, Ioan Manolescu, and Mendes Oulamara.

Rotational invariance of the planar random-cluster model  Version PDF