Conférenciers pléniers

Jérémie Bigot, Université de Bordeaux

Applications du transport optimal pour l’analyse statistique de données

Résumé : Dans cet exposé, il est proposé de donner un aperçu de l’utilisation de distances non-euclidiennes basées sur la théorie du transport optimal de mesures de probabilités pour l’analyse de données (histogrammes, nuages de points) et leurs applications en statistique et apprentissage. On discutera plus particulièrement de la notion de barycentres dans l’espace de Wasserstein à l’aide de distances de transport régularisées, et leurs liens avec la notion usuelle d’estimateurs à noyau pour l’estimation de densité en statistique.

Djalil Chafaï, Université Paris-Dauphine

Dynamiques de gaz de particules en répulsion singulière

Résumé : Cet exposé présentera des processus associés à des modèles de gaz de particules en interaction, issus ou inspirés des matrices aléatoires et de la physique statistique. Ces dynamiques sont à la fois des objets d'intérêt naturels et des outils pour l'échantillonnage. Les phénomènes de grande dimension y jouent un rôle important.

Fabienne Comte, Université Paris-Descartes

Nonparametric estimation for diffusion models

Résumé : We consider a diffusion model $$dX_t= b(X_t)dt + \sigma(X_t) dW_t, \quad X_0=\eta,$$ under conditions ensuring stationary and geometrical $\beta$-mixing of the process. We assume that we observe a sample $(X_{k\Delta})_{1\leq k\leq n}$. Our aim is to study nonparametric estimators of the drift $b(\cdot )$ and the diffusion function $\sigma^2(\cdot)$, under general conditions. We focus in the talk on the case of drift estimation. We propose projection estimators based on a least-square type contrast and, in order to generalize existing results, we want to consider possibly non compactly supported projection bases and possibly non bounded volatility. To that aim, we relate the model with an heteroskedastic regression model, plus some residual terms. This allows to see the role of dependency between the variables and to present different probabilistic tools used to face each part of the problem:

a matricial Bernstein inequality allows us to extend the methods used for compactly supported estimation to a more general context; it can be extended to dependent variables,
different strategies are presented to handle the non boundedness assumption on the diffusion coefficient : they are related either to coupling methods and Talagrand inequality or to chaining techniques and martingale deviations inequality.

For each step, we try to see the "price" of each assumption and to get convinced that it is optimal. We detail the case of the Hermite basis, which is ${\mathbb R}-$supported and relevant for the diffusion context. Promising numerical results relying on this basis can be shown. (Joint work with Valentine Genon-Catalot, Université Paris Descartes)

Benjamin Jourdain, École Nationale des Ponts et Chaussées

Échantillonnage de probabilités dans l'ordre convexe et approximation de problèmes de transport optimal martingale

Résumé : D’après le théorème de Strassen, deux probabilités $\mu$ et $\nu$ sur ${\mathbb R}^d$ sont dans l'ordre convexe si et seulement s'il existe un couplage martingale entre $\mu$ et $\nu$. Le problème de transport optimal martingale a été introduit il y a une dizaine d'années en finance pour obtenir des bornes de prix robustes pour des options portant sur des actifs sous-jacents dont on connaît les lois marginales $\mu$ et $\nu $ à deux instants. Pour résoudre numériquement ce problème, il convient d'approcher $\mu$ et $\nu$ par des probabilités à support fini. Mais, en général, l'ordre convexe est perdu lors de l'échantillonnage. Nous verrons comment restaurer l'ordre convexe au niveau discret tout en préservant la convergence vers $\mu$ et $\nu$ lorsque la taille des échantillons tend vers l'infini. (Travail joint avec Aurélien Alfonsi et Jacopo Corbetta)

Victor Panaretos, École Polytechnique Fédérale de Lausanne (Suisse)

Functional Data Analysis by Matrix Completion

Résumé : Functional data analyses typically proceed by smoothing, followed by functional PCA. This paradigm implicitly assumes that rough variation is due to nuisance noise. Nevertheless, relevant functional features such as time-localised or short scale fluctuations may indeed be rough relative to the global scale, but still smooth at shorter scales. These may be confounded with the global smooth components of variation by the smoothing and PCA, potentially distorting the parsimony and interpretability of the analysis. We investigate how both smooth and rough variations can be recovered on the basis of discretely observed functional data. Assuming that a functional datum arises as the sum of two uncorrelated components, one smooth and one rough, we develop identifiability conditions for the recovery of the two corresponding covariance operators. In the Gaussian case, this would correspond to a sort of blind deconvolution problem. The key requirement is that the the superposed covariances possess complementary forms of parsimony: one smooth and low rank (large scale), and the other banded and potentially high rank (small scale). Under these conditions, we show that the recovery problem is reducible to a low rank matrix completion problem, and exploit this to construct consistent estimators of the two covariances. Our work bears similarities with low rank plus sparse matrix recovery, but rests on deterministic functional conditions. (Based on joint work with Marie-Hélène Descary).

Françoise Pène, Université de Brest

Promenade Aléatoire en Paysages Aléatoires et modèles apparentés

Résumé : Les promenades aléatoires en paysages aléatoires (PAPAs) ont été introduites par Kesten et Spitzer ainsi que par Borodin. Elles ont aussi été étudiées par Bolthausen. Nous présenterons les résultats historiques, ainsi que les résultats récents complétant et précisant ces résultats. Nous présenterons également un modèle introduit par Matheron et de Marsily pour modéliser le déplacement dans un milieu inhomogène stratifié. Il s'agit d'un modèle de marche aléatoire sur Z^2 avec orientation aléatoire des lignes horizontales. Nous verrons le lien existant avec les PAPAs. Nous nous intéresserons au comportement asymptotique de ce modèle aléatoire et, en particulier, à la question de la persistance posée par Matheron et de Marsily. Nous parlerons aussi d'une généralisation naturelle des PAPAs, le modèle des U-statistiques indexées par une marche aléatoire. Enfin, nous considérerons d'un modèle de marche aléatoire en dimension 1 avec des ronds-points placés à distances aléatoires les uns des autres. Lors de cet exposé, nous parlerons notamment de nos travaux en collaboration avec Fabienne Castell, Nadine Guillotin-Plantard et Bruno Schapira (PAPAs et modèle de Matheron et de Marsily); mais aussi avec Brice Franke et Martin Wendler (U-statistiques); ainsi qu'avec Alessandra Bianchi et Marco Lenci (ronds-points aléatoires).

Prix de Thèse Jacques Neveu

Anna Ben-Hamou, Lauréate 2016, Université Pierre et Marie Curie

Temps de mélange de marches aléatoires sur des graphes aléatoires

Résumé : Dans cet exposé, nous commencerons par rappeler la notion de temps de mélange d’une chaîne de Markov et introduirons le phénomène de cutoff, qui décrit une convergence très abrupte à l’équilibre: la distance (en variation totale) entre la loi de la chaîne et la probabilité stationnaire reste très proche de 1 jusqu’au temps de mélange puis chute abruptement de 1 à 0 en un temps bien plus petit, appelé la fenêtre du cutoff. Etablir le cutoff pour une chaîne donnée requiert souvent une analyse extrêmement fine de la chaîne, et il existe assez peu de résultats généraux permettant par exemple d’exhiber des grandes classes de graphes sur lesquels la marche aléatoire présente le cutoff. On peut alors se demander ce qu’il se passe sur un graphe « typique ». Nous considérerons le cas des graphes aléatoires à suite prescrite de degrés, et montrerons qu’avec forte probabilité, sur de tels graphes, la marche aléatoire dite « sans rebroussement » présente le cutoff. Ce résultat a été obtenu avec Justin Salez (Paris Diderot), mon co-directeur de thèse. Nous nous intéresserons ensuite à la comparaison des temps de mélange de la marche simple et de la marche sans rebroussement. En exprimant les temps de mélange en termes d’entropie sur un arbre de Galton-Watson qui constitue une approximation locale du graphe, nous montrerons que la marche aléatoire sans rebroussement mélange plus vite que la marche simple. Ce résultat est issu d’une collaboration avec Eyal Lubetzky (NYU) et Yuval Peres (Microsoft Reserach).

Aran Raoufi, Lauréat 2017, Institut des Hautes Études Scientifiques

Sharp threshold phenomenon and lattice models of statistical physics

Résumé : In this talk, we start by a fast overview of the study of the sharp threshold phenomenon in theoretical computer science, probability theory, combinatorics and statistical physics. Afterwards, we focus on sharp threshold phenomenon in the lattice spin systems of statistical physics.

Sessions parallèles

Chaque session sera composée d'un exposé introductif de 40 min. puis de trois exposés de 25 min. (questions comprises) sur des travaux récents. Le détail de chaque session parallèle sera annoncé ultérieurement.

#	Titre	Organisateur
P1	Analyse stochastique	Laure Coutin
P2	Echantillonnage et algorithmes stochastiques	Sophie Laruelle
P3	Échantillonnage pour des processus déterministes par morceaux	Pierre-André Zitt
P4	Graphes, réseaux et cartes aléatoires	Igor Kortchemski
P5	Matrices aléatoires	Guillaume Cébron
P6	Percolation	Jean-Baptiste Gouéré
P7	Processus et Finance	Romuald Elie
P8	Processus stochastiques et biologie	Vincent Bansaye
P9	Systèmes de particules	Oriane Blondel
P10	Théorèmes limites	Jean-Christophe Breton
S1	Apprentissage et enchères	Vianney Perchet
S2	Détection de ruptures et segmentation	Farida Enikeeva
S3	Estimation à noyau: nouvelles approches pour la sélection de fenêtre	Angelina Roche
S4	Extrêmes spatiaux	Clément Dombry
S5	Séries temporelles à valeurs entières	Célestin Kokonendji
S6	Sondages sur données temporelles	Anne De Moliner
S7	Statistique sur les graphes	Nicolas Verzelen
S8	Super-résolution : du discret au continu	Joseph Salmon
S9	Traitement du signal, de données textuelles et de l'image	Marianne Clausel

Programme scientifique