Résumé : Dans cet exposé, il est proposé de donner un aperçu de l’utilisation de distances non-euclidiennes basées sur la théorie du transport optimal de mesures de probabilités pour l’analyse de données (histogrammes, nuages de points) et leurs applications en statistique et apprentissage. On discutera plus particulièrement de la notion de barycentres dans l’espace de Wasserstein à l’aide de distances de transport régularisées, et leurs liens avec la notion usuelle d’estimateurs à noyau pour l’estimation de densité en statistique.
Résumé : Cet exposé présentera des processus associés à des modèles de gaz de particules en interaction, issus ou inspirés des matrices aléatoires et de la physique statistique. Ces dynamiques sont à la fois des objets d'intérêt naturels et des outils pour l'échantillonnage. Les phénomènes de grande dimension y jouent un rôle important.
Résumé : We consider a diffusion model $$dX_t= b(X_t)dt + \sigma(X_t) dW_t, \quad X_0=\eta,$$ under conditions ensuring stationary and geometrical $\beta$-mixing of the process. We assume that we observe a sample $(X_{k\Delta})_{1\leq k\leq n}$. Our aim is to study nonparametric estimators of the drift $b(\cdot )$ and the diffusion function $\sigma^2(\cdot)$, under general conditions. We focus in the talk on the case of drift estimation. We propose projection estimators based on a least-square type contrast and, in order to generalize existing results, we want to consider possibly non compactly supported projection bases and possibly non bounded volatility. To that aim, we relate the model with an heteroskedastic regression model, plus some residual terms. This allows to see the role of dependency between the variables and to present different probabilistic tools used to face each part of the problem:
Résumé : D’après le théorème de Strassen, deux probabilités $\mu$ et $\nu$ sur ${\mathbb R}^d$ sont dans l'ordre convexe si et seulement s'il existe un couplage martingale entre $\mu$ et $\nu$. Le problème de transport optimal martingale a été introduit il y a une dizaine d'années en finance pour obtenir des bornes de prix robustes pour des options portant sur des actifs sous-jacents dont on connaît les lois marginales $\mu$ et $\nu $ à deux instants. Pour résoudre numériquement ce problème, il convient d'approcher $\mu$ et $\nu$ par des probabilités à support fini. Mais, en général, l'ordre convexe est perdu lors de l'échantillonnage. Nous verrons comment restaurer l'ordre convexe au niveau discret tout en préservant la convergence vers $\mu$ et $\nu$ lorsque la taille des échantillons tend vers l'infini. (Travail joint avec Aurélien Alfonsi et Jacopo Corbetta)
Résumé : Functional data analyses typically proceed by smoothing, followed by functional PCA. This paradigm implicitly assumes that rough variation is due to nuisance noise. Nevertheless, relevant functional features such as time-localised or short scale fluctuations may indeed be rough relative to the global scale, but still smooth at shorter scales. These may be confounded with the global smooth components of variation by the smoothing and PCA, potentially distorting the parsimony and interpretability of the analysis. We investigate how both smooth and rough variations can be recovered on the basis of discretely observed functional data. Assuming that a functional datum arises as the sum of two uncorrelated components, one smooth and one rough, we develop identifiability conditions for the recovery of the two corresponding covariance operators. In the Gaussian case, this would correspond to a sort of blind deconvolution problem. The key requirement is that the the superposed covariances possess complementary forms of parsimony: one smooth and low rank (large scale), and the other banded and potentially high rank (small scale). Under these conditions, we show that the recovery problem is reducible to a low rank matrix completion problem, and exploit this to construct consistent estimators of the two covariances. Our work bears similarities with low rank plus sparse matrix recovery, but rests on deterministic functional conditions. (Based on joint work with Marie-Hélène Descary).
Résumé : Les promenades aléatoires en paysages aléatoires (PAPAs) ont été introduites par Kesten et Spitzer ainsi que par Borodin. Elles ont aussi été étudiées par Bolthausen. Nous présenterons les résultats historiques, ainsi que les résultats récents complétant et précisant ces résultats. Nous présenterons également un modèle introduit par Matheron et de Marsily pour modéliser le déplacement dans un milieu inhomogène stratifié. Il s'agit d'un modèle de marche aléatoire sur Z^2 avec orientation aléatoire des lignes horizontales. Nous verrons le lien existant avec les PAPAs. Nous nous intéresserons au comportement asymptotique de ce modèle aléatoire et, en particulier, à la question de la persistance posée par Matheron et de Marsily. Nous parlerons aussi d'une généralisation naturelle des PAPAs, le modèle des U-statistiques indexées par une marche aléatoire. Enfin, nous considérerons d'un modèle de marche aléatoire en dimension 1 avec des ronds-points placés à distances aléatoires les uns des autres. Lors de cet exposé, nous parlerons notamment de nos travaux en collaboration avec Fabienne Castell, Nadine Guillotin-Plantard et Bruno Schapira (PAPAs et modèle de Matheron et de Marsily); mais aussi avec Brice Franke et Martin Wendler (U-statistiques); ainsi qu'avec Alessandra Bianchi et Marco Lenci (ronds-points aléatoires).
Résumé : Dans cet exposé, nous commencerons par rappeler la notion de temps de mélange d’une chaîne de Markov et introduirons le phénomène de cutoff, qui décrit une convergence très abrupte à l’équilibre: la distance (en variation totale) entre la loi de la chaîne et la probabilité stationnaire reste très proche de 1 jusqu’au temps de mélange puis chute abruptement de 1 à 0 en un temps bien plus petit, appelé la fenêtre du cutoff. Etablir le cutoff pour une chaîne donnée requiert souvent une analyse extrêmement fine de la chaîne, et il existe assez peu de résultats généraux permettant par exemple d’exhiber des grandes classes de graphes sur lesquels la marche aléatoire présente le cutoff. On peut alors se demander ce qu’il se passe sur un graphe « typique ». Nous considérerons le cas des graphes aléatoires à suite prescrite de degrés, et montrerons qu’avec forte probabilité, sur de tels graphes, la marche aléatoire dite « sans rebroussement » présente le cutoff. Ce résultat a été obtenu avec Justin Salez (Paris Diderot), mon co-directeur de thèse. Nous nous intéresserons ensuite à la comparaison des temps de mélange de la marche simple et de la marche sans rebroussement. En exprimant les temps de mélange en termes d’entropie sur un arbre de Galton-Watson qui constitue une approximation locale du graphe, nous montrerons que la marche aléatoire sans rebroussement mélange plus vite que la marche simple. Ce résultat est issu d’une collaboration avec Eyal Lubetzky (NYU) et Yuval Peres (Microsoft Reserach).
Résumé : In this talk, we start by a fast overview of the study of the sharp threshold phenomenon in theoretical computer science, probability theory, combinatorics and statistical physics. Afterwards, we focus on sharp threshold phenomenon in the lattice spin systems of statistical physics.