Clustering parcimonieux pour extrêmes multivariés

Jeudi 18 novembre 2021, 10:15 à 11:15

Salle de séminaires M.0.1

Nicolas Meyer

IMAG, Université de Montpellier

 

Étudier la dépendance des extrêmes multivariés est l’un des enjeux majeurs de la théorie des valeurs extrêmes. Sous l’hypothèse de variation régulière, cette structure de dépendance est caractérisée par une mesure, appelée mesure spectrale, qui est définie sur l’orthant positif de la sphère unité. Cette mesure regroupe l’information sur la localisation des événements extrêmes. Son support est souvent parcimonieux puisque de tels événements n’apparaissent pas simultanément dans toutes les directions de l’espace. Cependant, elle est définie comme limite faible de probabilités ce qui rend difficile l’estimation d’un tel support. Dans cet exposé, nous introduisons la notion de variation régulière parcimonieuse qui permet de mieux identifier la structure parcimonieuse des extrêmes. d’un vecteur X. Nous utilisons ensuite ce concept dans un cadre statistique et proposons une procédure qui met en évidence des clusters de coordonnées extrêmes de X. Cette approche inclut aussi la sélection d’un seuil au-dessus duquel les valeurs prises par X sont considérées comme extrêmes. Nous proposons alors un algorithme efficace que nous appliquons sur différents exemples.

 

----------------------------------------------------

Multivariate sparse clustering for extremes Studying the tail dependence of multivariate extremes is a major challenge in extreme value analysis. Under a regular variation assumption, the dependence structure of the positive extremes is characterized by a measure, the spectral measure, defined on the positive orthant of the unit sphere. This measure gathers information on the localization of large events and has often a sparse support since such events do not simultaneously occur in all directions. However, it is defined via weak convergence which does not provide a natural way to capture this sparsity structure. In this talk, we introduce the notion of sparse regular variation which allows to better learn the tail structure of a random vector X. We use this concept in a statistical framework and provide a procedure which captures clusters of extremal coordinates of X. This approach also includes the identification of a threshold above which the values taken by X are considered as extreme. It leads to an efficient algorithm which we apply on several examples.