Complétion de séries temporelles multi-variées en grande dimension

Jeudi 10 mars 2022, 10:15 à 11:15

salle des séminaires (M.0.1)

Amélie Rosier

Modal'X, Université Paris Nanterre

Soit le modèle de complétion :

$Y_i =\langle U_i,M_{k,\tau}\rangle +\langle U_i,\epsilon\rangle +\xi_i$,

où $Y_1,\dots,Y_n$ désignent $n$ entrées de la matrice $X = M_{k,\tau} +\epsilon$ dont les lignes sont des séries temporelles, $\epsilon$ est une matrice aléatoire centrée dont les lignes sont indépendantes, $(U_1,\xi_1),\dots,(U_n,\xi_n)$ sont $n$ variables aléatoires i.i.d à valeurs dans $M_{d,T}(\mathbb R)\times\mathbb R$ et indépendantes de $\epsilon$, et $U_i$ est indépendante de $\xi_i$ pour tout $i\in\{1,\dots,n\}$. Le paramètre $k$ est le rang de $M_{k,\tau}$ et $\tau$ est un paramètre caractérisant une propriété spécifique à la tendance d’une série temporelle comme la $\tau$-périodicité. Enfin, notons que les $\xi_i$ sont les erreurs d’observation liées à l’instrument de mesure, tandis que $\epsilon$ est la composante stochastique de $X$.
Sous l’hypothèse que les lignes de $\epsilon$ sont issues d’un processus $\phi$-mélangeant, nous établirons un contrôle en $O(k(d +\tau)\log(n)/n)$ du risque quadratique de l’estimateur des moindres carrés $\hat M_k$ de $M_{k,\tau}$. La structure de série temporelle permet d’améliorer le contrôle en $O(k(d + T)\log(n)/n)$ établi dans Koltchinskii et al. (2011). Nous démontrerons alors une inégalité d’oracle pour l’estimateur adaptatif $\hat M_{\hat k}$, où $\hat k$ est sélectionné en pénalisant la fonction de perte quadratique par un terme en $O(k(d +\tau)\log(n)/n)$. Des expériences numériques seront présentées en fin d’exposé.

Il s’agit d’un travail en collaboration avec Pierre Alquier et Nicolas Marie.

Cet exposé rentre dans le cadre de l'ANR SMILES ANR-18-CE40-0014.