Le Groupe de travail de Statistique est organisé par Gaëlle Chagny et Antoine Channarond. Sauf précision contraire, les séances ont lieu au Madrillet le jeudi, de 10h15 à 11h15 dans la salle de séminaire M.0.1 (rez-de-chaussée).

Programme 2017-2018


Prochaines séances

25 septembre 2017 (11h, séance commune avec le GT Probabilités, Théorie ergodique et Systèmes dynamiques) Pascal Moyal (Laboratoire de Mathématiques appliquées de Compiègne, Univ. de Technologie de Compiègne) Stabilité du modèle d'appariement aléatoire sur les graphes généraux: étude structurelle, forme produit et couplage Nous considérons un modèle d’appariement d’entités générées aléatoirement, pour lequel les paires possibles sont fixées par un graphe de compatibilité. Ce modèle, qui a des applications naturelles à l'économie collaborative, la gestion des banques de sang et d'organes et aux chaînes de production, généralise celui de Kaldentey, Kaplan et Weiss à un graphe non-nécessairement biparti. La stabilité du système est tout d'abord étudiée suivant les propriétés structurelles du graphes de compatibilité et la politique d’appariement. En outre, nous caractérisons explicitement dans une forme produit, l'état stationnaire à valeurs dans les mots sur l'alphabet des noeuds, sous la politique "Premier entré, premier marié". Nous proposons finalement, dans un cadre plus général, un schéma de couplage arrière fort crucial pour la simulation, conséquence d'un théorème sous-additif au sens de la longueur des mots. Des connexions de ces résultats avec la théorie classique d’appariement dans les graphes (et dans les grands graphes aléatoires) seront aussi évoquées. (Travaux joints avec Jean Mairesse, Ana Busic et Ohad Perry)

28 septembre 2017 (10h15) Pierre-Yves Louis (Laboratoire de Mathématiques et Applications, Univ. Poitiers) Algorithmes de clustering : deux approches Dans un premier temps nous verrons comment une méthode usuelle de clustering permet, sur un jeu de données réelles, de contribuer au débat en écologie entre taxonomistes traditionnels et tenants des codes-barres génétiques. Nous présenterons ensuite une nouvelle méthode de clustering fondée sur des algorithmes de type MCMC pour des processus ponctuels marqués. Le cas de la grande dimension sera discuté.

19 octobre 2017 (10h15) Aboubacar Amiri (Laboratoire Lille, Économie et Management, Univ. Lille 3) Non parametric estimation for multivariate data streams

26 octobre 2017 (10h15) Halim Zeghdoudi (Univ. de Annaba, Algérie) On Composite Rayleigh-Pareto Distribution: Application to real Algerian fire insurance losses data set This paper proposes a new distribution, called as composite Rayleigh-Pareto distribution. Some properties of the distributions are given with estimation and some illustrative examples. An applications of the model to a real Algerian fire insurance losses data set is presented finally and compared with the fit attained by classical two parameter distributions and composite exponential-Pareto distribution.

9 novembre 2017 (10h15) Youri Kutoyants (LMM, Univ. du Maine, Le Mans) On frequency estimation for periodic diffusion processes We consider several models of diffusion processes with periodic in time trend coefficients and we describe the properties of the MLE and Bayes estimators of the frequency in the asymptotics of large samples and small noise. We start with the Signal in White Gaussian Noise model. We show the rates of convergence of mean square error in regular and non regular cases. Then we consider diffusion processes with a periodic deterministic component in the trend (additive periodicity) and describe the properties of estimators (consistency, limit distributions, convergence of moments, asymptotic efficiency) in regular and non regular situations. Special attention is paid to the partially observed systems where the periodic function is multiplied by the unobservable component. Using the Kalman filter asymptotics we give the properties of estimators in three situations: as the noises in observations and state equations tend to zero, as the noise in state equation only tends to zero and as the time of observations tends to infinity.

23 novembre 2017 (10h15) Viktor Konev (Tomsk State University) CuSum quickest detection rule for Markovian time series: Kullback-Leibler approach We consider the problem of quick detection of abrupt parameter changes in an autoregressive model with Gaussian white noise. The time of change is deterministic but otherwise unknown. In contrast to detection algorithms for i.i.d. models, the analysis of most procedures known in the literature for detecting disruption in autoregressive schemes reduces to only one characteristic, the false alarm rate, while the delay time characteristic is studied only by means of numerical simulation for some specific models. We develop the method proposed by Lai for detecting abrupt changes in stochastic systems with dependent observations. We prove that window-limited CUSUM rule minimizes the asymptotic detection delay risk under appropriate constraint on the probability of false alarm for the autoregressive model provided that pre-change and post-change parameters are known and the process is stable before and after the disruption. Moreover, it is point-wise optimal. To treat the detection problem for autoregression with unknown post-change parameters we prove some extensions of Lai's theorem for the generalized CUSUM procedure. This result allows us to establish the asymptotic minimaxity and point-wise optimality of CUSUM rule by making use of the risk involving additional supremum in parameter over some compact in the stability region of the autoregressive process.

30 novembre 2017 (10h15) Evgeny Pchelintsev (Tomsk State University) Efficient robust nonparametric estimation in a Lévy regression model We consider the robust adaptive non parametric estimation problem for the periodic function observed in the continuous time regression model with the Lévy noises. We propose an adaptive model selection procedure, based on the improved weighted least square estimates. Under some conditions on the noise distribution we prove sharp oracle inequalities for the robust risks and we establish the efficiency property for the proposed model selection procedure in the adaptive setting.

25 janvier 2018 (10h15) Igor Nikiforov (Laboratoire de Modélisation et Sûreté des Systèmes, Univ. de Technologie de Troyes) Sequential detection of transient changes This presentation addresses the problem of transient change detection. It is assumed that the duration of a transient change is usually short. In contrast to the conventional abrupt change detection, where the post-change period is assumed to be infinitely long, the detection of a transient change should be done before it disappears. The alert about the transient changes after their disappearance is considered as a missed detection. Often, such a transient change is represented by a dynamic profile in the parameter space. The conventional quickest change detection criterion, minimizing the average detection delay provided that a false alarm rate is upper bounded, cannot be used now and another optimality criterion which minimizes the worst-case probability of missed detection provided that the worst-case probability of false alarm during a certain period is upper bounded is used for a transient change detection. A special attention will be paid to the case of arbitrary (non-Gaussian) distribution of observations. A special continuous-discrete model with transient changes will be also considered. Finally, several possible applications of the proposed tests will be presented.


Séances passées

21 septembre 2017 (10h15) Yousri Slaoui (Laboratoire de Mathématiques et Applications, Univ. Poitiers) Sélection de paramètre de lissage des estimateurs récursifs construits à l'aide des algorithmes stochastiques du cas réel au cas des données fonctionnelles avec des applications Dans le cadre des big-data, nous sommes très souvent amenés à traiter un ensemble volumineux de données. Dans la première partie, nous utilisons des algorithmes stochastiques, afin de construire des estimateurs récursifs. L’intérêt majeur de ces approches récursives est qu’elles permettent une mise à jour rapide des estimateurs lorsque les données sont observées de manière séquentielle sans être obligé de stocker en mémoire toutes les observations passées. Dans la deuxième partie, nous proposons une automatisation du paramètre de lissage en utilisant la méthode d’injection qui consiste à utiliser un critère de type erreur quadratique et de proposer par la suite des estimateurs non paramétriques des quantités inconnues. Dans la troisième partie, nous considérons le problème d'estimation récursive d'une fonction de régression dans un cadre non paramétrique dans le cas où la réponse du modèle est une variable aléatoire réelle et la variable explicative du modèle est une variable aléatoire fonctionnelle, nous présentons quelques résultats concernant le comportement asymptotique de l'estimateur non paramétrique proposé, nous automatisons par la suite le paramètre de lissage et nous comparons la méthode proposée à des méthodes existantes en utilisant des données simulées et ensuite des données réelles.

20 septembre 2017 (11h) Lise Bellanger (Laboratoire de Mathématiques Jean Leray, Univ. Nantes) Exploration Statistique en santé : Un test d’association pour la détection de regroupements de variants génétiques rares Les études d'association génétiques de type cas-témoins visent à tester l’association entre un (des) variant(s) génétique(s) et une maladie donnée. Les études d’association génome-entier ont permis l’identification de nombreux variants génétiques fréquents impliqués dans des pathologies complexes. Cependant ceux-ci n’expliquent qu’une faible part de l’héritabilité des maladies. Il est depuis peu possible, grâce au développement des technologies de séquençage de nouvelle génération, d'étudier les variants génétiques rares susceptibles de présenter des effets génétiques plus forts que ceux détecter à partir des variants fréquents. C’est pourquoi ce domaine de recherche est en plein essor. Du fait de la faible fréquence des variants rares dans la population générale, les tests statistiques d’association adaptés aux variants rares présentent de nouveaux défis par rapport à ceux construits pour l’analyse des variantes fréquents. La stratégie d’analyse généralement adoptée consiste à agréger l’information par groupe de variants rares pour conserver une bonne puissance de test. Ces groupes sont définis sur une région génétique d’intérêt préalablement fixée, bien souvent l’unité biologique qu’est le gène. Étant donné la complexité de tester l’association entre un groupe de variants et des maladies complexes, de nombreux tests ont déjà été développés ; mais aucun n’est uniformément plus puissant. De plus, peu d’entre eux intègrent l’information sur les positions génétiques. Or il a été montré que des mutations peuvent êtres concentrées dans des domaines fonctionnels des gènes. Le test par permutations développé, DoEstRare (pour “Density-oriented Estimation for Rare variant positions”), permet d’explorer et d’identifier des regroupements de mutations rares pathogènes sur un gène donné. Il compare à la fois la distribution des positions des mutations et la fréquence allélique moyenne entre les cas et les témoins. Une comparaison avec les principaux tests existants, par simulations et sur des données réelles, a été menée pour s’assurer des bonnes propriétés du test construit. Ces travaux sont le fruit d’une collaboration avec l’institut du thorax (Inserm UMR 1087 / CNRS UMR 6291, CHU de Nantes) au travers le projet région VaCaRMe.

14 septembre 2017 (10h15) Evans Gouno (Laboratoire de Mathématiques de Bretagne Atlantique, Univ. Bretagne sud) Inférence pour les processus auto-excités : une application à l’occurrence des impacts de foudre Les processus auto-excités (PAE) introduits dans les année 70 par Hawkes, sont caractérisés par une intensité qui dépend de toute ou d’une partie, de l’histoire du processus lui-même. Ils trouvent des applications dans de nombreux domaines : sismologie, neurophysiologie, génétique, épidémiologie, finance, fiabilité. Nous présentons un travail sur l’estimation des paramètres de l’intensité d’un PAE, motivé par une étude industrielle concernant la fiabilité de matériels électriques. Il s’agit d’évaluer l’influence de l’activité orageuse sur la propension à la panne du matériel. Le travail s’appuie sur des données d’occurrences d’impacts de foudre collectées sur une période de plusieurs années. Nous développons des méthodes d’inférence par maximum de vraisemblance et envisageons une approche bayésienne. Nous explorons également la relation entre des variables exogènes et l’occurrence des impacts.

11 septembre 2017 (11h, séance commune avec le GT Probabilités, Théorie ergodique et Systèmes dynamiques) Pierre Etoré (Laboratoire Jean Kuntzmann, Univ. Grenoble Alpes) Équations Différentielles Stochastiques unidimensionnelles inhomogènes en temps faisant intervenir le temps local du processus inconnu, et opérateurs paraboliques associés Dans ce travail on cherche tout d’abord à étendre les résultats de J.F. Le Gall (1984) sur les Equations Différentielles Stochastiques avec Temps Local (EDSTL), au cas où tous les coefficients qui apparaissent dans l’EDSTL dépendent du temps. Nous obtenons des résultats d’existence et d’unicité pour les solutions de l’EDSTL dans ce contexte inhomogène en temps. Dans un second temps nous nous penchons sur la question des opérateurs paraboliques naturellement associés au processus $X$ solution de l’EDSTL étudiée. Nous prouvons une formule de Feynman-Kac liant $X$ et la solution $u(t,x)$ d’un problème d’EDP parabolique avec condition de transmission inhomogène en temps. En fait nous devons prouver nous-même l’existence d’une telle solution $u(t,x)$. En effet le résultat n’est pas fourni directement par le papier fondateur du O.A. Ladyzhenskaya et al. (1966), où ce type de problème est étudié sous une forme purement divergence. Enfin on cherche à identifier le générateur du processus de Feller constitué par le processus temps-espace associé à $X$. Les extensions possibles et les aspects simulation sont brièvement discutés en fin d’exposé. Ceci est un travail en commun avec Miguel Martinez de l’Université Marne-la-Vallé-Paris-Est.