Exposé
Exploration Statistique en santé : Un test d’association pour la détection de regroupements de variants génétiques rares
Équations Différentielles Stochastiques unidimensionnelles inhomogènes en temps faisant intervenir le temps local du processus inconnu, et opérateurs paraboliques associés
Dans ce travail on cherche tout d’abord à étendre les résultats de J.F. Le Gall (1984) sur les Equations Différentielles Stochastiques avec Temps Local (EDSTL), au cas où tous les coefficients qui apparaissent dans l’EDSTL dépendent du temps. Nous obtenons des résultats d’existence et d’unicité pour les solutions de l’EDSTL dans ce contexte inhomogène en temps. Dans un second temps nous nous penchons sur la question des opérateurs paraboliques naturellement associés au processus $X$ solution de l’EDSTL étudiée.
Algorithmes de clustering : deux approches
Dans un premier temps nous verrons comment une méthode usuelle de clustering permet, sur un jeu de données réelles, de contribuer au débat en écologie entre taxonomistes traditionnels et tenants des codes-barres génétiques. Nous présenterons ensuite une nouvelle méthode de clustering fondée sur des algorithmes de type MCMC pour des processus ponctuels marqués. Le cas de la grande dimension sera discuté.
Sélection de paramètre de lissage des estimateurs récursifs construits à l'aide des algorithmes stochastiques du cas réel au cas des données fonctionnelles avec des applications
Dans le cadre des big-data, nous sommes très souvent amenés à traiter un ensemble volumineux de données. Dans la première partie, nous utilisons des algorithmes stochastiques, afin de construire des estimateurs récursifs. L’intérêt majeur de ces approches récursives est qu’elles permettent une mise à jour rapide des estimateurs lorsque les données sont observées de manière séquentielle sans être obligé de stocker en mémoire toutes les observations passées.