Soutenance de thèse de Kévin Caye le 11/12/17

Kévin Caye de l’équipe BCM soutiendra sa thèse lundi 11 décembre 2017 à 14h sur le thème :

« Méthodes de factorisation matricielle pour la génomique des populations et les tests d’association »

“Matrix factorization methods for population genomics and association mapping”

Direction de Thèse :
- M. Olivier François, Professeur à l’UGA, TIMC-IMAG, Grenoble, Directeur
- M. Olivier Michel, Professeur à l’UGA, GIPSA-Lab, Grenoble, Co-Directeur
- M. Jean-Luc Bosson, Professeur des Universités - Praticien Hospitalier à l’UGA, TIMC-IMAG, Grenoble, Co-encadrant

Membres du jury :
- M. Michael BLUM, Directeur de Recherche CNRS, UGA, TIMC-IMAG, Grenoble, Président
- M. Christophe AMBROISE, Professeur UEVE, LaMME, Évry, Rapporteur
- M. Charles BOUVEYRON, Professeur UCA, Dieudonné, Asclepios, Nice, Rapporteur
- M. Thomas BURGER, Chargé de Recherche CNRS, CEA, Grenoble, Examinateur

Lieu : Bâtiment Boucherle, 109 Faculté de Médecine et de Pharmacie, 38700 La Tronche

— 

Mots-clés : optimisation, factorisation de matrices, structure génétique des populations, métissage, étude d’association, facteurs de confusion, bio-informatique

Résumé : Nous présentons des méthodes statistiques reposant sur des problèmes de factorisation matricielle.
Une première méthode permet l’inférence rapide de la structure de populations à partir de données génétiques en incluant l’information de proximité géographique.
Une deuxième méthode permet de corriger les études d’association pour les facteurs de confusion. Nous présentons dans ce manuscrit les modèles statistiques, ainsi que des aspects théoriques des algorithmes d’inférence. De plus, à l’aide de simulations numériques, nous
comparons les performances de nos méthodes à celles des méthodes existantes.
Enfin, nous appliquons nos méthodes sur des données biologiques réelles. Nos méthodes ont été implémentées et distribuées sous la forme de packages R : tess3r et lfmm.

— 

Key-words : optimization, matrix factorization, genetic structure of populations, admixture, association study, confounding factors, bioinformatics

Abstract : We present statistical methods based on matrix factorization problems.
A first method allows efficient inference of population structure from genetic data and including geographic proximity information.
A second method corrects the association studies for confounding factors. We present in this manuscript the models, as well as the theoretical aspects of the inference algorithms. Moreover, using numerical simulations, we compare the performance of our methods with those of existing methods.
Finally, we use our methods on real biological data. Our methods have been implemented and distributed as R packages : tess3r and lfmm.