Soutenance de thèse de Thomas Dias-Alves le 18/12/17

Thomas Dias-Alves de l’équipe BCM soutiendra sa thèse le lundi 18 décembre 2017 à 13h30 sur le thème :

« Modélisation du déséquilibre de liaison en génomique des populations par méthodes d’optimisation »

“ Modeling the linkage disequilibrium in population genomics with optimization methods ”

Direction de Thèse :
- M. Michael BLUM, Directeur de Recherche CNRS, Université Grenoble Alpes, laboratoire TIMC-IMAG, Grenoble, Directeur

Membres du jury :
- Mme Emmanuelle Génin, Directrice de Recherche INSERM, UMR 1078 ’Genetics, functional genomics and biotechnology’, UBO, Brest, Rapporteur
- M. Julien Chiquet, Chargé de Recherche UMR AgroParisTech / INRA, MIA, Paris, Rapporteur
- M. Franck Picard, Directeur de Recherche CNRS UMR LBBE "Biométrie et Biologie Évolutive", UCB, Lyon, Examinateur
- M. Étienne Patin, Chargé de Recherche CNRS URA3012 / Institut Pasteur, Paris, Examinateur
- M. Bertrand Servin, Chargé de Recherche INRA Unité GenPhySE "Génétique, Physiologie et Systèmes d’Élevage", Toulouse, Examinateur

Lieu : Salle des Thèses du Bâtiment Boucherle, 109 Faculté de Médecine et de Pharmacie, 38700 La Tronche

— 

Mots-clés : optimisation, déséquilibre de liaison, haplotype

Résumé : Nous présentons un nouveau formalisme et des nouvelles méthodes pour modéliser le déséquilibre de liaison et tenir compte de la structure en haplotypes pour les données issues de la génomique des populations. La modélisation repose sur un problème d’optimisation avec contraintes qui est résolue avec un algorithme de programmation dynamique. Les méthodes établies ont toutes l’avantage d’avoir un coût algorithmique linéaire et donc de pouvoir traiter de grands jeux de données.
Dans un premier temps, nous avons appliqué notre approche à l’étude des populations métisses et plus particulièrement au problème d’inférence des coefficients de métissage locaux.
Notre méthode a été appliquée à des génotypes simulés de métissage humain ainsi qu’à des vrais génotypes obtenus dans des populations métisses de peupliers.
Dans un second temps, nous avons développé notre formalisme d’optimisation pour traiter de l’inférence des haplotypes à partir des génotypes d’une population.
L’ensemble de ces méthodes d’optimisation a été développé dans un module Python qui s’appelle Loter.

— 

Key-words : optimization, linkage disequillibrium, haplotype

Abstract : We present a new formalism and new methods to model linkage disequilibrium and to account for haplotype structure of population genomics data. Modeling relies on an optimization problem with constraints that is solved using dynamic programming. The algorithmic cost of proposed methods is linear, which is a desirable property to process large datasets.
First, we applied our framework to study admixed populations and perform local ancestry inference. Our method is applied to simulated genotypes of admixed human populations and to real genotypes from admixed Populus species.
Second, we developed our optimization framework to perform haploptype phasing and imputation based on a population of genotypes. All optimization methods have been developed in a Python package called Loter.


Laboratoire TIMC-IMAG, Domaine de la Merci, 38706 La Tronche Cedex

CNRS
UGA
ENVL
Grenoble INP
Mentions Légales