Modélisation du déséquilibre de liaison en génomique des populations par méthodes d'optimisation - Archive ouverte HAL Accéder directement au contenu
Thèse Année : 2017

Modeling the linkage disequilibrium in population genomics with optimization methods

Modélisation du déséquilibre de liaison en génomique des populations par méthodes d'optimisation

Résumé

We present a new formalism and new methods to model linkage disequilibrium and to account for haplotype structure of population genomics data. Modeling relies on an optimization problem with constraints that is solved using dynamic programming. The algorithmic cost of proposed methods is linear, which is a desirable property to process large datasets.First, we applied our framework to study admixed populations and perform local ancestry inference. Our method is applied to simulated genotypes of admixed human populations and to real genotypes from admixed Populus species.Second, we developed our optimization framework to perform haploptype phasing and imputation based on a population of genotypes. All optimization methods have been developed in a Python package called Loter.
Nous présentons un nouveau formalisme et des nouvelles méthodes pour modéliser le déséquilibre de liaison et tenir compte de la structure en haplotypes pour les données issues de la génomique des populations. La modélisation repose sur un problème d'optimisation avec contraintes qui est résolue avec un algorithme de programmation dynamique. Les méthodes établies ont toutes l'avantage d'avoir un coût algorithmique linéaire et donc de pouvoir traiter de grands jeux de données.Dans un premier temps, nous avons appliqué notre approche à l'étude des populations métisses et plus particulièrement au problème d'inférence des coefficients de métissage locaux.Notre méthode a été appliquée à des génotypes simulés de métissage humain ainsi qu'à des vrais génotypes obtenus dans des populations métisses de peupliers.Dans un second temps, nous avons développé notre formalisme d'optimisation pour traiter de l'inférence des haplotypes à partir des génotypes d'une population.L'ensemble de ces méthodes d'optimisation a été développé dans un module Python qui s'appelle Loter.
Fichier principal
Vignette du fichier
DIAS-ALVES_2017_diffusion.pdf (5.64 Mo) Télécharger le fichier
Origine : Version validée par le jury (STAR)
Loading...

Dates et versions

tel-01758037 , version 1 (04-04-2018)

Identifiants

  • HAL Id : tel-01758037 , version 1

Citer

Thomas Dias Alves. Modélisation du déséquilibre de liaison en génomique des populations par méthodes d'optimisation. Statistiques [math.ST]. Université Grenoble Alpes, 2017. Français. ⟨NNT : 2017GREAS052⟩. ⟨tel-01758037⟩
1957 Consultations
901 Téléchargements

Partager

Gmail Facebook X LinkedIn More