Soutenance de thèse de Charlotte MAUGARD le 25/11/19

Charlotte MAUGARD des équipes EPSP et BCM soutiendra sa thèse le lundi 25 novembre 2019 à 14h :


« Analyse des données massives de source assurantielle de la Mutualité Sociale Agricole,
pour la surveillance en santé au travail des travailleurs agricoles en France »


Lieu :  Amphithéâtre du Grenoble Institut des Neurosciences (GIN), 31 Chemin Fortuné Ferrini, 38700 La Tronche
 


Direction de thèse :


Jury :
  • Dr Pierre LEBAILLY, Maître de conférences, Centre régional de lutte contre le cancer François Baclesse, INSERM - UMR 1086 «ANTICIPE» (Rapporteur)
  • Pr Marie ZINS,Professeur des universités - praticien hospitalier, Hôpital Paul Brousse, INSERM - UMS 011 « Cohortes en population » (Rapporteure)
  • Dr Florence FORBES, Directrice de recherche, INRIA Grenoble Rhône Alpes (Examinatrice)
  • Dr Rémy SLAMA, Directeur de recherche, Inserm U1209 / CNRS UMR 5309, IAB, Université Grenoble Alpes (Président)


    bullet Résumé :
     
     
    Introduction : La surveillance sanitaire et la vigilance (identification de nouveaux risques en particulier) représentent un enjeu majeur dans le champ santé-travail. En complément des études épidémiologiques classiques, l’analyse systématique, sans a priori, de données collectées en routine pourrait être un atout pour la détection précoce de pathologies en lien avec le travail. Dans ce contexte, la Mutualité Sociale Agricole (MSA), le régime de protection sociale dédié aux travailleurs agricoles français, a souhaité développer son activité de vigilance en exploitant ses données médico-administratives, utilisées pour le remboursement de prestations de santé. En partenariat avec l’Agence nationale de sécurité sanitaire de l'alimentation, de l'environnement et du travail (Anses), un projet de fouille des données a donc été mis en place dans lequel ce travail de thèse s’inscrit. L’objectif de la thèse consiste plus précisément à tester, sans hypothèses préalables, l'existence ou non d'associations entre les activités agricoles et les pathologies reconnues en tant qu’affection de longue durée (ALD). 
     
    Méthode : Les travaux présentés ont été menés sur la population de non-salariés (chefs d’exploitation ou d’entreprise) affiliés à la MSA, en disposant d’une part de données de cotisations, renseignant au niveau individuel, les activités professionnelles, caractéristiques démographiques et socio-économiques, et d’autre part, de données médico-administratives renseignant les déclarations de pathologies reconnues en ALD et informations associées dont la pathologie codée en CIM-10. Grâce à l’accord de la CNIL, un identifiant unique a été créé pour que, pour la première fois, ces données administratives et médico-administratives puissent être fusionnées et restructurées afin de permettre l’application de modèles. Des modèles de régression logistique ont été utilisés, en adaptant la sélection de variables pour chaque ALD et en utilisant la validation croisée afin de limiter le surajustement des modèles. Plusieurs méthodes ont été testées pour mieux prendre en compte les facteurs de confusion potentiels. Ces différents modèles ont ensuite été évalués via des mesures de robustesse et appliqués aux données à deux niveaux de précision pour la pathologie (ALD et CIM-10). Les associations statistiques entre chaque combinaison d’activité professionnelle et de pathologie ont été caractérisées par leur p-valeur, corrigées pour les tests multiples, et la valeur de l’odds ratio correspondant.
     
    Résultats : Le traitement des données a permis d’étudier une population constituée de 899 212 non-salariés affiliés entre 2006 et 2016. Au sein de cette population, il a été possible d’identifier 100 706 individus avec au moins une déclaration d’ALD sur la période d’observation. La méthodologie appliquée a mis en évidence 54 associations statistiquement significatives entre une activité professionnelle et une ALD, permettant à la fois de capturer des déterminants de santé déjà connus ou suspectés mais aussi de générer des hypothèses intéressantes. Après ajustement sur des facteurs de confusion, les secteurs agricoles les plus associés à des pathologies, faisant l’objet d’ALD chez les non-salariés, sont la viticulture, l’exploitation de bois, le paysagisme, et les entreprises de jardins ou de reboisement.
     
    Discussion : Ce travail de thèse apporte une première démonstration de la faisabilité et de la pertinence de l’analyse systématique des données collectées en routine à des fins assurantielles, sur l’ensemble de la population agricole, pour rechercher des risques sanitaires associés aux diverses activités professionnelles. Les « signaux » ainsi mis en évidence seront investigués à l’aide d’un groupe d’experts. D’autres modèles pourront être testés, au premier rang desquels les modèles de survie. Cette approche pourra ainsi constituer un outil précieux contribuant au dispositif de vigilance sanitaire des risques professionnels agricoles.

     

    bulletMots clés :

    Bases de données administratives, Assurance Maladie, Surveillance épidémiologique, Fouille de données, Risques professionnels, Travailleurs agricoles