L’intelligence artificielle au service de la sélection génétique des animaux d’élevage

Deux laboratoires du centre INRAE Occitanie-Toulouse, Génétique et physiologie des systèmes d’élevage (Genphyse – INRAE/INP ENSAT/ENVT) et Mathématiques et informatique appliquées Toulouse (MIAT – INRAE), ont mis au point un projet interdisciplinaire original associant intelligence artificielle et génétique moléculaire pour prédire l’impact des variabilités génétiques.

illustration L’intelligence artificielle au service de la sélection génétique des animaux d’élevage
© INRAE

Il y a quelques années, la sélection génétique animale a connu une véritable révolution grâce à l’avènement de la génomique, qui a permis de séquencer les génomes et donc de beaucoup plus facilement sélectionner certains traits de caractères essentiels aux programmes de sélection (les phénotypes). Cependant, relier des variations génétiques détectées à des caractères phénotypiques d’intérêt reste toujours compliqué. Dans le projet OBAMA, la combinaison de l’intelligence artificielle (AI) et de la génomique animale, vise à améliorer la compréhension de l’influence des facteurs génétiques sur les phénotypes.

La sélection génétique : un gène = un phénotype ?

Si seulement c’était aussi simple… Les progrès de la génomique ont permis de découvrir plusieurs variations génétiques, des versions différentes d’un même gène ou d’un ensemble de gènes, qui sont à l’origine de différents phénotypes. Ces derniers correspondent à des caractères plus ou moins visibles chez un individu. Il peut ainsi s’agir de la couleur des poils, de la quantité de lait produite ou encore de la résistance à la chaleur.

Cependant, dire qu’un gène est responsable d’un phénotype est une simplification qui s’observe finalement rarement dans la réalité. Au final, c’est souvent un ensemble de variations génétiques qui entre en jeu. Or, certaines (pour ne pas dire la majorité) se localisent dans des régions non codantes de l’ADN, très nombreuses et encore méconnues. Il est donc difficile de comprendre comment ces variations affectent les gènes et donc les phénotypes.

L’intelligence artificielle, une possible réponse

Parmi les différentes méthodes utilisées en IA, il y a notamment l’apprentissage automatique ou machine learning en anglais. Cela consiste à laisser la machine apprendre « seule » sur un projet ou une question, en lui fournissant d’énormes quantités de données. Ce qui pour l’instant a été principalement développée pour l’analyse d’images, mais n’existe pas pour l’analyse de séquences ADN.

Des méthodes de l’apprentissage profond (deep learning en anglais), qui est une des formes du machine learning, ont déjà été développées chez l’humain pour évaluer l’impact de mutations (donc de variations génétiques) sur différents processus moléculaires clés. Ces méthodes aident ainsi à mieux comprendre comment des variations génétiques non codantes peuvent influencer des phénotypes chez l’humain. Le but est donc de transposer cette méthode chez les animaux d’élevage, en particulier chez le porc.

Une méthode qui nécessite beaucoup de données

La méthode d’intelligence artificielle choisie nécessite de très nombreuses séquences d’ADN pour s’entraîner et apprendre. Cependant, il faut, en outre, que ces séquences soient associées à des données fonctionnelles et biologiques pour parfaire la prédiction génétique-phénotype. Chez l’humain, ce genre d’information est limitée.

En revanche, chez les animaux d’élevage et le porc en particulier, on peut enrichir les jeux de données grâce à l’orthologie. Il s’agit d’un lien qui s’établit au cours de l’évolution entre deux gènes présents chez deux espèces différentes, le porc et le sanglier par exemple.

En utilisant les informations génétiques d’autres animaux proches du porc ayant des gènes orthologues, les scientifiques pourront considérablement augmenter les jeux de données sur lesquels l’IA s’entraînera et apprendra.

Ce projet original et interdisciplinaire permettra de mettre en place une nouvelle stratégie d’identification de variations génétiques à l’origine de caractères complexes d’intérêt chez le porc et aidera ainsi à l’amélioration des schémas de sélection actuels.

Le projet OBAMA bénéficie du soutien du métaprogramme INRAE « DIGIT-BIO » qui s’intéresse aux comportements des systèmes biologiques, de l’échelle de la molécule à celle de l’organisme et de la population dans leurs environnements de proximité.

Source : https://www.inrae.fr/actualites/lintelligence-artificielle-au-service-selection-genetique-animaux-delevage

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *

Ce site utilise Akismet pour réduire les indésirables. En savoir plus sur comment les données de vos commentaires sont utilisées.