Evo 2, un modèle d’intelligence artificielle développé par des chercheurs de l’Arc Institute, de l’université de Stanford et de NVIDIA, révolutionne la biologie. Ce système ouvert, capable de prédire les variations génétiques et de générer des séquences génomiques, promet d’accélérer la recherche et la conception dans tous les domaines de la vie.
Evo 2 est un modèle d’intelligence artificielle avancée, développé par des chercheurs de l’Arc Institute, de l’université de Stanford et de NVIDIA : entraîné sur 9,3 mille milliards de paires de bases d’ADN provenant d’un atlas génomique hautement soigné qui couvre tous les domaines de la vie, ce modèle est capable de prédire les variations génétiques et de générer des séquences génomiques dans tous les domaines de la vie.

Comme ChatGPT, le célèbre chatbot d’intelligence artificielle désormais également disponible sur Whatsapp, EVO 2 est prêt à débarquer dans les laboratoires du monde entier, en tant que système ouvert (y compris les paramètres du modèle, le code d’apprentissage) pour accélérer l’exploration et la conception de la complexité biologique. Développé par des chercheurs de l’Arc Institute, de l’université de Stanford et de NVIDIA, EVO 2 est un modèle d’intelligence artificielle avancée capable de prédire les variations génétiques et de générer des séquences génomiques dans tous les domaines de la vie.
Les tests montrent qu’Evo 2 prédise avec précision les effets fonctionnels des mutations dans les génomes procaryotes et eucaryotes et peut également réécrire le génome du mammouth laineux à partir de séquences génomiques brutes, sans référence d’apprentissage directe, démontrant la capacité de généraliser la fonction à partir de la seule séquence. Dans l’étude « Genome Modeling and Design Across All Domains of Life with Evo 2 » disponible en preprint sur BioRxiv, ses développeurs expliquent en détail comment ce modèle d’intelligence artificielle, entraîné sur 9,3 mille milliards de paires de bases d’ADN, permet des prévisions et des conceptions à l’échelle génomique. Evo 2, précise les équipes, peut analyser et générer jusqu’à 1 million de nucléotides à la fois, réussissant à évaluer des motifs et des relations à long terme au sein des séquences d’ADN.
Lors de l’entraînement, EVO 2 a prouvé qu’il pouvait prévoir la paire de bases suivante dans une séquence, de manière similaire à la façon dont les modèles linguistiques prédisent le mot suivant dans une phrase. « Cette approche permet à Evo 2 d’identifier des structures génomiques complexes et de modéliser avec précision l’impact fonctionnel des variations génétiques dans tous les domaines de la vie, » ont affirmé les développeurs.
Les résultats des tests ont effectivement mis en évidence la capacité d’EVO 2 à prédire avec précision les effets fonctionnels des mutations dans les génomes de procaryotes et eucaryotes, sans avoir besoin de spécifier l’activité des gènes. « Le modèle a démontré une sensibilité aux mutations dans les codons de départ, les sites d’épissage et les régions génomiques conservées, avec des performances conformes aux contraintes biologiques connues. »
Concernant la génération de séquences à l’échelle génomique, EVO 2 a montré qu’il pouvait créer des génomes mitochondriaux complets, des génomes bactériens et des séquences à l’échelle chromosomique de levure. « Nous avons décidé de rendre EVo 2 complètement ouvert, y compris les paramètres du modèle, le code d’apprentissage, le code d’inférence et le jeu de données OpenGenome2, afin d’accélérer l’exploration et la conception de la complexité biologique, » ont ajouté les développeurs. « Cela représente un progrès significatif dans l’intelligence artificielle génomique, combinant une précision prédictive avec des capacités génératives à l’échelle génomique.«
