﻿﻿{"id":1671,"date":"2025-11-24T15:25:06","date_gmt":"2025-11-24T14:25:06","guid":{"rendered":"https:\/\/elearningsamba.com\/index.php\/evo-2-lia-qui-ecrit-de-ladn-fonctionnel\/"},"modified":"2025-11-24T15:25:06","modified_gmt":"2025-11-24T14:25:06","slug":"evo-2-lia-qui-ecrit-de-ladn-fonctionnel","status":"publish","type":"page","link":"https:\/\/elearningsamba.com\/index.php\/evo-2-lia-qui-ecrit-de-ladn-fonctionnel\/","title":{"rendered":"Evo 2 \u2013 L&#8217;IA qui \u00e9crit de l&#8217;ADN fonctionnel"},"content":{"rendered":"<p>Vous pensiez que les IA g\u00e9n\u00e9ratives se contentaient de pondre des images de chats \u00e0 6 pattes fa\u00e7on Ghibli et des textes pomp\u00e9s sur Wikip\u00e9dia ? H\u00e9 bien, je vais vous d\u00e9cevoir car des chercheurs de l\u2019Arc Institute, Stanford, NVIDIA, UC Berkeley et d\u2019autres viennent de pousser le concept beaucoup, beaucoup plus loin\u2026<\/p>\n<p>En effet, ils ont cr\u00e9\u00e9 <strong>Evo 2<\/strong>, le plus grand mod\u00e8le d\u2019IA pour la biologie jamais rendu public, capable de lire, comprendre et m\u00eame <strong>\u00e9crire de l\u2019ADN fonctionnel<\/strong>. Et cerise sur le g\u00e2teau, une \u00e9tude publi\u00e9e cette semaine dans <strong><br \/>\n<a href=\"https:\/\/www.nature.com\/articles\/s41586-025-09749-7\">Nature<\/a><br \/>\n<\/strong> d\u00e9montre qu\u2019on peut utiliser cette technologie pour cr\u00e9er des prot\u00e9ines totalement nouvelles qui n\u2019ont jamais exist\u00e9 dans la nature\u2026 et qui fonctionnent vraiment !<\/p>\n<p>Le projet<br \/>\n<a href=\"https:\/\/arcinstitute.org\/news\/evo2\">Evo 2<\/a><br \/>\nfonctionne comme un LLM classique, sauf qu\u2019au lieu de lui faire bouffer du texte, on lui a fait avaler <strong>9,3 trillions de nucl\u00e9otides<\/strong> (les fameux A, T, G, C qui composent l\u2019ADN) provenant de plus de <strong>128 000 g\u00e9nomes<\/strong> couvrant tous les domaines du vivant : bact\u00e9ries, arch\u00e9es, virus, mais aussi humains, plantes et autres eucaryotes.<\/p>\n<p>Leur mod\u00e8le existe en deux versions : 7 milliards et 40 milliards de param\u00e8tres (comparable aux gros LLM actuels) mais sa vraie force, c\u2019est sa fen\u00eatre de contexte d\u2019<strong>un million de paires de bases<\/strong>, soit 8 fois plus que son pr\u00e9d\u00e9cesseur Evo 1. Pour vous donner une id\u00e9e, c\u2019est suffisant pour analyser un chromosome entier de levure ou un g\u00e9nome bact\u00e9rien complet en une seule passe.<\/p>\n<p>Pour entra\u00eener ce monstre, il a fallu mobiliser plus de <strong>2 000 GPU NVIDIA H100<\/strong> pendant plusieurs mois sur le cloud DGX, soit environ 150 fois plus de puissance de calcul qu\u2019AlphaFold. L\u2019architecture utilis\u00e9e, baptis\u00e9e <strong><br \/>\n<a href=\"https:\/\/github.com\/Zymrael\/savanna\/blob\/main\/paper.pdf\">StripedHyena 2<\/a><br \/>\n<\/strong>, permet un entra\u00eenement 3 fois plus rapide que les transformers classiques sur les longues s\u00e9quences et petit fun fact, Greg Brockman, cofondateur d\u2019OpenAI, a particip\u00e9 au d\u00e9veloppement de cette architecture pendant son ann\u00e9e sabbatique.<\/p>\n<p>L\u2019une des applications les plus impressionnantes d\u2019Evo 2, c\u2019est sa capacit\u00e9 \u00e0 pr\u00e9dire si une mutation g\u00e9n\u00e9tique risque de causer une maladie, et ce, <strong>sans aucun entra\u00eenement sp\u00e9cifique<\/strong>. Les chercheurs ont test\u00e9 le mod\u00e8le sur le g\u00e8ne <strong>BRCA1<\/strong>, connu pour son lien avec le cancer du sein. R\u00e9sultat, Evo 2 a pr\u00e9dit avec plus de <strong>90% de pr\u00e9cision<\/strong> quelles mutations \u00e9taient pathog\u00e8nes et lesquelles \u00e9taient b\u00e9nignes.<\/p>\n<p>Mieux encore, Evo 2 est actuellement le seul mod\u00e8le capable de pr\u00e9dire l\u2019effet des mutations dans les r\u00e9gions <strong>non-codantes<\/strong> de l\u2019ADN (les fameuses parties qu\u2019on pensait \u201cinutiles\u201d et qu\u2019on appelait autrefois \u201cADN poubelle\u201d). Pour les variants codants, il est second meilleur, mais pour les variants non-codants, il est carr\u00e9ment le top du top of the pop !<\/p>\n<p>Et pour prouver que le mod\u00e8le ne fait pas que r\u00e9gurgiter ses donn\u00e9es d\u2019entra\u00eenement, l\u2019\u00e9quipe lui a demand\u00e9 d\u2019annoter le g\u00e9nome du <strong>mammouth laineux<\/strong>, une esp\u00e8ce qui n\u2019\u00e9tait \u00e9videmment pas dans son dataset. Et le mod\u00e8le a correctement identifi\u00e9 la structure exons-introns du g\u00e9nome de ce pachyderme (aujourd\u2019hui disparu parce que j\u2019ai mang\u00e9 le dernier), d\u00e9montrant qu\u2019il a vraiment \u201ccompris\u201d les r\u00e8gles fondamentales du vivant.<\/p>\n<p>Mais l\u00e0 o\u00f9 \u00e7a devient vraiment dingue, c\u2019est ce concept de <strong>\u201cdesign s\u00e9mantique\u201d<\/strong>. En effet, dans les g\u00e9nomes bact\u00e9riens, les g\u00e8nes qui travaillent ensemble sont souvent positionn\u00e9s c\u00f4te \u00e0 c\u00f4te, du coup, si on donne \u00e0 l\u2019IA le contexte g\u00e9nomique d\u2019une fonction particuli\u00e8re, elle peut g\u00e9n\u00e9rer de nouveaux g\u00e8nes ayant des fonctions similaires.<\/p>\n<p>En gros, on prompte l\u2019IA avec de l\u2019ADN au lieu de texte, et comme un bon LLM qui compl\u00e8te vos phrases, Evo compl\u00e8te\u2026 vos g\u00e9nomes.<\/p>\n<p>Pour tester cette approche, les chercheurs ont d\u2019abord g\u00e9n\u00e9r\u00e9 une toxine bact\u00e9rienne bas\u00e9e sur une toxine connue. Ils ont ensuite utilis\u00e9 cette toxine comme \u201cprompt\u201d pour demander \u00e0 l\u2019IA de cr\u00e9er des antitoxines correspondantes. Sur <strong>10 propositions<\/strong>, la moiti\u00e9 ont r\u00e9ussi \u00e0 neutraliser partiellement la toxine, et deux d\u2019entre elles l\u2019ont compl\u00e8tement d\u00e9sactiv\u00e9e avec 95-100% de survie cellulaire.<\/p>\n<p>Et ces antitoxines n\u2019avaient que <strong>21 \u00e0 27% de similarit\u00e9<\/strong> avec les prot\u00e9ines existantes, donc autant dire qu\u2019Evo a invent\u00e9 quelque chose de quasi-nouveau ! Et ce n\u2019est pas du bricolage al\u00e9atoire puisque l\u2019analyse montre que ces prot\u00e9ines seraient l\u2019\u00e9quivalent d\u2019un assemblage de <strong>15 \u00e0 20 morceaux<\/strong> de prot\u00e9ines diff\u00e9rentes, recombin\u00e9s de fa\u00e7on in\u00e9dite.<\/p>\n<p>Et ce qui est encore plus impressionnant, c\u2019est que certaines de ces antitoxines g\u00e9n\u00e9r\u00e9es fonctionnent contre <strong>plusieurs toxines diff\u00e9rentes<\/strong> utilisant des m\u00e9canismes d\u2019action distincts. L\u2019une d\u2019elles neutralise trois toxines naturelles, alors que l\u2019antitoxine naturelle \u00e9quivalente ne fonctionne que contre sa toxine d\u2019origine. L\u2019IA aurait donc identifi\u00e9 une compatibilit\u00e9 fonctionnelle plus large que ce qu\u2019on observe dans la nature !<\/p>\n<p>Les chercheurs ont aussi test\u00e9 des syst\u00e8mes o\u00f9 l\u2019antitoxine est un <strong>ARN<\/strong> plut\u00f4t qu\u2019une prot\u00e9ine. L\u00e0 encore, le mod\u00e8le a g\u00e9n\u00e9r\u00e9 une antitoxine fonctionnelle avec 88% de survie, tout en conservant les caract\u00e9ristiques structurelles essentielles malgr\u00e9 une s\u00e9quence divergente.<\/p>\n<p>Mais surtout, l\u2019\u00e9quipe a g\u00e9n\u00e9r\u00e9 une toxine qui ne ressemble \u00e0 <strong>absolument rien de connu<\/strong>. Aucune similarit\u00e9 de s\u00e9quence, aucune similarit\u00e9 structurale, m\u00eame avec les m\u00e9thodes de d\u00e9tection les plus sensibles. Pour reconstituer tous les acides amin\u00e9s de cette prot\u00e9ine, il faudrait recombiner des fragments de <strong>plus de 40 prot\u00e9ines diff\u00e9rentes<\/strong>, ce qui ressemble plus \u00e0 une prot\u00e9ine Frankenstein cr\u00e9\u00e9e de toutes pi\u00e8ces qu\u2019\u00e0 une variation \u00e9volutive.<\/p>\n<p>Et histoire de pousser l\u2019id\u00e9e encore plus loin, l\u2019\u00e9quipe s\u2019est attaqu\u00e9e aux <strong>anti-CRISPR<\/strong>. Ce sont des prot\u00e9ines utilis\u00e9es par les phages pour d\u00e9sactiver le syst\u00e8me immunitaire bact\u00e9rien, qui sont parmi les plus \u00e9volutives qui existent, avec une diversit\u00e9 de s\u00e9quences et de m\u00e9canismes absolument folle.<\/p>\n<p>Et <strong>17% des prot\u00e9ines g\u00e9n\u00e9r\u00e9es<\/strong> ont montr\u00e9 une activit\u00e9 anti-CRISPR mesurable, soit un taux de succ\u00e8s remarquable. Parmi les candidates qui fonctionnent, certaines n\u2019ont aucune similarit\u00e9 de s\u00e9quence d\u00e9tectable avec les prot\u00e9ines connues, et m\u00eame leurs structures pr\u00e9dites ne ressemblent \u00e0 rien dans les bases de donn\u00e9es. Ce sont litt\u00e9ralement des prot\u00e9ines nouvelles qui font le job !<\/p>\n<p>Mais Evo 2 ne s\u2019arr\u00eate pas \u00e0 la g\u00e9n\u00e9ration de prot\u00e9ines individuelles. Le mod\u00e8le peut maintenant cr\u00e9er des <strong>s\u00e9quences g\u00e9nomiques compl\u00e8tes<\/strong> de plusieurs centaines de milliers de paires de bases. L\u2019\u00e9quipe a test\u00e9 trois niveaux de complexit\u00e9 :<\/p>\n<ul>\n<li><strong>G\u00e9nomes mitochondriaux<\/strong> : \u00e0 partir d\u2019un fragment de 3 kb d\u2019ADN mitochondrial humain, Evo 2 a g\u00e9n\u00e9r\u00e9 des g\u00e9nomes complets de 16 000 bases avec le bon nombre de g\u00e8nes codants, d\u2019ARNt et d\u2019ARNr. Les prot\u00e9ines g\u00e9n\u00e9r\u00e9es ont \u00e9t\u00e9 valid\u00e9es par AlphaFold 3 et correspondent \u00e0 des complexes fonctionnels de la cha\u00eene respiratoire.<\/li>\n<li><strong>G\u00e9nomes bact\u00e9riens<\/strong> : en partant de <em>Mycoplasma genitalium<\/em> (le g\u00e9nome bact\u00e9rien minimal), le mod\u00e8le a produit des s\u00e9quences de 600 kb o\u00f9 pr\u00e8s de 70% des g\u00e8nes pr\u00e9dits correspondent \u00e0 des domaines prot\u00e9iques connus.<\/li>\n<li><strong>Chromosomes de levure<\/strong> : Evo 2 a g\u00e9n\u00e9r\u00e9 330 kb d\u2019ADN eucaryote avec des introns, des promoteurs, des ARNt correctement positionn\u00e9s, le tout ressemblant aux vrais g\u00e8nes de levure.<\/li>\n<\/ul>\n<p>Les chercheurs ont m\u00eame encod\u00e9 des <strong>messages en code Morse<\/strong> (\u201cEVO2\u201d, \u201cLO\u201d) dans les profils d\u2019accessibilit\u00e9 de la chromatine des s\u00e9quences g\u00e9n\u00e9r\u00e9es, d\u00e9montrant qu\u2019on peut \u201cprogrammer\u201d l\u2019\u00e9pig\u00e9nome avec ce mod\u00e8le.<\/p>\n<p>On nage en pleine science-fiction, mais \u00e7a fonctionne !<\/p>\n<p>Pour finir en beaut\u00e9, l\u2019\u00e9quipe a l\u00e2ch\u00e9 Evo sur <strong>1,7 million de g\u00e8nes<\/strong> bact\u00e9riens et viraux comme prompts, g\u00e9n\u00e9rant <strong>120 milliards de paires de bases<\/strong> d\u2019ADN synth\u00e9tique. Cette base de donn\u00e9es, baptis\u00e9e<br \/>\n<a href=\"https:\/\/evodesign.org\/syngenome\/\">SynGenome<\/a><br \/>\n, est accessible gratuitement et permet de rechercher des s\u00e9quences par fonction, domaine prot\u00e9ique, esp\u00e8ce ou terme Gene Ontology.<\/p>\n<p><img decoding=\"async\" src=\"https:\/\/korben.info\/cdn-cgi\/image\/width=1200,fit=scale-down,quality=90,f=avif\/evo-2-ia-genere-proteines-fonctionnelles\/evo-2-ia-genere-proteines-fonctionnelles-1.png\" alt=\"\" loading=\"lazy\"><\/p>\n<p>On y trouve notamment des <strong>prot\u00e9ines chim\u00e9riques<\/strong> avec des fusions de domaines jamais observ\u00e9es dans la nature. Ces combinaisons pourraient repr\u00e9senter des innovations fonctionnelles \u00e0 explorer pour la biologie synth\u00e9tique.<\/p>\n<p>Et le plus beau dans tout \u00e7a c\u2019est que <strong>tout est open source<\/strong>. Les mod\u00e8les (7B et 40B param\u00e8tres) sont disponibles sur<br \/>\n<a href=\"https:\/\/huggingface.co\/arcinstitute\">Hugging Face<\/a><br \/>\n, le code d\u2019entra\u00eenement et d\u2019inf\u00e9rence est sur<br \/>\n<a href=\"https:\/\/github.com\/arcinstitute\/evo2\">GitHub<\/a><br \/>\n, et le dataset OpenGenome2 est t\u00e9l\u00e9chargeable. Vous pouvez m\u00eame tester Evo 2 directement dans votre navigateur via l\u2019<br \/>\n<a href=\"https:\/\/build.nvidia.com\/arc\/evo2-40b\">API h\u00e9berg\u00e9e par NVIDIA<\/a><br \/>\nou l\u2019interface <strong>Evo Designer<\/strong>.<\/p>\n<p>\n<img decoding=\"async\" src=\"https:\/\/korben.info\/cdn-cgi\/image\/width=1200,fit=scale-down,quality=90,f=avif\/evo-2-ia-genere-proteines-fonctionnelles\/evo-2-ia-genere-proteines-fonctionnelles-2.png\" alt=\"\" loading=\"lazy\">\n<\/p>\n<p>Pour ceux qui veulent aller plus loin, NVIDIA propose aussi des tutoriels de fine-tuning via son framework<br \/>\n<a href=\"https:\/\/docs.nvidia.com\/bionemo-framework\/\">BioNeMo<\/a><br \/>\n, et une collaboration avec le labo<br \/>\n<a href=\"https:\/\/www.goodfire.ai\/research\/interpreting-evo-2\">Goodfire<\/a><br \/>\na produit un outil d\u2019interpr\u00e9tabilit\u00e9 pour visualiser ce que le mod\u00e8le \u201cvoit\u201d dans les s\u00e9quences g\u00e9nomiques.<\/p>\n<p>Bien s\u00fbr, la g\u00e9n\u00e9ration autor\u00e9gressive peut produire des s\u00e9quences r\u00e9p\u00e9titives ou des \u201challucinations\u201d biologiques (des g\u00e8nes r\u00e9alistes mais non fonctionnels), et c\u2019est pourquoi ce design s\u00e9mantique n\u00e9cessite des filtres et des validations exp\u00e9rimentales. De plus, cette approche est limit\u00e9e aux fonctions encod\u00e9es par les relations contextuelles dans les g\u00e9nomes prokaryotes, ce qui exclut de nombreuses applications eucaryotes\u2026 pour l\u2019instant.<\/p>\n<p>Un des g\u00e9nomes bact\u00e9riens g\u00e9n\u00e9r\u00e9s \u00e9tait d\u2019ailleurs incomplet et ne fonctionnerait probablement pas si on le synth\u00e9tisait et l\u2019ins\u00e9rait dans une vraie bact\u00e9rie. Mais l\u2019\u00e9quipe travaille d\u00e9j\u00e0 avec des experts en synth\u00e8se et assemblage d\u2019ADN de l\u2019Universit\u00e9 du Maryland pour tester exp\u00e9rimentalement ces g\u00e9nomes g\u00e9n\u00e9r\u00e9s.<\/p>\n<p>Bref, on n\u2019en est pas encore \u00e0 cr\u00e9er des enzymes qui dig\u00e8rent le plastique sur commande, mais le fait qu\u2019une IA puisse g\u00e9n\u00e9rer des prot\u00e9ines fonctionnelles \u00e0 partir de rien, juste en apprenant les patterns de l\u2019\u00e9volution\u2026 c\u2019est quand m\u00eame compl\u00e8tement dingue. Et avec un taux de succ\u00e8s allant de 17 \u00e0 50% sur seulement quelques dizaines de variants test\u00e9s, le design s\u00e9mantique surpasse d\u00e9j\u00e0 de nombreuses m\u00e9thodes classiques de conception de prot\u00e9ines.<\/p>\n<p>Quoiqu\u2019il en soit, la biologie g\u00e9n\u00e9rative vient de franchir un cap, et j\u2019ai h\u00e2te de voir ce que les biologistes vont en faire !<\/p>\n<p>\n<a href=\"https:\/\/arstechnica.com\/science\/2025\/11\/generative-ai-meets-the-genome\/\">Source<\/a><\/p>\n","protected":false},"excerpt":{"rendered":"<p>Vous pensiez que les IA g\u00e9n\u00e9ratives se contentaient de pondre des images de chats \u00e0 6 pattes fa\u00e7on Ghibli et des textes pomp\u00e9s sur Wikip\u00e9dia ? H\u00e9 bien, je vais vous d\u00e9cevoir car des chercheurs de l\u2019Arc Institute, Stanford, NVIDIA, UC Berkeley et d\u2019autres viennent de pousser le concept beaucoup, beaucoup plus loin\u2026 En effet, ils ont cr\u00e9\u00e9 Evo 2, le plus grand mod\u00e8le d\u2019IA pour la biologie jamais rendu public, capable de lire, comprendre et m\u00eame \u00e9crire de l\u2019ADN fonctionnel. Et cerise sur le g\u00e2teau, une \u00e9tude publi\u00e9e cette semaine dans Nature d\u00e9montre qu\u2019on peut utiliser cette technologie pour cr\u00e9er des prot\u00e9ines totalement nouvelles qui n\u2019ont jamais exist\u00e9 dans la nature\u2026 et qui fonctionnent vraiment ! Le projet Evo 2 fonctionne comme un LLM classique, sauf qu\u2019au lieu de lui faire bouffer du texte, on lui a fait avaler 9,3 trillions de nucl\u00e9otides (les fameux A, T, G, C qui composent l\u2019ADN) provenant de plus de 128 000 g\u00e9nomes couvrant tous les domaines du vivant : bact\u00e9ries, arch\u00e9es, virus, mais aussi humains, plantes et autres eucaryotes. Leur mod\u00e8le existe en deux versions : 7 milliards et 40 milliards de param\u00e8tres (comparable aux gros LLM actuels) mais sa vraie force, c\u2019est sa fen\u00eatre de contexte d\u2019un million de paires de bases, soit 8 fois plus que son pr\u00e9d\u00e9cesseur Evo 1. Pour vous donner une id\u00e9e, c\u2019est suffisant pour analyser un chromosome entier de levure ou un g\u00e9nome bact\u00e9rien complet en une seule passe. Pour entra\u00eener ce monstre, il a fallu mobiliser plus de 2 000 GPU NVIDIA H100 pendant plusieurs mois sur le cloud DGX, soit environ 150 fois plus de puissance de calcul qu\u2019AlphaFold. L\u2019architecture utilis\u00e9e, baptis\u00e9e StripedHyena 2 , permet un entra\u00eenement 3 fois plus rapide que les transformers classiques sur les longues s\u00e9quences et petit fun fact, Greg Brockman, cofondateur d\u2019OpenAI, a particip\u00e9 au d\u00e9veloppement de cette architecture pendant son ann\u00e9e sabbatique. L\u2019une des applications les plus impressionnantes d\u2019Evo 2, c\u2019est sa capacit\u00e9 \u00e0 pr\u00e9dire si une mutation g\u00e9n\u00e9tique risque de causer une maladie, et ce, sans aucun entra\u00eenement sp\u00e9cifique. Les chercheurs ont test\u00e9 le mod\u00e8le sur le g\u00e8ne BRCA1, connu pour son lien avec le cancer du sein. R\u00e9sultat, Evo 2 a pr\u00e9dit avec plus de 90% de pr\u00e9cision quelles mutations \u00e9taient pathog\u00e8nes et lesquelles \u00e9taient b\u00e9nignes. Mieux encore, Evo 2 est actuellement le seul mod\u00e8le capable de pr\u00e9dire l\u2019effet des mutations dans les r\u00e9gions non-codantes de l\u2019ADN (les fameuses parties qu\u2019on pensait \u201cinutiles\u201d et qu\u2019on appelait autrefois \u201cADN poubelle\u201d). Pour les variants codants, il est second meilleur, mais pour les variants non-codants, il est carr\u00e9ment le top du top of the pop ! Et pour prouver que le mod\u00e8le ne fait pas que r\u00e9gurgiter ses donn\u00e9es d\u2019entra\u00eenement, l\u2019\u00e9quipe lui a demand\u00e9 d\u2019annoter le g\u00e9nome du mammouth laineux, une esp\u00e8ce qui n\u2019\u00e9tait \u00e9videmment pas dans son dataset. Et le mod\u00e8le a correctement identifi\u00e9 la structure exons-introns du g\u00e9nome de ce pachyderme (aujourd\u2019hui disparu parce que j\u2019ai mang\u00e9 le dernier), d\u00e9montrant qu\u2019il a vraiment \u201ccompris\u201d les r\u00e8gles fondamentales du vivant. Mais l\u00e0 o\u00f9 \u00e7a devient vraiment dingue, c\u2019est ce concept de \u201cdesign s\u00e9mantique\u201d. En effet, dans les g\u00e9nomes bact\u00e9riens, les g\u00e8nes qui travaillent ensemble sont souvent positionn\u00e9s c\u00f4te \u00e0 c\u00f4te, du coup, si on donne \u00e0 l\u2019IA le contexte g\u00e9nomique d\u2019une fonction particuli\u00e8re, elle peut g\u00e9n\u00e9rer de nouveaux g\u00e8nes ayant des fonctions similaires. En gros, on prompte l\u2019IA avec de l\u2019ADN au lieu de texte, et comme un bon LLM qui compl\u00e8te vos phrases, Evo compl\u00e8te\u2026 vos g\u00e9nomes. Pour tester cette approche, les chercheurs ont d\u2019abord g\u00e9n\u00e9r\u00e9 une toxine bact\u00e9rienne bas\u00e9e sur une toxine connue. Ils ont ensuite utilis\u00e9 cette toxine comme \u201cprompt\u201d pour demander \u00e0 l\u2019IA de cr\u00e9er des antitoxines correspondantes. Sur 10 propositions, la moiti\u00e9 ont r\u00e9ussi \u00e0 neutraliser partiellement la toxine, et deux d\u2019entre elles l\u2019ont compl\u00e8tement d\u00e9sactiv\u00e9e avec 95-100% de survie cellulaire. Et ces antitoxines n\u2019avaient que 21 \u00e0 27% de similarit\u00e9 avec les prot\u00e9ines existantes, donc autant dire qu\u2019Evo a invent\u00e9 quelque chose de quasi-nouveau ! Et ce n\u2019est pas du bricolage al\u00e9atoire puisque l\u2019analyse montre que ces prot\u00e9ines seraient l\u2019\u00e9quivalent d\u2019un assemblage de 15 \u00e0 20 morceaux de prot\u00e9ines diff\u00e9rentes, recombin\u00e9s de fa\u00e7on in\u00e9dite. Et ce qui est encore plus impressionnant, c\u2019est que certaines de ces antitoxines g\u00e9n\u00e9r\u00e9es fonctionnent contre plusieurs toxines diff\u00e9rentes utilisant des m\u00e9canismes d\u2019action distincts. L\u2019une d\u2019elles neutralise trois toxines naturelles, alors que l\u2019antitoxine naturelle \u00e9quivalente ne fonctionne que contre sa toxine d\u2019origine. L\u2019IA aurait donc identifi\u00e9 une compatibilit\u00e9 fonctionnelle plus large que ce qu\u2019on observe dans la nature ! Les chercheurs ont aussi test\u00e9 des syst\u00e8mes o\u00f9 l\u2019antitoxine est un ARN plut\u00f4t qu\u2019une prot\u00e9ine. L\u00e0 encore, le mod\u00e8le a g\u00e9n\u00e9r\u00e9 une antitoxine fonctionnelle avec 88% de survie, tout en conservant les caract\u00e9ristiques structurelles essentielles malgr\u00e9 une s\u00e9quence divergente. Mais surtout, l\u2019\u00e9quipe a g\u00e9n\u00e9r\u00e9 une toxine qui ne ressemble \u00e0 absolument rien de connu. Aucune similarit\u00e9 de s\u00e9quence, aucune similarit\u00e9 structurale, m\u00eame avec les m\u00e9thodes de d\u00e9tection les plus sensibles. Pour reconstituer tous les acides amin\u00e9s de cette prot\u00e9ine, il faudrait recombiner des fragments de plus de 40 prot\u00e9ines diff\u00e9rentes, ce qui ressemble plus \u00e0 une prot\u00e9ine Frankenstein cr\u00e9\u00e9e de toutes pi\u00e8ces qu\u2019\u00e0 une variation \u00e9volutive. Et histoire de pousser l\u2019id\u00e9e encore plus loin, l\u2019\u00e9quipe s\u2019est attaqu\u00e9e aux anti-CRISPR. Ce sont des prot\u00e9ines utilis\u00e9es par les phages pour d\u00e9sactiver le syst\u00e8me immunitaire bact\u00e9rien, qui sont parmi les plus \u00e9volutives qui existent, avec une diversit\u00e9 de s\u00e9quences et de m\u00e9canismes absolument folle. Et 17% des prot\u00e9ines g\u00e9n\u00e9r\u00e9es ont montr\u00e9 une activit\u00e9 anti-CRISPR mesurable, soit un taux de succ\u00e8s remarquable. Parmi les candidates qui fonctionnent, certaines n\u2019ont aucune similarit\u00e9 de s\u00e9quence d\u00e9tectable avec les prot\u00e9ines connues, et m\u00eame leurs structures pr\u00e9dites ne ressemblent \u00e0 rien dans les bases de donn\u00e9es. Ce sont litt\u00e9ralement des prot\u00e9ines nouvelles qui font le job ! Mais Evo 2 ne s\u2019arr\u00eate pas \u00e0 la g\u00e9n\u00e9ration de prot\u00e9ines individuelles. Le mod\u00e8le peut maintenant cr\u00e9er des s\u00e9quences g\u00e9nomiques compl\u00e8tes de plusieurs centaines de milliers de paires de bases. L\u2019\u00e9quipe a test\u00e9 trois niveaux de complexit\u00e9 :<\/p>\n","protected":false},"author":1,"featured_media":1672,"parent":0,"menu_order":0,"comment_status":"closed","ping_status":"closed","template":"","meta":{"give_campaign_id":0,"_monsterinsights_skip_tracking":false,"_monsterinsights_sitenote_active":false,"_monsterinsights_sitenote_note":"","_monsterinsights_sitenote_category":0,"_kadence_starter_templates_imported_post":false,"footnotes":""},"class_list":["post-1671","page","type-page","status-publish","has-post-thumbnail","hentry"],"campaignId":"","_links":{"self":[{"href":"https:\/\/elearningsamba.com\/index.php\/wp-json\/wp\/v2\/pages\/1671","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/elearningsamba.com\/index.php\/wp-json\/wp\/v2\/pages"}],"about":[{"href":"https:\/\/elearningsamba.com\/index.php\/wp-json\/wp\/v2\/types\/page"}],"author":[{"embeddable":true,"href":"https:\/\/elearningsamba.com\/index.php\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/elearningsamba.com\/index.php\/wp-json\/wp\/v2\/comments?post=1671"}],"version-history":[{"count":0,"href":"https:\/\/elearningsamba.com\/index.php\/wp-json\/wp\/v2\/pages\/1671\/revisions"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/elearningsamba.com\/index.php\/wp-json\/wp\/v2\/media\/1672"}],"wp:attachment":[{"href":"https:\/\/elearningsamba.com\/index.php\/wp-json\/wp\/v2\/media?parent=1671"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}