﻿﻿{"id":2587,"date":"2026-03-23T11:57:06","date_gmt":"2026-03-23T10:57:06","guid":{"rendered":"https:\/\/elearningsamba.com\/index.php\/un-agent-ia-a-mene-700-experiences-en-deux-jours-pour-ameliorer-un-modele-de-langage\/"},"modified":"2026-03-23T11:57:06","modified_gmt":"2026-03-23T10:57:06","slug":"un-agent-ia-a-mene-700-experiences-en-deux-jours-pour-ameliorer-un-modele-de-langage","status":"publish","type":"page","link":"https:\/\/elearningsamba.com\/index.php\/un-agent-ia-a-mene-700-experiences-en-deux-jours-pour-ameliorer-un-modele-de-langage\/","title":{"rendered":"Un agent IA a men\u00e9 700 exp\u00e9riences en deux jours pour am\u00e9liorer un mod\u00e8le de langage"},"content":{"rendered":"<p>Andrej Karpathy, ancien chercheur chez OpenAI et ex-responsable de l&#8217;IA chez Tesla, a laiss\u00e9 tourner un agent IA pendant 48 heures sur un petit mod\u00e8le de langage. R\u00e9sultat : 700 exp\u00e9riences, 20 optimisations retenues et un gain de 11 % sur le temps d&#8217;entra\u00eenement.<\/p>\n<h2>Le principe d&#8217;autoresearch<\/h2>\n<p>Mais c&#8217;est quoi ce concept d&#8217;autoresearch ? Et bien le fonctionnement est assez direct : un agent IA re\u00e7oit un script d&#8217;entra\u00eenement de 630 lignes en Python et un budget de calcul fixe de 5 minutes par exp\u00e9rience sur un seul GPU. Et c&#8217;est l\u00e0 que l&#8217;agent se met en mouvement pour lire le code, formuler une hypoth\u00e8se, modifier le script, lancer l&#8217;entra\u00eenement, \u00e9valuer le r\u00e9sultat, et surtout d\u00e9cider, ou non, de conserver une modification.<\/p>\n<p>Si le mod\u00e8le s&#8217;am\u00e9liore, le changement devient la nouvelle base. Sinon, il revient en arri\u00e8re et essaie autre chose. En deux jours de boucle continue, l&#8217;agent a conduit environ 700 it\u00e9rations et identifi\u00e9 20 am\u00e9liorations cumulables qui ont r\u00e9duit le temps n\u00e9cessaire pour atteindre le niveau GPT-2 de 2,02 heures \u00e0 1,80 heure.<\/p>\n<p>Tobias L\u00fctke, le patron de Shopify, a d&#8217;ailleurs test\u00e9 le syst\u00e8me sur des donn\u00e9es internes : apr\u00e8s une nuit, 37 exp\u00e9riences et un gain de 19 % sur les performances de son mod\u00e8le.<\/p>\n<h2>La question de l&#8217;auto-am\u00e9lioration<\/h2>\n<p>L\u00e0 o\u00f9 le projet fait pas mal parler, c&#8217;est l&#8217;id\u00e9e que cette IA s&#8217;am\u00e9liore elle-m\u00eame en boucle, dans un sc\u00e9nario que certains chercheurs en s\u00e9curit\u00e9 aiment appeler &#8220;exploser d&#8217;intelligence&#8221; (c&#8217;est aussi comme \u00e7a que j&#8217;appelle chaque moment que je passe \u00e0 regarder l&#8217;ami Korben me parler de ses projets en cours).<\/p>\n<p>Karpathy temp\u00e8re : son agent n&#8217;optimise pas son propre code, il ajuste l&#8217;entra\u00eenement d&#8217;un mod\u00e8le bien plus petit et bien moins complexe.<\/p>\n<p>Par contre, il assume que tous les grands labos d&#8217;IA vont adopter cette m\u00e9thode et que \u00e7a va acc\u00e9l\u00e9rer la recherche. Il imagine \u00e0 terme des essaims d&#8217;agents qui collaborent en parall\u00e8le, testent des pistes diff\u00e9rentes et remontent les meilleures id\u00e9es \u00e0 des \u00e9chelles de plus en plus grandes. Son objectif : ne pas reproduire le travail d&#8217;un doctorant, mais celui d&#8217;une communaut\u00e9 enti\u00e8re de chercheurs.<\/p>\n<p>Bon maintenant il faut quand m\u00eame relever que certains critiquent quand m\u00eame l&#8217;id\u00e9e, car elle ressemble en partie \u00e0 AutoML, une technique qui est d\u00e9j\u00e0 utilis\u00e9e chez Microsoft et Google.<\/p>\n<p>Karpathy a r\u00e9pondu que la comparaison ne tient pas : AutoML fonctionne avec des variations al\u00e9atoires ou des algorithmes \u00e9volutifs, alors qu&#8217;autoresearch utilise un vrai mod\u00e8le de langage qui \u00e9crit du code, apprend de ses exp\u00e9riences pr\u00e9c\u00e9dentes et a acc\u00e8s \u00e0 internet. Bref, tout ceci est fascinant.<\/p>\n<p>Source :<br \/>\n<a href=\"https:\/\/thenewstack.io\/karpathy-autonomous-experiment-loop\/\">The News Hack<\/a><\/p>\n","protected":false},"excerpt":{"rendered":"<p>Andrej Karpathy, ancien chercheur chez OpenAI et ex-responsable de l&#8217;IA chez Tesla, a laiss\u00e9 tourner un agent IA pendant 48 heures sur un petit mod\u00e8le de langage. R\u00e9sultat : 700 exp\u00e9riences, 20 optimisations retenues et un gain de 11 % sur le temps d&#8217;entra\u00eenement. Le principe d&#8217;autoresearch Mais c&#8217;est quoi ce concept d&#8217;autoresearch ? Et bien le fonctionnement est assez direct : un agent IA re\u00e7oit un script d&#8217;entra\u00eenement de 630 lignes en Python et un budget de calcul fixe de 5 minutes par exp\u00e9rience sur un seul GPU. Et c&#8217;est l\u00e0 que l&#8217;agent se met en mouvement pour lire le code, formuler une hypoth\u00e8se, modifier le script, lancer l&#8217;entra\u00eenement, \u00e9valuer le r\u00e9sultat, et surtout d\u00e9cider, ou non, de conserver une modification. Si le mod\u00e8le s&#8217;am\u00e9liore, le changement devient la nouvelle base. Sinon, il revient en arri\u00e8re et essaie autre chose. En deux jours de boucle continue, l&#8217;agent a conduit environ 700 it\u00e9rations et identifi\u00e9 20 am\u00e9liorations cumulables qui ont r\u00e9duit le temps n\u00e9cessaire pour atteindre le niveau GPT-2 de 2,02 heures \u00e0 1,80 heure. Tobias L\u00fctke, le patron de Shopify, a d&#8217;ailleurs test\u00e9 le syst\u00e8me sur des donn\u00e9es internes : apr\u00e8s une nuit, 37 exp\u00e9riences et un gain de 19 % sur les performances de son mod\u00e8le. La question de l&#8217;auto-am\u00e9lioration L\u00e0 o\u00f9 le projet fait pas mal parler, c&#8217;est l&#8217;id\u00e9e que cette IA s&#8217;am\u00e9liore elle-m\u00eame en boucle, dans un sc\u00e9nario que certains chercheurs en s\u00e9curit\u00e9 aiment appeler &#8220;exploser d&#8217;intelligence&#8221; (c&#8217;est aussi comme \u00e7a que j&#8217;appelle chaque moment que je passe \u00e0 regarder l&#8217;ami Korben me parler de ses projets en cours). Karpathy temp\u00e8re : son agent n&#8217;optimise pas son propre code, il ajuste l&#8217;entra\u00eenement d&#8217;un mod\u00e8le bien plus petit et bien moins complexe. Par contre, il assume que tous les grands labos d&#8217;IA vont adopter cette m\u00e9thode et que \u00e7a va acc\u00e9l\u00e9rer la recherche. Il imagine \u00e0 terme des essaims d&#8217;agents qui collaborent en parall\u00e8le, testent des pistes diff\u00e9rentes et remontent les meilleures id\u00e9es \u00e0 des \u00e9chelles de plus en plus grandes. Son objectif : ne pas reproduire le travail d&#8217;un doctorant, mais celui d&#8217;une communaut\u00e9 enti\u00e8re de chercheurs. Bon maintenant il faut quand m\u00eame relever que certains critiquent quand m\u00eame l&#8217;id\u00e9e, car elle ressemble en partie \u00e0 AutoML, une technique qui est d\u00e9j\u00e0 utilis\u00e9e chez Microsoft et Google. Karpathy a r\u00e9pondu que la comparaison ne tient pas : AutoML fonctionne avec des variations al\u00e9atoires ou des algorithmes \u00e9volutifs, alors qu&#8217;autoresearch utilise un vrai mod\u00e8le de langage qui \u00e9crit du code, apprend de ses exp\u00e9riences pr\u00e9c\u00e9dentes et a acc\u00e8s \u00e0 internet. Bref, tout ceci est fascinant. Source : The News Hack<\/p>\n","protected":false},"author":1,"featured_media":2588,"parent":0,"menu_order":0,"comment_status":"closed","ping_status":"closed","template":"","meta":{"give_campaign_id":0,"_monsterinsights_skip_tracking":false,"_monsterinsights_sitenote_active":false,"_monsterinsights_sitenote_note":"","_monsterinsights_sitenote_category":0,"_kadence_starter_templates_imported_post":false,"footnotes":""},"class_list":["post-2587","page","type-page","status-publish","has-post-thumbnail","hentry"],"campaignId":"","_links":{"self":[{"href":"https:\/\/elearningsamba.com\/index.php\/wp-json\/wp\/v2\/pages\/2587","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/elearningsamba.com\/index.php\/wp-json\/wp\/v2\/pages"}],"about":[{"href":"https:\/\/elearningsamba.com\/index.php\/wp-json\/wp\/v2\/types\/page"}],"author":[{"embeddable":true,"href":"https:\/\/elearningsamba.com\/index.php\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/elearningsamba.com\/index.php\/wp-json\/wp\/v2\/comments?post=2587"}],"version-history":[{"count":0,"href":"https:\/\/elearningsamba.com\/index.php\/wp-json\/wp\/v2\/pages\/2587\/revisions"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/elearningsamba.com\/index.php\/wp-json\/wp\/v2\/media\/2588"}],"wp:attachment":[{"href":"https:\/\/elearningsamba.com\/index.php\/wp-json\/wp\/v2\/media?parent=2587"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}