{"id":2587,"date":"2026-03-23T11:57:06","date_gmt":"2026-03-23T10:57:06","guid":{"rendered":"https:\/\/elearningsamba.com\/index.php\/un-agent-ia-a-mene-700-experiences-en-deux-jours-pour-ameliorer-un-modele-de-langage\/"},"modified":"2026-03-23T11:57:06","modified_gmt":"2026-03-23T10:57:06","slug":"un-agent-ia-a-mene-700-experiences-en-deux-jours-pour-ameliorer-un-modele-de-langage","status":"publish","type":"page","link":"https:\/\/elearningsamba.com\/index.php\/un-agent-ia-a-mene-700-experiences-en-deux-jours-pour-ameliorer-un-modele-de-langage\/","title":{"rendered":"Un agent IA a men\u00e9 700 exp\u00e9riences en deux jours pour am\u00e9liorer un mod\u00e8le de langage"},"content":{"rendered":"

Andrej Karpathy, ancien chercheur chez OpenAI et ex-responsable de l’IA chez Tesla, a laiss\u00e9 tourner un agent IA pendant 48 heures sur un petit mod\u00e8le de langage. R\u00e9sultat : 700 exp\u00e9riences, 20 optimisations retenues et un gain de 11 % sur le temps d’entra\u00eenement.<\/p>\n

Le principe d’autoresearch<\/h2>\n
Mais c’est quoi ce concept d’autoresearch ? Et bien le fonctionnement est assez direct : un agent IA re\u00e7oit un script d’entra\u00eenement de 630 lignes en Python et un budget de calcul fixe de 5 minutes par exp\u00e9rience sur un seul GPU. Et c’est l\u00e0 que l’agent se met en mouvement pour lire le code, formuler une hypoth\u00e8se, modifier le script, lancer l’entra\u00eenement, \u00e9valuer le r\u00e9sultat, et surtout d\u00e9cider, ou non, de conserver une modification.<\/p>\n
Si le mod\u00e8le s’am\u00e9liore, le changement devient la nouvelle base. Sinon, il revient en arri\u00e8re et essaie autre chose. En deux jours de boucle continue, l’agent a conduit environ 700 it\u00e9rations et identifi\u00e9 20 am\u00e9liorations cumulables qui ont r\u00e9duit le temps n\u00e9cessaire pour atteindre le niveau GPT-2 de 2,02 heures \u00e0 1,80 heure.<\/p>\n
Tobias L\u00fctke, le patron de Shopify, a d’ailleurs test\u00e9 le syst\u00e8me sur des donn\u00e9es internes : apr\u00e8s une nuit, 37 exp\u00e9riences et un gain de 19 % sur les performances de son mod\u00e8le.<\/p>\n

La question de l’auto-am\u00e9lioration<\/h2>\n
L\u00e0 o\u00f9 le projet fait pas mal parler, c’est l’id\u00e9e que cette IA s’am\u00e9liore elle-m\u00eame en boucle, dans un sc\u00e9nario que certains chercheurs en s\u00e9curit\u00e9 aiment appeler “exploser d’intelligence” (c’est aussi comme \u00e7a que j’appelle chaque moment que je passe \u00e0 regarder l’ami Korben me parler de ses projets en cours).<\/p>\n
Karpathy temp\u00e8re : son agent n’optimise pas son propre code, il ajuste l’entra\u00eenement d’un mod\u00e8le bien plus petit et bien moins complexe.<\/p>\n
Par contre, il assume que tous les grands labos d’IA vont adopter cette m\u00e9thode et que \u00e7a va acc\u00e9l\u00e9rer la recherche. Il imagine \u00e0 terme des essaims d’agents qui collaborent en parall\u00e8le, testent des pistes diff\u00e9rentes et remontent les meilleures id\u00e9es \u00e0 des \u00e9chelles de plus en plus grandes. Son objectif : ne pas reproduire le travail d’un doctorant, mais celui d’une communaut\u00e9 enti\u00e8re de chercheurs.<\/p>\n
Bon maintenant il faut quand m\u00eame relever que certains critiquent quand m\u00eame l’id\u00e9e, car elle ressemble en partie \u00e0 AutoML, une technique qui est d\u00e9j\u00e0 utilis\u00e9e chez Microsoft et Google.<\/p>\n
Karpathy a r\u00e9pondu que la comparaison ne tient pas : AutoML fonctionne avec des variations al\u00e9atoires ou des algorithmes \u00e9volutifs, alors qu’autoresearch utilise un vrai mod\u00e8le de langage qui \u00e9crit du code, apprend de ses exp\u00e9riences pr\u00e9c\u00e9dentes et a acc\u00e8s \u00e0 internet. Bref, tout ceci est fascinant.<\/p>\n
Source :
\nThe News Hack<\/a><\/p>\n","protected":false},"excerpt":{"rendered":"
Andrej Karpathy, ancien chercheur chez OpenAI et ex-responsable de l’IA chez Tesla, a laiss\u00e9 tourner un agent IA pendant 48 heures sur un petit mod\u00e8le de langage. R\u00e9sultat : 700 exp\u00e9riences, 20 optimisations retenues et un gain de 11 % sur le temps d’entra\u00eenement. Le principe d’autoresearch Mais c’est quoi ce concept d’autoresearch ? Et bien le fonctionnement est assez direct : un agent IA re\u00e7oit un script d’entra\u00eenement de 630 lignes en Python et un budget de calcul fixe de 5 minutes par exp\u00e9rience sur un seul GPU. Et c’est l\u00e0 que l’agent se met en mouvement pour lire le code, formuler une hypoth\u00e8se, modifier le script, lancer l’entra\u00eenement, \u00e9valuer le r\u00e9sultat, et surtout d\u00e9cider, ou non, de conserver une modification. Si le mod\u00e8le s’am\u00e9liore, le changement devient la nouvelle base. Sinon, il revient en arri\u00e8re et essaie autre chose. En deux jours de boucle continue, l’agent a conduit environ 700 it\u00e9rations et identifi\u00e9 20 am\u00e9liorations cumulables qui ont r\u00e9duit le temps n\u00e9cessaire pour atteindre le niveau GPT-2 de 2,02 heures \u00e0 1,80 heure. Tobias L\u00fctke, le patron de Shopify, a d’ailleurs test\u00e9 le syst\u00e8me sur des donn\u00e9es internes : apr\u00e8s une nuit, 37 exp\u00e9riences et un gain de 19 % sur les performances de son mod\u00e8le. La question de l’auto-am\u00e9lioration L\u00e0 o\u00f9 le projet fait pas mal parler, c’est l’id\u00e9e que cette IA s’am\u00e9liore elle-m\u00eame en boucle, dans un sc\u00e9nario que certains chercheurs en s\u00e9curit\u00e9 aiment appeler “exploser d’intelligence” (c’est aussi comme \u00e7a que j’appelle chaque moment que je passe \u00e0 regarder l’ami Korben me parler de ses projets en cours). Karpathy temp\u00e8re : son agent n’optimise pas son propre code, il ajuste l’entra\u00eenement d’un mod\u00e8le bien plus petit et bien moins complexe. Par contre, il assume que tous les grands labos d’IA vont adopter cette m\u00e9thode et que \u00e7a va acc\u00e9l\u00e9rer la recherche. Il imagine \u00e0 terme des essaims d’agents qui collaborent en parall\u00e8le, testent des pistes diff\u00e9rentes et remontent les meilleures id\u00e9es \u00e0 des \u00e9chelles de plus en plus grandes. Son objectif : ne pas reproduire le travail d’un doctorant, mais celui d’une communaut\u00e9 enti\u00e8re de chercheurs. Bon maintenant il faut quand m\u00eame relever que certains critiquent quand m\u00eame l’id\u00e9e, car elle ressemble en partie \u00e0 AutoML, une technique qui est d\u00e9j\u00e0 utilis\u00e9e chez Microsoft et Google. Karpathy a r\u00e9pondu que la comparaison ne tient pas : AutoML fonctionne avec des variations al\u00e9atoires ou des algorithmes \u00e9volutifs, alors qu’autoresearch utilise un vrai mod\u00e8le de langage qui \u00e9crit du code, apprend de ses exp\u00e9riences pr\u00e9c\u00e9dentes et a acc\u00e8s \u00e0 internet. Bref, tout ceci est fascinant. Source : The News Hack<\/p>\n","protected":false},"author":1,"featured_media":2588,"parent":0,"menu_order":0,"comment_status":"closed","ping_status":"closed","template":"","meta":{"give_campaign_id":0,"_monsterinsights_skip_tracking":false,"_monsterinsights_sitenote_active":false,"_monsterinsights_sitenote_note":"","_monsterinsights_sitenote_category":0,"_kadence_starter_templates_imported_post":false,"footnotes":""},"class_list":["post-2587","page","type-page","status-publish","has-post-thumbnail","hentry"],"campaignId":"","_links":{"self":[{"href":"https:\/\/elearningsamba.com\/index.php\/wp-json\/wp\/v2\/pages\/2587","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/elearningsamba.com\/index.php\/wp-json\/wp\/v2\/pages"}],"about":[{"href":"https:\/\/elearningsamba.com\/index.php\/wp-json\/wp\/v2\/types\/page"}],"author":[{"embeddable":true,"href":"https:\/\/elearningsamba.com\/index.php\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/elearningsamba.com\/index.php\/wp-json\/wp\/v2\/comments?post=2587"}],"version-history":[{"count":0,"href":"https:\/\/elearningsamba.com\/index.php\/wp-json\/wp\/v2\/pages\/2587\/revisions"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/elearningsamba.com\/index.php\/wp-json\/wp\/v2\/media\/2588"}],"wp:attachment":[{"href":"https:\/\/elearningsamba.com\/index.php\/wp-json\/wp\/v2\/media?parent=2587"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}