Vous voulez faire tourner un mod\u00e8le d’IA en local sans avoir besoin d’un serveur de la NASA ? Eh bien Nvidia vient de l\u00e2cher une bombe avec Nemotron 3<\/strong>, une famille de mod\u00e8les open source plut\u00f4t impressionnant et surtout, ils ont publi\u00e9 leurs donn\u00e9es d’entra\u00eenement afin de jouer la transparence totale. Chapeau !<\/p>\n

\n
ollama run nemotron-3-nano:30b\n<\/span><\/span><\/code><\/pre>\nJ’ai trouv\u00e9 que vitesse de g\u00e9n\u00e9ration \u00e9tait vraiment impressionnante, \u00e7a d\u00e9bite beaucoup plus qu’un Llama 3 qui est de taille \u00e9quivalente. Apr\u00e8s, je suis sur un Mac M4 avec 128 Go de RAM, donc je suis plut\u00f4t bien loti mais j’ai trouv\u00e9 ce mod\u00e8le vraiment tr\u00e8s rapide. Je pense que je vais vraiment m’en servir pour des trucs comme de la qualification, du r\u00e9sum\u00e9, de l’analyse ce genre de choses.<\/p>\n \n\n<\/p>\n A voir maintenant si en fran\u00e7ais il s’en sort bien sur les tournures de phrases. Quoi qu’il en soit pour du d\u00e9veloppement et des workflows agentiques, il n’y a pas photo, \u00e7a va \u00eatre mon nouveau mod\u00e8le par d\u00e9faut quand j’ai besoin de choses en local.<\/p>\n La famille Nemotron 3 ne se limite pas au Nano \u00e9videmment. Y’a aussi le Super avec environ 100 milliards de param\u00e8tres pour les applications multi-agents, et l’Ultra avec 500 milliards pour les t\u00e2ches vraiment complexes. Ces deux-l\u00e0 arriveront au premier semestre 2026 donc faudra encore \u00eatre un peu patient. Nvidia a aussi sorti des biblioth\u00e8ques comme NeMo Gym pour l’entra\u00eenement et NeMo RL pour le fine-tuning.<\/p>\n Jensen Huang, le patron de Nvidia, a aussi dit un truc int\u00e9ressant lors de l’annonce : “L’innovation ouverte est le fondement du progr\u00e8s de l’IA.<\/em>” Venant d’une bo\u00eete qui a longtemps jou\u00e9 la carte proprio sur ses technos, je trouve que c’est un sacr\u00e9 virage et des entreprises comme Accenture, Deloitte, Oracle, Palantir, ou m\u00eame Cursor sont d\u00e9j\u00e0 en train d’int\u00e9grer Nemotron dans leurs produits.<\/p>\n Ce qui est cool aussi, c’est que le mod\u00e8le supporte 24 langues officielles de l’UE plus une dizaine d’autres comme l’arabe, le chinois ou le japonais et c\u00f4t\u00e9 code, il g\u00e8re Python, C++, Java, Rust, Go, et m\u00eame du CUDA. Bref, c’est plut\u00f4t polyvalent.<\/p>\n Voil\u00e0, donc si vous cherchez un mod\u00e8le open source s\u00e9rieux avec des donn\u00e9es d’entra\u00eenement transparentes et une vitesse de g\u00e9n\u00e9ration qui arrache, Nemotron 3 Nano m\u00e9rite clairement le coup d\u2019\u0153il !<\/p>\n\nSource<\/a>\n<\/p>\n<\/div>\n","protected":false},"excerpt":{"rendered":" Vous voulez faire tourner un mod\u00e8le d’IA en local sans avoir besoin d’un serveur de la NASA ? Eh bien Nvidia vient de l\u00e2cher une bombe avec Nemotron 3, une famille de mod\u00e8les open source plut\u00f4t impressionnant et surtout, ils ont publi\u00e9 leurs donn\u00e9es d’entra\u00eenement afin de jouer la transparence totale. Chapeau ! Le mod\u00e8le phare de cette nouvelle famille s’appelle Nemotron 3 Nano et c’est un mod\u00e8le de 30 milliards de param\u00e8tres, mais attention, il n’en active que 3,5 milliards \u00e0 la fois gr\u00e2ce \u00e0 une architecture hybride qui m\u00e9lange du Mamba-2 et du Mixture-of-Experts ( MoE ). \u00c7a permet de garder des performances de ouf tout en restant l\u00e9ger niveau ressources. Sous le capot, Nvidia a \u00e9galement mis le paquet puisque le mod\u00e8le a \u00e9t\u00e9 entra\u00een\u00e9 sur 25 trillions de tokens. J’ai bien dit “trillions”… Pour vous donner une id\u00e9e, les donn\u00e9es d’entra\u00eenement incluent du Common Crawl de 2013 \u00e0 2025, du code dans 43 langages diff\u00e9rents, des articles scientifiques, et une tonne de donn\u00e9es synth\u00e9tiques g\u00e9n\u00e9r\u00e9es par d’autres mod\u00e8les. Et tout \u00e7a, Nvidia l’a rendu public donc vous pouvez t\u00e9l\u00e9charger les datasets sur Hugging Face et v\u00e9rifier par vous-m\u00eame ce qui a servi \u00e0 entra\u00eener le bouzin. C\u00f4t\u00e9 performances, Nemotron 3 Nano se d\u00e9fend plut\u00f4t bien . Sur les benchmarks de raisonnement math\u00e9matique comme AIME25, il atteint 99,2% quand on lui donne acc\u00e8s \u00e0 des outils. Sur le coding avec LiveCodeBench, il tape du 68,3%, ce qui le place devant Qwen3-30B. Et pour les t\u00e2ches d’agent logiciel genre SWE-Bench, il monte \u00e0 38,8%. Pas mal pour un mod\u00e8le qu’on peut faire tourner sur du matos grand public. D’ailleurs, parlons du matos justement. Nemotron 3 Nano tourne sur des cartes comme la H100, la A100, ou m\u00eame la future RTX PRO 6000 et supporte jusqu’\u00e0 1 million de tokens en contexte si vous avez assez de VRAM. Et niveau vitesse, Nvidia annonce un d\u00e9bit de tokens 4 fois sup\u00e9rieur \u00e0 la g\u00e9n\u00e9ration pr\u00e9c\u00e9dente, avec 60% de tokens de raisonnement en moins. C’est donc exactement ce que tout le monde demande \u00e0 saoir du token qui sort vite pour les workflows agentiques. Maintenant, pour l’utiliser, c’est hyper simple. Il est dispo sur Hugging Face, et vous pouvez le lancer avec Transformers, vLLM, TensorRT, ou m\u00eame llama.cpp. Y’a m\u00eame un mode “thinking” qu’on peut activer ou d\u00e9sactiver selon si on veut du raisonnement pouss\u00e9 ou des r\u00e9ponses rapides. Pour ma part, je l’ai test\u00e9 \u00e0 l’aide d’Ollama comme ceci : ollama run nemotron-3-nano:30b J’ai trouv\u00e9 que vitesse de g\u00e9n\u00e9ration \u00e9tait vraiment impressionnante, \u00e7a d\u00e9bite beaucoup plus qu’un Llama 3 qui est de taille \u00e9quivalente. Apr\u00e8s, je suis sur un Mac M4 avec 128 Go de RAM, donc je suis plut\u00f4t bien loti mais j’ai trouv\u00e9 ce mod\u00e8le vraiment tr\u00e8s rapide. Je pense que je vais vraiment m’en servir pour des trucs comme de la qualification, du r\u00e9sum\u00e9, de l’analyse ce genre de choses. A voir maintenant si en fran\u00e7ais il s’en sort bien sur les tournures de phrases. Quoi qu’il en soit pour du d\u00e9veloppement et des workflows agentiques, il n’y a pas photo, \u00e7a va \u00eatre mon nouveau mod\u00e8le par d\u00e9faut quand j’ai besoin de choses en local. La famille Nemotron 3 ne se limite pas au Nano \u00e9videmment. Y’a aussi le Super avec environ 100 milliards de param\u00e8tres pour les applications multi-agents, et l’Ultra avec 500 milliards pour les t\u00e2ches vraiment complexes. Ces deux-l\u00e0 arriveront au premier semestre 2026 donc faudra encore \u00eatre un peu patient. Nvidia a aussi sorti des biblioth\u00e8ques comme NeMo Gym pour l’entra\u00eenement et NeMo RL pour le fine-tuning. Jensen Huang, le patron de Nvidia, a aussi dit un truc int\u00e9ressant lors de l’annonce : “L’innovation ouverte est le fondement du progr\u00e8s de l’IA.” Venant d’une bo\u00eete qui a longtemps jou\u00e9 la carte proprio sur ses technos, je trouve que c’est un sacr\u00e9 virage et des entreprises comme Accenture, Deloitte, Oracle, Palantir, ou m\u00eame Cursor sont d\u00e9j\u00e0 en train d’int\u00e9grer Nemotron dans leurs produits. Ce qui est cool aussi, c’est que le mod\u00e8le supporte 24 langues officielles de l’UE plus une dizaine d’autres comme l’arabe, le chinois ou le japonais et c\u00f4t\u00e9 code, il g\u00e8re Python, C++, Java, Rust, Go, et m\u00eame du CUDA. Bref, c’est plut\u00f4t polyvalent. Voil\u00e0, donc si vous cherchez un mod\u00e8le open source s\u00e9rieux avec des donn\u00e9es d’entra\u00eenement transparentes et une vitesse de g\u00e9n\u00e9ration qui arrache, Nemotron 3 Nano m\u00e9rite clairement le coup d\u2019\u0153il ! Source<\/p>\n","protected":false},"author":1,"featured_media":1822,"parent":0,"menu_order":0,"comment_status":"closed","ping_status":"closed","template":"","meta":{"give_campaign_id":0,"_monsterinsights_skip_tracking":false,"_monsterinsights_sitenote_active":false,"_monsterinsights_sitenote_note":"","_monsterinsights_sitenote_category":0,"_kadence_starter_templates_imported_post":false,"footnotes":""},"class_list":["post-1821","page","type-page","status-publish","has-post-thumbnail","hentry"],"campaignId":"","_links":{"self":[{"href":"https:\/\/elearningsamba.com\/index.php\/wp-json\/wp\/v2\/pages\/1821","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/elearningsamba.com\/index.php\/wp-json\/wp\/v2\/pages"}],"about":[{"href":"https:\/\/elearningsamba.com\/index.php\/wp-json\/wp\/v2\/types\/page"}],"author":[{"embeddable":true,"href":"https:\/\/elearningsamba.com\/index.php\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/elearningsamba.com\/index.php\/wp-json\/wp\/v2\/comments?post=1821"}],"version-history":[{"count":0,"href":"https:\/\/elearningsamba.com\/index.php\/wp-json\/wp\/v2\/pages\/1821\/revisions"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/elearningsamba.com\/index.php\/wp-json\/wp\/v2\/media\/1822"}],"wp:attachment":[{"href":"https:\/\/elearningsamba.com\/index.php\/wp-json\/wp\/v2\/media?parent=1821"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}