﻿﻿{"id":1867,"date":"2025-12-21T09:04:25","date_gmt":"2025-12-21T08:04:25","guid":{"rendered":"https:\/\/elearningsamba.com\/index.php\/15-to-de-vram-sur-un-mac-studio-le-rdma-thunderbolt-5-qui-change-la-donne\/"},"modified":"2025-12-21T09:04:25","modified_gmt":"2025-12-21T08:04:25","slug":"15-to-de-vram-sur-un-mac-studio-le-rdma-thunderbolt-5-qui-change-la-donne","status":"publish","type":"page","link":"https:\/\/elearningsamba.com\/index.php\/15-to-de-vram-sur-un-mac-studio-le-rdma-thunderbolt-5-qui-change-la-donne\/","title":{"rendered":"1,5 To de VRAM sur un Mac Studio &#8211; Le RDMA Thunderbolt 5 qui change la donne"},"content":{"rendered":"<p>Vous r\u00eavez de faire tourner des mod\u00e8les d&#8217;IA de 600 milliards de param\u00e8tres sur votre bureau sans avoir \u00e0 vendre vos enfants ? H\u00e9 bien Jeff Geerling vient de tester un truc qui va vous faire baver, je pense. En tout cas, moi \u00e7a m&#8217;\u00e9nerve (dans le bon sens du terme hein&#8230;) !<\/p>\n<p>Apple lui a pr\u00eat\u00e9 4 Mac Studios M3 Ultra pour tester une nouvelle fonctionnalit\u00e9 qui d\u00e9barque avec macOS 26.2 et qui s&#8217;appelle le <strong>RDMA over Thunderbolt 5<\/strong>. En gros, c&#8217;est une techno qui permet \u00e0 plusieurs Macs de partager leur m\u00e9moire unifi\u00e9e comme si c&#8217;\u00e9tait un seul gros pool de RAM et du coup, au lieu d&#8217;avoir 4 machines s\u00e9par\u00e9es avec chacune leur m\u00e9moire, vous vous retrouvez avec 1,5 To de VRAM partag\u00e9e accessible par toutes les machines.<\/p>\n<p>Le setup de Jeff c&#8217;est deux Mac Studios avec 512 Go de RAM chacun \u00e0 environ 11 700 dollars pi\u00e8ce, plus deux autres avec 256 Go \u00e0 8 100 dollars. Total de la douloureuse : environ 40 000 dollars. \u00c7a pique, c&#8217;est clair, mais attendez de voir ce que \u00e7a fait.<\/p>\n<p>Le truc qui change vraiment la donne avec le RDMA c&#8217;est la latence. Avant, quand un Mac devait acc\u00e9der \u00e0 la m\u00e9moire d&#8217;un autre Mac via le r\u00e9seau, \u00e7a prenait environ 300 microsecondes. Avec cette nouvelle impl\u00e9mentation Thunderbolt 5, on tombe \u00e0 moins de 50 microsecondes. \u00c7a para\u00eet rien comme \u00e7a, mais pour faire tourner ce genre de mod\u00e8les, c&#8217;est \u00e9norme.<\/p>\n<p>Jeff a fait tourner des benchmarks classiques et les r\u00e9sultats sont plut\u00f4t impressionnants. Sur Geekbench 6, le M3 Ultra explose le Dell Pro Max et l&#8217;AMD Ryzen AI Max+ 395 en mono et multi-coeur. Mais le plus fou c&#8217;est sur le benchmark HPL en virgule flottante 64 bits o\u00f9 c&#8217;est le seul syst\u00e8me desktop test\u00e9 \u00e0 d\u00e9passer 1 T\u00e9raflop, avec presque le double des performances du Nvidia GB10.<\/p>\n<div class=\"youtube-container\">\n<div>\n<p>C\u00f4t\u00e9 mod\u00e8les IA massifs, le cluster fait tourner Qwen3 235B \u00e0 32 tokens par seconde avec Exo, DeepSeek V3.1 et ses 671 milliards de param\u00e8tres scale correctement sur les 4 machines, et m\u00eame Kimi K2 Thinking avec ses 1000 milliards de param\u00e8tres tourne \u00e0 environ 30 tokens par seconde. Tout \u00e7a en consommant environ 250 watts max et en faisant quasi aucun bruit.<\/p>\n<p>Par contre, c&#8217;est encore du logiciel en beta et \u00e7a se sent. Par exemple, Jeff a eu pas mal de crashs pendant ses tests HPL sur Thunderbolt avec des instabilit\u00e9s qui ont n\u00e9cessit\u00e9 des red\u00e9marrages fr\u00e9quents, ou encore le fait que seulement 4 Macs sont support\u00e9s pour l&#8217;instant malgr\u00e9 les 5 ports Thunderbolt 5 disponibles. Ensuite y&#8217;a le probl\u00e8me de l&#8217;administration \u00e0 distance qui est inexistante, car impossible de mettre \u00e0 jour macOS via SSH, donc faut se taper l&#8217;interface graphique \u00e0 la main sur chaque machine.<\/p>\n<p>Bref, c&#8217;est hyper prometteur comme techno, surtout pour ceux qui veulent faire tourner des LLM monstrueux sur leur bureau sans monter une salle serveur mais faudra attendre que le logiciel murisse un peu avant de claquer vos 40 000 balles de PEL dedans.<\/p>\n<p>\n<a href=\"https:\/\/www.jeffgeerling.com\/blog\/2025\/15-tb-vram-on-mac-studio-rdma-over-thunderbolt-5\">Source<\/a>\n<\/p>\n<\/div>\n<\/div>\n","protected":false},"excerpt":{"rendered":"<p>Vous r\u00eavez de faire tourner des mod\u00e8les d&#8217;IA de 600 milliards de param\u00e8tres sur votre bureau sans avoir \u00e0 vendre vos enfants ? H\u00e9 bien Jeff Geerling vient de tester un truc qui va vous faire baver, je pense. En tout cas, moi \u00e7a m&#8217;\u00e9nerve (dans le bon sens du terme hein&#8230;) ! Apple lui a pr\u00eat\u00e9 4 Mac Studios M3 Ultra pour tester une nouvelle fonctionnalit\u00e9 qui d\u00e9barque avec macOS 26.2 et qui s&#8217;appelle le RDMA over Thunderbolt 5. En gros, c&#8217;est une techno qui permet \u00e0 plusieurs Macs de partager leur m\u00e9moire unifi\u00e9e comme si c&#8217;\u00e9tait un seul gros pool de RAM et du coup, au lieu d&#8217;avoir 4 machines s\u00e9par\u00e9es avec chacune leur m\u00e9moire, vous vous retrouvez avec 1,5 To de VRAM partag\u00e9e accessible par toutes les machines. Le setup de Jeff c&#8217;est deux Mac Studios avec 512 Go de RAM chacun \u00e0 environ 11 700 dollars pi\u00e8ce, plus deux autres avec 256 Go \u00e0 8 100 dollars. Total de la douloureuse : environ 40 000 dollars. \u00c7a pique, c&#8217;est clair, mais attendez de voir ce que \u00e7a fait. Le truc qui change vraiment la donne avec le RDMA c&#8217;est la latence. Avant, quand un Mac devait acc\u00e9der \u00e0 la m\u00e9moire d&#8217;un autre Mac via le r\u00e9seau, \u00e7a prenait environ 300 microsecondes. Avec cette nouvelle impl\u00e9mentation Thunderbolt 5, on tombe \u00e0 moins de 50 microsecondes. \u00c7a para\u00eet rien comme \u00e7a, mais pour faire tourner ce genre de mod\u00e8les, c&#8217;est \u00e9norme. Jeff a fait tourner des benchmarks classiques et les r\u00e9sultats sont plut\u00f4t impressionnants. Sur Geekbench 6, le M3 Ultra explose le Dell Pro Max et l&#8217;AMD Ryzen AI Max+ 395 en mono et multi-coeur. Mais le plus fou c&#8217;est sur le benchmark HPL en virgule flottante 64 bits o\u00f9 c&#8217;est le seul syst\u00e8me desktop test\u00e9 \u00e0 d\u00e9passer 1 T\u00e9raflop, avec presque le double des performances du Nvidia GB10. C\u00f4t\u00e9 mod\u00e8les IA massifs, le cluster fait tourner Qwen3 235B \u00e0 32 tokens par seconde avec Exo, DeepSeek V3.1 et ses 671 milliards de param\u00e8tres scale correctement sur les 4 machines, et m\u00eame Kimi K2 Thinking avec ses 1000 milliards de param\u00e8tres tourne \u00e0 environ 30 tokens par seconde. Tout \u00e7a en consommant environ 250 watts max et en faisant quasi aucun bruit. Par contre, c&#8217;est encore du logiciel en beta et \u00e7a se sent. Par exemple, Jeff a eu pas mal de crashs pendant ses tests HPL sur Thunderbolt avec des instabilit\u00e9s qui ont n\u00e9cessit\u00e9 des red\u00e9marrages fr\u00e9quents, ou encore le fait que seulement 4 Macs sont support\u00e9s pour l&#8217;instant malgr\u00e9 les 5 ports Thunderbolt 5 disponibles. Ensuite y&#8217;a le probl\u00e8me de l&#8217;administration \u00e0 distance qui est inexistante, car impossible de mettre \u00e0 jour macOS via SSH, donc faut se taper l&#8217;interface graphique \u00e0 la main sur chaque machine. Bref, c&#8217;est hyper prometteur comme techno, surtout pour ceux qui veulent faire tourner des LLM monstrueux sur leur bureau sans monter une salle serveur mais faudra attendre que le logiciel murisse un peu avant de claquer vos 40 000 balles de PEL dedans. Source<\/p>\n","protected":false},"author":1,"featured_media":1868,"parent":0,"menu_order":0,"comment_status":"closed","ping_status":"closed","template":"","meta":{"give_campaign_id":0,"_monsterinsights_skip_tracking":false,"_monsterinsights_sitenote_active":false,"_monsterinsights_sitenote_note":"","_monsterinsights_sitenote_category":0,"_kadence_starter_templates_imported_post":false,"footnotes":""},"class_list":["post-1867","page","type-page","status-publish","has-post-thumbnail","hentry"],"campaignId":"","_links":{"self":[{"href":"https:\/\/elearningsamba.com\/index.php\/wp-json\/wp\/v2\/pages\/1867","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/elearningsamba.com\/index.php\/wp-json\/wp\/v2\/pages"}],"about":[{"href":"https:\/\/elearningsamba.com\/index.php\/wp-json\/wp\/v2\/types\/page"}],"author":[{"embeddable":true,"href":"https:\/\/elearningsamba.com\/index.php\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/elearningsamba.com\/index.php\/wp-json\/wp\/v2\/comments?post=1867"}],"version-history":[{"count":0,"href":"https:\/\/elearningsamba.com\/index.php\/wp-json\/wp\/v2\/pages\/1867\/revisions"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/elearningsamba.com\/index.php\/wp-json\/wp\/v2\/media\/1868"}],"wp:attachment":[{"href":"https:\/\/elearningsamba.com\/index.php\/wp-json\/wp\/v2\/media?parent=1867"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}