{"id":1571,"date":"2025-11-11T07:23:47","date_gmt":"2025-11-11T06:23:47","guid":{"rendered":"https:\/\/elearningsamba.com\/index.php\/reins-un-ollama-sur-mobile-sans-faire-tourner-ollama-sur-mobile\/"},"modified":"2025-11-11T07:23:47","modified_gmt":"2025-11-11T06:23:47","slug":"reins-un-ollama-sur-mobile-sans-faire-tourner-ollama-sur-mobile","status":"publish","type":"page","link":"https:\/\/elearningsamba.com\/index.php\/reins-un-ollama-sur-mobile-sans-faire-tourner-ollama-sur-mobile\/","title":{"rendered":"Reins – Un Ollama sur mobile sans faire tourner Ollama sur mobile"},"content":{"rendered":"

Le probl\u00e8me est simple\u2026 les LLM bouffent un max de RAM. Par exemple, un LLaMA 7B, c\u2019est dans les 12 GB de RAM. Et m\u00eame quantifi\u00e9 en int4 pour gagner de la place, vous tombez \u00e0 environ 3,5 GB. Et \u00e7a, c\u2019est juste le mod\u00e8le hein\u2026 Faut y ajouter le contexte, l\u2019OS, les autres apps, et votre smartphone \u00e0 8 GB de RAM commence \u00e0 suer de la raie.<\/p>\n

Google a bien s\u00fbr sorti
\nGemini Nano<\/a>
\npour Android, leur petit LLM optimis\u00e9 pour mobile mais c\u2019est compatible avec une poign\u00e9e de smartphone car il faut un NPU d\u00e9di\u00e9, assez de RAM, et une architecture tr\u00e8s r\u00e9cente. Les autres, vous irez vous faire voir\u2026<\/p>\n

Du coup, une solution \u201cpragmatique\u201d, c\u2019est de laisser votre Mac, votre PC, ou un petit serveur faire tourner Ollama chez vous, et d\u2019utiliser votre smartphone comme simple client pour vous y connecter \u00e0 distance. Vous gardez vos donn\u00e9es locales, vous profitez de toute la puissance des mod\u00e8les lourds, et votre iPhone ne chauffe pas comme un radiateur.<\/p>\n

Et pour \u00e7a, il existe tout un tas d\u2019apps mobiles qui font office de client Ollama. Des apps comme
\n Enchanted<\/a>
\nsur iOS,
\n My Ollama<\/a>
\n,
\n Heat<\/a>
\n, et m\u00eame les solutions cross-platform comme
\n Ollamb<\/a>
\ncod\u00e9 en Flutter. Et aujourd\u2019hui, je vous parle de
\n Reins<\/a>
\n, une app d\u00e9velopp\u00e9e par Ibrahim Cetin qui se d\u00e9marque par des fonctionnalit\u00e9s que j\u2019ai trouv\u00e9es bien pens\u00e9es.<\/p>\n

$\"\"$ <\/p>\n

Les fonctionnalit\u00e9s sont con\u00e7ues pour des cas d\u2019usage du monde r\u00e9el. Vous pouvez ainsi d\u00e9finir un prompt system diff\u00e9rent par conversation ce qui est pratique si vous avez un chat pour le code, un pour l\u2019\u00e9criture, un pour la traduction et j\u2019en passe\u2026 Vous \u00e9ditez et r\u00e9g\u00e9n\u00e9rez les prompts \u00e0 la vol\u00e9e et vous pouvez changer de mod\u00e8le en cours de conversation sans tout perdre.<\/p>\n

Reins supporte \u00e9galement l\u2019envoi d\u2019images, ce qui est utile si vous utilisez un mod\u00e8le vision comme LLaVA. Vous pouvez aussi tweaker les param\u00e8tres avanc\u00e9s tels que la temp\u00e9rature, seed, taille du contexte, tokens max\u2026etc. Et le streaming fonctionne en temps r\u00e9el, comme \u00e7a pas besoin d\u2019attendre une r\u00e9ponse compl\u00e8te avant de la voir.<\/p>\n

$\"\"$ <\/p>\n

Bien s\u00fbr, la question de la s\u00e9curit\u00e9 se pose. Il faut quand m\u00eame exposer votre serveur Ollama sur Internet pour y acc\u00e9der de l\u2019ext\u00e9rieur donc pensez HTTPS obligatoire, tunnel ngrok temporaire si vous testez, VPN Tailscale ou Wireguard si vous voulez du permanent et s\u00e9curis\u00e9. Bref, les pr\u00e9cautions classiques.<\/p>\n

Vous pouvez t\u00e9l\u00e9charger Reins sur l\u2019App Store,
\n en APK ou r\u00e9cup\u00e9rer les builds macOS\/Linux sur GitHub<\/a>
\n.<\/p>\n

Merci \u00e0 Lorenper pour l\u2019info.<\/p>\n","protected":false},"excerpt":{"rendered":"