﻿﻿{"id":1455,"date":"2025-10-28T08:38:25","date_gmt":"2025-10-28T07:38:25","guid":{"rendered":"https:\/\/elearningsamba.com\/index.php\/handy-un-outil-de-reconnaissance-vocale-incroyable-et-open-source\/"},"modified":"2025-10-28T08:38:25","modified_gmt":"2025-10-28T07:38:25","slug":"handy-un-outil-de-reconnaissance-vocale-incroyable-et-open-source","status":"publish","type":"page","link":"https:\/\/elearningsamba.com\/index.php\/handy-un-outil-de-reconnaissance-vocale-incroyable-et-open-source\/","title":{"rendered":"Handy &#8211; Un outil de reconnaissance vocale incroyable (et open source)"},"content":{"rendered":"<p>Je suis d\u00e9go\u00fbt\u00e9 parce que je viens de payer un abonnement pour un logiciel qui fait exactement \u00e7a, sauf que bah l\u00e0,<br \/>\n<a href=\"https:\/\/handy.computer\/\">Handy<\/a><br \/>\n, c\u2019est gratuit. L\u2019id\u00e9e derri\u00e8re ce logiciel, c\u2019est un outil de speech to text qui fonctionne uniquement en local. Pas d\u2019abonnement, tout est gratuit, et pas de cloud\u2026 il faut juste configurer un raccourci clavier. Et ensuite vous parlez et le texte appara\u00eet comme par magie.<\/p>\n<p>A la base, l\u2019id\u00e9e de cet outil est venue d\u2019un accident. CJ se casse le doigt et il est pl\u00e2tr\u00e9 pendant six semaines. Du coup il lui est impossible de taper normalement. Il cherche alors des outils de transcription vocale.<\/p>\n<p>Par exemple, Dragon NaturallySpeaking, mais bon, 100 balles, \u00e7a fait chier. Google Docs aussi propose ce genre de fonctionnalit\u00e9s, mais uniquement en ligne. Et \u00e7a envoie tout dans le cloud, donc bonjour \u00e0 confidentialit\u00e9. Quant \u00e0 Windows Speech Recognition, c\u2019est bugu\u00e9 et assez limit\u00e9. Bref, toutes les alternatives qu\u2019il a trouv\u00e9es \u00e9taient soit payantes, soit n\u00e9cessit\u00e9 une connexion permanente vers des serveurs tiers.<\/p>\n<p>Alors CJ a fait ce que font les devs quand un probl\u00e8me les agace. Non pas aller sur Reddit pour dire de la merde random sur moi, mais plut\u00f4t coder une solution qui fonctionne super bien !<\/p>\n<p>Et au lieu de la garder pour lui ou de la rendre payante lui il a d\u00e9cid\u00e9 de tout mettre en open source avec une licence MIT.<\/p>\n<p>\n<img decoding=\"async\" src=\"https:\/\/korben.info\/cdn-cgi\/image\/width=1200,fit=scale-down,quality=90,f=avif\/handy-computer-speech-to-text-accessibility-open-s\/handy-computer-speech-to-text-accessibility-open-s-2.png\" alt=\"\" loading=\"lazy\">\n<\/p>\n<p>\n<img decoding=\"async\" src=\"https:\/\/korben.info\/cdn-cgi\/image\/width=1200,fit=scale-down,quality=90,f=avif\/handy-computer-speech-to-text-accessibility-open-s\/handy-computer-speech-to-text-accessibility-open-s-3.png\" alt=\"\" loading=\"lazy\">\n<\/p>\n<p>Et ce que vous \u00eates en train de lire pr\u00e9cis\u00e9ment maintenant, et bien je suis en train de le dicter. Et \u00e7a marche dans les emails, les formulaires web, les \u00e9diteurs de texte, peu importe. Et comme je vous le disais, toute la transcription se fait localement sur votre machine. Et tout \u00e7a gr\u00e2ce \u00e0 quoi ? Et bien gr\u00e2ce \u00e0 Whisper d\u2019OpenAI, dont je vous ai d\u00e9j\u00e0 parl\u00e9 beaucoup de fois.<\/p>\n<p>Handy est cod\u00e9 en Rust pour la performance et la s\u00e9curit\u00e9 et surtout cross plateforme, c\u2019est-\u00e0-dire qu\u2019il marche ou Linux, macOS et Windows. Et au niveau de la config, il y a quelques options comme le choix de la langue ou le mode d\u2019enregistrement avec le raccourci clavier, soit vous faites du push to talk, soit vous faites une \u00e9coute en continu.<\/p>\n<p>\n<img decoding=\"async\" src=\"https:\/\/korben.info\/cdn-cgi\/image\/width=1200,fit=scale-down,quality=90,f=avif\/handy-computer-speech-to-text-accessibility-open-s\/handy-computer-speech-to-text-accessibility-open-s-4.png\" alt=\"\" loading=\"lazy\">\n<\/p>\n<p>Ce truc est g\u00e9nial aussi bien pour l\u2019accessibilit\u00e9 que pour la reconnaissance vocale en elle-m\u00eame qui est plut\u00f4t utile dans la vie de tous les jours. D\u2019ailleurs, il y a plusieurs mod\u00e8les IA disponibles, comme tous les mod\u00e8les Whisper, mais aussi un mod\u00e8le que je ne connaissais pas, qui s\u2019appelle Parakeet et qui franchement fonctionne tr\u00e8s bien. C\u2019est celui que j\u2019utilise actuellement.<\/p>\n<p>\n<img decoding=\"async\" src=\"https:\/\/korben.info\/cdn-cgi\/image\/width=1200,fit=scale-down,quality=90,f=avif\/handy-computer-speech-to-text-accessibility-open-s\/handy-computer-speech-to-text-accessibility-open-s-5.png\" alt=\"\" loading=\"lazy\">\n<\/p>\n<p>Testez si ce truc fonctionne bien sur votre vieux PC mais moi en tout cas sur mon Mac de derni\u00e8re g\u00e9n\u00e9ration c\u2019est encore plus rapide que ce que j\u2019avais avec un mod\u00e8le Whisper sur mon outil payant.<\/p>\n<p>Voil\u00e0, si vous cherchiez un outil de reconnaissance vocale, vous pouvez vous arr\u00eater l\u00e0 parce que vous venez de trouver. Et non pas parce qu\u2019il est parfait, mais parce que comme c\u2019est open source, vous pouvez vous-m\u00eame le rendre parfait pour vos usages (Le code est sur<br \/>\n<a href=\"https:\/\/github.com\/cjpais\/Handy\">GitHub<\/a><br \/>\n).<\/p>\n<p>Merci \u00e0 Lilian pour le partage de ce projet absolument g\u00e9nial !<\/p>\n<p><em>Article dict\u00e9e int\u00e9gralement \u00e0 l\u2019aide de Handy (et corrig\u00e9 manuellement pour les quelques erreurs de transcription)<\/em><\/p>\n","protected":false},"excerpt":{"rendered":"<p>Je suis d\u00e9go\u00fbt\u00e9 parce que je viens de payer un abonnement pour un logiciel qui fait exactement \u00e7a, sauf que bah l\u00e0, Handy , c\u2019est gratuit. L\u2019id\u00e9e derri\u00e8re ce logiciel, c\u2019est un outil de speech to text qui fonctionne uniquement en local. Pas d\u2019abonnement, tout est gratuit, et pas de cloud\u2026 il faut juste configurer un raccourci clavier. Et ensuite vous parlez et le texte appara\u00eet comme par magie. A la base, l\u2019id\u00e9e de cet outil est venue d\u2019un accident. CJ se casse le doigt et il est pl\u00e2tr\u00e9 pendant six semaines. Du coup il lui est impossible de taper normalement. Il cherche alors des outils de transcription vocale. Par exemple, Dragon NaturallySpeaking, mais bon, 100 balles, \u00e7a fait chier. Google Docs aussi propose ce genre de fonctionnalit\u00e9s, mais uniquement en ligne. Et \u00e7a envoie tout dans le cloud, donc bonjour \u00e0 confidentialit\u00e9. Quant \u00e0 Windows Speech Recognition, c\u2019est bugu\u00e9 et assez limit\u00e9. Bref, toutes les alternatives qu\u2019il a trouv\u00e9es \u00e9taient soit payantes, soit n\u00e9cessit\u00e9 une connexion permanente vers des serveurs tiers. Alors CJ a fait ce que font les devs quand un probl\u00e8me les agace. Non pas aller sur Reddit pour dire de la merde random sur moi, mais plut\u00f4t coder une solution qui fonctionne super bien ! Et au lieu de la garder pour lui ou de la rendre payante lui il a d\u00e9cid\u00e9 de tout mettre en open source avec une licence MIT. Et ce que vous \u00eates en train de lire pr\u00e9cis\u00e9ment maintenant, et bien je suis en train de le dicter. Et \u00e7a marche dans les emails, les formulaires web, les \u00e9diteurs de texte, peu importe. Et comme je vous le disais, toute la transcription se fait localement sur votre machine. Et tout \u00e7a gr\u00e2ce \u00e0 quoi ? Et bien gr\u00e2ce \u00e0 Whisper d\u2019OpenAI, dont je vous ai d\u00e9j\u00e0 parl\u00e9 beaucoup de fois. Handy est cod\u00e9 en Rust pour la performance et la s\u00e9curit\u00e9 et surtout cross plateforme, c\u2019est-\u00e0-dire qu\u2019il marche ou Linux, macOS et Windows. Et au niveau de la config, il y a quelques options comme le choix de la langue ou le mode d\u2019enregistrement avec le raccourci clavier, soit vous faites du push to talk, soit vous faites une \u00e9coute en continu. Ce truc est g\u00e9nial aussi bien pour l\u2019accessibilit\u00e9 que pour la reconnaissance vocale en elle-m\u00eame qui est plut\u00f4t utile dans la vie de tous les jours. D\u2019ailleurs, il y a plusieurs mod\u00e8les IA disponibles, comme tous les mod\u00e8les Whisper, mais aussi un mod\u00e8le que je ne connaissais pas, qui s\u2019appelle Parakeet et qui franchement fonctionne tr\u00e8s bien. C\u2019est celui que j\u2019utilise actuellement. Testez si ce truc fonctionne bien sur votre vieux PC mais moi en tout cas sur mon Mac de derni\u00e8re g\u00e9n\u00e9ration c\u2019est encore plus rapide que ce que j\u2019avais avec un mod\u00e8le Whisper sur mon outil payant. Voil\u00e0, si vous cherchiez un outil de reconnaissance vocale, vous pouvez vous arr\u00eater l\u00e0 parce que vous venez de trouver. Et non pas parce qu\u2019il est parfait, mais parce que comme c\u2019est open source, vous pouvez vous-m\u00eame le rendre parfait pour vos usages (Le code est sur GitHub ). Merci \u00e0 Lilian pour le partage de ce projet absolument g\u00e9nial ! Article dict\u00e9e int\u00e9gralement \u00e0 l\u2019aide de Handy (et corrig\u00e9 manuellement pour les quelques erreurs de transcription)<\/p>\n","protected":false},"author":1,"featured_media":1456,"parent":0,"menu_order":0,"comment_status":"closed","ping_status":"closed","template":"","meta":{"give_campaign_id":0,"_monsterinsights_skip_tracking":false,"_monsterinsights_sitenote_active":false,"_monsterinsights_sitenote_note":"","_monsterinsights_sitenote_category":0,"_kadence_starter_templates_imported_post":false,"footnotes":""},"class_list":["post-1455","page","type-page","status-publish","has-post-thumbnail","hentry"],"campaignId":"","_links":{"self":[{"href":"https:\/\/elearningsamba.com\/index.php\/wp-json\/wp\/v2\/pages\/1455","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/elearningsamba.com\/index.php\/wp-json\/wp\/v2\/pages"}],"about":[{"href":"https:\/\/elearningsamba.com\/index.php\/wp-json\/wp\/v2\/types\/page"}],"author":[{"embeddable":true,"href":"https:\/\/elearningsamba.com\/index.php\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/elearningsamba.com\/index.php\/wp-json\/wp\/v2\/comments?post=1455"}],"version-history":[{"count":0,"href":"https:\/\/elearningsamba.com\/index.php\/wp-json\/wp\/v2\/pages\/1455\/revisions"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/elearningsamba.com\/index.php\/wp-json\/wp\/v2\/media\/1456"}],"wp:attachment":[{"href":"https:\/\/elearningsamba.com\/index.php\/wp-json\/wp\/v2\/media?parent=1455"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}