\nimport<\/span> ollama<\/span>\n<\/span><\/span>from<\/span> ollama<\/span> import<\/span> chat<\/span>,<\/span> web_search<\/span>,<\/span> web_fetch<\/span>\n<\/span><\/span>\n<\/span><\/span>model<\/span> =<\/span> \"qwen3:4b\"<\/span>\n<\/span><\/span>\n<\/span><\/span># 1. Sans recherche web<\/span>\n<\/span><\/span>response_classic<\/span> =<\/span> chat<\/span>(<\/span> # pas ollama.chat<\/span>\n<\/span><\/span> model<\/span>=<\/span>model<\/span>,<\/span>\n<\/span><\/span> messages<\/span>=<\/span>[{<\/span>\n<\/span><\/span> \"role\"<\/span>:<\/span> \"user\"<\/span>,<\/span>\n<\/span><\/span> \"content\"<\/span>:<\/span> \"Quelles sont les features de React 19?\"<\/span>\n<\/span><\/span> }]<\/span>\n<\/span><\/span>)<\/span>\n<\/span><\/span>print<\/span>(<\/span>\"Sans recherche web:\"<\/span>,<\/span> response_classic<\/span>.<\/span>message<\/span>.<\/span>content<\/span>[:<\/span>500<\/span>])<\/span> # .message.content<\/span>\n<\/span><\/span>\n<\/span><\/span># 2. Avec recherche web<\/span>\n<\/span><\/span>search_results<\/span> =<\/span> web_search<\/span>(<\/span>\"React 19 features derni\u00e8res nouveaut\u00e9s\"<\/span>)<\/span>\n<\/span><\/span>print<\/span>(<\/span>\"R\u00e9sultats:\"<\/span>,<\/span> search_results<\/span>)<\/span>\n<\/span><\/span>\n<\/span><\/span># 3. Avec outils<\/span>\n<\/span><\/span>available_tools<\/span> =<\/span> {<\/span>'web_search'<\/span>:<\/span> web_search<\/span>,<\/span> 'web_fetch'<\/span>:<\/span> web_fetch<\/span>}<\/span>\n<\/span><\/span>messages<\/span> =<\/span> [{<\/span>\n<\/span><\/span> \"role\"<\/span>:<\/span> \"user\"<\/span>,<\/span>\n<\/span><\/span> \"content\"<\/span>:<\/span> \"Utilise la recherche web pour me dire les derni\u00e8res features de React 19\"<\/span>\n<\/span><\/span>}]<\/span>\n<\/span><\/span>\n<\/span><\/span>response_with_tools<\/span> =<\/span> chat<\/span>(<\/span>\n<\/span><\/span> model<\/span>=<\/span>model<\/span>,<\/span>\n<\/span><\/span> messages<\/span>=<\/span>messages<\/span>,<\/span>\n<\/span><\/span> tools<\/span>=<\/span>[<\/span>web_search<\/span>,<\/span> web_fetch<\/span>],<\/span>\n<\/span><\/span> think<\/span>=<\/span>True<\/span>\n<\/span><\/span>)<\/span>\n<\/span><\/span>\n<\/span><\/span># Acc\u00e8s aux tool_calls<\/span>\n<\/span><\/span>if<\/span> response_with_tools<\/span>.<\/span>message<\/span>.<\/span>tool_calls<\/span>:<\/span>\n<\/span><\/span> for<\/span> tool_call<\/span> in<\/span> response_with_tools<\/span>.<\/span>message<\/span>.<\/span>tool_calls<\/span>:<\/span>\n<\/span><\/span> function_to_call<\/span> =<\/span> available_tools<\/span>.<\/span>get<\/span>(<\/span>tool_call<\/span>.<\/span>function<\/span>.<\/span>name<\/span>)<\/span>\n<\/span><\/span> if<\/span> function_to_call<\/span>:<\/span>\n<\/span><\/span> args<\/span> =<\/span> tool_call<\/span>.<\/span>function<\/span>.<\/span>arguments<\/span>\n<\/span><\/span> result<\/span> =<\/span> function_to_call<\/span>(<\/span>**<\/span>args<\/span>)<\/span>\n<\/span><\/span> print<\/span>(<\/span>f<\/span>\"Outil utilis\u00e9: {tool_call.function.name}\"<\/span>)<\/span>\n<\/span><\/span> print<\/span>(<\/span>f<\/span>\"R\u00e9sultat: {str(result)[:500]}...\"<\/span>)<\/span>\n<\/span><\/span>\n<\/span><\/span>print<\/span>(<\/span>\"R\u00e9ponse finale:\"<\/span>,<\/span> response_with_tools<\/span>.<\/span>message<\/span>.<\/span>content<\/span>)<\/span>\n<\/span><\/span><\/code><\/pre>\nLes performances varient ensuite selon les mod\u00e8les. Qwen3:4b est parfait pour du temps r\u00e9el avec environ 85 tokens\/seconde. GPT-OSS:120b est plus lent mais donne des r\u00e9sultats de qualit\u00e9 id\u00e9aux pour de la production. Pour du dev local, je vous recommande qwen3:8b, c\u2019est le bon compromis entre vitesse et intelligence.<\/p>\n Le truc cool, c\u2019est que vous pouvez maintenant cr\u00e9er des agents sp\u00e9cialis\u00e9s. Genre un agent DevOps qui surveille les CVE de vos d\u00e9pendances, un agent Marketing qui analyse les tendances de votre secteur, ou un agent Support qui maintient une base de connaissances \u00e0 jour.<\/p>\n Voici un exemple :<\/p>\n\nimport ollama\n<\/span><\/span>from ollama import chat, web_search\n<\/span><\/span>\n<\/span><\/span>class SecurityAgent:\n<\/span><\/span> def __init__(self):\n<\/span><\/span> self.model = \"qwen3:4b\"\n<\/span><\/span>\n<\/span><\/span> def check_vulnerabilities(self, technologies):\n<\/span><\/span> rapport = \"\ud83d\udee1\ufe0f RAPPORT S\u00c9CURIT\u00c9nn\"\n<\/span><\/span>\n<\/span><\/span> for tech in technologies:\n<\/span><\/span> # Recherche directe des CVE r\u00e9centes\n<\/span><\/span> results = web_search(f\"{tech} CVE vulnerabilities 2025 critical\")\n<\/span><\/span>\n<\/span><\/span> # Demande au mod\u00e8le d'analyser\n<\/span><\/span> response = chat(\n<\/span><\/span> model=self.model,\n<\/span><\/span> messages=[{\n<\/span><\/span> \"role\": \"user\",\n<\/span><\/span> \"content\": f\"R\u00e9sume les vuln\u00e9rabilit\u00e9s critiques de {tech}: {results}\"\n<\/span><\/span> }]\n<\/span><\/span> )\n<\/span><\/span>\n<\/span><\/span> rapport += f\"### {tech}n{response.message.content}nn\"\n<\/span><\/span>\n<\/span><\/span> return rapport\n<\/span><\/span>\n<\/span><\/span># Utilisation\n<\/span><\/span>agent = SecurityAgent()\n<\/span><\/span>rapport = agent.check_vulnerabilities([\"Node.js\", \"PostgreSQL\", \"Docker\"])\n<\/span><\/span>print(rapport)\n<\/span><\/span><\/code><\/pre>\nMaintenant, pour optimiser un peu tout \u00e7a et ne pas flamber votre quota API, voici quelques astuces assez classiques\u2026 D\u2019abord, mettez en cache les r\u00e9sultats. Ensuite, soyez sp\u00e9cifique dans vos requ\u00eates. Par exemple \u201cReact hooks\u201d va chercher plein de trucs inutiles, alors que \u201cReact 19 nouveaux hooks useActionState\u201d sera plus efficace.<\/p>\n On peut vraiment r\u00e9duire la quantit\u00e9 de requ\u00eates en \u00e9tant malin sur le prompt engineering. Par exemple, au lieu de laisser le mod\u00e8le chercher tout seul, guidez-le : \u201cV\u00e9rifie uniquement sur la doc officielle de React<\/em>\u201d plut\u00f4t que \u201cCherche des infos sur React<\/em>\u201d.<\/p>\n Et comme Ollama supporte MCP Server, Cline, Codex et Goose, c\u2019est royal car vous pouvez aussi brancher votre assistant IA directement dans votre IDE, Slack, ou Discord. H\u00e9 oui, vous allez enfin pouvoir coder un bot Discord qui va fact-checker automatiquement les affirmations douteuses et foireuses de vos coll\u00e8gues. Le r\u00eave !<\/p>\n Pour aller plus loin, vous pouvez aussi combiner la recherche web avec le fetching de pages sp\u00e9cifiques. L\u2019API web_fetch<\/code> permet ainsi de r\u00e9cup\u00e9rer le contenu d\u2019une URL pr\u00e9cise. Pratique pour analyser en profondeur une doc ou un article :<\/p>\n\nfrom ollama import web_search, web_fetch, chat\n<\/span><\/span>\n<\/span><\/span># 1. Recherche d'articles pertinents\n<\/span><\/span>search_results = web_search(\"React 19 vs Vue 3 comparison 2025\")\n<\/span><\/span>top_url = search_results.results[0]['url'] # ou .url selon le type\n<\/span><\/span>print(f\"\ud83d\udcf0 Article trouv\u00e9: {search_results.results[0]['title']}\")\n<\/span><\/span>\n<\/span><\/span># 2. R\u00e9cup\u00e9ration du contenu complet de la page\n<\/span><\/span>page_content = web_fetch(top_url)\n<\/span><\/span>print(f\"\ud83d\udcc4 {len(page_content.content)} caract\u00e8res r\u00e9cup\u00e9r\u00e9s\")\n<\/span><\/span>\n<\/span><\/span># 3. Analyse approfondie du contenu\n<\/span><\/span>response = chat(\n<\/span><\/span> model=\"qwen3:4b\", # ou \"gpt-oss\" si disponible\n<\/span><\/span> messages=[{\n<\/span><\/span> \"role\": \"user\",\n<\/span><\/span> \"content\": f\"\"\"\n<\/span><\/span> Analyse cette comparaison technique:\n<\/span><\/span> {page_content.content[:4000]}\n<\/span><\/span>\n<\/span><\/span> Donne-moi:\n<\/span><\/span> 1. Les points cl\u00e9s de chaque framework\n<\/span><\/span> 2. Le gagnant selon l'article\n<\/span><\/span> 3. Les cas d'usage recommand\u00e9s\n<\/span><\/span> \"\"\"\n<\/span><\/span> }]\n<\/span><\/span>)\n<\/span><\/span>\n<\/span><\/span>print(f\"n\ud83d\udd0d Analyse:n{response.message.content}\")\n<\/span><\/span><\/code><\/pre>\nAlors bien s\u00fbr, des fois la recherche retournera des trucs pas pertinents, surtout si votre requ\u00eate est vague et de son c\u00f4t\u00e9, le mod\u00e8le peut aussi mal interpr\u00e9ter les r\u00e9sultats s\u2019il est trop petit. Mais bon, compar\u00e9 \u00e0 une IA qui vous sort que Windows 11 n\u2019existe pas encore, on a fait quand m\u00eame pas mal de chemin, vous ne trouvez pas ??<\/p>\n J\u2019esp\u00e8re qu\u2019\u00e0 terme, Ollama ajoutera aussi le support de sources personnalis\u00e9es car ce serait vraiment cool de pouvoir indexer par exemple sa propre doc ou ses propres emails pour y faire des recherches\u2026 Mais bon, en attendant cette nouvelle API permet enfin de contrebalancer ce probl\u00e8me des mod\u00e8les pas \u00e0 jour en terme de connaissances, et \u00e7a c\u2019est d\u00e9j\u00e0 \u00e9norme !<\/p>\n A vous de jouer maintenant !<\/p>\n\nSource<\/a>\n<\/p>\n<\/div>\n<\/div>\n<\/div>\n","protected":false},"excerpt":{"rendered":" Ce qui est super relou avec les IA qu\u2019on peut utiliser en local, genre avec Ollama, c\u2019est que si on lui demande des infos un peu trop r\u00e9cente, \u00e7a nous sort des vieux chiffres de 2023 avec la confiance d\u2019un vendeur de voitures d\u2019occasion. Bon bah \u00e7a, c\u2019est fini puisqu\u2019 Ollama vient de sortir une API de recherche web qui permet enfin \u00e0 vos mod\u00e8les locaux d\u2019acc\u00e9der \u00e0 des infos fra\u00eeches dispo sur le net. Woohoo o\/ ! Baptis\u00e9e Ollama Web Search, cette API REST permet donc \u00e0 vos mod\u00e8les de faire des recherches sur le web en temps r\u00e9el comme \u00e7a plus besoin de se contenter des donn\u00e9es d\u2019entra\u00eenement fig\u00e9es dans le temps. Selon la doc officielle , l\u2019API fournit \u201cles derni\u00e8res informations du web pour r\u00e9duire les hallucinations et am\u00e9liorer la pr\u00e9cision\u201d. En gros, votre IA locale devient aussi \u00e0 jour que ChatGPT, mais sans envoyer vos donn\u00e9es perso \u00e0 OpenAI. Les mod\u00e8les compatibles avec cette nouvelle fonctionnalit\u00e9 incluent qwen3, LLama, gpt-oss (la version open source d\u2019OpenAI), deepseek-v3.1, et plein d\u2019autres. Et d\u2019apr\u00e8s les premiers tests de la communaut\u00e9 , qwen3 et gpt-oss sont m\u00eame plut\u00f4t dou\u00e9s pour exploiter cette fonctionnalit\u00e9. Le mod\u00e8le comprend qu\u2019il lui manque une info, fait sa recherche, analyse les r\u00e9sultats et nous sort une r\u00e9ponse document\u00e9e ! C\u2019est trop incrrrr ! Vous allez pouvoir booster vos scripts \/ bots \/ outils d\u2019IA locale pour qu\u2019ils puissent surveiller des choses dispo en ligne, les comparer, g\u00e9n\u00e9rer des r\u00e9sum\u00e9s \u00e0 partir de sites web, fact checker ou compl\u00e9ter des infos\u2026etc. Mais alors comment s\u2019en servir ? Bon, on est vendredi soir et j\u2019ai la flemme de tourner un tuto vid\u00e9o, donc m\u00eame si je risque de d\u00e9tailler tout \u00e7a bient\u00f4t \u00e0 mes Patreons d\u2019amour , voici quand m\u00eame quelques explications. D\u2019abord, il faut cr\u00e9er une cl\u00e9 API Ollama . La doc explique que vous avez un essai gratuit g\u00e9n\u00e9reux pour commencer, mais s\u2019il vous en faut plus, il faudra prendre un petit abonnement Ollama Cloud \u2026 Une fois votre cl\u00e9 en poche, exportez-la dans votre environnement comme ceci : export OLLAMA_API_KEY=”votre_cl\u00e9_ici” Le plus simple ensuite pour tester, c\u2019est avec curl : curl https:\/\/ollama.com\/api\/web_search –header “Authorization: Bearer $OLLAMA_API_KEY” -d ‘{ “query”: “derni\u00e8res vuln\u00e9rabilit\u00e9s CVE janvier 2025” }’ Mais bon, soyons honn\u00eates, on va plut\u00f4t utiliser Python car c\u2019est quand m\u00eame plus cool \ud83d\ude09 . Voici donc un exemple de script basique qui compare une r\u00e9ponse avec et sans recherche web : import ollama from ollama import chat, web_search, web_fetch model = “qwen3:4b” # 1. Sans recherche web response_classic = chat( # pas ollama.chat model=model, messages=[{ “role”: “user”, “content”: “Quelles sont les features de React 19?” }] ) print(“Sans recherche web:”, response_classic.message.content[:500]) # .message.content # 2. Avec recherche web search_results = web_search(“React 19 features derni\u00e8res nouveaut\u00e9s”) print(“R\u00e9sultats:”, search_results) # 3. Avec outils available_tools = {‘web_search’: web_search, ‘web_fetch’: web_fetch} messages = [{ “role”: “user”, “content”: “Utilise la recherche web pour me dire les derni\u00e8res features de React 19″ }] response_with_tools = chat( model=model, messages=messages, tools=[web_search, web_fetch], think=True ) # Acc\u00e8s aux tool_calls if response_with_tools.message.tool_calls: for tool_call in response_with_tools.message.tool_calls: function_to_call = available_tools.get(tool_call.function.name) if function_to_call: args = tool_call.function.arguments result = function_to_call(**args) print(f”Outil utilis\u00e9: {tool_call.function.name}”) print(f”R\u00e9sultat: {str(result)[:500]}…”) print(“R\u00e9ponse finale:”, response_with_tools.message.content) Les performances varient ensuite selon les mod\u00e8les. Qwen3:4b est parfait pour du temps r\u00e9el avec environ 85 tokens\/seconde. GPT-OSS:120b est plus lent mais donne des r\u00e9sultats de qualit\u00e9 id\u00e9aux pour de la production. Pour du dev local, je vous recommande qwen3:8b, c\u2019est le bon compromis entre vitesse et intelligence. Le truc cool, c\u2019est que vous pouvez maintenant cr\u00e9er des agents sp\u00e9cialis\u00e9s. Genre un agent DevOps qui surveille les CVE de vos d\u00e9pendances, un agent Marketing qui analyse les tendances de votre secteur, ou un agent Support qui maintient une base de connaissances \u00e0 jour. Voici un exemple : import ollama from ollama import chat, web_search class SecurityAgent: def __init__(self): self.model = “qwen3:4b” def check_vulnerabilities(self, technologies): rapport = “\ud83d\udee1\ufe0f RAPPORT S\u00c9CURIT\u00c9nn” for tech in technologies: # Recherche directe des CVE r\u00e9centes results = web_search(f”{tech} CVE vulnerabilities 2025 critical”) # Demande au mod\u00e8le d’analyser response = chat( model=self.model, messages=[{ “role”: “user”, “content”: f”R\u00e9sume les vuln\u00e9rabilit\u00e9s critiques de {tech}: {results}” }] ) rapport += f”### {tech}n{response.message.content}nn” return rapport # Utilisation agent = SecurityAgent() rapport = agent.check_vulnerabilities([“Node.js”, “PostgreSQL”, “Docker”]) print(rapport) Maintenant, pour optimiser un peu tout \u00e7a et ne pas flamber votre quota API, voici quelques astuces assez classiques\u2026 D\u2019abord, mettez en cache les r\u00e9sultats. Ensuite, soyez sp\u00e9cifique dans vos requ\u00eates. Par exemple \u201cReact hooks\u201d va chercher plein de trucs inutiles, alors que \u201cReact 19 nouveaux hooks useActionState\u201d sera plus efficace. On peut vraiment r\u00e9duire la quantit\u00e9 de requ\u00eates en \u00e9tant malin sur le prompt engineering. Par exemple, au lieu de laisser le mod\u00e8le chercher tout seul, guidez-le : \u201cV\u00e9rifie uniquement sur la doc officielle de React\u201d plut\u00f4t que \u201cCherche des infos sur React\u201d. Et comme Ollama supporte MCP Server, Cline, Codex et Goose, c\u2019est royal car vous pouvez aussi brancher votre assistant IA directement dans votre IDE, Slack, ou Discord. H\u00e9 oui, vous allez enfin pouvoir coder un bot Discord qui va fact-checker automatiquement les affirmations douteuses et foireuses de vos coll\u00e8gues. Le r\u00eave ! Pour aller plus loin, vous pouvez aussi combiner la recherche web avec le fetching de pages sp\u00e9cifiques. L\u2019API web_fetch permet ainsi de r\u00e9cup\u00e9rer le contenu d\u2019une URL pr\u00e9cise. Pratique pour analyser en profondeur une doc ou un article : from ollama import web_search, web_fetch, chat # 1. Recherche d’articles pertinents search_results = web_search(“React 19 vs Vue 3 comparison 2025″) top_url = search_results.results[0][‘url’] # ou .url selon le type print(f”\ud83d\udcf0 Article trouv\u00e9: {search_results.results[0][‘title’]}”) # 2. R\u00e9cup\u00e9ration du contenu complet de la page page_content = web_fetch(top_url) print(f”\ud83d\udcc4 {len(page_content.content)} caract\u00e8res r\u00e9cup\u00e9r\u00e9s”) # 3. Analyse approfondie du contenu response = chat( model=”qwen3:4b”, # ou “gpt-oss” si disponible messages=[{ “role”: “user”, “content”: f””” Analyse cette comparaison technique: {page_content.content[:4000]} Donne-moi: 1. Les points cl\u00e9s de chaque framework 2. Le gagnant selon l’article 3. Les cas d’usage recommand\u00e9s “”” }] ) print(f”n\ud83d\udd0d Analyse:n{response.message.content}”) Alors bien s\u00fbr, des fois la recherche retournera des trucs pas pertinents,<\/p>\n","protected":false},"author":1,"featured_media":1219,"parent":0,"menu_order":0,"comment_status":"closed","ping_status":"closed","template":"","meta":{"give_campaign_id":0,"_monsterinsights_skip_tracking":false,"_monsterinsights_sitenote_active":false,"_monsterinsights_sitenote_note":"","_monsterinsights_sitenote_category":0,"_kadence_starter_templates_imported_post":false,"footnotes":""},"class_list":["post-1218","page","type-page","status-publish","has-post-thumbnail","hentry"],"campaignId":"","_links":{"self":[{"href":"https:\/\/elearningsamba.com\/index.php\/wp-json\/wp\/v2\/pages\/1218","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/elearningsamba.com\/index.php\/wp-json\/wp\/v2\/pages"}],"about":[{"href":"https:\/\/elearningsamba.com\/index.php\/wp-json\/wp\/v2\/types\/page"}],"author":[{"embeddable":true,"href":"https:\/\/elearningsamba.com\/index.php\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/elearningsamba.com\/index.php\/wp-json\/wp\/v2\/comments?post=1218"}],"version-history":[{"count":0,"href":"https:\/\/elearningsamba.com\/index.php\/wp-json\/wp\/v2\/pages\/1218\/revisions"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/elearningsamba.com\/index.php\/wp-json\/wp\/v2\/media\/1219"}],"wp:attachment":[{"href":"https:\/\/elearningsamba.com\/index.php\/wp-json\/wp\/v2\/media?parent=1218"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}