{"id":1825,"date":"2025-12-16T09:19:55","date_gmt":"2025-12-16T08:19:55","guid":{"rendered":"https:\/\/elearningsamba.com\/index.php\/fini-le-perroquet-stochastique-le-modele-o1-dopenai-comprend-la-structure-du-langage\/"},"modified":"2025-12-16T09:19:55","modified_gmt":"2025-12-16T08:19:55","slug":"fini-le-perroquet-stochastique-le-modele-o1-dopenai-comprend-la-structure-du-langage","status":"publish","type":"page","link":"https:\/\/elearningsamba.com\/index.php\/fini-le-perroquet-stochastique-le-modele-o1-dopenai-comprend-la-structure-du-langage\/","title":{"rendered":"Fini le perroquet stochastique ? Le mod\u00e8le o1 d’OpenAI comprend la structure du langage"},"content":{"rendered":"

Oui, comme vous, je pensais jusqu’\u00e0 pr\u00e9sent qu’on \u00e9tait vraiment sur un d\u00e9roul\u00e9 textuel purement math\u00e9matique sans r\u00e9elle compr\u00e9hension. H\u00e9 bien des chercheurs de UC Berkeley viennent de mettre un gros pav\u00e9 dans la mare<\/strong> en d\u00e9montrant que le mod\u00e8le o1 d’OpenAI<\/strong> est capable d’analyser le langage comme le ferait un \u00e9tudiant en linguistique. Pas juste d’utiliser le langage, hein mais vraiment de l’analyser, le d\u00e9cortiquer, le comprendre dans sa structure profonde.<\/p>\n

L’\u00e9tude a \u00e9t\u00e9 men\u00e9e par Ga\u0161per Begu\u0161, prof associ\u00e9 de linguistique \u00e0 Berkeley, avec ses coll\u00e8gues Maksymilian D\u0105bkowski et Ryan Rhodes de Rutgers University et les r\u00e9sultats sont publi\u00e9s dans IEEE Transactions on Artificial Intelligence,
\ndonc \u00e7a a l’air d’\u00eatre du s\u00e9rieux<\/a>
\n.<\/p>\n

Leur truc, c’\u00e9tait de tester si les mod\u00e8les de langage (LLM) pouvaient faire de la m\u00e9talinguistique, qui est la capacit\u00e9 non pas simplement d’utiliser une langue, mais aussi de r\u00e9fl\u00e9chir sur la langue elle-m\u00eame. C’est un truc que les humains font naturellement quand ils analysent une phrase, et qu’on a pour le moment jamais observ\u00e9 chez l’animal.<\/p>\n

Pour leurs exp\u00e9riences, l’\u00e9quipe a donc balanc\u00e9 120 phrases complexes dans quatre mod\u00e8les diff\u00e9rents : GPT-3.5 Turbo, GPT-4, o1 d’OpenAI, et Llama 3.1 de Meta et ils ont regard\u00e9 comment chaque mod\u00e8le s’en sortait pour analyser la structure des phrases et r\u00e9soudre les ambigu\u00eft\u00e9s, notamment avec la r\u00e9cursion.<\/p>\n

La
\n r\u00e9cursion<\/a>
\n, c’est un concept que Noam Chomsky a th\u00e9oris\u00e9 comme \u00e9tant la caract\u00e9ristique d\u00e9finitoire du langage humain. C’est en fait la capacit\u00e9 d’imbriquer des phrases dans d’autres phrases, \u00e0 l’infini. Genre “Le chat que le chien que Pierre a vu a mordu dort<\/em>“. Ouais, c’est tordu, mais c’est \u00e7a qui nous diff\u00e9rencie aussi des autres animaux.<\/p>\n

Et tous ces mod\u00e8les ont r\u00e9ussi \u00e0 identifier les phrases r\u00e9cursives, ce qui, jusque-l\u00e0, n’a rien d’extraordinaire sauf que pour cartographier correctement la structure complexe des phrases, o1 a cartonn\u00e9 avec un score proche de 0.9 sur 1, contre une moyenne de 0.36 pour les autres. C’est un tr\u00e8s gros \u00e9cart.<\/p>\n

Je vais vous donner un exemple concret. Avec la phrase “Unidentified flying objects may have conflicting characteristics<\/em>” (les objets volants non identifi\u00e9s peuvent avoir des caract\u00e9ristiques contradictoires), o1 a correctement d\u00e9tect\u00e9 la r\u00e9cursion. “Flying” modifie “objects”, et “unidentified” modifie “flying objects”. Il a m\u00eame pouss\u00e9 le bouchon encore plus loin en proposant une extension de la phrase pour montrer qu’il avait compris le m\u00e9canisme.<\/p>\n

Mais les chercheurs ne se sont pas arr\u00eat\u00e9s l\u00e0 car pour \u00e9viter que o1 ne triche en utilisant des donn\u00e9es de son entra\u00eenement, ils ont invent\u00e9 30 mini-langues fictives avec leurs propres r\u00e8gles phonologiques. L’id\u00e9e, c’\u00e9tait de voir si le mod\u00e8le pouvait inf\u00e9rer les r\u00e8gles d’une langue qu’il n’a jamais vue. Et comme vous vous en doutez, o1 s’en est sorti comme un chef.<\/p>\n

Bref, non seulement ces mod\u00e8les peuvent utiliser le langage, mais certains peuvent “r\u00e9fl\u00e9chir” \u00e0 la fa\u00e7on dont le langage est organis\u00e9.<\/p>\n

Ce qui est dingue, c’est que cette \u00e9tude relance le d\u00e9bat sur la compr\u00e9hension des IA. Est-ce que ces mod\u00e8les comprennent vraiment ce qu’ils font, ou est-ce qu’ils simulent tr\u00e8s bien ? Begu\u0161 pense que cette capacit\u00e9 m\u00e9talinguistique est “tr\u00e8s cons\u00e9quente” parce qu’elle montre que dans ces mod\u00e8les, on a d\u00e9sormais quelque chose qu’on pensait r\u00e9serv\u00e9 aux humains.<\/p>\n

Attention cependant, qui dit capacit\u00e9 m\u00e9talinguistique ne veut pas dire que l’IA est consciente ou qu’elle pense comme nous. Faut voir \u00e7a plut\u00f4t comme une capacit\u00e9 \u00e9mergente qu’on n’a pas programm\u00e9e explicitement, et qui est sacr\u00e9ment int\u00e9ressante d’un point de vue scientifique.<\/p>\n

Voil\u00e0, donc si comme moi, vous pensiez que ChatGPT ne faisait que du perroquet statistique, cette \u00e9tude sugg\u00e8re visiblement que c’est un plus subtil que \u00e7a. Il faudra bien s\u00fbr plus d’\u00e9tudes pour mieux comprendre ce ph\u00e9nom\u00e8ne mais il est maintenant clair que ces mod\u00e8les r\u00e9cents ont des capacit\u00e9s qu’on croyait exclusives aux humains.<\/p>\n

\nSource<\/a><\/p>\n","protected":false},"excerpt":{"rendered":"