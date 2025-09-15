Envoyé par OpenAI Envoyé par

Nous avons vu pourquoi les hallucinations sont si difficiles à éliminer, mais pas doù proviennent ces erreurs factuelles si spécifiques. Quand on y pense, les grands modèles pré-entraînés commettent rarement dautres types derreur, comme des fautes dorthographes ou des incohérences au niveau des parenthèses. La différence réside dans les logiques qui se cachent dans les données.



Les modèles de langage apprennent tout dabord via une phase de pré-entraînement, un processus qui consiste à prédire le mot suivant au sein dune énorme quantité de texte. Dans cette phase, à la différence de ce qui se passe dans les problèmes de machine learning classiques, il ny a pas détiquette « vrai/faux » associée à chaque affirmation. Le modèle ne voit que des exemples positifs de formulations naturelles et doit donc estimer la distribution globale du langage.



Il est deux fois plus difficile de faire la distinction entre les affirmations valides et non valides sans exemples étiquetés daffirmations non valides. Mais même avec les étiquettes, certaines erreurs restent inévitables. Pour bien en comprendre les raisons, basons nous sur une nouvelle analogie. Dans le domaine de la reconnaissance dimages, létiquetage de millions de photos de chats et de chiens permet aux algorithmes de les classer de manière fiable. Imaginons quau lieu détiqueter chaque photo en fonction de son sujet (chien ou chat), nous indiquions la date danniversaire de lanimal. Ces dates étant aléatoires, cette tâche générerait toujours des erreurs, quel que soit le degré de sophistication de lalgorithme.



Il en va de même pour le pré-entraînement. Lorthographe et lorganisation des parenthèses suivent une logique. Les erreurs sont donc éliminées à mesure que les volumes de données augmentent. A contrario, les faits aléatoires dont la fréquence est faible, comme la date danniversaire dun animal, ne peuvent pas être prédits par une logique quelconque et génèrent donc des hallucinations. Notre analyse explique les types dhallucinations qui résultent de la prédiction du mot suivant. Dans lidéal, de nouvelles étapes suivant le pré-entraînement devraient pouvoir les éliminer, mais ce nest aujourdhui pas parfaitement le cas pour les raisons décrites dans la section précédente.