La startup 2Brains propose de dissocier la génération du langage de la vérification des faits afin d'éliminer les hallucinations de l'IAaffirmant que l'approche de la Silicon Valley est une impasse
Le journaliste Robert X. Cringely remet en question la théorie dominante selon laquelle l'augmentation massive de la puissance de calcul résoudra automatiquement le problème des hallucinations de l'IA. Il suggère que les centaines de milliards investis par l'industrie pourraient s'avérer une erreur historique si la taille des modèles ne garantit jamais leur fiabilité. Pour illustrer son propos, il présente sa propre entreprise, 2Brains, qui aurait corrigé ces erreurs de fiabilité par une approche architecturale plutôt que par une simple montée en échelle. L'hallucination est un problème majeur des grands modèles de langage (LLM) et les experts craignent qu'il soit insoluble.
Dans le domaine de l'IA, une hallucination est une réponse fausse ou trompeuse présentée comme un fait certain par un chatbot, comme un chatbot qui invente des chiffres financiers pour une entreprise sans disposer de données réelles à ce sujet. Ce phénomène vient d'une limite fondamentale des systèmes : les grands modèles de langage génèrent du texte sur la base de patterns statistiques plutôt que par récupération de connaissances vérifiées.
Cela signifie qu'ils produisent du contenu qui semble plausible, sans mécanisme pour vérifier l'exactitude ou la validité des sources. En d'autres termes, l'IA ne sait pas vraiment : elle prédit ce qui est statistiquement probable, ce qui peut donner lieu à des affirmations fausses exprimées avec une totale assurance.
Les impacts sont sérieux. Selon Stanford HAI, les modèles hallucinent dans 15 à 20 % des requêtes factuelles sans ancrage externe, et ce taux monte à 58 à 88 % dans les requêtes juridiques. Les cas réels illustrent bien les risques critiques : un avocat de New York a été sanctionné pour avoir soumis des citations juridiques fictives générées par ChatGPT, et un homme a souffert d'une intoxication après avoir suivi un conseil diététique inventé par l'IA.
Le dogme de la puissance de calcul pour vaincre l'hallucination
Dans son essai, Dario Amodei affirme que l'augmentation exponentielle de la puissance de calcul finirait par résoudre tous les problèmes complexes liés à l'IA. Cette vision implique notamment que les hallucinations se dissiperaient d'elles-mêmes à mesure que les modèles gagneraient en taille et en temps d'entraînement. Mais Robert Cringely compare cette promesse à « un véritable mot d'excuse qui donne l'absolution à l'industrie de l'IA toute entière ».
(Robert X. Cringely est le nom de plume du journaliste Mark Stephens et d’une équipe de journalistes du site InfoWorld. Mark Stephens est le troisième journaliste à contribuer aux colonnes du magazine InfoWorld sous le pseudonyme Robert X. Cringely, les deux premiers étant Rory J. O'Connor et Laurie Flynn.)
Persuadés que la taille des modèles suffira à régler le problème, les investisseurs, les opérateurs de centres de données et les fabricants de puces injectent des centaines de milliards de dollars par an pour acquérir toujours plus de puissance de calcul. Mais bien que cette dynamique financière arrange tous les acteurs de la chaîne d'approvisionnement technologique, ce sont les futurs clients qui devraient s'interroger sur la validité de cette approche.
La question des hallucinations n'est pas un détail ; elle représente la différence fondamentale entre un jouet technologique astucieux et un système véritablement fiable sur lequel une banque, un hôpital ou un tribunal pourraient s'appuyer en toute sécurité. Cela dit, des chercheurs d'OpenAI soutiennent qu'à l'issue du pré-entraînement d'un modèle, les hallucinations sont inévitables. En clair, ce n'est pas un bogue qu'on peut simplement corriger.
La startup 2Brains propose une solution architecturale alternative
Robert X. Cringely souligne qu'une approche architecturale différente existe déjà. Une petite entreprise qu'il a cofondée, 2Brains inc., aurait réussi à résoudre le problème des hallucinations dès 2022. Plutôt que de suivre la voie du gigantisme en attendant le développement de modèles de langage toujours plus grands, l'équipe a décidé de repenser fondamentalement la structure du système en optant pour une approche purement architecturale.
Le cœur de cette solution repose sur une séparation stricte des fonctions : la partie du système chargée de générer le langage est totalement isolée de celle dont le rôle est de récupérer et de vérifier les faits. Ces deux composantes distinctes sont ensuite réconciliées avant même qu'une quelconque réponse ne soit transmise à l'utilisateur final. Selon un billet de bogue de Robert X. Cringely, cette méthode fonctionne et offre plusieurs avantages.
Contrairement aux infrastructures colossales des Big Tech, cette approche s'exécute sur des processeurs ordinaires, ce qui la rend particulièrement économique. Les résultats des tests réalisés en se basant sur les critères d'évaluation du secteur montrent que cette architecture parvient à faire plus que doubler les performances de référence en matière de fidélité, réussissant l'exploit de ne produire absolument aucun fait inventé dans les cas vérifiés.
L'existence d'une solution simple et ciblée remet en cause le pari à mille milliards de dollars de l'industrie. Robert X. Cringely a déclaré que si une petite équipe a pu résoudre les hallucinations grâce à une architecture spécifique et de simples processeurs, la stratégie du gigantisme n'a que deux issues possibles.
Soit l'augmentation de la taille des modèles ne corrigera jamais les hallucinations, rendant les investissements colossaux totalement inutiles, soit elle finira par coûter des fortunes pour simplement réinventer une architecture déjà conçue par d'autres. Le discours ambiant sur l'IA est devenu une sorte de théologie commode qui demande aux croyants de dépenser sans compter, et qui profite avant tout à ceux qui ont intérêt à propager cette croyance.
L'Illusion de la demande et le piège des coûts irrécupérables
Les investisseurs s'attendent à une explosion de l'utilisation de l'IA, mais ce n'est pas le cas. Loin des promesses révolutionnaires, l'adoption de l'IA ralentit considérablement face à l'explosion et l'opacité des factures. Selon l'analyste, la transition vers une facturation basée sur l'utilisation de tokens a mis en lumière l'absence cruelle de retour sur investissement réel de cette technologie. La part des travailleurs utilisant l'IA au travail est en baisse.
Les directeurs financiers réalisent l'ampleur du désastre : une étude récente a révélé que 22 % des entreprises n'ont aucune visibilité sur leurs dépenses en IA avant la facturation, et seulement 26 % déclarent avoir une vue d'ensemble de ces coûts. À titre d'exemple, Uber a épuisé en seulement quatre mois l'intégralité de son budget 2026 consacré à l'IA. Son directeur des opérations se demande désormais si cette technologie en valait la peine.
Ce dernier a mis en lumière un problème interne qualifié de « tokenmaxxing ». Ce terme décrit une situation où les employés consomment énormément de requêtes et de puissance de calcul informatique, augmentant drastiquement les coûts, sans que l'entreprise parvienne à démontrer la valeur réelle apportée par ces dépenses colossales. Dans le cas d'Uber, la société peine à dire exactement en quoi l'IA a enrichi l'expérience des utilisateurs.
Face à ce gouffre sans fond, Uber a imposé des plafonds d'utilisation stricts allant de cinq dollars par semaine pour certains employés à un peu plus de mille dollars par mois pour les ingénieurs. Au lieu d'outils productifs, l'industrie inonde le marché de logiciels bâclés, inutiles et fondamentalement non sécurisés.
Conclusion
OpenAI a officiellement acté la limite fondamentale de la génération de texte par l'IA. L’avenir de ChatGPT et de ses concurrents ne se jouera pas sur l’élimination totale des hallucinations, mais sur la manière dont nous apprendrons à les gérer. Selon les experts de l'industrie, comme dans toute révolution technologique, la question n’est pas seulement « que peut faire la machine ? », mais « comment l’humain choisit de l’utiliser malgré ses failles ».
Dans le même temps, la solution architecturale développée par 2Brains suggère qu'il est possible d'éliminer le problème des hallucinations de manière économique, sans avoir à dépendre d'une puissance de calcul démesurée. Selon Robert X. Cringely, le succès de cette architecture, qui sépare simplement la génération de texte de la vérification des faits sur des processeurs standards, confronte l'industrie de l'IA à une réalité incontournable.
Robert X. Cringely soutient que cette approche prouve que soit la course au gigantisme ne parviendra jamais à rendre les modèles fiables, soit les géants technologiques finiront par dépenser des milliards de dollars dans le seul but de réinventer un modèle architectural qui existe et fonctionne déjà.
Source : billet de blogue
Et vous ?
Quel est votre avis sur le sujet ?
Que pensez-vous proposée par 2Brains pour mettre fin aux hallucinations de l'IA ?
Cette architecture peut-elle réellement résoudre le problème de l'hallucination des modèles ?Voir aussi
OpenAI l'avoue : génération de contre-vérités, de citations fictives ou de faits inexacts, les hallucinations de ChatGPT ne disparaîtront jamais. L'IA générative face à sa limite structurelle
L'hallucination est inévitable et serait une limitation innée des grands modèles de langage en intelligence artificielle, selon une étude sur la possibilité d'éliminer les hallucinations des LLM
L'IA coûte trop cher et n'est rentable pour personne : seuls Nvidia, les fabricants de matériel et le BTP en tirent profit, portés par la frénésie des centres de données, selon l'analyste Ed Zitron
Vous avez lu gratuitement 300 articles depuis plus d'un an.
Soutenez le club developpez.com en souscrivant un abonnement pour que nous puissions continuer à vous proposer des publications.
Soutenez le club developpez.com en souscrivant un abonnement pour que nous puissions continuer à vous proposer des publications.
