Des scientifiques ont approfondi une découverte bien établie : les grands modèles de langage (LLM) présentent de fortes corrélations de signaux avec le réseau cérébral du langage, la région de notre cerveau qui est responsable du traitement de la langue. La nouveauté de cette étude réside dans l'analyse de l'évolution de ces corrélations au fil de l'entraînement des modèles. Toutefois, les scientifiques restent prudents : la ressemblance entre une IA et le cerveau ne veut pas dire qu'ils sont la même chose. Cette prudence contraste avec le battage médiatique autour d'une IA consciente, alors même que Dario Amodei a déclaré rester ouvert à cette possibilité.L'étude en question a été réalisée par une équipe de scientifiques de l'École polytechnique fédérale de Lausanne (EPFL), du MIT et de l'Institut de technologie de Géorgie (Georgia Tech). L'étude a porté sur les similitudes entre les modèles et le cerveau. Elle a évalué 34 points de contrôle d'entraînement couvrant 300 milliards de tokens sur 8 modèles de tailles différents afin d'analyser « le lien entre l'alignement cérébral et la compétence linguistique ».
Les chercheurs ont constaté que l'alignement cérébral suit de plus près le développement de la compétence linguistique formelle, c'est-à-dire la connaissance des règles linguistiques, que celui de la compétence linguistique fonctionnelle. Mais les propriétés clés du langage qui sous-tendent cette similitude, ainsi que la manière dont les représentations similaires à celles du cerveau apparaissent et évoluent au cours de l'entraînement, restent floues.
« Nous constatons notamment que la corrélation entre la prédiction du mot suivant, l'alignement comportemental et l'alignement cérébral s'estompe dès que les modèles dépassent la maîtrise du langage humain », a écrit l'équipe dans son rapport d'étude, publié dans la revue scientifique ACL Anthology.
Une ressemblance avec le cerveau qui plafonne rapidement
L'équipe a réexaminé des conclusions antérieures qui montraient que les grands modèles de langage présentaient de fortes corrélations avec le réseau linguistique humain, la région du cerveau responsable du traitement du langage. (Des similitudes surprenantes entre les régions du cerveau et les programmes d'IA ont été découvertes pour la première fois en 2014 par des chercheurs qui étudiaient une région du cerveau très différente : le cortex visuel.)
Leurs nouveaux résultats ont révélé que les corrélations entre les signaux du modèle et ceux de la région cérébrale changent au cours du processus d'entraînement, au cours duquel les modèles apprennent à compléter automatiquement des milliards de mots élidés (tokens) à partir de passages de texte.
Les corrélations entre les signaux du modèle et ceux du réseau linguistique atteignent leur niveau maximal relativement tôt dans le processus d'entraînement. Si la poursuite de l'entraînement continue d'améliorer les performances fonctionnelles des modèles, elle n'augmente pas pour autant les corrélations avec le réseau linguistique. Autrement dit, « devenir meilleur en langage ne signifie pas devenir plus "semblable" au cerveau langagier humain ».
Ces résultats clarifient le tableau surprenant qui se dégage des recherches en neurosciences menées précédemment : « les programmes d'IA peuvent présenter de fortes similitudes avec des régions cérébrales à grande échelle, en remplissant des fonctions similaires et en utilisant des modèles de signaux très similaires ». Les neuroscientifiques ont exploité ces découvertes pour créer des modèles beaucoup plus performants des régions corticales.
Plus qu'un simple réseau langagier
Le vrai apport de cette étude est interprétatif. Les modèles de langage commerciaux réalisent désormais des tâches comme le raisonnement mathématique, que les neuroscientifiques associent à une région cérébrale distincte appelée le réseau à « demandes multiples ». La stagnation des corrélations avec le réseau du langage après un certain stade d'entraînement suggère que le modèle développerait des ressemblances avec d'autres régions.
Un modèle de langage industriel moderne serait ainsi moins analogue à un réseau langagier seul et plus analogue à un ensemble de régions corticales synthétiques, c'est-à-dire un réseau du...
La fin de cet article est réservée aux abonnés. Soutenez le Club Developpez.com en prenant un abonnement pour que nous puissions continuer à vous proposer des publications.