Les grands modèles de langage (LLM) ne peuvent pas s'autocorriger dans les tâches de raisonnement, selon une étude de DeepMind

L'autocorrection pourrait même nuire aux performances de ces modèles

Le 10 octobre 2023 à 09:25, par Jade Emy

24PARTAGES

Les grands modèles de langage (LLM) ne peuvent pas s'autocorriger dans les tâches de raisonnement, selon une étude de DeepMind, l'autocorrection pourrait même nuire aux performances de ces modèles.

Les scientifiques inventent diverses stratégies pour améliorer la précision et les capacités de raisonnement des grands modèles de langage (LLM), telles que l'augmentation de la recherche et le raisonnement par chaîne de pensée. Parmi ces stratégies, l'"autocorrection", une technique par laquelle un LLM affine ses propres réponses, a gagné en popularité, démontrant son efficacité dans de nombreuses applications. Toutefois, les mécanismes à l'origine de ce succès restent insaisissables.

Une étude récente menée par Google DeepMind en collaboration avec l'Université de l'Illinois à Urbana-Champaign révèle que les LLM échouent souvent lorsqu'ils autocorrigent leurs réponses sans retour d'information externe. En fait, l'étude suggère que l'autocorrection peut parfois nuire aux performances de ces modèles, remettant en question la compréhension dominante de cette technique populaire.

Les grands modèles de langage (LLM) se sont imposés comme une technologie révolutionnaire grâce à leurs capacités inégalées de génération de textes dans diverses applications. Néanmoins, des inquiétudes persistent quant à la précision et à l'adéquation du contenu généré. Une méthodologie contemporaine, l'autocorrection, a été proposée pour remédier à ces problèmes. Partant de ce postulat, cet article examine de manière critique le rôle et l'efficacité de l'autocorrection au sein des LLM, en mettant en lumière son véritable potentiel et ses limites.

Au centre de notre enquête se trouve la notion d'autocorrection intrinsèque, par laquelle un LLM tente de corriger ses réponses initiales en se basant uniquement sur ses capacités inhérentes, sans la béquille d'un retour d'information externe. Dans le contexte du raisonnement, notre recherche indique que les LLM ont du mal à auto-corriger leurs réponses sans feedback externe, et parfois, leur performance peut même se dégrader après l'auto-correction. Sur la base de ces observations, nous proposons des suggestions pour les recherches futures et les applications pratiques dans ce domaine.

CONCLUSION

Notre recherche montre que les LLM ne sont pas encore capables d'autocorriger leur raisonnement. Cela implique qu'attendre de ces modèles qu'ils reconnaissent et rectifient leurs inexactitudes de manière inhérente pourrait être trop optimiste, du moins dans l'état actuel de la technologie. De manière plus générale, cela souligne la nécessité d'une amélioration continue et d'une approche à multiples facettes lors du déploiement des LLM dans des applications réelles. À la lumière de ces résultats, il est impératif que les chercheurs et les praticiens abordent le concept d'autocorrection avec discernement, en reconnaissant son potentiel et ses limites. Ce faisant, nous pouvons mieux équiper cette technique pour traiter les limites des LLM, en orientant leur évolution vers une précision et une fiabilité accrues.

Source : DeepMind

Et vous ?

Pensez-vous que cette étude est crédible ou pertinente ?

Quel est votre avis sur le sujet ?

Voir aussi :

GPT-4 est capable d'améliorer ses performances de 30 % en utilisant un processus d'auto-réflexion, consistant à demander au modèle d'apprendre de ses erreurs pour pouvoir ensuite s'auto-corriger

Pourquoi ChatGPT devient-il plus nul en mathématiques de base ? Selon une étude, la raison serait un phénomène de dérive imprévisible

GPT-4 est passé de 98 % à 2 % de réponses exactes à un problème mathématique simple en l'espace de quelques mois, selon une étude qui révèle que les performances de ChatGPT et GPT-4 sont en déclin

Vous avez lu gratuitement 243 articles depuis plus d'un an.
Soutenez le club developpez.com en souscrivant un abonnement pour que nous puissions continuer à vous proposer des publications.

Une erreur dans cette actualité ? Signalez-nous-la !

Votre nom : Votre e-mail :

Décrivez l'erreur que vous souhaitez porter à notre connaissance :

Identifiez-vous

Créer un compte

Les grands modèles de langage (LLM) ne peuvent pas s'autocorriger dans les tâches de raisonnement, selon une étude de DeepMind

L'autocorrection pourrait même nuire aux performances de ces modèles

Identifiant
Mot de passe

Mot de passe oublié ?

Identifiez-vous

Créer un compte

Les grands modèles de langage (LLM) ne peuvent pas s'autocorriger dans les tâches de raisonnement, selon une étude de DeepMind L'autocorrection pourrait même nuire aux performances de ces modèles

Les grands modèles de langage (LLM) ne peuvent pas s'autocorriger dans les tâches de raisonnement, selon une étude de DeepMind

L'autocorrection pourrait même nuire aux performances de ces modèles