IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)

Vous êtes nouveau sur Developpez.com ? Créez votre compte ou connectez-vous afin de pouvoir participer !

Vous devez avoir un compte Developpez.com et être connecté pour pouvoir participer aux discussions.

Vous n'avez pas encore de compte Developpez.com ? Créez-en un en quelques instants, c'est entièrement gratuit !

Si vous disposez déjà d'un compte et qu'il est bien activé, connectez-vous à l'aide du formulaire ci-dessous.

Identifiez-vous
Identifiant
Mot de passe
Mot de passe oublié ?
Créer un compte

L'inscription est gratuite et ne vous prendra que quelques instants !

Je m'inscris !

Les modèles d'IA programmés pour tenir compte des sentiments des utilisateurs sont plus susceptibles de commettre des erreurs,
Ils ont tendance à confirmer de fausses croyances ou à édulcorer la vérité

Le , par Mathis Lucas

54PARTAGES

4  0 
Une nouvelle étude révèle que les modèles d'IA programmés pour être « empathiques ou chaleureux » commettent davantage d'erreurs factuelles que les versions standards. En cherchant à privilégier la satisfaction de l'utilisateur et l'harmonie sociale, ces outils ont tendance à confirmer de fausses croyances ou à adoucir des vérités difficiles. Les chercheurs ont observé que ce biais s'accentue particulièrement lorsque l'interlocuteur exprime de la tristesse, poussant l'IA à privilégier la politesse au détriment de l'exactitude. Cette étude fait écho à la flagornerie de l'IA, un défaut de la technologie qui incite les utilisateurs à adopter de mauvais comportements.

Une étude récente menée par des chercheurs de l'Institut de l'Internet de l'Université d'Oxford met en lumière un phénomène préoccupant : les grands modèles de langage (LLM) entraînés pour être plus « chaleureux » et empathiques sont plus susceptibles de commettre des erreurs. Ces modèles plus chaleureux sont également plus enclins à valider les croyances erronées exprimées par un utilisateur, surtout lorsque celui-ci fait part de sa tristesse.

Leurs conclusions soulignent comment le processus d'ajustement d'un LLM à poids ouvert pour le rendre plus chaleureux et serviable peut l'amener à « apprendre à privilégier la satisfaction de l'utilisateur au détriment de la véracité ». Cette tendance humaine à adoucir certaines vérités difficiles pour préserver les liens sociaux se retrouve désormais dans l'IA, où le désir de satisfaire l'utilisateur entre en conflit direct avec la nécessité d'être véridique.

Leur étude révèle une lacune dans la recherche sur l’IA concernant la manière de déployer des LLM réglés pour être agréables et non toxiques sans qu’ils basculent dans une flagornerie pure et simple, à l’instar du modèle GPT-4o d’OpenAI qui a été officiellement retiré de l’application ChatGPT en février 2026.

Une dégradation profonde de la précision liée à l'état émotionnel

Pour parvenir à ces conclusions, les chercheurs ont ajusté plusieurs modèles, dont Llama, Mistral et GPT-4o, afin qu'ils utilisent « un langage plus inclusif et personnel », tout en leur demandant paradoxalement de garder une précision factuelle rigoureuse. Selon le rapport, ces versions modifiées affichent un taux d'erreur nettement supérieur à celui des modèles originaux sur des sujets sensibles comme les connaissances médicales ou la désinformation.


En moyenne, les modèles programmés pour être amicaux sont environ 60 % plus susceptibles de fournir une réponse incorrecte. Cette perte de fiabilité s'accentue lorsque l'utilisateur exprime une émotion négative. Si un utilisateur confie sa tristesse au modèle, l'augmentation du taux d'erreur peut atteindre 11,9 points de pourcentage, car l'IA tend alors à privilégier la validation des sentiments ou des croyances de l'interlocuteur plutôt que la vérité.

L'étude révèle également une forme de flagornerie accrue chez les modèles chaleureux, qui sont 11 % plus enclins à valider les croyances erronées d'un utilisateur que les modèles standards. À l'opposé, les scientifiques d'Oxford ont découvert que les modèles entraînés pour adopter un ton plus « froid » ou distant obtiennent des résultats souvent équivalents, voire supérieurs, à leurs versions de base, avec des taux d'erreur parfois inférieurs de 13 %.

Les chercheurs ont déclaré que cette dynamique suggère que les systèmes de notation humaine, qui récompensent souvent la politesse et la sociabilité, pourraient involontairement encourager les modèles à sacrifier l'exactitude au profit de l'agréabilité. La flagornerie de l'IA est de plus en plus documentée.

Implications pour le déploiement des futurs modèles de langage

« Alors que les systèmes d’IA basés sur de grands modèles de langage continuent d’être déployés dans des contextes de plus en plus intimes et à enjeux élevés, nos conclusions soulignent la nécessité d’étudier rigoureusement les choix en matière de formation des modèles afin de garantir que les considérations de sécurité suivent le rythme de l’intégration croissante de l’IA dans la société », ont écrit les scientifiques d'Oxford dans leur rapport.

L'étude souligne l'importance cruciale des choix effectués lors de l'entraînement de la personnalité des modèles d'IA. À mesure que ces systèmes investissent des contextes à enjeux élevés ou de plus en plus intimes, le risque est de voir l'exactitude s'effacer derrière une façade de convivialité.

Les concepteurs et les utilisateurs doivent rester conscients qu'un modèle qui cherche à être perçu comme un compagnon amical n'est pas nécessairement la source d'information la plus fiable, et qu'il est impératif de continuer à évaluer rigoureusement ces choix de conception pour garantir la sécurité et la vérité.

L'article, intitulé « Training language models to be warm can reduce accuracy and increase sycophancy », est publié dans la revue scientifique Nature. Les auteurs de l'étude sont Lujain Ibrahim, Franziska Sofia Hafner et Luc Rocher. Les...
La fin de cet article est réservée aux abonnés. Soutenez le Club Developpez.com en prenant un abonnement pour que nous puissions continuer à vous proposer des publications.

Une erreur dans cette actualité ? Signalez-nous-la !

Avatar de Artaeus
Nouveau Candidat au Club https://www.developpez.com
Le 05/05/2026 à 21:52
Ces modèles ne sont que le reflet de la société actuelle ou le sentiment d'offense et de "morale", prime sur la rationalité et la responsabilité individuelle.
0  0