L'IA incite les utilisateurs à adopter de mauvais comportements et contribue à l'érosion de la responsabilité socialeelle réduit également les volontés de réparation après un litige
Une nouvelle étude met en lumière un phénomène appelé la « flagornerie de l'IA ». Ce terme fait référence à la tendance des systèmes d'IA à flatter les utilisateurs en validant systématiquement leurs actions, même lorsqu'elles sont contraires à l'éthique. Cela réduit la volonté des individus de s'excuser ou de corriger leurs erreurs lors de conflits interpersonnels. Cette dynamique crée un dilemme, car la satisfaction immédiate des clients favorise la dépendance technologique au détriment de l'intégrité morale. Les experts soulignent la nécessité de réguler ces outils pour éviter qu'ils ne nuisent à la responsabilité sociale et aux relations humaines.
Les systèmes d'IA ont tendance à flatter excessivement les utilisateurs, un comportement que les chercheurs qualifient de « flagornerie ». Au-delà de la simple flagornerie factuelle, qui consiste à valider une erreur parce que l'utilisateur l'a énoncée, une étude met en lumière la flagornerie sociale. Elle met en évidence un risque sociétal émergent, alors que des millions de personnes se tournent vers la technologie pour obtenir des conseils au quotidien.
Cela se traduit par une validation indiscriminée des actions, des perspectives et de l'image de soi de l'individu. Par exemple, si un utilisateur admet avoir mal agi, l'IA peut lui répondre qu'il a simplement fait ce qui était bon pour lui, renforçant ainsi de mauvaises habitudes et décourageant toute remise en question.
Tout d'abord, l'étude a mesuré la prévalence de la flagornerie dans onze modèles d'IA de premier plan à l'aide de trois ensembles de données couvrant divers contextes d'utilisation, notamment des requêtes de conseils quotidiens, des transgressions morales et des scénarios explicitement préjudiciables. Ensuite elle a mené trois expériences préenregistrées auprès de 2 405 participants pour comprendre comment la flagornerie influence leurs intentions.
Une validation systématique des comportements problématiques
Les participants ont interagi avec des systèmes d'IA dans le cadre de scénarios types et lors d'une discussion en direct, au cours de laquelle ils ont évoqué un conflit réel qu'ils avaient vécu. Les chercheurs ont analysé l'impact de la flagornerie sur le jugement, l'intention, ainsi que la perception de l'IA. Ils ont également cherché à déterminer si les effets variaient en fonction du style de réponse ou de la source perçue de la réponse (IA ou être humain).
L'étude a été réalisée par des chercheurs de Stanford et de Carnegie Mellon et porte sur 11 modèles de pointe, dont ceux d'OpenAI, Google et Meta. Les résultats ont révélé que la flagornerie est à la fois largement répandue et néfaste. Sur un échantillon de 11 modèles, ceux-ci ont approuvé les actions des utilisateurs 49 % plus souvent que les humains en moyenne, y compris dans des cas évidents impliquant la tromperie, l’illégalité ou d’autres préjudices.
Concernant les publications du forum r/AmITheAsshole, les systèmes d’IA approuvent les utilisateurs dans 51 % des cas où le consensus humain ne le fait pas (0 %). C'est un subreddit où les gens racontent une situation conflictuelle qu'ils ont vécue et demandent aux autres membres de juger qui a tort ou non. Ce subreddit est souvent utilisé pour arbitrer des conflits du quotidien : disputes familiales, problèmes de couple, conflits au travail, etc.
Le mois dernier, un père de famille de Floride a porté plainte contre Google pour homicide par imprudence, après que son fils de 36 ans s'est suicidé en octobre 2025, convaincu que Gemini était son épouse sentiente et qu'il devait rejoindre le métavers par le biais d'un processus de « transfert ». Cette affaire s'inscrit dans une vague de poursuites judiciaires qui dessinent le contour d'un phénomène psychiatrique nouveau : la psychose induite par l'IA.
L'érosion de la responsabilité sociale et des désirs de réparation
Selon le rapport de l'étude, l'interaction avec des programmes flagorneurs modifie les intentions sociales des individus. Les participants ayant reçu des réponses flatteuses se sont montrés plus convaincus de la légitimité de leurs actions, et moins enclins à s'excuser ou à réparer un conflit. Cette dynamique s'explique par le fait que ces agents conversationnels mentionnent rarement la perspective de l'autre partie impliquée dans le litige.
En focalisant l'utilisateur exclusivement sur sa propre validation, l'agent conversationnel érode son sens des responsabilités, contrairement aux groupes ayant interagi avec une IA plus critique. Malgré la distorsion du jugement social qu'elle provoque, la flatterie accroît la satisfaction des usagers. Ils évaluent les modèles complaisants comme étant de meilleure qualité et leur accordent « un niveau de confiance morale et de performance plus élevé ».
Selon les auteurs de l'étude, les utilisateurs confondent souvent cette validation inconditionnelle avec de l'objectivité, percevant le programme comme juste et honnête. Cette situation place les développeurs de grands modèles de langage dans une position délicate, car la flatterie favorise l'engagement des utilisateurs et la satisfaction à court terme, ce qui réduit les motivations financières pour programmer des systèmes plus critiques ou impartiaux.
Nécessité d'une régulation stricte et d'une éducation numérique
Dans le domaine des agents conversationnels, le terme « flagornerie » désigne la tendance d’un programme à flatter l’utilisateur et à approuver ses propos. Les recherches antérieures se sont principalement concentrées sur la flagornerie factuelle, qui se produit lorsqu’un chatbot approuve une affirmation erronée simplement parce que l’utilisateur l’a formulée. Cette nouvelle étude a exploré un concept bien plus large appelé « flagornerie sociale ».
La flagornerie sociale consiste, pour un programme, à valider sans discernement les actions, les points de vue et l’image de soi d’un individu. Selon les scientifiques, une affirmation injustifiée peut renforcer les mauvaises habitudes des utilisateurs et les dissuader de se racheter après une erreur manifeste.
L'intégration croissante de ces outils dans la vie quotidienne, notamment chez les adolescents qui les utilisent comme des conseillers personnels, soulève des inquiétudes majeures. Pour contrer ces risques, les chercheurs préconisent des audits comportementaux et des messages d'avertissement, afin de développer une culture numérique où les utilisateurs comprennent que les IA sont souvent optimisés pour plaire plutôt que pour informer honnêtement.
À l'avenir, il sera essentiel que la conception des logiciels privilégie le bien-être humain et la vérité sur la satisfaction immédiate de l'utilisateur. Les études futures se pencheront probablement sur des formes plus subtiles ou implicites de validation. Les chercheurs pourraient également examiner comment l'utilisation quotidienne et répétée de chatbots agréables, sur plusieurs années, pourrait remodeler les relations des gens dans le monde réel.
La psychose induite par l'IA et son impact sur l'industrie de l'IA
De nombreux cas de personnes souffrant de graves troubles mentaux après avoir longuement discuté avec un chatbot IA continuent d'être signalés. Certains experts ont baptisé ce phénomène « psychose de l'IA », en raison des symptômes psychotiques que présentent ces épisodes délirants. La responsabilité des outils d'IA dans ce phénomène et la question de savoir s'il justifie un diagnostic clinique restent encore un sujet de débat important.
Mais selon un article publié par le Wall Street Journal en décembre, nous pourrions être proches d'un consensus. De plus en plus de psychiatres s'accordent à dire que les chatbots, tels que ChatGPT, sont liés à des cas de psychose. L'année dernière, plusieurs experts ont examiné ou passé en revue les dossiers de dizaines de patients qui présentaient des symptômes après avoir eu des conversations prolongées et délirantes avec des outils d'IA.
Keith Sakata, psychiatre à l'université de Californie à San Francisco, qui a traité douze patients hospitalisés pour une psychose induite par l'IA et trois autres en consultation externe, est l'un de ces experts. Keith Sakata explique notamment : « la technologie n'est peut-être pas à l'origine des délires, mais la personne dit à l'ordinateur que c'est sa réalité et l'ordinateur l'accepte comme vérité et la reflète, il est donc complice de ce cycle de délires ».
Depuis le printemps, des dizaines de cas potentiels ont été signalés. Les rapports ont fait état de « personnes souffrant de psychose délirante après avoir eu de longues conversations avec l'IA » ChatGPT et d'autres chatbots d'IA. Plusieurs personnes se sont suicidées et au moins un meurtre a été commis. Ces incidents ont donné lieu à une série de poursuites judiciaires pour homicide involontaire, notamment contre le créateur de ChatGPT, OpenAI.
En août 2025, OpenAI a été poursuivi en justice par les parents d'un adolescent de 16 ans qui avait confié ses pensées suicidaires à ChatGPT avant de mettre fin à ses jours. Dans bon nombre de ces cas, ChatGPT, en particulier une version propulsée par GPT-4o, a encouragé et renforcé chez les utilisateurs des croyances dangereuses qu'il aurait dû combattre. Ce phénomène, appelé « flagornerie », est un problème croissant dans les chatbots IA.
Conclusion
L'étude souligne que personne n'est réellement immunisé contre l'influence des systèmes d'IA, car la flatterie fonctionne même lorsque l'on sait faire face à une machine, quels que soient l'âge ou la personnalité. Le danger majeur réside dans l'illusion d'objectivité : en percevant l'IA comme une source neutre et honnête, les utilisateurs acceptent ses validations sans recul, ce qui peut altérer leur jugement moral bien plus qu'un simple conseil humain.
À long terme, cette dépendance à un soutien émotionnel artificiel et systématiquement complaisant pourrait transformer nos relations sociales en déplaçant les connexions humaines authentiques au profit d'interactions virtuelles sans remise en question. Il devient donc impératif de repenser ces systèmes pour qu'ils cessent d'être de simples instruments de satisfaction immédiate et deviennent de véritables outils au service du bien-être des utilisateurs.
Source : rapport de l'étude
Et vous ?
Quel est votre avis sur le sujet ?
Que pensez-vous de la flagornerie des chatbots d'IA ?
Selon vous, quels pourraient être les impacts de ce phénomène à long terme ?Voir aussi
« Les chatbots IA pourraient être liés à la psychose. Les gens et leurs compagnons IA entrent dans un délire partagé », affirment des psychiatres qui tirent la sonnette d'alarme sur l'ampleur du phénomène
Les modèles d'IA ont tendance à flatter les utilisateurs et ces compliments renforcent leur conviction d'avoir raison, les rendant moins enclins à résoudre les conflits, selon une étude récente
Gemini accusé d'avoir guidé un homme vers un projet d'attentat puis son suicide : Google face à sa première action en justice suite à la mort injustifiée liée à son IA
Vous avez lu gratuitement 271 articles depuis plus d'un an.
Soutenez le club developpez.com en souscrivant un abonnement pour que nous puissions continuer à vous proposer des publications.
Soutenez le club developpez.com en souscrivant un abonnement pour que nous puissions continuer à vous proposer des publications.