Une nouvelle étude suggère que l'intelligence artificielle (IA) a officiellement réussi le test de Turing des mèmes. Les grands modèles de langage seraient donc désormais capables de générer des mèmes jugés plus drôles que ceux créés par un être humain moyen.Cette découverte fait suite à une précédente affirmation de chercheurs selon laquelle GPT-4 a réussi le test de Turing, un critère permettant de distinguer les machines des humains. Lors de l'expérience visant à reproduire le test, les scientifiques ont constaté que les participants considéraient GPT-4 comme un humain dans 54 % des cas.
La nouvelle étude, quant à elle, s'est attachée à examiner le rôle des LLM en tant que créateurs de contenu humoristique, et notamment de mèmes sur Internet. Ethan Mollick, professeur à la Wharton School de l'université de Pennsylvanie, a publié un message sur X, déclarant : « J'ai le regret d'annoncer que le test de Turing des mèmes a été réussi ».
« Les LLM produisent des mèmes plus drôles que l'humain moyen, tel que jugé par les humains », a-t-il déclaré, ajoutant que « les humains travaillant avec l'IA ne bénéficient d'aucun avantage... Cependant, les meilleurs créateurs de mèmes humains battent toujours l'IA ».
I regret to announce that the meme Turing Test has been passed.
— Ethan Mollick (@emollick) March 17, 2025
LLMs produce funnier memes than the average human, as judged by humans. Humans working with AI get no boost (a finding that is coming up often in AI-creativity work) The best human memers still beat AI, however. pic.twitter.com/O0sl5GRQNd
Ethan Mollick a fait référence à un article de recherche intitulé "One Does Not Simply Meme Alone : Evaluating Co-Creativity Between LLMs and Humans in the Generation of Humor", rédigé par Zhikun Wu, Thomas Weber et Florian Müller.
L'étude a exploré la manière dont les humains et l'IA collaborent pour générer des mèmes, en comparant les résultats de trois groupes : humain seul, collaboration humain-AI et IA seule.
À l'aide de modèles de mèmes et de sujets prédéfinis tels que le travail, la nourriture et le sport, les participants ont généré des légendes au cours d'une phase d'idéation chronométrée. Les mèmes générés par l'IA, entièrement créés par GPT-4, ont ensuite été évalués par rapport à ceux des autres groupes sur la base de l'humour, de la créativité et de la possibilité de les partager.
Les résultats ont montré que les mèmes créés uniquement par l'IA étaient systématiquement mieux notés que les mèmes créés par l'homme dans toutes les catégories. Si les collaborations entre l'homme et l'IA ont produit plus d'idées, la qualité ne s'est pas améliorée de manière significative.
Il est à noter que les meilleurs mèmes créés par l'homme surpassent encore l'IA dans le domaine de l'humour.
Ces résultats soulignent la capacité croissante de l'IA à reproduire, voire à surpasser, certains aspects de la créativité humaine, en particulier dans les contenus culturels et humoristiques tels que les mèmes.
Toutefois, si l'IA stimule la productivité et réduit la charge de travail créatif, elle n'améliore pas toujours la qualité lorsqu'elle est associée à des êtres humains.
Le résumé et la conclusion de l'étude scientifique sont présentés ci-dessous :
Il a été démontré que la collaboration renforce la créativité et permet d'obtenir des résultats plus innovants et plus efficaces. Alors que des recherches antérieures ont exploré les capacités des grands modèles de langage (LLM) à servir de partenaires de co-création dans des tâches telles que l'écriture de poèmes ou la création de récits, le potentiel de collaboration des LLM dans des domaines riches en humour et culturellement nuancés reste une question ouverte. Pour combler cette lacune, nous avons mené une étude sur les utilisateurs afin d'explorer le potentiel des LLM dans la cocréation de mèmes, une forme d'expression créative axée sur l'humour et culturellement spécifique.
Nous avons mené une étude auprès de trois groupes de 50 participants chacun : un groupe composé uniquement d'humains créant des mèmes sans assistance de l'IA, un groupe collaborant avec l'IA et interagissant avec un LLM de pointe, et un groupe composé uniquement d'IA dans lequel le LLM générait des mèmes de manière autonome. Nous avons évalué la qualité des mèmes générés par le biais du crowdsourcing, chaque mème étant évalué en fonction de sa...
La fin de cet article est réservée aux abonnés. Soutenez le Club Developpez.com en prenant un abonnement pour que nous puissions continuer à vous proposer des publications.