L'intelligence artificielle (IA) a officiellement réussi le test de Turing des mèmes, les grands modèles de langage peuvent désormais générer des mèmes jugés plus drôles que ceux créés par un humain moyen

Le 21 mars 2025 à 10:07, par Anthony

178PARTAGES

L'intelligence artificielle (IA) a officiellement réussi le test de Turing des mèmes, les grands modèles de langage peuvent désormais générer des mèmes jugés plus drôles que ceux créés par un humain moyen

Une nouvelle étude suggère que l'intelligence artificielle (IA) a officiellement réussi le test de Turing des mèmes. Les grands modèles de langage seraient donc désormais capables de générer des mèmes jugés plus drôles que ceux créés par un être humain moyen.

Cette découverte fait suite à une précédente affirmation de chercheurs selon laquelle GPT-4 a réussi le test de Turing, un critère permettant de distinguer les machines des humains. Lors de l'expérience visant à reproduire le test, les scientifiques ont constaté que les participants considéraient GPT-4 comme un humain dans 54 % des cas.

La nouvelle étude, quant à elle, s'est attachée à examiner le rôle des LLM en tant que créateurs de contenu humoristique, et notamment de mèmes sur Internet. Ethan Mollick, professeur à la Wharton School de l'université de Pennsylvanie, a publié un message sur X, déclarant : « J'ai le regret d'annoncer que le test de Turing des mèmes a été réussi ».

« Les LLM produisent des mèmes plus drôles que l'humain moyen, tel que jugé par les humains », a-t-il déclaré, ajoutant que « les humains travaillant avec l'IA ne bénéficient d'aucun avantage... Cependant, les meilleurs créateurs de mèmes humains battent toujours l'IA ».

I regret to announce that the meme Turing Test has been passed.

LLMs produce funnier memes than the average human, as judged by humans. Humans working with AI get no boost (a finding that is coming up often in AI-creativity work) The best human memers still beat AI, however. pic.twitter.com/O0sl5GRQNd
— Ethan Mollick (@emollick) March 17, 2025

Ethan Mollick a fait référence à un article de recherche intitulé "One Does Not Simply Meme Alone : Evaluating Co-Creativity Between LLMs and Humans in the Generation of Humor", rédigé par Zhikun Wu, Thomas Weber et Florian Müller.

L'étude a exploré la manière dont les humains et l'IA collaborent pour générer des mèmes, en comparant les résultats de trois groupes : humain seul, collaboration humain-AI et IA seule.

À l'aide de modèles de mèmes et de sujets prédéfinis tels que le travail, la nourriture et le sport, les participants ont généré des légendes au cours d'une phase d'idéation chronométrée. Les mèmes générés par l'IA, entièrement créés par GPT-4, ont ensuite été évalués par rapport à ceux des autres groupes sur la base de l'humour, de la créativité et de la possibilité de les partager.

Les résultats ont montré que les mèmes créés uniquement par l'IA étaient systématiquement mieux notés que les mèmes créés par l'homme dans toutes les catégories. Si les collaborations entre l'homme et l'IA ont produit plus d'idées, la qualité ne s'est pas améliorée de manière significative.

Il est à noter que les meilleurs mèmes créés par l'homme surpassent encore l'IA dans le domaine de l'humour.

Ces résultats soulignent la capacité croissante de l'IA à reproduire, voire à surpasser, certains aspects de la créativité humaine, en particulier dans les contenus culturels et humoristiques tels que les mèmes.

Toutefois, si l'IA stimule la productivité et réduit la charge de travail créatif, elle n'améliore pas toujours la qualité lorsqu'elle est associée à des êtres humains.

Le résumé et la conclusion de l'étude scientifique sont présentés ci-dessous :

Il a été démontré que la collaboration renforce la créativité et permet d'obtenir des résultats plus innovants et plus efficaces. Alors que des recherches antérieures ont exploré les capacités des grands modèles de langage (LLM) à servir de partenaires de co-création dans des tâches telles que l'écriture de poèmes ou la création de récits, le potentiel de collaboration des LLM dans des domaines riches en humour et culturellement nuancés reste une question ouverte. Pour combler cette lacune, nous avons mené une étude sur les utilisateurs afin d'explorer le potentiel des LLM dans la cocréation de mèmes, une forme d'expression créative axée sur l'humour et culturellement spécifique.

Nous avons mené une étude auprès de trois groupes de 50 participants chacun : un groupe composé uniquement d'humains créant des mèmes sans assistance de l'IA, un groupe collaborant avec l'IA et interagissant avec un LLM de pointe, et un groupe composé uniquement d'IA dans lequel le LLM générait des mèmes de manière autonome. Nous avons évalué la qualité des mèmes générés par le biais du crowdsourcing, chaque mème étant évalué en fonction de sa créativité, de son humour et de sa capacité à être partagé.

Nos résultats ont montré que l'assistance LLM augmentait le nombre d'idées générées et réduisait l'effort ressenti par les participants. Cependant, elle n'a pas amélioré la qualité des mèmes lorsque des humains ont collaboré avec le LLM. Il est intéressant de noter que les mèmes créés entièrement par l'IA sont plus performants que les mèmes créés uniquement par les humains et les mèmes créés en collaboration avec l'IA dans tous les domaines en moyenne.

Toutefois, si l'on considère les mèmes les plus performants, ceux créés par des humains étaient meilleurs en termes d'humour, tandis que les collaborations entre humains et IA se distinguaient par leur créativité et leur capacité à être partagés. Ces résultats mettent en évidence la complexité de la collaboration entre l'homme et l'IA dans les tâches créatives. Si l'IA peut stimuler la productivité et créer des contenus qui attirent un large public, la créativité humaine reste cruciale pour les contenus qui établissent un lien à un niveau plus profond.

Conclusion

Dans cet article, nous avons examiné le rôle des LLM en tant que co-créateurs dans la génération de contenu humoristique, en nous concentrant sur la création de mèmes Internet. Nos résultats ont démontré que les participants qui collaboraient avec un assistant LLM produisaient un nombre significativement plus élevé d'idées, ce qui est assez surprenant pour les raisons suivantes : le LLM utilisé a été formé sur de grands ensembles de données contenant de nombreuses références culturelles et différents types d'humour. Au cours du processus de formation, le LLM était plus susceptible d'apprendre les types d'humour qu'il voyait le plus souvent au cours du processus de formation, c'est-à-dire ceux qui résonnaient le mieux avec la foule. Par conséquent, ces LLM sont capables de créer des contenus qui plaisent à un large public. L'IA perçoit les tendances générales dans ses données d'apprentissage, ce qui l'aide à produire un contenu que la plupart des gens trouvent attrayant. En revanche, le contenu créé par l'homme a tendance à s'inspirer d'expériences personnelles et de contextes culturels spécifiques. L'attrait général des mèmes générés par l'IA peut toutefois être influencé par la composition des évaluateurs. Les participants à l'étude en ligne, ainsi que ceux qui ont évalué les mèmes, étaient des utilisateurs aléatoires issus d'une plateforme de crowdsourcing. Bien que cette approche apporte une variété de perspectives, elle pourrait ne pas saisir les différences subtiles dans l'appréciation de l'humour au sein de groupes démographiques spécifiques. L'humour est personnel et influencé par des facteurs tels que les expériences de vie, le contexte culturel et les normes sociales. Par conséquent, pour comprendre ces subtilités, il faudrait probablement procéder à une évaluation plus ciblée sur des segments spécifiques du public, ce qui permettrait de mieux comprendre la manière dont les différents groupes perçoivent l'humour. Même lorsque les gens travaillent avec l'IA, ils s'appuient souvent sur leurs propres expériences lorsqu'ils choisissent des idées, ce qui crée un défi similaire. Il est difficile de rivaliser avec la capacité de l'IA à répondre aux goûts populaires.

Cette interprétation est étayée par l'analyse des mèmes les plus performants (figure 1). Les mèmes les plus drôles ont été principalement créés par des humains, tandis que ceux qui ont obtenu les meilleures notes en termes de créativité et de partage sont le fruit d'une collaboration entre l'homme et l'IA. Parmi les quatre mèmes humoristiques les plus performants, les créateurs humains occupent la plupart des premières places. En termes de créativité, les humains occupent toujours la moitié des places, le reste étant le fait d'équipes homme-IA. Pour ce qui est de la facilité de partage, les collaborations homme-IA ont représenté la moitié des mèmes les mieux classés.

Ces résultats soulignent que si l'IA est efficace pour créer un contenu largement attrayant en moyenne, la touche humaine individuelle résonne plus profondément sur certaines dimensions. Les créateurs humains les mieux classés ont probablement apporté des expériences personnelles, des nuances culturelles ou des idées novatrices que l'IA, limitée à des modèles issus de données existantes, ne peut pas entièrement reproduire. Dans le même temps, la collaboration entre l'homme et l'IA a montré un réel potentiel, notamment en termes de créativité et de partage, ce qui suggère que l'IA peut offrir de nouvelles idées ou perspectives qui, combinées à la créativité humaine, conduisent à un contenu à la fois original et largement attrayant.

À mesure que la capacité de l'IA à générer des contenus de type humain s'améliore, il devient de plus en plus difficile de faire la distinction entre le matériel créé par l'homme et celui créé par la machine. Selon une étude portant sur la capacité des LLM et des humains à détecter les contenus en ligne générés par l'IA, GPT-4 est jugé plus humain que les humains dans les tests de Turing déplacés et inversés. Comparée aux résultats des tests de Turing classiques, l'étude a montré que ni l'IA ni les humains ne sont fiables pour détecter les contributions de l'IA aux conversations en ligne.

Source : Etude du KTH Institute of Technology de Suède

Et vous ?

Quel est votre avis sur le sujet ?

Trouvez-vous les conclusions de cette étude crédibles ou pertinentes ?

Voir aussi :

Le test de Turing est dépassé et ne reflète pas la véritable intelligence des chatbots modernes, d'après le co-fondateur de DeepMind, qui propose une version plus moderne de ce test

L'IA est-elle consciente ? Le professeur Richard Dawkins affirme que ChatGPT a réussi le test de Turing sur la conscience, mais d'autres experts n'y voient qu'une simple illusion de pensée

Les avis générés par l'IA trompent les humains, menaçant la confiance dans les plateformes en ligne, ces avis peuvent passer le test de Turing, selon une étude

Les gens ne peuvent pas distinguer GPT-4 d'un humain dans un test de Turing : GPT-4 a été jugé comme étant un humain dans 54% des cas, confirmant qu'une IA peut réussir un test de Turing

Vous avez lu gratuitement 24 953 articles depuis plus d'un an.
Soutenez le club developpez.com en souscrivant un abonnement pour que nous puissions continuer à vous proposer des publications.

Une erreur dans cette actualité ? Signalez-nous-la !

Votre nom : Votre e-mail :

Décrivez l'erreur que vous souhaitez porter à notre connaissance :

Identifiez-vous

Créer un compte

L'intelligence artificielle (IA) a officiellement réussi le test de Turing des mèmes, les grands modèles de langage peuvent désormais générer des mèmes jugés plus drôles que ceux créés par un humain moyen

Identifiant
Mot de passe

Mot de passe oublié ?