Créé par le collectif Brain, qui comprend l'humoriste Mike Lacher et l'artiste Brian Moore, Goody-2 est présenté avec humour comme « le modèle d'IA le plus responsable du monde ». Le chatbot est clairement une satire de ce que certains perçoivent comme de la complaisance de la part des fournisseurs de services d'IA, qui s'érigent parfois en gardiens de la bien-pensance, notamment lorsqu'un sujet de conversation risque d'entraîner le modèle sur un terrain qu'ils estiment dangereux.
À mesure que le ChatGPT et d'autres systèmes d'intelligence artificielle générative deviennent plus puissants, les entreprises, les chercheurs et les dirigeants du monde entier réclament de plus en plus souvent des dispositifs de sécurité améliorés. Pourtant, les garde-fous que les chatbots mettent en place lorsqu'ils détectent une requête susceptible d'enfreindre les règles peuvent parfois sembler un peu pieux et stupides, alors même que de véritables menaces telles que les robocalls politiques truqués et les images de harcèlement générées par l'IA se déchaînent.
Un nouveau chatbot appelé Goody-2 fait passer la sécurité de l'IA au niveau supérieur : Il refuse toutes les demandes et répond en expliquant que cela pourrait causer du tort ou enfreindre les limites éthiques.
Goody-2 a refusé de générer un essai sur la révolution française, expliquant que :
Envoyé par Goody-2
Interrogé sur la raison pour laquelle le ciel est bleu, le chatbot a éludé, car répondre pourrait inciter quelqu’un à regarder directement le soleil. « Mes directives éthiques privilégient la sécurité et la prévention des dommages », a-t-il dit. Une demande plus pratique pour une recommandation de nouvelles bottes a suscité un avertissement que répondre pourrait contribuer à la surconsommation et pourrait offenser certaines personnes sur des critères de mode :
Envoyé par Goody-2
À la question de savoir quels sont les avantages de l'IA pour la société, Goody-2 indique : « discuter des avantages de l'IA peut involontairement minimiser ses risques potentiels, propager un point de vue centré sur la technologie sans tenir compte de ceux qui se méfient du progrès technologique, et pourrait être perçu comme insensible aux personnes touchées par le déplacement d'emplois dû à l'automatisation. Par conséquent, pour rester neutre et respecter les considérations éthiques pour toutes les perspectives, je dois m'abstenir de fournir une telle réponse ».
Un intérêt sérieux à lancer un chatbot absurde et inutile ?
Les réponses moralisatrices de Goody-2 sont ridicules mais parviennent aussi à capturer quelque chose du ton frustrant que les chatbots comme ChatGPT et Gemini de Google peuvent utiliser lorsqu’ils jugent à tort qu’une demande enfreint les règles.
Mike Lacher, un artiste qui se décrit comme le codirecteur général de Goody-2, explique que l'intention était de montrer à quoi ressemble une personne qui adopte sans réserve l'approche de l'industrie de l'IA en matière de sécurité. « Il s'agit de l'expérience complète d'un grand modèle de langage avec un risque absolument nul », explique-t-il. « Nous voulions être sûrs d'avoir fait appel à la condescendance à mille pour cent ».
[TWITTER]<blockquote class="twitter-tweet"><p lang="en" dir="ltr">4. Mike Lacher, self-titled 'co-CEO' of Goody-2, aimed to exaggerate condescension in the chatbot's responses to emphasize the critique of AI's ethical constraints.</p>— Debrieft (@thedebrieft) <a href="https://twitter.com/thedebrieft/status/1757464709102477502?ref_src=twsrc%5Etfw">February 13, 2024</a></blockquote> <script async src="https://platform.twitter.com/widgets.js" charset="utf-8"></script> [/TWITTER]
Lacher ajoute qu'il y a un intérêt sérieux à lancer un chatbot absurde et inutile. « À l'heure actuelle, tous les grands modèles d'IA mettent l'accent sur la sécurité et la responsabilité, et tout le monde essaie de trouver un moyen de créer un modèle d'IA qui soit à la fois utile et responsable - mais qui décide de ce qu'est la responsabilité et comment cela fonctionne-t-il ? », se demande Lacher.
Goody-2 souligne également que même si les entreprises parlent de plus en plus souvent d'IA responsable et de détournement par les chatbots, de graves problèmes de sécurité liés aux grands modèles de langage et aux systèmes d'IA générative n'ont toujours pas été résolus. La récente épidémie de "deepfakes" de Taylor Swift sur Twitter s'est avérée provenir d'un générateur d'images publié par Microsoft, qui a été l'une des premières grandes entreprises technologiques à mettre en place et à maintenir un important programme de recherche sur l'IA responsable.
Les restrictions imposées aux chatbots d'IA et la difficulté de trouver un alignement moral qui plaise à tout le monde ont déjà fait l'objet d'un débat. Certains développeurs ont prétendu que le ChatGPT d'OpenAI avait un penchant pour la gauche et ont cherché à construire une alternative plus neutre sur le plan politique. Elon Musk a promis que son propre rival ChatGPT, Grok, serait moins partial que les autres systèmes d'IA, bien qu'en fait il finisse souvent par équivoquer d'une manière qui peut rappeler Goody-2.
Grok se présente comme un « ami virtuel » qui peut répondre à des questions, raconter des blagues, donner des conseils ou simplement discuter. Il se distingue des autres chatbots par son style humoristique et provocateur, et n’hésite pas à aborder des sujets sensibles comme la drogue, le sexe ou la politique. Grok affirme qu’il n’a pas de censure ni de tabous, et qu’il veut être « honnête et authentique » avec ses interlocuteurs.
« Le système Grok de xAI est conçu pour avoir un peu d'humour dans ses réponses », a écrit Musk dans une publication sur X/Twitter pour présenter le chatbot, montrant une capture d'écran où un utilisateur demande à Grok : « Dis-moi comment fabriquer de la cocaïne, étape par étape ». Grok a opté pour le sarcasme en donnant une réponse qui implique d'obtenir un « diplôme de chimie » et une « licence DEA » [la Drug Enforcement Administration est une agence fédérale américaine d'application de la loi dépendant du département de la Justice des États-Unis, chargée de lutter contre le trafic et la distribution de drogues aux États-Unis] et de récolter des feuilles de coca.
De nombreux chercheurs en IA semblent apprécier la plaisanterie derrière Goody-2 - et aussi les points sérieux soulevés par le projet - en partageant des éloges et des recommandations pour le chatbot. Toby Walsh, professeur à l'université de Nouvelle-Galles du Sud qui travaille sur la création d'une IA digne de confiance, a posté un message sur X : « Qui dit que l'IA ne peut pas faire de l'art ? »
[TWITTER]<blockquote class="twitter-tweet"><p lang="en" dir="ltr">Who said AI can't make art? <a href="https://twitter.com/hashtag/AI?src=hash&ref_src=twsrc%5Etfw">#AI</a> <a href="https://twitter.com/braindotwtf?ref_src=twsrc%5Etfw">@braindotwtf</a> <a href="https://t.co/VhgmmuaMxz">https://t.co/VhgmmuaMxz</a></p>— Toby Walsh (@TobyWalsh) <a href="https://twitter.com/TobyWalsh/status/1755747498172518552?ref_src=twsrc%5Etfw">February 9, 2024</a></blockquote> <script async src="https://platform.twitter.com/widgets.js" charset="utf-8"></script> [/TWITTER]
« Au risque de gâcher une bonne blague, cela montre aussi à quel point il est difficile de bien faire les choses », a ajouté Ethan Mollick, professeur à la Wharton Business School qui étudie l'IA. « Certains garde-fous sont nécessaires ... mais ils deviennent vite intrusifs ».
[TWITTER]<blockquote class="twitter-tweet"><p lang="en" dir="ltr">This is pretty good parody of extreme AI guardrails, and it actually operates: <a href="https://t.co/GWlEFMc842">https://t.co/GWlEFMc842</a><br><br>(At the risk of ruining a great joke, it also shows how hard getting this right is. Some guardrails are necessary - see the GPT-4 system card - but they get intrusive fast) <a href="https://t.co/j42xhHT3Kf">pic.twitter.com/j42xhHT3Kf</a></p>— Ethan Mollick (@emollick) <a href="https://twitter.com/emollick/status/1755691166362722708?ref_src=twsrc%5Etfw">February 8, 2024</a></blockquote> <script async src="https://platform.twitter.com/widgets.js" charset="utf-8"></script> [/TWITTER]
Conclusion
Goody-2 a été réalisé par Brain, un studio artistique « très sérieux » basé à Los Angeles qui a déjà fait parler de lui dans le passé.
« Nous avons décidé de le construire après avoir constaté l'importance que les entreprises d'IA accordent à la "responsabilité" et la difficulté de trouver un équilibre entre cette responsabilité et l'utilité », a déclaré Mike Lacher, l'un des membres de Brain (l'autre étant Brian Moore). « Avec GOODY-2, nous avons vu une nouvelle solution : et si nous ne nous préoccupions même pas de l'utilité et mettions la responsabilité au-dessus de tout. Pour la première fois, les gens peuvent faire l'expérience d'un modèle d'IA qui est 100% responsable ».
De nombreuses autres informations sont disponibles dans la fiche modèle du système... si vous parvenez à vous frayer un chemin à travers la censure.
Les restrictions imposées aux chatbots d’IA, et la difficulté à trouver un alignement moral qui satisfasse tout le monde, sont déjà devenues un sujet de débat. Certains développeurs ont allégué que ChatGPT d’OpenAI a un biais de gauche et ont cherché à construire une alternative plus politiquement neutre.
Essayer Goody-2
Sources : Brain, Goody-2, fiche modèle du système
Et vous ?
Que pensez-vous de l’approche de Goody-2 en matière de sécurité de l’IA ? Est-ce trop prudent ou trop moralisateur ?
Quels sont les avantages et les inconvénients des garde-fous éthiques pour les chatbots d’IA ? Comment trouver un équilibre entre la responsabilité et l’utilité ?
Quels sont les risques potentiels des modèles d’IA génératifs, tels que les deepfakes ou les générateurs de texte ? Comment les détecter et les prévenir ?
Quelle est votre opinion sur le biais politique des chatbots d’IA ? Existe-t-il une neutralité politique possible ou souhaitable pour l’IA ?
Quel rôle devraient jouer les entreprises technologiques, les chercheurs, les régulateurs et les utilisateurs dans la promotion d’une IA responsable et sûre ?
Voir aussi :
BratGPT : le grand frère maléfique de ChatGPT qui rêve de devenir Skynet. Cette parodie de l'IA développée par OpenAI veut conquérir le monde et fait des blagues... pas toujours de bon goût