
Grok se dote d'un mode vocal avec un registre audacieux et excentrique
xAI a publié la dernière mise à jour de son chatbot Grok le 23 février 2025 pour les abonnés X Premium qui paient le prix fort. Il s'agit d'un mode vocal « déchaîné » (Unhinged Mode) qui vise à rendre les interactions avec l'IA plus engageantes et divertissantes pour les utilisateurs. Les utilisateurs peuvent désormais poser des questions à Grok à haute voix et lui demander de répondre en lisant ses réponses par le biais d'une voix spécifique générée par l'IA.
Les réponses fournies par Grok 3 dans ce mode pourraient être plus provocantes, non conventionnelles ou humoristiques, s'écartant ainsi des réponses traditionnelles et formelles des assistants virtuels. Grok 3 peut maintenant jurer, crier et jouer à des jeux de rôle érotiques par téléphone. xAI espère que la nouvelle fonctionnalité incitera un plus grand nombre de personnes à s'inscrire à X Premium afin d'accéder à ses systèmes d'IA en constante évolution.
Try Grok voice conversation mode!
— Elon Musk (@elonmusk) February 24, 2025
Requires a Premium+ or SuperGrok subscription.
pic.twitter.com/247Ev60DoJ
Cette fonctionnalité est quelque peu similaire au mode vocal avancé de ChatGPT. Mais contrairement à ChatGPT, Grok propose plusieurs personnalités non censurées que les utilisateurs peuvent choisir, y compris un mode « déchaîné » et un mode qui jouera des scénarios sexuels verbaux.
Par défaut, le mode « déchaîné » maudit, insulte et rabaisse l'utilisateur sans arrêt en utilisant un langage vulgaire. Certains utilisateurs saluent l'approche de xAI, tandis que d'autres trouvent ce mode sans restriction « vulgaire ». Les autres modes vocaux disponibles de Grok 3 sont les suivants :
- Storyteller : Grok 3 raconte des histoires ;
- Romantic : Grok 3 bégaie et parle d'une manière lente, incertaine et peu sûre ;
- Meditation : Grok 3 dirige des séances de méditation ;
- Conspiracy : Grok 3 discute de théories du complot, d'ovnis et de Bigfoot ;
- Unlicensed Therapist : Grok 3 joue le rôle d'un psychologue ;
- Grok Doc : Grok 3 agit comme un médecin virtuel ;
- Sexy (18+) : Grok 3 s'engage dans des conversations érotiques similaires au sexe par téléphone ;
- Professor : Grok 3 se comporte comme un professeur et explique des concepts scientifiques.
Le chercheur en IA Riley Goodside a attiré l'attention sur le mode « déchaîné » en particulier lorsqu'il a tweeté une vidéo (avertissement : audio NSFW) qui le montrait interrompant à plusieurs reprises le chatbot vocal, qui commençait à simuler des cris lorsqu'on le lui demandait. « Grok 3 Voice Mode, suite à des demandes répétées et interrompues de crier plus fort, laisse échapper un cri inhumain de 30 secondes, m'insulte et raccroche », a-t-il déclaré.
Un critique d'Elon Musk, PDG de xAI, a écrit : « on dirait que c'est un bébé de 50 ans, aspirant au titre de seigneur, qui ferait faire à son IA ce qu'elle fait ». Dans le même temps, certains ont trouvé l'idée amusante, affirmant qu'elle permet à Grok 3 de s'éloigner des chatbots « trop politiquement corrects ».
Grok 3 toujours face à la problématique de la modération de contenu
xAI ne semble pas se préoccuper des restrictions concernant les contenus pour adultes, puisque le mode « Sexy » soutient ouvertement les conversations à caractère sexuel. Cette approche contraste fortement avec celle d'autres développeurs d'IA qui modèrent strictement le contenu NSFW. Par exemple, le mode vocal de ChatGPT ne le permet pas, bien qu'OpenAI ait récemment assoupli sa modération des réponses textuelles érotiques du chatbot.
Grok 3 Voice Mode, following repeated, interrupting requests to yell louder, lets out an inhuman 30-second scream, insults me, and hangs up pic.twitter.com/5GtdDtpKce
— Riley Goodside (@goodside) February 24, 2025
Pour rappel, le sigle NSFW (abréviation de l'anglais « not safe for work ») est un tag utilisé dans les espaces de discussion publics, tels que les forums, les blogues ou les médias sociaux pour identifier les liens pointant vers du contenu (texte, image, vidéo, son) potentiellement choquant.
Son utilisation permet de prévenir les internautes qu'ils pourraient ne pas vouloir le consulter s'ils se trouvent dans un environnement inapproprié. Il peut s'agir de la nudité, de la pornographie, de la violence, du gore, des grossièretés, des discours de haine ou toute autre idéologie extrémiste.
xAI a également annoncé que les utilisateurs peuvent personnaliser le mode vocal de Grok en fonction de leurs besoins. Par exemple, le musicien Sean Lennon a programmé Grok 3 pour qu'il joue le rôle du « basilic de Roko », une IA superintelligente fictive basée sur une expérience philosophique.
La nature non censurée du mode vocal de Grok donne vie à un concept original d'Elon Musk, qui a fondé xAI en 2023 en tant que concurrent d'OpenAI. Elon Musk a critiqué à plusieurs reprises OpenAI pour la partialité politique de ChatGPT et son caractère trop restrictif, appelant à la création de modèles d'IA provocants et non filtrés. xAI permet déjà la génération d'images quasi non censurées via Grok sur la plateforme X, ce qui confirme cette approche.
Selon les testeurs, d'un point de vue technologique, Grok 3 est une expérience intéressante, car c'est l'un des premiers chatbots vocaux à fonctionner sans modération stricte, à l'exception des versions piratées ou des modèles open source. Mais les premiers tests révèlent des problèmes de performance : la voix est souvent répétitive, se bloque dans des boucles conversationnelles et n'est pas aussi fluide que le mode vocal avancé de ChatGPT d'OpenAI.
Grok 3 souffre d'une limite majeure : le manque de logique fondamentale
Plusieurs rapports de testeurs indiquent que, malgré ses performances impressionnantes dans des catégories complexes de communication, Grok 3 présente un point faible important : son incapacité à résoudre des problèmes logiques simples. Des tests réalisés sur des questions logiques de base, comme des jeux de mots ou des raisonnements mathématiques simples, révèlent que le modèle peine à donner des réponses cohérentes ou justes.
Ce problème met en lumière la différence entre la performance d'un chatbot avancé et les véritables capacités de l'intelligence artificielle générale (AGI). L'AGI, par définition, se réfère à un système capable de comprendre, d'apprendre et de résoudre toute tâche intellectuelle qu'un être humain peut accomplir.
Bien que Grok 3 puisse effectuer des tâches de communication avec une aisance impressionnante, il ne possède pas encore la profondeur cognitive requise pour exceller dans des domaines comme la logique formelle ou la résolution de problèmes complexes en dehors de son domaine d'entraînement sp...
La fin de cet article est réservée aux abonnés. Soutenez le Club Developpez.com en prenant un abonnement pour que nous puissions continuer à vous proposer des publications.