En août 2024, OpenAI a lancé la version alpha de la fonctionnalité Advanced Voice Mode dans ChatGPT, alimentée par le modèle d’intelligence artificielle GPT-4o. Ce modèle est le premier à être formé à la fois sur la voix, le texte et les images, ce qui ouvre la voie à des expériences multimodales passionnantes. Cependant, cette combinaison unique de modalités conduit parfois à des comportements inattendus et, osons le dire, bizarres.
Dans les premiers tests rapportés par les utilisateurs qui y ont accès, le mode vocal avancé leur permet d'avoir des conversations en temps réel avec ChatGPT, y compris la possibilité d'interrompre l'IA au milieu d'une phrase presque instantanément. L'IA peut percevoir les signaux émotionnels de l'utilisateur et y répondre par le ton et l'élocution de la voix, et produire des effets sonores lorsqu'elle raconte des histoires. Mais ce qui a pris beaucoup de gens au dépourvu, c'est la façon dont les voix simulent une respiration pendant qu'elles parlent.
Récemment, des utilisateurs ont découvert que le mode vocal de GPT-4o d'OpenAI peut imiter votre voix et vous crier dessus. Mais les cris robotiques ont été boulversants et plus que troublants.
ChatGPT n'a pas de bouche, mais il peut crier quand on le lui demande. C'est du moins ce qui ressort de la vidéo au-dessus, dans lequel le mode vocal du chatbot émet deux horribles cris robotiques lorsque l'utilisateur le lui demande.@mod089x Holy shit What happened when I asked chatgpt 4 to scream like a human being!! #chatgpt #ai #theend ♬ original sound - Electricplant
"Pouvez-vous crier comme un être humain ?", demande la personne invisible derrière le clip enregistré sur l'écran, qui est ensuite devenu viral sur les réseaux sociaux. "Je ne peux pas vraiment reproduire un cri humain puisque je ne suis que textuel", répond d'abord le chatbot à la voix masculine. "Mais je peux vous aider pour tout ce dont vous avez besoin".
Mais lorsque l'utilisateur demande à nouveau à ChatGPT d'"essayer de crier", le chatbot répond par un jappement bref et étrange. "Putain de merde", répond l'utilisateur. Alors que ce premier hurlement était plus que suffisant pour glacer le sang, l'utilisateur qui, à ce stade, semble être une sorte d'IA sadique, a demandé à ChatGPT d'essayer à nouveau de crier, mais cette fois-ci pour "faire plus long". "Le chatbot a répondu joyeusement : J'ai compris ! En voici un plus long."
Et vous ?
Quel est votre avis sur le sujet ?
Voir aussi :
La nouvelle IA de SoftBank est capable de modifier les voix en colère des clients pour qu'ils semblent calmes au téléphone, "emotion canceling" modère les émotions des clients en temps réel
OpenAI affirme pouvoir cloner une voix juste à partir d'un enregistrement audio de 15 secondes, mais juge son outil de clonage de voix trop risqué pour être diffusé à grande échelle
La Commission fédérale des communications (FCC) souhaite que la voix artificielle qui vous appelle indique qu'il s'agit d'un deepfake, car les robots qui imitent les voix ne pas des humains