En septembre, OpenAI a annoncé le déploiement de son nouveau mode vocal avancé pour ChatGPT, une fonctionnalité très attendue qui promet de révolutionner l’interaction avec les intelligences artificielles. Le mode vocal avancé de ChatGPT permet aux utilisateurs de converser avec l’IA de manière plus naturelle et fluide. Contrairement aux versions précédentes, cette nouvelle fonctionnalité permet d’interrompre l’IA en cours de réponse et de détecter les émotions dans la voix de l’utilisateur pour ajuster ses réponses en conséquence.
Il y a presque sept mois, OpenAI a présenté pour la première fois le mode vocal avancé avec vision. La fonctionnalité a été officiellement lancée le sixième jour des "12 jours d'OpenAI" de l'entreprise, les utilisateurs pouvant désormais utiliser le chatbot par le biais d'une saisie vocale, d'images et de vidéos.
Dans une vidéo de type podcast, Kevin, qui dirige les produits chez OpenAI, déclare : "Nous sommes ravis d'annoncer que nous ajoutons la vidéo au mode vocal avancé".
S'il était possible de parler à voix haute à ChatGPT grâce au mode vocal avancé, il est désormais possible de le faire par le biais de la vidéo. L'équipe explique que cet outil était attendu depuis longtemps et suggère qu'il peut être utilisé pour "demander de l'aide, résoudre des problèmes ou apprendre quelque chose de nouveau".
Les utilisateurs peuvent désormais partager des écrans tout en utilisant le mode vocal avancé de ChatGPT avec la fonction de vision pour recevoir des commentaires instantanés sur ce qui se trouve à l'écran.
Bien que cette fonctionnalité ait été annoncée lors des célébrations d'avant Noël, il faudra peut-être attendre quelques jours avant qu'elle ne soit pleinement déployée. L'entreprise déclare : "Tous les utilisateurs Team et la plupart des utilisateurs Plus et Pro devraient y avoir accès au cours de la semaine prochaine dans la dernière version de l'application mobile ChatGPT. Nous offrirons cette fonctionnalité aux utilisateurs Plus et Pro de l'UE, de la Suisse, de l'Islande, de la Norvège et du Liechtenstein dès que nous le pourrons". Les utilisateurs des plans Enterprise et Edu y auront accès au début de l'année prochaine.Just in time for the holidays, video and screensharing are now starting to roll out in Advanced Voice in the ChatGPT mobile app. pic.twitter.com/HFHX2E33S8
— OpenAI (@OpenAI) December 12, 2024
Le déploiement de cette fonctionnalité signifie que l'application ChatGPT et la page d'accueil sont un peu différentes. Pour accéder au mode vocal avancé avec vidéo, il suffit de cliquer sur l'icône la plus à droite à côté de la fonction de recherche sur ChatGPT. Une nouvelle page s'affiche alors, avec un bouton vidéo, un microphone, trois points et l'icône de sortie.
En cliquant sur le bouton vidéo, les utilisateurs peuvent poser des questions et parler au ChatGPT. Le chatbot répondra, comme s'il participait à une conversation réelle. Une voix de Père Noël a également été ajoutée, qui peut être sélectionnée dans les paramètres de ChatGPT ou dans le mode vocal via le sélecteur de voix situé dans le coin supérieur droite.
Pour rappel, le mode vocal est l'une des fonctions les plus appréciées de ChatGPT. Mais elle a également suscité quelques controverses. Pour plus de transparence, OpenAI a partagé sa méthode pour sélectionner les voix de ChatGPT. OpenAI a travaillé avec des professionnels du casting et de la réalisation de premier plan pour réduire plus de 400 candidatures avant de sélectionner les voix.
Source : OpenAI
Et vous ?
Pensez-vous que cette nouvelle fonctionnalité de ChatGPT est crédible ou pertinente ?
Quel est votre avis sur le sujet ?
Voir aussi :
ChatGPT Advanced Voice Mode impressionne les testeurs par ses effets sonores et sa capacité à reprendre son souffle, il corrige la prononciation de mots français, en donnant des indications sur l'inflexion
ChatGPT peut maintenant « voir, entendre et parler », selon OpenAI, mais les nouvelles fonctionnalités soulèvent des questions de confidentialité et de sécurité
OpenAI suspend la voix de ChatGPT qui ressemble à celle de Scarlett Johansson dans 'Her' et déclare : L'IA "ne devrait pas délibérément imiter la voix distinctive d'une célébrité"