Les bizarreries de GPT-4o montrent à quel point l’IA vocale reste encore en phase d’exploration. Le clonage accidentel de la voix de l’utilisateur ou les sons involontaires (cris, gémissements, respirations...) rappellent que la technologie, bien que puissante, n’est pas encore totalement maîtrisée dans des conditions réelles comme les environnements bruyants.
Malgré cela, l’IA multimodale avance à grands pas. Le fait que GPT-4o tente d’adapter son ton ou de "respirer" comme un humain est à la fois fascinant… et parfois un peu troublant. On assiste clairement à une tentative de rendre la machine plus "vivante", même si elle fait encore quelques faux pas.
Pour ceux qui découvrent ces technologies, il est toujours possible d’essayer Chat GPT pour se faire une idée du potentiel, sans forcément passer par les fonctions avancées ou payantes. Cela reste une belle porte d’entrée dans le monde de l’intelligence artificielle.
0 |
0 |