Veo 3, l'outil de génération de vidéo par IA de Google, entraîne une explosion de contenus sur des plateformes comme X et YouTube

Quelques heures seulement après sa présentation durant la Google I/O

Le 23 mai 2025 à 12:58, par Stéphane le calme

39PARTAGES

Veo 3, l'outil de génération de vidéo par IA de Google, entraîne une explosion de contenus sur des plateformes comme X et YouTube
quelques heures seulement après sa présentation durant la Google I/O

Lors de la conférence Google I/O, la firme de Mountain View a dévoilé Veo 3, la dernière version de son générateur de vidéos basé sur l'intelligence artificielle. Cette technologie avancée permet de créer des vidéos réalistes à partir de simples descriptions textuelles, intégrant dialogues, musiques et effets sonores. Cependant, son utilisation soulève des questions sur la prolifération de contenus générés par IA sur des plateformes comme YouTube.

En décembre 2024, OpenAI a lancé en disponibilité générale Sora, son programme de génération de vidéos par intelligence artificielle. L'utilisateur note en langage naturel ce qu'il veut obtenir comme résultat vidéo et Sora génère jusqu'à 20 secondes de vidéos.

Lors de l'annonce de la disponibilité, l'entreprise a précisé que le programme a encore des limites et que toutes les vidéos créées par Sora auront des métadonnées C2PA et un filigrane comme paramètre par défaut pour permettre aux utilisateurs d'identifier les vidéos créées par le programme.

Quelques jours après cette annonce, Google Deepmind a présenté Veo 2, un outil de génération de vidéos par intelligence artificielle qui s'appuie sur le Veo original et crée des « vidéos d'une qualité incroyable ». Cette annonce montrait la volonté de Google de concurrencer OpenAI dans le but de battre Sora et d'être le meilleur modèle IA vidéo. Selon Google, Veo 2 peut créer des « clips vidéos de quelques minutes » dans des résolutions 4k et est moins susceptible « d'halluciner » des détails indésirables.

Veo 3 : une prouesse technologique

Lors de l'édition 2025 de la conférence Google dédiée aux développeurs, Google a présenté son dernier modèle de génération de vidéos par IA, Veo 3, qui peut également créer et incorporer du son. Comme Veo 2, cet outil d'IA est en concurrence avec le générateur vidéo Sora d'OpenAI, mais sa capacité à incorporer du son dans la vidéo qu'il crée constitue une distinction essentielle. L'entreprise précise que Veo 3 peut incorporer de l'audio, notamment des dialogues entre les personnages ainsi que des sons d'animaux.

Envoyé par Google

Veo génère des vidéos de haute qualité à une résolution de 1080p qui peuvent dépasser une minute, dans une grande variété de styles cinématographiques et visuels. Grâce à une compréhension avancée du langage naturel et de la sémantique visuelle, il peut générer des vidéos qui représentent fidèlement la vision créative de l'utilisateur, en captant avec précision le ton d'une invite et en restituant les détails dans les invites plus longues.

Le modèle comprend également les termes cinématographiques tels que "timelapse" ou "plans aériens d'un paysage", offrant un niveau de contrôle créatif sans précédent. Et il crée des séquences cohérentes et homogènes, de sorte que les personnes, les animaux et les objets se déplacent de manière réaliste tout au long des plans.

« Veo 3 excelle dans les domaines du texte et de l'image, de la physique du monde réel et de la synchronisation labiale précise », a déclaré Eli Collins, vice-président produit de Google DeepMind. L'outil d'IA vidéo-audio est déjà disponible pour les abonnés américains à la nouvelle formule d'abonnement Ultra de Google, d'un montant de 249,99 dollars par mois, qui s'adresse aux passionnés d'IA. Veo 3 sera également disponible pour les utilisateurs de la plateforme d'entreprise Vertex AI de Google.

Une explosion de contenus générés par IA

Depuis son lancement, Veo 3 a été utilisé pour créer une multitude de vidéos virales sur YouTube et X, allant de sketchs humoristiques à des simulations de jeux vidéo. Par exemple, une vidéo générée par Veo 3 montre un faux unboxing d'iPhone, si réaliste qu'il est difficile de distinguer la fiction de la réalité. D'autres clips présentent des interviews de rue fictives ou des sessions de jeu "Fortnite" entièrement simulées. Ces contenus, bien que divertissants, soulèvent des préoccupations quant à la frontière entre réalité et fiction sur les plateformes numériques.

Ci-dessous par exemple, nous avons une vidéo générée par Veo 3 d'un standup

NO WAY. It did it. And, was that, actually funny?

Prompt:
> a man doing stand up comedy in a small venue tells a joke (include the joke in the dialogue) https://t.co/GFvPAssEHx pic.twitter.com/LrCiVAp1Bl
— fofr (@fofrAI) May 20, 2025

Celle-ci d'une sitcom qui n'a jamais existé

Good lord, Veo-3. I keep alternating between being stunned and laughing my ass off. pic.twitter.com/sdmEHoJlBh
— Theoretically Media (@TheoMediaAI) May 21, 2025

Une séquence d'un film qui n'existe pas

Created with Google Flow.

Visuals, Sound Design, and Voice were prompted using Veo 3 text-to-video.

Welcome to a new era of filmmaking. pic.twitter.com/E3NSA1WsXe
— Dave Clark (@Diesol) May 21, 2025

Ou d'une conférence technologique qui n'a jamais eu lieu

Before you ask: yes, everything is AI here. The video and sound both coming from a single text prompt using #Veo3 by @GoogleDeepMind .Whoever is cooking the model, let him cook! Congrats @Totemko and the team for the Google I/O live stream and the new Veo site! pic.twitter.com/sxZuvFU49s
— László Gaál (@laszlogaal_) May 21, 2025

Google Veo 3 permet de créer des vidéos de chant et de musique à partir d'une simple invite.

Google Veo 3 can create singing and music videos from a single prompt.

It's just insane how coherent it is to the video.

🔈Sound On! pic.twitter.com/RMwc1sSOmX
— Jerrod Lew (@jerrod_lew) May 20, 2025

Vidéo de Will Smith mangeant des spaghettis générée par Veo 3

Chaque fois qu'une entreprise dévoile un nouvel outil de génération de vidéos par l'IA, il se produit un rituel désormais familier : quelqu'un crée une vidéo de l'acteur Will Smith en train de manger des spaghettis. Ce qui n'était au départ qu'un mème s'est transformé en une référence originale pour tester le réalisme et les capacités des vidéos générées par l'IA. Le scénario bizarre (Smith mangeant des nouilles) est devenu un test décisif pour savoir dans quelle mesure un modèle peut gérer les expressions faciales, les mouvements des mains et les textures désordonnées comme la nourriture.

Avec le lancement de Veo 3 aux États-Unis, les utilisateurs ont rapidement mis à l'épreuve le nouvel outil vidéo IA de Google en générant de nouvelles vidéos de Will Smith mangeant des spaghettis. Jetez un coup d'œil à la vidéo partagée par Javi Lopez, un utilisateur de X.

Just got access to Veo 3 and the first thing I did was try the Will Smith spaghetti test. SOUND ON pic.twitter.com/y0CiZwNxgM
— Javi Lopez ⛩️ (@javilopen) May 22, 2025

Cette vidéo a été faite en 2023 avec Veo 2. Un bon point de départ pour faire des comparaisons sur l'évolution de l'outil de Google.

Google Veo 2 has done it.

We are now eating spaghett at last. pic.twitter.com/AZO81w8JC0
— Jerrod Lew (@jerrod_lew) December 17, 2024

S'il fallait rester sur le mème et non sur l'outil, voici des vidéos de 2023 de Smith mangeant des spaghettis.

Les vidéos de 2023 ont été critiquées pour leur manque de réalisme, les mouvements peu naturels et des artefacts visuels qui montrent clairement qu'elles ont été générées par une IA. En revanche, la vidéo générée par Veo 3 présente un niveau de fidélité visuelle nettement supérieur. Les textures, l'éclairage et les détails des spaghettis, de la fourchette et des expressions faciales de Will Smith sont rendus avec une grande précision, montrant des changements subtils qui traduisent l'émotion et la réaction.

Quand Will Smith est entré dans la danse

Le mème est devenu si répandu que même Will Smith l'a reconnu. En février dernier, l'acteur a publié sur Instagram une parodie humoristique de la tendance, alimentant ainsi sa popularité et consolidant sa place dans la culture Internet.

« C'est devenu incontrôlable ! » a-t-il mis en légende de sa publication.

Vers une régulation nécessaire ?

L'intégration de Veo 3 dans YouTube Shorts permet aux créateurs de générer des vidéos de 6 secondes à partir de simples descriptions textuelles. Bien que cette fonctionnalité offre de nouvelles opportunités créatives, elle pose également des défis en matière de modération et de véracité des contenus.

Pour garantir la transparence dans l’utilisation de l’IA, toutes les vidéos créées avec Veo sont marquées d’un filigrane SynthID, développé par Google DeepMind également. Ce filigrane authentifie les vidéos générées par l’IA et empêche toute manipulation indétectable, offrant ainsi une couche de sécurité supplémentaire dans la lutte contre la désinformation visuelle.

La facilité avec laquelle Veo 3 peut produire des vidéos réalistes soulève des questions sur la nécessité d'une régulation plus stricte des contenus générés par IA. Si des outils comme SynthID sont un pas dans la bonne direction, ils ne suffisent pas à eux seuls à garantir l'authenticité des informations diffusées. Il est essentiel que les plateformes, les développeurs et les régulateurs collaborent pour établir des normes claires et protéger les utilisateurs contre les contenus trompeurs.

Conclusion

Veo 3 représente une avancée majeure dans le domaine de la génération de vidéos par intelligence artificielle, offrant des possibilités créatives inédites. Cependant, son utilisation massive sur des plateformes comme YouTube met en lumière les défis liés à la véracité des contenus et à la protection des utilisateurs. Il est impératif d'adopter une approche équilibrée, combinant innovation technologique et responsabilité éthique, pour tirer le meilleur parti de ces outils tout en minimisant leurs risques potentiels.

Sources : Google, vidéos dans le texte, Will Smith

Et vous ?

Que pensez-vous des performances de Veo 3 ? Des vidéos générées par l'outil de Google, laquelle / lesquelles vous a / ont le plus intéressé(s) / impressionné(s) ?

Veo 3 représente-t-il une avancée ou une menace pour la création audiovisuelle traditionnelle ?

À quel point peut-on encore parler de "création" lorsque tout est généré à partir d'une simple description textuelle ?

La qualité des vidéos générées par IA surpassera-t-elle bientôt celle des contenus réalisés par des humains ?

Les créateurs humains risquent-ils d’être marginalisés ou remplacés par les IA sur les plateformes comme YouTube ?

Une IA peut-elle créer du contenu vraiment original, ou ne fait-elle que recycler des patterns existants ?

Quels métiers émergeront avec la généralisation de ces outils ? Les monteurs vidéo ou scénaristes IA seront-ils les "nouveaux créateurs" ?

Vous avez lu gratuitement 2 896 articles depuis plus d'un an.
Soutenez le club developpez.com en souscrivant un abonnement pour que nous puissions continuer à vous proposer des publications.

Une erreur dans cette actualité ? Signalez-nous-la !

Votre nom : Votre e-mail :

Décrivez l'erreur que vous souhaitez porter à notre connaissance :