
quelques heures seulement après sa présentation durant la Google I/O
Lors de la conférence Google I/O, la firme de Mountain View a dévoilé Veo 3, la dernière version de son générateur de vidéos basé sur l'intelligence artificielle. Cette technologie avancée permet de créer des vidéos réalistes à partir de simples descriptions textuelles, intégrant dialogues, musiques et effets sonores. Cependant, son utilisation soulève des questions sur la prolifération de contenus générés par IA sur des plateformes comme YouTube.
En décembre 2024, OpenAI a lancé en disponibilité générale Sora, son programme de génération de vidéos par intelligence artificielle. L'utilisateur note en langage naturel ce qu'il veut obtenir comme résultat vidéo et Sora génère jusqu'à 20 secondes de vidéos.
Lors de l'annonce de la disponibilité, l'entreprise a précisé que le programme a encore des limites et que toutes les vidéos créées par Sora auront des métadonnées C2PA et un filigrane comme paramètre par défaut pour permettre aux utilisateurs d'identifier les vidéos créées par le programme.
Quelques jours après cette annonce, Google Deepmind a présenté Veo 2, un outil de génération de vidéos par intelligence artificielle qui s'appuie sur le Veo original et crée des « vidéos d'une qualité incroyable ». Cette annonce montrait la volonté de Google de concurrencer OpenAI dans le but de battre Sora et d'être le meilleur modèle IA vidéo. Selon Google, Veo 2 peut créer des « clips vidéos de quelques minutes » dans des résolutions 4k et est moins susceptible « d'halluciner » des détails indésirables.
Veo 3 : une prouesse technologique
Lors de l'édition 2025 de la conférence Google dédiée aux développeurs, Google a présenté son dernier modèle de génération de vidéos par IA, Veo 3, qui peut également créer et incorporer du son. Comme Veo 2, cet outil d'IA est en concurrence avec le générateur vidéo Sora d'OpenAI, mais sa capacité à incorporer du son dans la vidéo qu'il crée constitue une distinction essentielle. L'entreprise précise que Veo 3 peut incorporer de l'audio, notamment des dialogues entre les personnages ainsi que des sons d'animaux.

Une explosion de contenus générés par IA
Depuis son lancement, Veo 3 a été utilisé pour créer une multitude de vidéos virales sur YouTube et X, allant de sketchs humoristiques à des simulations de jeux vidéo. Par exemple, une vidéo générée par Veo 3 montre un faux unboxing d'iPhone, si réaliste qu'il est difficile de distinguer la fiction de la réalité. D'autres clips présentent des interviews de rue fictives ou des sessions de jeu "Fortnite" entièrement simulées. Ces contenus, bien que divertissants, soulèvent des préoccupations quant à la frontière entre réalité et fiction sur les plateformes numériques.
Ci-dessous par exemple, nous avons une vidéo générée par Veo 3 d'un standup
[TWITTER]<blockquote class="twitter-tweet"><p lang="en" dir="ltr">NO WAY. It did it. And, was that, actually funny?<br><br>Prompt:<br>> a man doing stand up comedy in a small venue tells a joke (include the joke in the dialogue) <a href="https://t.co/GFvPAssEHx">https://t.co/GFvPAssEHx</a> <a href="https://t.co/LrCiVAp1Bl">pic.twitter.com/LrCiVAp1Bl</a></p>— fofr (@fofrAI) <a href="https://twitter.com/fofrAI/status/1924924738494669011?ref_src=twsrc%5Etfw">May 20, 2025</a></blockquote> <script async src="https://platform.twitter.com/widgets.js" charset="utf-8"></script> [/TWITTER]
Celle-ci d'une sitcom qui n'a jamais existé
[TWITTER]<blockquote class="twitter-tweet"><p lang="en" dir="ltr">Good lord, Veo-3. I keep alternating between being stunned and laughing my ass off. <a href="https://t.co/sdmEHoJlBh">pic.twitter.com/sdmEHoJlBh</a></p>— Theoretically Media (@TheoMediaAI) <a href="https://twitter.com/TheoMediaAI/status/1925210469133877286?ref_src=twsrc%5Etfw">May 21, 2025</a></blockquote> <script async src="https://platform.twitter.com/widgets.js" charset="utf-8"></script> [/TWITTER]
Une séquence d'un film qui n'existe pas
[TWITTER]<blockquote class="twitter-tweet"><p lang="en" dir="ltr">Created with Google Flow. <br><br>Visuals, Sound Design, and Voice were prompted using Veo 3 text-to-video.<br><br>Welcome to a new era of filmmaking. <a href="https://t.co/E3NSA1WsXe">pic.twitter.com/E3NSA1WsXe</a></p>— Dave Clark (@Diesol) <a href="https://twitter.com/Diesol/status/1925114473544913004?ref_src=twsrc%5Etfw">May 21, 2025</a></blockquote> <script async src="https://platform.twitter.com/widgets.js" charset="utf-8"></script> [/TWITTER]
Ou d'une conférence technologique qui n'a jamais eu lieu
[TWITTER]<blockquote class="twitter-tweet"><p lang="en" dir="ltr">Before you ask: yes, everything is AI here. The video and sound both coming from a single text prompt using <a href="https://twitter.com/hashtag/Veo3?src=hash&ref_src=twsrc%5Etfw">#Veo3</a> by <a href="https://twitter.com/GoogleDeepMind?ref_src=twsrc%5Etfw">@GoogleDeepMind</a> .Whoever is cooking the model, let him cook! Congrats <a href="https://twitter.com/Totemko?ref_src=twsrc%5Etfw">@Totemko</a> and the team for the Google I/O live stream and the new Veo site! <a href="https://t.co/sxZuvFU49s">pic.twitter.com/sxZuvFU49s</a></p>— László Gaál (@laszlogaal_) <a href="https://twitter.com/laszlogaal_/status/1925094336200573225?ref_src=twsrc%5Etfw">May 21, 2025</a></blockquote> <script async src="https://platform.twitter.com/widgets.js" charset="utf-8"></script> [/TWITTER]
Google Veo 3 permet de créer des vidéos de chant et de musique à partir d'une simple invite.
[TWITTER]<blockquote class="twitter-tweet"><p lang="en" dir="ltr">Google Veo 3 can create singing and music videos from a single prompt.<br><br>It's just insane how coherent it is to the video.<br><br>🔈Sound On! <a href="https://t.co/RMwc1sSOmX">pic.twitter.com/RMwc1sSOmX</a></p>— Jerrod Lew (@jerrod_lew) <a href="https://twitter.com/jerrod_lew/status/1924934440486371589?ref_src=twsrc%5Etfw">May 20, 2025</a></blockquote> <script async src="https://platform.twitter.com/widgets.js" charset="utf-8"></script> [/TWITTER]
Vidéo de Will Smith mangeant des spaghettis générée par Veo 3
Chaque fois qu'une entreprise dévoile un nouvel outil de génération de vidéos par l'IA, il se produit un rituel désormais familier : quelqu'un crée une vidéo de l'acteur Will Smith en train de manger des spaghettis. Ce qui n'était au départ qu'un mème s'est transformé en une référence originale pour tester le réalisme et les capacités des vidéos générées par l'IA. Le scénario bizarre (Smith mangeant des nouilles) est devenu un test décisif pour savoir dans quelle mesure un modèle peut gérer les expressions faciales, les mouvements des mains et les textures désordonnées comme la nourriture.
Avec le lancement de Veo 3 aux États-Unis, les utilisateurs ont rapidement mis à l'épreuve le nouvel outil vidéo IA de Google en générant de nouvelles vidéos de Will Smith mangeant des spaghettis. Jetez un coup d'œil à la vidéo partagée par Javi Lopez, un utilisateur de X.
[TWITTER]<blockquote class="twitter-tweet"><p lang="en" dir="ltr">Just got access to Veo 3 and the first thing I did was try the Will Smith spaghetti test. SOUND ON <a href="https://t.co/y0CiZwNxgM">pic.twitter.com/y0CiZwNxgM</a></p>— Javi Lopez ⛩️ (@javilopen) <a href="https://twitter.com/javilopen/status/1925495026903380358?ref_src=twsrc%5Etfw">May 22, 2025</a></blockquote> <script async src="https://platform.twitter.com/widgets.js" charset="utf-8"></script> [/TWITTER]
Cette vidéo a été faite en 2023 avec Veo 2. Un bon point de départ pour faire des comparaisons sur l'évolution de l'outil de Google.
[TWITTER]<blockquote class="twitter-tweet"><p lang="en" dir="ltr">Google Veo 2 has done it.<br><br>We are now eating spaghett at last. <a href="https://t.co/AZO81w8JC0">pic.twitter.com/AZO81w8JC0</a></p>— Jerrod Lew (@jerrod_lew) <a href="https://twitter.com/jerrod_lew/status/1868809004400754871?ref_src=twsrc%5Etfw">December 17, 2024</a></blockquote> <script async src="https://platform.twitter.com/widgets.js" charset="utf-8"></script> [/TWITTER]
S'il fallait rester sur le mème et non sur l'outil, voici des vidéos de 2023 de Smith mangeant des spaghettis.
Les vidéos de 2023 ont été critiquées pour leur manque de réalisme, les mouvements peu naturels et des artefacts visuels qui montrent clairement qu'elles ont été générées par une IA. En revanche, la vidéo générée par Veo 3 présente un niveau de fidélité visuelle nettement supérieur. Les textures, l'éclairage et les détails des spaghettis, de la fourchette et des expressions faciales de Will Smith sont rendus avec une grande précision, montrant des changements subtils qui traduisent l'émotion et la réaction.
Quand Will Smith est entré dans la danse
Le mème est devenu si répandu que même Will Smith l'a reconnu. En février dernier, l'acteur a publié sur Instagram une parodie humoristique de la tendance, alimentant ainsi sa popularité et consolidant sa place dans la culture Internet.
« C'est devenu incontrôlable ! » a-t-il mis en légende de sa publication.
Vers une régulation nécessaire ?
L'intégration de Veo 3 dans YouTube Shorts permet aux créateurs de générer des vidéos de 6 secondes à partir de simples descriptions textuelles. Bien que cette fonctionnalité offre de nouvelles opportunités créatives, elle pose également des défis en matière de modération et de véracité des contenus.
Pour garantir la transparence dans l’utilisation de l’IA, toutes les vidéos créées avec Veo sont marquées d’un filigrane SynthID, développé par Google DeepMind également. Ce filigrane authentifie les vidéos générées par l’IA et empêche toute manipulation indétectable, offrant ainsi une couche de sécurité supplémentaire dans la lutte contre la désinformation visuelle.
La facilité avec laquelle Veo 3 peut produire des vidéos réalistes soulève des questions sur la nécessité d'une régulation plus stricte des contenus générés par IA. Si des outils comme SynthID sont un pas dans la bonne direction, ils ne suffisent pas à eux seuls à garantir l'authenticité des informations diffusées. Il est essentiel que les plateformes, les développeurs et les régulateurs collaborent pour établir des normes claires et protéger les utilisateurs contre les contenus trompeurs.
Conclusion
Veo 3 représente une avancée majeure dans le domaine de la génération de vidéos par intelligence artificielle, offrant des possibilités créatives inédites. Cependant, son utilisation massive sur des plateformes comme YouTube met en lumière les défis liés à la véracité des contenus et à la protection des utilisateurs. Il est impératif d'adopter une approche équilibrée, combinant innovation technologique et responsabilité éthique, pour tirer le meilleur parti de ces outils tout en minimisant leurs risques potentiels.
Sources : Google, vidéos dans le texte, Will Smith
Et vous ?







Vous avez lu gratuitement 2 articles depuis plus d'un an.
Soutenez le club developpez.com en souscrivant un abonnement pour que nous puissions continuer à vous proposer des publications.
Soutenez le club developpez.com en souscrivant un abonnement pour que nous puissions continuer à vous proposer des publications.