IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)

Vous êtes nouveau sur Developpez.com ? Créez votre compte ou connectez-vous afin de pouvoir participer !

Vous devez avoir un compte Developpez.com et être connecté pour pouvoir participer aux discussions.

Vous n'avez pas encore de compte Developpez.com ? Créez-en un en quelques instants, c'est entièrement gratuit !

Si vous disposez déjà d'un compte et qu'il est bien activé, connectez-vous à l'aide du formulaire ci-dessous.

Identifiez-vous
Identifiant
Mot de passe
Mot de passe oublié ?
Créer un compte

L'inscription est gratuite et ne vous prendra que quelques instants !

Je m'inscris !

Veo 3, l'outil de génération de vidéo par IA de Google, entraîne une explosion de contenus sur des plateformes comme X et YouTube
Quelques heures seulement après sa présentation durant la Google I/O

Le , par Stéphane le calme

15PARTAGES

3  0 
Veo 3, l'outil de génération de vidéo par IA de Google, entraîne une explosion de contenus sur des plateformes comme X et YouTube
quelques heures seulement après sa présentation durant la Google I/O

Lors de la conférence Google I/O, la firme de Mountain View a dévoilé Veo 3, la dernière version de son générateur de vidéos basé sur l'intelligence artificielle. Cette technologie avancée permet de créer des vidéos réalistes à partir de simples descriptions textuelles, intégrant dialogues, musiques et effets sonores. Cependant, son utilisation soulève des questions sur la prolifération de contenus générés par IA sur des plateformes comme YouTube.

En décembre 2024, OpenAI a lancé en disponibilité générale Sora, son programme de génération de vidéos par intelligence artificielle. L'utilisateur note en langage naturel ce qu'il veut obtenir comme résultat vidéo et Sora génère jusqu'à 20 secondes de vidéos.

Lors de l'annonce de la disponibilité, l'entreprise a précisé que le programme a encore des limites et que toutes les vidéos créées par Sora auront des métadonnées C2PA et un filigrane comme paramètre par défaut pour permettre aux utilisateurs d'identifier les vidéos créées par le programme.

Quelques jours après cette annonce, Google Deepmind a présenté Veo 2, un outil de génération de vidéos par intelligence artificielle qui s'appuie sur le Veo original et crée des « vidéos d'une qualité incroyable ». Cette annonce montrait la volonté de Google de concurrencer OpenAI dans le but de battre Sora et d'être le meilleur modèle IA vidéo. Selon Google, Veo 2 peut créer des « clips vidéos de quelques minutes » dans des résolutions 4k et est moins susceptible « d'halluciner » des détails indésirables.

Veo 3 : une prouesse technologique

Lors de l'édition 2025 de la conférence Google dédiée aux développeurs, Google a présenté son dernier modèle de génération de vidéos par IA, Veo 3, qui peut également créer et incorporer du son. Comme Veo 2, cet outil d'IA est en concurrence avec le générateur vidéo Sora d'OpenAI, mais sa capacité à incorporer du son dans la vidéo qu'il crée constitue une distinction essentielle. L'entreprise précise que Veo 3 peut incorporer de l'audio, notamment des dialogues entre les personnages ainsi que des sons d'animaux.

Citation Envoyé par Google
Veo génère des vidéos de haute qualité à une résolution de 1080p qui peuvent dépasser une minute, dans une grande variété de styles cinématographiques et visuels. Grâce à une compréhension avancée du langage naturel et de la sémantique visuelle, il peut générer des vidéos qui représentent fidèlement la vision créative de l'utilisateur, en captant avec précision le ton d'une invite et en restituant les détails dans les invites plus longues.

Le modèle comprend également les termes cinématographiques tels que "timelapse" ou "plans aériens d'un paysage", offrant un niveau de contrôle créatif sans précédent. Et il crée des séquences cohérentes et homogènes, de sorte que les personnes, les animaux et les objets se déplacent de manière réaliste tout au long des plans.
« Veo 3 excelle dans les domaines du texte et de l'image, de la physique du monde réel et de la synchronisation labiale précise », a déclaré Eli Collins, vice-président produit de Google DeepMind. L'outil d'IA vidéo-audio est déjà disponible pour les abonnés américains à la nouvelle formule d'abonnement Ultra de Google, d'un montant de 249,99 dollars par mois, qui s'adresse aux passionnés d'IA. Veo 3 sera également disponible pour les utilisateurs de la plateforme d'entreprise Vertex AI de Google.


Une explosion de contenus générés par IA

Depuis son lancement, Veo 3 a été utilisé pour créer une multitude de vidéos virales sur YouTube et X, allant de sketchs humoristiques à des simulations de jeux vidéo. Par exemple, une vidéo générée par Veo 3 montre un faux unboxing d'iPhone, si réaliste qu'il est difficile de distinguer la fiction de la réalité. D'autres clips présentent des interviews de rue fictives ou des sessions de jeu "Fortnite" entièrement simulées. Ces contenus, bien que divertissants, soulèvent des préoccupations quant à la frontière entre réalité et fiction sur les plateformes numériques.

Ci-dessous par exemple, nous avons une vidéo générée par Veo 3 d'un standup



Celle-ci d'une sitcom qui n'a jamais existé



Une séquence d'un film qui n'existe pas



Ou d'une conférence technologique qui n'a jamais eu lieu



Google Veo 3 permet de créer des vidéos de chant et de musique à partir d'une simple invite.



Vidéo de Will Smith mangeant des spaghettis générée par Veo 3

Chaque fois qu'une entreprise dévoile un nouvel outil de génération de vidéos par l'IA, il se produit un rituel désormais familier : quelqu'un crée une vidéo de l'acteur Will Smith en train de manger des spaghettis. Ce qui n'était au départ qu'un mème s'est transformé en une référence originale pour tester le réalisme et les capacités des vidéos générées par l'IA. Le scénario bizarre (Smith mangeant des nouilles) est devenu un test décisif pour savoir dans quelle mesure un modèle peut gérer les expressions faciales, les mouvements des mains et les textures désordonnées comme la nourriture.

Avec le lancement de Veo 3 aux États-Unis, les utilisateurs ont rapidement mis à l'épreuve le nouvel outil vidéo IA de Google en générant de nouvelles vidéos de Will Smith mangeant des spaghettis. Jetez un coup d'œil à la vidéo partagée par Javi Lopez, un utilisateur de X.



Cette vidéo a été faite en 2023 avec Veo 2. Un bon point de départ pour faire des comparaisons sur l'évolution de l'outil de Google.



S'il fallait rester sur le mème et non sur l'outil, voici des vidéos de 2023 de Smith mangeant des spaghettis.


Les vidéos de 2023 ont été critiquées pour leur manque de réalisme, les mouvements peu naturels et des artefacts visuels qui montrent clairement qu'elles ont été générées par une IA. En revanche, la vidéo générée par Veo 3 présente un niveau de fidélité visuelle nettement supérieur. Les textures, l'éclairage et les détails des spaghettis, de la fourchette et des expressions faciales de Will Smith sont rendus avec une grande précision, montrant des changements subtils qui traduisent l'émotion et la réaction.

Quand Will Smith est entré dans la danse

Le mème est devenu si répandu que même Will Smith l'a reconnu. En février dernier, l'acteur a publié sur Instagram une parodie humoristique de la tendance, alimentant ainsi sa popularité et consolidant sa place dans la culture Internet.

« C'est devenu incontrôlable ! » a-t-il mis en légende de sa publication.


Vers une régulation nécessaire ?

L'intégration de Veo 3 dans YouTube Shorts permet aux créateurs de générer des vidéos de 6 secondes à partir de simples descriptions textuelles. Bien que cette fonctionnalité offre de nouvelles opportunités créatives, elle pose également des défis en matière de modération et de véracité des contenus.

Pour garantir la transparence dans l’utilisation de l’IA, toutes les vidéos créées avec Veo sont marquées d’un filigrane SynthID, développé par Google DeepMind également. Ce filigrane authentifie les vidéos générées par l’IA et empêche toute manipulation indétectable, offrant ainsi une couche de sécurité supplémentaire dans la lutte contre la désinformation visuelle.

La facilité avec laquelle Veo 3 peut produire des vidéos réalistes soulève des questions sur la nécessité d'une régulation plus stricte des contenus générés par IA. Si des outils comme SynthID sont un pas dans la bonne direction, ils ne suffisent pas à eux seuls à garantir l'authenticité des informations diffusées. Il est essentiel que les plateformes, les développeurs et les régulateurs collaborent pour établir des normes claires et protéger les utilisateurs contre les contenus trompeurs.

Conclusion

Veo 3 représente une avancée majeure dans le domaine de la génération de vidéos par intelligence artificielle, offrant des possibilités créatives inédites. Cependant, son utilisation massive sur des plateformes comme YouTube met en lumière les défis liés à la véracité des contenus et à la protection des utilisateurs. Il est impératif d'adopter une approche équilibrée, combinant innovation technologique et responsabilité éthique, pour tirer le meilleur parti de ces outils tout en minimisant leurs risques potentiels.

Sources : Google, vidéos dans le texte, Will Smith

Et vous ?

Que pensez-vous des performances de Veo 3 ? Des vidéos générées par l'outil de Google, laquelle / lesquelles vous a / ont le plus intéressé(s) / impressionné(s) ?

Veo 3 représente-t-il une avancée ou une menace pour la création audiovisuelle traditionnelle ?

À quel point peut-on encore parler de "création" lorsque tout est généré à partir d'une simple description textuelle ?

La qualité des vidéos générées par IA surpassera-t-elle bientôt celle des contenus réalisés par des humains ?

Les créateurs humains risquent-ils d’être marginalisés ou remplacés par les IA sur les plateformes comme YouTube ?

Une IA peut-elle créer du contenu vraiment original, ou ne fait-elle que recycler des patterns existants ?

Quels métiers émergeront avec la généralisation de ces outils ? Les monteurs vidéo ou scénaristes IA seront-ils les "nouveaux créateurs" ?
Vous avez lu gratuitement 289 articles depuis plus d'un an.
Soutenez le club developpez.com en souscrivant un abonnement pour que nous puissions continuer à vous proposer des publications.

Une erreur dans cette actualité ? Signalez-nous-la !

Avatar de Artaeus
Nouveau Candidat au Club https://www.developpez.com
Le 03/07/2025 à 19:22
"Raciste" ... Faudrait déjà définir ce que ça signifie et qui décide de ce qui est "raciste" ou pas ...
On voit depuis 30 ans le glissement de ce mot qui désormais sert à définir tout et n'importe quoi.
3  2 
Avatar de calvaire
Expert éminent https://www.developpez.com
Le 03/07/2025 à 18:51
je trouve pas la vidéo raciste mais c'est de l'humour qui m'a bien faire rigolé.
ca joue sur pleins de cliché, pas que les noirs, la grosse femme blanche américaine, les flics blanc qui tirent ou le chinois qui cuisine des chiens et les chats.

et sans parler des scènes qui n'ont tellement aucun sens mais assez bien fait avec l'ia, c'est extrêmement drôle je trouve. De l'auto dérisions et de la parodie qui me rappelle la grande époque de Top Gear et l'humour de son présentateur de génie.

Ça nous change de l'humour bien fade et pas drôle de certains humoriste et film comédie français. Qui d'ailleurs se base sur des clichés bien lessivé (l'homme blanc hétéro idiot/bête qui se fait marcher dessus par sa femme), l'homme qui se prends une gifle au cinema, jamais l'inverse, ou alors dans ce cas c'est mal, si l'homme se prends la beigne par contre c'est mérité et "drole".
3  3 
Avatar de smobydick
Membre averti https://www.developpez.com
Le 04/07/2025 à 0:10
Quand bien même bytedance arriverait à filtrer, dès que la branche des usa sera rachetée, les vannes seront de nouveau ouvertes et autoriseront les contenus racistes. Car oui, les vidéos de cette compilation sont totalement racistes, il faut vraiment être fêlé pour dire le contraire et remettre en cause la définition du racisme.
Et comme d'habitude, c'est toujours les mêmes racistes qui ne voient que de l'humour et qui veulent avoir le droit de juger de ce qui relève du racisme ou pas, selon leurs propres standards de racistes bien entendu.
0  2