Google Deepmind présente Veo 2, un nouvel outil de génération de vidéos par l'IA pour créer des "vidéos d'une qualité incroyable"

Dans le but de battre Sora d'OpenAI et d'être le meilleur modèle IA vidéo

Le 17 décembre 2024 à 16:07, par Jade Emy

161PARTAGES

Google Deepmind a présenté Veo 2, un nouvel outil de génération de vidéos par intelligence artificielle (IA) qui s'appuie sur le Veo original et crée des "vidéos d'une qualité incroyable". Cette annonce intervient après le lancement de la version officielle de Sora, le modèle de génération de vidéo par IA d'OpenAI, montrant la volonté de Google de concurrencer OpenAI. Selon Google, Veo 2 peut créer des "clips de quelques minutes" dans des résolutions 4k et est moins susceptible d'"halluciner" des détails indésirables.

Ce mois de décembre, OpenAI a lancé la version officielle de son programme de génération de vidéos par intelligence artificielle "Sora". Le programme intègre des messages écrits et crée des vidéos numériques d'une durée maximale de 20 secondes. Mais l'entreprise précise que le programme a encore des limites. De plus, OpenAI a déclaré que toutes les vidéos créées par Sora auront des métadonnées C2PA et un filigrane comme paramètre par défaut pour permettre aux utilisateurs d'identifier les vidéos créées par le programme.

En réponse, Google Deepmind a présenté Veo 2, un nouvel outil de génération de vidéos par intelligence artificielle (IA) qui s'appuie sur le Veo original et crée des "vidéos d'une qualité incroyable", dans le but de battre OpenAI. Nouvelle itération de Veo, l'outil phare de conversion de texte en vidéo de Google, Veo 2 peut créer des "clips de quelques minutes" dans des résolutions 4k et Google a mis l'accent sur sa compréhension des demandes cinématographiques.

Pour montrer les capacités de Veo 2, Google a déclaré : "Suggérez objectif 18 mm" dans votre requête et Veo 2 saura créer le plan grand angle pour lequel cet objectif est connu, ou estompez l'arrière-plan et concentrez-vous sur votre sujet en ajoutant "faible profondeur de champ" dans votre requête. De plus, Google affirme que Veo 2 est moins susceptible d'"halluciner" des détails indésirables et a une "meilleure compréhension de la physique du monde réel et des nuances des mouvements et de l'expression humaine".

Toutefois, Google a fait preuve de circonspection en ce qui concerne l'accès à l'outil. Actuellement, les utilisateurs ne peuvent accéder à Veo 2 que par l'intermédiaire de leur plateforme VideoFX, qui dispose d'une liste d'attente. Une fois inscrits, les utilisateurs ne pourront toujours pas exploiter toutes les capacités de l'outil, car il est limité à une résolution de 720p et à une durée de huit secondes, alors que les abonnés à ChatGPT Pro peuvent créer des vidéos de 1080p d'une durée maximale de 20 secondes avec Sora.

Today, we’re announcing Veo 2: our state-of-the-art video generation model which produces realistic, high-quality clips from text or image prompts. 🎥

We’re also releasing an improved version of our text-to-image model, Imagen 3 - available to use in ImageFX through… pic.twitter.com/h6ejHaMUM4
— Google DeepMind (@GoogleDeepMind) December 16, 2024

Voici l'annonce de Google :

Nous annonçons de nouvelles versions de Veo et d'Imagen et présentons notre dernière expérience en matière de génération d'images : Whisk.

En début d'année, nous avons présenté notre modèle de génération vidéo, Veo, et notre dernier modèle de génération d'images, Imagen 3. Depuis, il est passionnant de voir les gens donner vie à leurs idées avec l'aide de ces modèles : Les créateurs de YouTube explorent les possibilités créatives des arrière-plans vidéo pour leurs courts métrages YouTube, les entreprises clientes améliorent les flux de travail créatifs sur Vertex AI et les créatifs utilisent VideoFX et ImageFX pour raconter leurs histoires. En collaboration avec des cinéastes et des entreprises, nous continuons à développer et à faire évoluer ces technologies.

Aujourd'hui, nous présentons un nouveau modèle vidéo, Veo 2, et la dernière version d'Imagen 3, qui permettent tous deux d'obtenir des résultats de pointe. Ces modèles sont désormais disponibles dans VideoFX, ImageFX et...

La fin de cet article est réservée aux abonnés. Soutenez le Club Developpez.com en prenant un abonnement pour que nous puissions continuer à vous proposer des publications.

Une erreur dans cette actualité ? Signalez-nous-la !

Votre nom : Votre e-mail :

Décrivez l'erreur que vous souhaitez porter à notre connaissance :