Google lance le modèle vidéo Veo 3.1 avec des améliorations en termes de réalisme et de fidélité, un son natif amélioré et des effets sonores synchronisés, et une nouvelle fonctionnalité d'extension de scène

Le 17 octobre 2025 à 07:52, par Alex

4PARTAGES

Google lance le modèle vidéo Veo 3.1 avec des améliorations en termes de réalisme et de fidélité, un son natif amélioré et des effets sonores synchronisés, et une nouvelle fonctionnalité d'extension de scène

Google a annoncé Veo 3.1 et Veo 3.1 Fast avec des améliorations clés en termes de réalisme, de fidélité et de respect des consignes, offrant des vidéos de meilleure qualité avec un son natif amélioré qui se caractérise par des dialogues naturels et des effets sonores synchronisés. La mise à jour ajoute également la prise en charge des formats 16:9 paysage et portrait, répondant ainsi à la demande croissante de vidéos verticales. Veo 3.1 et Veo 3.1 Fast sont tous deux disponibles via l'application Gemini, Google AI Studio et Vertex AI au même prix que Veo 3, la variante Fast offrant des générations plus rapides et plus abordables.

Lors de la conférence Google I/O, Google a dévoilé Veo 3, la dernière version de son générateur de vidéos basé sur l'intelligence artificielle (IA). Cette technologie avancée permet de créer des vidéos réalistes à partir de simples descriptions textuelles, intégrant dialogues, musiques et effets sonores. Cependant, son utilisation soulève des questions sur la prolifération de contenus générés par IA sur des plateformes comme YouTube.

Récemment, Google a annoncé Veo 3.1 et Veo 3.1 Fast, les dernières versions de son modèle de génération vidéo par IA disponible via l'application Google Gemini, Google Flow, Google AI Studio et Vertex AI. Quelques semaines seulement après le lancement de Sora 2 par OpenAI, Veo 3.1 arrive avec des améliorations clés en termes de réalisme, de fidélité et de respect des consignes, offrant des vidéos de meilleure qualité avec un son natif amélioré qui se caractérise par des dialogues naturels et des effets sonores synchronisés. La mise à jour ajoute également la prise en charge des formats 16:9 paysage et portrait, répondant ainsi à la demande croissante de vidéos verticales.

https://youtu.be/B78BJuPxmBU

Les développeurs peuvent désormais guider le modèle à l'aide de trois images de référence maximum afin de maintenir la cohérence des personnages ou des objets dans plusieurs clips, ainsi qu'une nouvelle fonctionnalité d'extension de scène qui permet de créer des vidéos plus longues en connectant de nouveaux clips à la dernière image du précédent, préservant ainsi la continuité visuelle (auparavant limitée à 30 secondes). Le modèle fait également preuve d'une compréhension plus approfondie des styles cinématographiques, offrant aux développeurs un plus grand contrôle créatif sur le ton et la composition.

Veo 3.1 alimente l'outil de création cinématographique Google Flow, qui prend désormais en charge l'audio généré pour ses fonctionnalités « Ingredients to Video », « Frames to Video » et « Extend ». Les développeurs peuvent télécharger des images comme points de départ ou d'arrivée, ajouter de l'audio personnalisé ou générer des transitions entre les scènes. Veo 3.1 et Veo 3.1 Fast sont tous deux disponibles via l'application Gemini, Google AI Studio et Vertex AI au même prix que Veo 3, la variante Fast offrant des générations plus rapides et plus abordables.

Veo 3.1 : un modèle amélioré de génération de vidéos

Veo 3.1 et Veo 3.1 Fast permettent aux développeurs de créer des contenus plus attrayants grâce à des améliorations significatives. Les modèles génèrent désormais un son natif plus riche, allant des conversations naturelles aux effets sonores synchronisés, et offrent un meilleur contrôle narratif grâce à une meilleure compréhension des styles cinématographiques. Les capacités améliorées de conversion d'images en vidéos garantissent une meilleure adhésion aux consignes tout en offrant une qualité audio et visuelle supérieure et en conservant la cohérence des personnages dans plusieurs scènes.

En plus de la mise à jour du modèle, Google introduit de nouvelles fonctionnalités, notamment l'utilisation d'images de référence pour guider la génération de vidéos, prolonger les vidéos Veo existantes et générer des transitions entre la première et la dernière image.

https://youtu.be/orcRl82lGLc

Guidez la génération avec « Ingredients to video »

Vous pouvez désormais guider le processus de génération en fournissant jusqu'à 3 images de référence d'un personnage, d'un objet ou d'une scène. Cela est utile pour maintenir la cohérence des personnages dans plusieurs plans ou pour appliquer un style spécifique à votre vidéo.

https://youtu.be/h9efowrW9ik

Code python :

Sélectionner tout

1
2
3
4
5
6
7
8
9
10
11
12
13
from google import genai 
from google.genai import types 
  
  
client = genai.Client() 
  
operation = client.models.generate_videos( 
    model="veo-3.1-generate-preview", 
    prompt=prompt, 
    config=types.GenerateVideosConfig( 
        reference_images=[reference_image1, reference_image2], 
    ), 
)

Créez des vidéos plus longues avec « Scene extension »

Votre histoire n'est plus limitée par la génération originale. Avec Scene extension, vous pouvez créer des vidéos plus longues, pouvant même durer une minute ou plus, en générant de nouveaux clips qui se connectent à votre vidéo précédente. Chaque nouvelle vidéo est générée sur la base de la dernière seconde du clip précédent. Cela permet de maintenir la continuité visuelle, ce qui rend cette fonctionnalité idéale pour prolonger les plans avec un fond sonore.

https://youtu.be/_Fpl8SuQC4c

Code python :

Sélectionner tout

1
2
3
4
5
6
7
8
9
10
from google import genai 
  
  
client = genai.Client() 
  
operation = client.models.generate_videos( 
    model="veo-3.1-generate-preview", 
    prompt=prompt, 
    video=video_to_extend 
)

Contrôlez votre vidéo avec « Première et dernière image »

Créez des scènes fluides et naturelles qui relient deux images différentes. En fournissant une image de départ et une image de fin, vous pouvez demander à Veo 3.1 de générer la transition entre les deux, avec l'audio qui l'accompagne.

https://youtu.be/Kew48V17NWM

Code python :

Sélectionner tout

1
2
3
4
5
6
7
8
9
10
11
12
13
from google import genai 
from google.genai import types 
  
client = genai.Client() 
  
operation = client.models.generate_videos( 
    model="veo-3.1-generate-preview", 
    prompt=prompt, 
    image=first_frame, 
    config=types.GenerateVideosConfig( 
        last_frame=last_frame, 
    ), 
)

Cette annonce intervient alors que depuis quelques mois, une nouvelle vague de contenus inonde les réseaux sociaux : les vidéos générées par intelligence artificielle, étranges, absurdes, parfois dérangeantes, mais irrésistiblement virales. Ce phénomène a été baptisé "AI slop", littéralement la « bouillie numérique produite par IA ». Le terme n’est pas anodin : il reflète une perception de contenu industriel, bâclé, produit à la chaîne, qui n’a pas de valeur artistique intrinsèque mais qui exploite les failles des algorithmes de recommandation pour générer du clic… et de l’argent. Pour les professionnels du numérique, ce raz-de-marée est révélateur : il illustre à la fois la puissance des outils IA grand public, la fragilité des plateformes face à la manipulation algorithmique, et la mutation du business model de la création en ligne.

Source : Google

Et vous ?

Pensez-vous que cette annonce est crédible ou pertinente ?

Quel est votre avis sur le sujet ?

Voir aussi :

TikTok est inondé de vidéos à caractère raciste et antisémite créées à l'aide de l'outil d'IA de génération de vidéo Veo 3 de Google, les garde-fous mis en place par Google et TikTok se révèlent inefficaces

Les vidéos de deepfake deviennent étonnamment bonnes : l'IA chinoise OmniHuman-1 peut générer les vidéos de deepfake les plus réalistes à ce jour, parlant, chantant et bougeant, à partir d'une seule photo

OpenAI annonce Sora 2 et une nouvelle application sociale de vidéo et audio d'IA pour créer des deepfakes de vos amis grâce à des « caméos » pour spammer le web avec encore plus d'AI Slop

Vous avez lu gratuitement 13 523 articles depuis plus d'un an.
Soutenez le club developpez.com en souscrivant un abonnement pour que nous puissions continuer à vous proposer des publications.

Une erreur dans cette actualité ? Signalez-nous-la !

Votre nom : Votre e-mail :

Décrivez l'erreur que vous souhaitez porter à notre connaissance :

Identifiez-vous

Créer un compte

Google lance le modèle vidéo Veo 3.1 avec des améliorations en termes de réalisme et de fidélité, un son natif amélioré et des effets sonores synchronisés, et une nouvelle fonctionnalité d'extension de scène

Identifiant
Mot de passe

Mot de passe oublié ?