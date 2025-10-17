Google a annoncé Veo 3.1 et Veo 3.1 Fast avec des améliorations clés en termes de réalisme, de fidélité et de respect des consignes, offrant des vidéos de meilleure qualité avec un son natif amélioré qui se caractérise par des dialogues naturels et des effets sonores synchronisés. La mise à jour ajoute également la prise en charge des formats 16:9 paysage et portrait, répondant ainsi à la demande croissante de vidéos verticales. Veo 3.1 et Veo 3.1 Fast sont tous deux disponibles via l'application Gemini, Google AI Studio et Vertex AI au même prix que Veo 3, la variante Fast offrant des générations plus rapides et plus abordables.
Lors de la conférence Google I/O, Google a dévoilé Veo 3, la dernière version de son générateur de vidéos basé sur l'intelligence artificielle (IA). Cette technologie avancée permet de créer des vidéos réalistes à partir de simples descriptions textuelles, intégrant dialogues, musiques et effets sonores. Cependant, son utilisation soulève des questions sur la prolifération de contenus générés par IA sur des plateformes comme YouTube.
Récemment, Google a annoncé Veo 3.1 et Veo 3.1 Fast, les dernières versions de son modèle de génération vidéo par IA disponible via l'application Google Gemini, Google Flow, Google AI Studio et Vertex AI. Quelques semaines seulement après le lancement de Sora 2 par OpenAI, Veo 3.1 arrive avec des améliorations clés en termes de réalisme, de fidélité et de respect des consignes, offrant des vidéos de meilleure qualité avec un son natif amélioré qui se caractérise par des dialogues naturels et des effets sonores synchronisés. La mise à jour ajoute également la prise en charge des formats 16:9 paysage et portrait, répondant ainsi à la demande croissante de vidéos verticales.
Les développeurs peuvent désormais guider le modèle à l'aide de trois images de référence maximum afin de maintenir la cohérence des personnages ou des objets dans plusieurs clips, ainsi qu'une nouvelle fonctionnalité d'extension de scène qui permet de créer des vidéos plus longues en connectant de nouveaux clips à la dernière image du précédent, préservant ainsi la continuité visuelle (auparavant limitée à 30 secondes). Le modèle fait également preuve d'une compréhension plus approfondie des styles cinématographiques, offrant aux développeurs un plus grand contrôle créatif sur le ton et la composition.
Veo 3.1 alimente l'outil de création cinématographique Google Flow, qui prend désormais en charge l'audio généré pour ses fonctionnalités « Ingredients to Video », « Frames to Video » et « Extend ». Les développeurs peuvent télécharger des images comme points de départ ou d'arrivée, ajouter de l'audio personnalisé ou générer des transitions entre les scènes. Veo 3.1 et Veo 3.1 Fast sont tous deux disponibles via l'application Gemini, Google AI Studio et Vertex AI au même prix que Veo 3, la variante Fast offrant des générations plus rapides et plus abordables.
Veo 3.1 : un modèle amélioré de génération de vidéos
Veo 3.1 et Veo 3.1 Fast permettent aux développeurs de créer des contenus plus attrayants grâce à des améliorations significatives. Les modèles génèrent désormais un son natif plus riche, allant des conversations naturelles aux effets sonores synchronisés, et offrent un meilleur contrôle narratif grâce à une meilleure compréhension des styles cinématographiques. Les capacités améliorées de conversion d'images en vidéos garantissent une meilleure adhésion aux consignes tout en offrant une qualité audio et visuelle supérieure et en conservant la cohérence des personnages dans plusieurs scènes.
En plus de la mise à jour du modèle, Google introduit de nouvelles fonctionnalités, notamment l'utilisation d'images de référence pour guider la génération de vidéos, prolonger les vidéos Veo existantes et générer des transitions entre la première et la dernière image.
Guidez la génération avec « Ingredients to video »
Vous pouvez désormais guider le processus de génération en fournissant jusqu'à 3 images de référence d'un personnage, d'un objet ou d'une scène. Cela est utile pour maintenir la cohérence des personnages dans plusieurs plans ou pour appliquer un style spécifique à votre vidéo.
from google import genai from google.genai import types client = genai.Client() operation = client.models.generate_videos( model="veo-3.1-generate-preview", prompt=prompt, config=types.GenerateVideosConfig( reference_images=[reference_image1, reference_image2], ), )
Créez des vidéos plus longues avec « Scene extension »
Votre histoire n'est plus limitée par la génération originale. Avec Scene extension, vous pouvez créer des vidéos plus longues, pouvant même durer une minute ou plus, en générant de nouveaux clips qui se connectent à votre vidéo précédente. Chaque nouvelle vidéo est générée sur la base de la dernière seconde du clip précédent. Cela permet de maintenir la continuité visuelle, ce qui rend cette fonctionnalité idéale pour prolonger les plans avec un fond sonore.
from google import genai client = genai.Client() operation = client.models.generate_videos( model="veo-3.1-generate-preview", prompt=prompt, video=video_to_extend )
Contrôlez votre vidéo avec « Première et dernière image »
Créez des scènes fluides et naturelles qui relient deux images différentes. En fournissant une image de départ et une image de fin, vous pouvez demander à Veo 3.1 de générer la transition entre les deux, avec l'audio qui l'accompagne.
from google import genai from google.genai import types client = genai.Client() operation = client.models.generate_videos( model="veo-3.1-generate-preview", prompt=prompt, image=first_frame, config=types.GenerateVideosConfig( last_frame=last_frame, ), )
Cette annonce intervient alors que depuis quelques mois, une nouvelle vague de contenus inonde les réseaux sociaux : les vidéos générées par intelligence artificielle, étranges, absurdes, parfois dérangeantes, mais irrésistiblement virales. Ce phénomène a été baptisé "AI slop", littéralement la « bouillie numérique produite par IA ». Le terme nest pas anodin : il reflète une perception de contenu industriel, bâclé, produit à la chaîne, qui na pas de valeur artistique intrinsèque mais qui exploite les failles des algorithmes de recommandation pour générer du clic et de largent. Pour les professionnels du numérique, ce raz-de-marée est révélateur : il illustre à la fois la puissance des outils IA grand public, la fragilité des plateformes face à la manipulation algorithmique, et la mutation du business model de la création en ligne.
Source : Google
