IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)

Vous êtes nouveau sur Developpez.com ? Créez votre compte ou connectez-vous afin de pouvoir participer !

Vous devez avoir un compte Developpez.com et être connecté pour pouvoir participer aux discussions.

Vous n'avez pas encore de compte Developpez.com ? Créez-en un en quelques instants, c'est entièrement gratuit !

Si vous disposez déjà d'un compte et qu'il est bien activé, connectez-vous à l'aide du formulaire ci-dessous.

Identifiez-vous
Identifiant
Mot de passe
Mot de passe oublié ?
Créer un compte

L'inscription est gratuite et ne vous prendra que quelques instants !

Je m'inscris !

Google Deepmind écrase OpenAI Sora avec son générateur vidéo Veo 3 qui intègre l'audio, et annonce Imagen 4 et Lyria 2
Ses nouveaux modèles multimédias génératifs Vertex AI

Le , par Jade Emy

39PARTAGES

4  0 
Google a annoncé Veo 3, un générateur de vidéo par intelligence artificielle (IA) capable de créer et d'incorporer du son. Cet outil d'IA est en concurrence avec le générateur vidéo Sora d'OpenAI, mais sa capacité à incorporer du son dans la vidéo qu'il crée constitue une distinction essentielle. L'outil d'IA vidéo-audio est déjà disponible pour les abonnés américains de la nouvelle formule d'abonnement Ultra de Google, d'un montant de 249,99 dollars par mois, qui s'adresse aux passionnés d'IA les plus acharnés.

En décembre 2024, OpenAI a lancé la version officielle de son programme de génération de vidéos par intelligence artificielle (IA) "Sora". Le programme intègre des messages écrits et crée des vidéos numériques d'une durée maximale de 20 secondes. Lors de l'annonce, l'entreprise a précisé que le programme a encore des limites et que toutes les vidéos créées par Sora auront des métadonnées C2PA et un filigrane comme paramètre par défaut pour permettre aux utilisateurs d'identifier les vidéos créées par le programme.

Quelques jours après cette annonce, Google Deepmind a présenté Veo 2, un outil de génération de vidéos par intelligence artificielle (IA) qui s'appuie sur le Veo original et crée des "vidéos d'une qualité incroyable". Cette annonce montrait la volonté de Google de concurrencer OpenAI dans le but de battre Sora et d'être le meilleur modèle IA vidéo. Selon Google, Veo 2 peut créer des "clips de quelques minutes" dans des résolutions 4k et est moins susceptible d'"halluciner" des détails indésirables.

Le 21 mai 2025, Google a annoncé son dernier modèle de génération de vidéos par IA, "Veo 3", qui peut également créer et incorporer du son. Comme Veo 2, cet outil d'IA est en concurrence avec le générateur vidéo Sora d'OpenAI, mais sa capacité à incorporer du son dans la vidéo qu'il crée constitue une distinction essentielle. L'entreprise précise que Veo 3 peut incorporer de l'audio, notamment des dialogues entre les personnages ainsi que des sons d'animaux.

"Veo 3 excelle dans les domaines du texte et de l'image, de la physique du monde réel et de la synchronisation labiale précise", a déclaré Eli Collins, vice-président produit de Google DeepMind. L'outil d'IA vidéo-audio est déjà disponible pour les abonnés américains à la nouvelle formule d'abonnement Ultra de Google, d'un montant de 249,99 dollars par mois, qui s'adresse aux passionnés d'IA. Veo 3 sera également disponible pour les utilisateurs de la plateforme d'entreprise Vertex AI de Google.


Google a également annoncé Imagen 4, son dernier outil de génération d'images, qui, selon l'entreprise, produit des images de meilleure qualité grâce à des invites de l'utilisateur. En outre, Google a dévoilé Flow, un nouvel outil de réalisation de films qui permet aux utilisateurs de créer des vidéos cinématographiques en décrivant les lieux, les plans et les préférences de style. Les utilisateurs peuvent accéder à cet outil via Gemini, Whisk, Vertex AI et Workspace.

Les derniers lancements interviennent alors que l'imagerie et la vidéo deviennent des cas d'utilisation populaires pour les invites d'IA générative. En mars, Sam Altman, PDG d'OpenAI, a déclaré que le générateur d'images 4o de ChatGPT était si populaire qu'il avait fait "fondre" les puces GPU de l'entreprise. L'entreprise a déclaré qu'elle avait dû limiter temporairement l'utilisation de cette fonction.

Google a un bilan mitigé en ce qui concerne ses générateurs d'images IA. En 2024, l'entreprise a dû relancer son outil Imagen 3 après avoir obtenu des résultats historiquement inexacts aux demandes des utilisateurs, ce qui a suscité de nombreuses critiques. Le cofondateur Sergey Brin a déclaré par la suite que cette mésaventure était due à un manque de "tests approfondis".

Le géant technologique a également mis à jour son générateur de vidéos Veo 2 pour permettre aux utilisateurs d'ajouter ou de supprimer des objets dans les vidéos à l'aide d'invites textuelles. En outre, Google a ouvert son modèle de génération de musique Lyria 2 aux créateurs via sa plateforme YouTube Shorts et aux entreprises utilisant Vertex AI.

Citation Envoyé par Google
Aujourd'hui, nous présentons la prochaine vague de modèles de médias d'IA générative sur Vertex AI : Imagen 4, Veo 3 et Lyria 2.

Nous avons déjà vu des clients générer des images étonnantes et photoréalistes avec Imagen 3, le modèle de génération d'images de Google. Les clients ont pris ces images et les ont transformées en vidéos et en ressources de haute qualité avec Veo 2. Nous avons même vu des clients prendre ces vidéos remarquables et leur donner vie avec un son de qualité professionnelle grâce à Lyria, le modèle avancé de génération de musique par l'IA de Google.

Avec une montée en puissance de l'espace média génératif de l'IA dans le marketing, les médias et plus encore, la narration n'a jamais été aussi facile. Les utilisateurs créent plus rapidement des éléments de campagne et élaborent des contenus créatifs révolutionnaires. Jetons un coup d'œil à chaque modèle et aux façons dont vous pouvez commencer dès aujourd'hui.
Présentation de Veo 3

Veo 3 est le dernier modèle de génération vidéo de Google DeepMind. Google affirme que Veo 3 peut générer des vidéos avec :

  • Une qualité améliorée lors de la génération de vidéos à partir d'invites textuelles et d'images.
  • De la parole, comme des dialogues et des voix off
  • De l'audio, comme de la musique et des effets sonores.

Voici quelques exemples :

  • Invite : Un plan moyen, un cadre d'aventure historique : La lumière chaude d'une lampe éclaire un cartographe dans un bureau encombré, en train d'étudier une carte ancienne et tentaculaire étalée sur une grande table. Cartographe : « D'après cette vieille carte marine, l'île perdue n'est pas un mythe ! Nous devons préparer une expédition immédiatement ! »

  • Invite : Un plan en contre-plongée montre une porte violette claire ouverte menant d'une pièce aux murs violets clairs et au sol gris à une scène extérieure animée. De l'herbe verte luxuriante et des fleurs sauvages se répandent de la porte sur le sol intérieur, créant une transition fantaisiste entre les espaces. Au-delà de la porte, des collines verdoyantes parsemées de fleurs sauvages s'étendent vers un ciel clair et lumineux. Un seul arbre se dresse au premier plan de la scène extérieure, ses feuilles ajoutant de la profondeur à la vue. La lumière du soleil et les éléments naturels contrastent avec la simplicité de l'espace intérieur, invitant à l'émerveillement et à l'évasion.


Pour l'instant, Veo 3 est en avant-première privée sur Vertex AI et ne sera disponible plus largement que dans les semaines à venir.

Voici quelques retours d'entreprises qui ont pu tester Veo 3 :

Citation Envoyé par David Sandström, directeur marketing, Klarna
Chez Klarna, nous cherchons constamment à repousser les limites de l'innovation dans nos efforts de marketing, et Veo a changé la donne dans nos flux de travail créatifs. Avec Veo et Imagen, nous avons transformé des processus de production qui prenaient beaucoup de temps en tâches rapides et efficaces qui nous permettent d'augmenter rapidement la création de contenu. Qu'il s'agisse de produire des b-rolls engageants, de concevoir des bumpers YouTube accrocheurs ou de développer des animations dynamiques sur les réseaux sociaux, ces outils ont permis à nos équipes d'être plus agiles et plus créatives. Les résultats parlent d'eux-mêmes, avec une augmentation de l'engagement et de la performance du contenu. Avec Google Cloud, nous jetons les bases de l'avenir du commerce et révolutionnons la manière dont nous donnons vie à notre marque.
Citation Envoyé par David Jones, fondateur et PDG, Brandtech
L'ajout de Veo 2 dans Pencil renforce notre engagement à doter les marketeurs d'une IA sophistiquée, leur permettant de produire des campagnes non seulement plus intelligentes et plus rapides, mais aussi plus audacieuses et plus inspirées sur le plan artistique. Nos projets pilotes ont donné des résultats incroyables, avec une réduction moyenne de 50 % des coûts et des délais de mise sur le marché. Ce changement radical en matière de contrôle et de qualité permet de transformer en quelques minutes des idées auparavant impossibles à concrétiser en un véritable contenu marketing. Japan Airlines montre la voie en appliquant Gen AI à l'industrie du voyage, et nous sommes impatients de voir comment d'autres marques suivront le mouvement.
Citation Envoyé par Justin Thomas, responsable de l'expérience numérique et de la croissance, Kraft Heinz
Avec Veo et Imagen sur Vertex AI dans le cadre de notre plateforme Tastemaker, Kraft Heinz a débloqué une vitesse et une efficacité sans précédent dans nos flux de travail créatifs. Ce qui nous prenait auparavant huit semaines ne prend plus que huit heures, ce qui se traduit par des économies substantielles.
Citation Envoyé par Aaron Rutley, chef de produit pour l'IA chez Envato.
Nous avons essayé plusieurs des meilleurs modèles vidéo, et Veo 2 a donné les résultats les plus impressionnants en termes de vitesse et de qualité sur un ensemble varié de textes et d'images. Dès les premiers jours du lancement, des dizaines de milliers d'abonnés d'Envato accédaient déjà à VideoGen, et près de 60 % des vidéos générées étaient téléchargées pour être utilisées dans des projets créatifs. Depuis mars, Envato a vu l'utilisation de VideoGen dépasser les 100 % mois après mois. Ce fut un plaisir de travailler avec Google Cloud pour donner vie à la fonctionnalité VideoGen d'Envato avec Veo.

Présentation d'Imagen 4

Présenté en avant-première publique, Imagen 4 est le dernier modèle de génération d'images de haute qualité de Google. L'entreprise affirme que Imagen 4 est capable de :

  • Rendu de texte exceptionnel et adhérence rapide
  • Qualité d'image globale supérieure dans tous les styles
  • Prise en charge multilingue des invites pour aider les créateurs dans le monde entier

Voici quelques exemples :

  • Invite : Capturez un gros plan intime baigné par la lumière chaude et douce du soleil de fin d'après-midi qui filtre dans une cuisine typique des années 1960. Le point de mire est un emballage vintage de farine tout usage au design charmant, posé sur un comptoir en Formica moucheté. L'emballage lui-même évoque la nostalgie à l'état pur : peut-être un papier épais et légèrement texturé dans un ton crème chaud, orné d'une typographie simple et audacieuse (un empattement ou une écriture sympathique) en rouge et bleu classique « FARINE TOUT USAGE », avec une charmante illustration comme une gerbe de blé stylisée ou un joyeux personnage de boulanger. En caractères gras plus petits, au bas de l'emballage : « NET WT 5 LBS (80 OZ) 2.27kg ». Concentrez-vous sur les détails de l'emballage - les bords légèrement souples du sac en papier, la texture de l'impression vintage, le texte invitant « Farine tout usage ». De subtils indices de la cuisine des années 1960 encadrent la prise de vue - le bord chromé du comptoir qui brille doucement, un aperçu flou du dosseret en céramique jaune pastel, ou le coin d'une boîte métallique vintage placée juste en dehors du champ. La faible profondeur de champ maintient l'attention sur l'emballage magnifiquement conçu, créant une esthétique riche en chaleur, en authenticité et en attrait nostalgique.

  • Invite : Cette bande dessinée de quatre planches utilise un style artistique charmant et délibérément pixellisé qui rappelle les jeux vidéo 8 bits classiques, avec des formes simples et une palette de couleurs limitée et lumineuse dominée par les verts, les bleus, les bruns et le gris/noir emblématique du dinosaure. Le décor est une plage de pixels stylisée. Le premier panneau montre le dinosaure T-Rex de Google Chrome, avec sa forme pixellisée caractéristique, portant de minuscules lunettes de soleil pixellisées et se prélassant sur une serviette de plage pixellisée sous un soleil jaune pâle. Des palmiers pixellisés se balancent doucement à l'arrière-plan, dans un ciel bleu pixellisé. Une légende en caractères pixelisés indique : « Même les messages d'erreur ont besoin de vacances ». La deuxième planche est un gros plan du T-Rex qui tente de construire un château de sable en pixels. Il tapote maladroitement un monticule de pixels bruns avec ses minuscules bras de pixels, l'air concentré. De petits coquillages pixellisés parsèment le sable autour de lui. La troisième image montre le T-Rex sautant joyeusement par-dessus une série de cactus pixellisés plantés près de la plage, imitant ainsi son jeu d'évitement d'obstacles. Un petit effet sonore « Boing ! Boing ! » s'affiche dans une police de caractères en bloc au-dessus de chaque saut. Un crabe pixellisé observe la scène de côté, en agitant sa pince pixellisée. Le dernier panneau montre le T-Rex flottant paisiblement sur le dos dans l'eau de pixels bleus, les lunettes de soleil toujours en place, avec une expression satisfaite. Une petite bulle de pensée au-dessus de lui contient des « Zzz... » pixellisés indiquant la relaxation.


Pour commencer à utiliser Imagen 4 en avant-première publique sur Vertex AI, vous pouvez utiliser Media Studio ou exécuter l'exemple de code suivant, qui utilise le SDK Google Gen AI pour Python.

Code : Sélectionner tout
1
2
3
4
5
6
7
8
9
10
11
from google import genai

# TODO(developer): Update and un-comment below lines
# project_id = "PROJECT_ID"
client = genai.Client(vertexai=True, project=project_id, location="us-central1")

prompt = """
A white wall with two Art Deco travel posters mounted. First poster has the text: "NEPTUNE", tagline: "The jewel of the solar system!' Second poster has the text: "JUPITER", tagline: "Travel with the giants!
"""

image = client.models...
La fin de cet article est réservée aux abonnés. Soutenez le Club Developpez.com en prenant un abonnement pour que nous puissions continuer à vous proposer des publications.

Une erreur dans cette actualité ? Signalez-nous-la !

Avatar de calvaire
Expert éminent https://www.developpez.com
Le 06/07/2025 à 18:11
Citation Envoyé par fredpeaks Voir le message
Pour celui qui demande une définition du racisme : https://fr.m.wikipedia.org/wiki/Racisme
Ici chaque extrait vidéo est clairement raciste et si vous ne voyez que du contenu absurde c’est que vous n’avez pas la référence au cliché raciste utilisé (ou que ne voulez pas la voir). Ce n’est pas parce que c’est "rigolo" qu’il faut continuer à le faire. Lancer des nains c’était sûrement très marrant. Les "experts éminents" de c news sont de passage.
Alors Wikipedia c'est pas une science exacte et est clairement orienté politiquement.
Ensuite la frontière entre d'humour ou racisme reste propre a chacun j'ai envie de dire, car ça varie beaucoup en fonction de l'époque et de chaque culture/pays. L’Europe de l'ouest devient de plus en plus coincé du cul, ce qui n'est heureusement pas le cas partout dans le monde.
Moi je trouve ces films/sketch très drôle





a l'inverse certains film progressiste sont d'une médiocrité abyssale comme "Toutes pour une" ou le dernier grand chef d’œuvre de l'exception culturelle française (hum hum...) Le Grand déplacement.
Ces films sont d'ailleurs d’après te définition de wikipedia raciste, les hommes blancs hétéro sont représenté de manière très offensante et déshumanisante.
J'en entends pourtant peu râler quand des femmes ou des noirs humilie un homme blanc dans des films, l'inverse par contre... combien de personne indigné car un homme blanc sait pris une claque par une femme et donc victime de violence conjugale ?
Combien de personne indigné par la claque du président Macron par sa femme ? une beigne sur Brigitte j'ai le sentiment que ça aurait été très différent. Mais bon c'est juste un "sentiment" hein

Le racisme n'est pas la ou on le pense finalement....
7  1 
Avatar de calvaire
Expert éminent https://www.developpez.com
Le 10/07/2025 à 11:35
Citation Envoyé par azurman Voir le message
Si on constate les dérives de TIKTOK aux USA, en France c'est tout à fait dramatique l'influence de ce réseau social sur les ados de 15 à 20 ans ! c'est le cas de ma fille de 19 ans : si c'est expliqué et dit sur TikTok, cela vaut mieux que l'explication de mes parents ! Agissez pour faire supprimer TikTok du réseau en France. Le ministère du numérique, il fait quoi ? Rcemment, on a vu que la grande bretagne avait apris après un attentat au couteau, qu'il fallait agir pour filtrer les achats d'armes sur le net : désormais, toutes les offres concernant des couteaux avec lames > 13cm n'éxistent plus en OK : en france, avec la même recherche, tout apparaît ! que fait le gouvernement francais ? que font les députés ?
Oui faut interdire les couteaux, ensuite les cutter, ensuite les fourchettes, ensuite les haches en magasin de bricolage, ensuite les foret de perceuse > 13cm, ensuite les clous > 13cm, ensuite les visses > 13cm, et enfin interdire l'émission Forged in Fire (le meilleur forgeron), car cette émission ultra toxique diffusé à la télé apprends aux jeunes a fabriquer de très bon couteaux hyper tranchant eux même.
Vous savez qu'on peux acheter des arbalètes de 300 livres sans problème ? Et je préfère me prendre une balle de chasseur qu'un carreaux d’arbalète. Y'a de très bon produits sur le site de hattila

interdire les couteaux réglera rien, on sait très bien quels sont les jeunes qui pose problèmes, et dans quels quartiers/lieux il y'a des problèmes.
Demain on ferais comme le président du Salvador Nayib Bukele, on embarque tous ceux de louche à Barbes, gare du nord, Stalingrad, Porte de la Chapelle, ça règle définitivement les problèmes pendant 10ans facile.
La police sait très déjà très bien qui a des couteaux ou autres joyeuseté, ou ils habitent et ou ils commettent leurs crimes. C'est juste une volonté politique de maintenir le bordel, d'ailleurs vous remarquerez que jamais ces problemes n'ont lieux dans leurs quartiers a eux (les politiciens), comme par hasard...
Ici a Singapour la police et ferme et applique la tolérance zéro, il n'y a aucun délinquant en liberté, le moindre petit crime et sévèrement puni. Il n'y a pas de trafiquant de drogue ou de meurtrier, ils ont déjà tous été condamné a mort ou a la prison a vie. La vermine ici n'existe plus et les gens honnête peuvent vivre en paix.
5  0 
Avatar de calvaire
Expert éminent https://www.developpez.com
Le 03/07/2025 à 18:51
je trouve pas la vidéo raciste mais c'est de l'humour qui m'a bien faire rigolé.
ca joue sur pleins de cliché, pas que les noirs, la grosse femme blanche américaine, les flics blanc qui tirent ou le chinois qui cuisine des chiens et les chats.

et sans parler des scènes qui n'ont tellement aucun sens mais assez bien fait avec l'ia, c'est extrêmement drôle je trouve. De l'auto dérisions et de la parodie qui me rappelle la grande époque de Top Gear et l'humour de son présentateur de génie.

Ça nous change de l'humour bien fade et pas drôle de certains humoriste et film comédie français. Qui d'ailleurs se base sur des clichés bien lessivé (l'homme blanc hétéro idiot/bête qui se fait marcher dessus par sa femme), l'homme qui se prends une gifle au cinema, jamais l'inverse, ou alors dans ce cas c'est mal, si l'homme se prends la beigne par contre c'est mérité et "drole".
10  8 
Avatar de Artaeus
Nouveau Candidat au Club https://www.developpez.com
Le 03/07/2025 à 19:22
"Raciste" ... Faudrait déjà définir ce que ça signifie et qui décide de ce qui est "raciste" ou pas ...
On voit depuis 30 ans le glissement de ce mot qui désormais sert à définir tout et n'importe quoi.
10  8 
Avatar de azurman
Nouveau Candidat au Club https://www.developpez.com
Le 10/07/2025 à 9:49
Si on constate les dérives de TIKTOK aux USA, en France c'est tout à fait dramatique l'influence de ce réseau social sur les ados de 15 à 20 ans ! c'est le cas de ma fille de 19 ans : si c'est expliqué et dit sur TikTok, cela vaut mieux que l'explication de mes parents ! Agissez pour faire supprimer TikTok du réseau en France. Le ministère du numérique, il fait quoi ? Rcemment, on a vu que la grande bretagne avait apris après un attentat au couteau, qu'il fallait agir pour filtrer les achats d'armes sur le net : désormais, toutes les offres concernant des couteaux avec lames > 13cm n'éxistent plus en OK : en france, avec la même recherche, tout apparaît ! que fait le gouvernement francais ? que font les députés ?
1  2 
Avatar de smobydick
Membre averti https://www.developpez.com
Le 04/07/2025 à 0:10
Quand bien même bytedance arriverait à filtrer, dès que la branche des usa sera rachetée, les vannes seront de nouveau ouvertes et autoriseront les contenus racistes. Car oui, les vidéos de cette compilation sont totalement racistes, il faut vraiment être fêlé pour dire le contraire et remettre en cause la définition du racisme.
Et comme d'habitude, c'est toujours les mêmes racistes qui ne voient que de l'humour et qui veulent avoir le droit de juger de ce qui relève du racisme ou pas, selon leurs propres standards de racistes bien entendu.
5  8 
Avatar de OrthodoxWindows
Membre expert https://www.developpez.com
Le 06/07/2025 à 0:54
Au delà du débat c'est raciste vs c'est de l'humour noir, il est clair que ce n'est pas des garde-fous mis en place par Google, TikTok ou d'autres entreprises qui changeront quoi que se soit à long terme.

De plus en plus, le développement de l'IA sera axé sur l'open-source, et les images et même vidéos générés par IA seront de moins en moins détectables.
Il sera indispensable de former les gens à l'IA, de réaliser de grosses campagnes de prévention, afin d'éviter de se retrouver avec des gens faisant confiance à des image/vidéos fictives qui se font passer pour vrai.

Concernant le racisme, sur le fond, je ne pense pas que l'IA générative aggravera les choses par rapport à aujourd'hui. Un raciste n'a pas besoin d'une IA pour se sentir conforter dans ses idées...
C'est surtout l'IA de fichage et de surveillance qui risque de renforcer le racisme, et qui d'ailleurs à déjà commencer à le faire.
0  5 
Avatar de fredpeaks
Nouveau Candidat au Club https://www.developpez.com
Le 06/07/2025 à 17:59
Pour celui qui demande une définition du racisme : https://fr.m.wikipedia.org/wiki/Racisme
Ici chaque extrait vidéo est clairement raciste et si vous ne voyez que du contenu absurde c’est que vous n’avez pas la référence au cliché raciste utilisé (ou que ne voulez pas la voir). Ce n’est pas parce que c’est "rigolo" qu’il faut continuer à le faire. Lancer des nains c’était sûrement très marrant. Les "experts éminents" de c news sont de passage.
1  7