IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)

Vous êtes nouveau sur Developpez.com ? Créez votre compte ou connectez-vous afin de pouvoir participer !

Vous devez avoir un compte Developpez.com et être connecté pour pouvoir participer aux discussions.

Vous n'avez pas encore de compte Developpez.com ? Créez-en un en quelques instants, c'est entièrement gratuit !

Si vous disposez déjà d'un compte et qu'il est bien activé, connectez-vous à l'aide du formulaire ci-dessous.

Identifiez-vous
Identifiant
Mot de passe
Mot de passe oublié ?
Créer un compte

L'inscription est gratuite et ne vous prendra que quelques instants !

Je m'inscris !

Grok Imagine Video 1.5 Preview de xAI d'Elon Musk occupe la première place du classement « Image-to-Video » d'Arena.ai avec un score Arena de 1 473

Le , par Alex

130PARTAGES

4  0 
Grok Imagine Video 1.5 Preview de xAI d'Elon Musk occupe la première place du classement « Image-to-Video » d'Arena.ai avec un score Arena de 1 473

La société d'IA d'Elon Musk, xAI, a lancé en avant-première Grok Imagine Video 1.5, un nouveau modèle permettant de transformer une image en vidéo. Ce modèle convertit une image fixe en une courte vidéo pouvant atteindre une résolution de 720p. Selon xAI, ce modèle réduite la perte de qualité lors de l'enchaînement d'extensions vidéo et améliore la cohérence visuelle et des mouvements tout au long du clip. xAI est désormais en concurrence directe avec des fournisseurs d'IA vidéo tels que Seedance et Veo de Google. Selon Elon Musk, Grok Imagine 1.5 se place au 1er rang sur Arena.ai.

xAI Corp. est une entreprise américaine spécialisée dans l'intelligence artificielle et créée par Elon Musk et Igor Babuschkin le 12 juillet 2023. Elle est un concurrent de l'entreprise OpenAI, notamment grâce au super-ordinateur Colossus en cours d'extension à Memphis (Tennessee). Au début 2026, xAI est marqué par une début de restructuration profonde, qui a suivi la perte d'une large majorité des cofondateurs, avec une refonte annoncée par Elon Musk de l’architecture technique et de la culture d’entreprise.

La société d'IA d'Elon Musk, xAI, a lancé en avant-première Grok Imagine Video 1.5, un nouveau modèle permettant de transformer une image en vidéo. Ce modèle convertit une image fixe en une courte vidéo pouvant atteindre une résolution de 720p. Les utilisateurs décrivent les mouvements de caméra, le rythme et l'ambiance à l'aide de consignes textuelles, et le modèle anime la scène tout en conservant intacts les détails et l'éclairage de l'image d'origine, selon xAI. Plusieurs plans peuvent également être assemblés pour former des scènes plus longues qui conservent un aspect cohérent.

Le modèle est actuellement disponible en avant-première via l'API xAI et peut être configuré en quelques lignes de code seulement. xAI est désormais en concurrence directe avec des fournisseurs d'IA vidéo tels que Seedance et Veo de Google. De son côté, OpenAI a retiré son modèle vidéo Sora, invoquant des contraintes de ressources et ce qui semblait être l'absence d'un modèle économique.


Présentation de Grok Imagine Video 1.5 Preview

Grok Imagine Video 1.5 est le modèle de génération de vidéos en production actuel de xAI, qui succède à Grok Imagine Video. Il s'agit d'un outil dédié à la conversion d'images en vidéos et de texte en vidéos, totalement distinct du chatbot Grok. Les deux produits partagent une marque mais ont des objectifs différents. xAI Grok Imagine Video 1.5 génère de la vidéo et de l'audio. L'évaluer sur la base des performances de raisonnement ou de codage du chatbot Grok constitue une erreur de catégorie qu'il convient d'éviter.

Voici les spécifications techniques du modèle :

- Moteur : xAI Aurora autorégressif, entraîné sur 110 000 GPU NVIDIA GB200
- Résolution : 480p (ébauche) et 720p (sortie)
- Fréquence d'images : 24 ips
- Durée du clip : 6 à 15 secondes
- Formats d'image : 7 formats pris en charge, dont 16:9, 9:16 et 1:1
- Vitesse de génération : 5 à 30 secondes, selon la complexité
- Audio : natif, généré en même temps que la vidéo

Parmi les changements apportés par la version 1.5 par rapport à la version 1.0, on peut cité des dialogues, des sons ambiants et une musique de fond plus naturels. Selon xAI, ce modèle réduite la perte de qualité lors de l'enchaînement d'extensions vidéo et améliore la cohérence visuelle et des mouvements tout au long du clip. Pour une comparaison plus large de la place de ce modèle par rapport à d'autres options, les mesures de performance fournissent un contexte utile. Selon Elon Musk, Grok Imagine 1.5 se place au 1er rang sur Arena.ai.




Principales fonctionnalités de Grok Imagine Video 1.5

Selon xAI, Grok Imagine Video 1.5 couvre six workflows principaux. Chacun répond à un besoin de production différent.

- Image-vers-vidéo : Le mode principal et le plus performant du modèle. Téléchargez une image fixe, décrivez le mouvement, et le modèle l'anime tout en préservant la composition, l'identité du sujet et le style visuel de la source. L'image d'entrée sert de première image plutôt que de simple référence.

- Texte vers vidéo : Construit une scène à partir d'une consigne écrite sans image de référence. Plus génératif et moins contrôlé que le mode image vers vidéo. Fonctionne mieux sur des scènes courtes, clairement décrites et comportant une action définie.

- Extension vidéo (Extension à partir d'une image) : Sélectionnez l'image finale d'un clip généré et demandez au modèle de continuer à partir de ce point précis. La continuité du mouvement, le positionnement des personnages et les conditions d'éclairage sont préservés au niveau de la jonction. Enchaîner plusieurs extensions permet aux créateurs de construire des séquences plus longues dans la limite de durée par clip.

- Montage vidéo basé sur des instructions : Décrivez une modification à apporter à un clip existant, et le modèle l'applique tout en préservant tout ce que vous n'avez pas spécifié. Le modèle linguistique de base traite naturellement les instructions de modification descriptives sans nécessiter d'ajustements de paramètres.

- Référence à la vidéo : Utilise une image d'entrée spécifiquement pour assurer la cohérence du sujet ou du style dans une nouvelle scène, plutôt que d'animer la composition elle-même. Utile pour maintenir l'apparence des personnages ou l'esthétique visuelle sur plusieurs clips.

- Génération audio native : Produit des dialogues synchronisés, des sons ambiants, des effets sonores et de la musique de fond lors du même passage de génération que la vidéo. Aucun outil audio séparé ni étape d'alignement n'est nécessaire.

Cette annonce intervient alors que le chatbot IA Grok d'Elon Musk avait suscité la controverse et la critique en début d'année pour une fonctionnalité permettant de dévêtir les utilisateurs de X (ex-Twitter) sans leur consentement. Pourtant Elon Musk avait déclaré en 2019 que « l’IA est plus dangereuse que les ogives nucléaires » et il devrait exister un organisme de réglementation supervisant le développement de cette technologie. « Je ne suis pas normalement un partisan de la réglementation et de la surveillance - je pense qu’on devrait généralement pécher par excès de minimisation de ces choses-là, mais il s’agit d’une situation où le public court un très grave danger », avait prévenu Musk. La question est : est-ce que Musk suit ces paroles pour son propre modèle ?


Voici l'annonce de xAI :

Grok Imagine 1.5 Preview

Notre tout dernier modèle de conversion d'images en vidéo, grok-imagine-video-1.5-preview, est désormais disponible en avant-première via l'API xAI.

grok-imagine-video-1.5-preview transforme une simple image fixe en une vidéo fluide et cinématographique. Donnez-lui une image de départ et une instruction décrivant le mouvement, et il animera la scène, y compris les mouvements de caméra, l'ambiance et la physique, tout en restant fidèle à votre image source. Vous pouvez générer des clips jusqu'à 720p.

Réalisez le plan à l'aide de consignes en langage naturel. Décrivez le mouvement de caméra, le rythme et la conception sonore, puis définissez la résolution et la durée du clip. Le modèle conserve les détails et l'éclairage de l'image d'entrée, de sorte que le résultat prolonge l'image d'origine plutôt que de la réinterpréter.

Le modèle fonctionne également bien pour les séquences. Mettez en scène chaque image, animez-la, puis enchaînez les plans pour former des scènes plus longues qui conservent un aspect cohérent tout au long du projet.


Animez une image en quelques lignes de code.

Code : Sélectionner tout
1
2
3
4
5
6
7
8
9
10
11
12
13
14
import os
import xai_sdk

client = xai_sdk.Client(api_key=os.getenv("XAI_API_KEY"))

response = client.video.generate(
    prompt="Slow cinematic push-in as embers drift across the battlefield and the helmet's crest stirs in the wind",
    model="grok-imagine-video-1.5-preview",
    image_url="https://your-host.com/helmet.jpg",
    duration=10,
    resolution="720p",
)

print(response.url)


Source : Annonce de Grok Imagine Video 1.5 Preview

Et vous ?

Pensez-vous que cette annonce est crédible ou pertinente ?
Quel est votre avis sur le sujet ?

Voir aussi :

L'IA Grok d'Elon Musk déshabille tout le monde, des mineurs aux dirigeants mondiaux sans leur consentement, et il ne semble pas possible d'y échapper. Des ministres français ont signalé l'affaire à l'Arcom

Google lance le modèle vidéo Veo 3.1 avec des améliorations en termes de réalisme et de fidélité, un son natif amélioré et des effets sonores synchronisés, et une nouvelle fonctionnalité d'extension de scène

Échec de Sora : OpenAI a débranché son IA face à une demande en puissance de calcul insoutenable et un coût journalier d'environ 15 millions de dollars à son pic,
Ainsi que des revenus quasi inexistants
Vous avez lu gratuitement 21 720 articles depuis plus d'un an.
Soutenez le club developpez.com en souscrivant un abonnement pour que nous puissions continuer à vous proposer des publications.

Une erreur dans cette actualité ? Signalez-nous-la !