IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)

Vous êtes nouveau sur Developpez.com ? Créez votre compte ou connectez-vous afin de pouvoir participer !

Vous devez avoir un compte Developpez.com et être connecté pour pouvoir participer aux discussions.

Vous n'avez pas encore de compte Developpez.com ? Créez-en un en quelques instants, c'est entièrement gratuit !

Si vous disposez déjà d'un compte et qu'il est bien activé, connectez-vous à l'aide du formulaire ci-dessous.

Identifiez-vous
Identifiant
Mot de passe
Mot de passe oublié ?
Créer un compte

L'inscription est gratuite et ne vous prendra que quelques instants !

Je m'inscris !

"Air Head", un court-métrage créé par le studio Shy Kids à l'aide de l'intelligence artificielle Sora d'OpenAI est disponible,
IA : menace ou atout pour l'industrie cinématographique ?

Le , par Patrick Ruiz

5PARTAGES

8  0 
Sora : OpenAI lance un modèle d'IA qui serait capable de créer une vidéo avec des scènes réalistes et imaginatives à partir d'instructions textuelles
mais la durée est limitée à 60 secondes

OpenAI a dévoilé jeudi un nouveau grand modèle de langage capable de générer des vidéos à partir de textes. Le nouvel outil d'IA, appelé Sora d'après mot japonais signifiant "ciel", est capable de générer des séquences réalistes d'une durée maximale de 60 secondes qui respectent les instructions de l'utilisateur en ce qui concerne le sujet et le style. OpenAI a ajouté que le modèle est capable de créer une vidéo à partir d'une image fixe ou d'ajouter de nouveaux éléments à des séquences existantes. Sora se place comme un nouveau rival du modèle d'IA Lumiere de Google qui est également capable de créer un contenu vidéo à partir de textes ou d'images.

Après la génération de texte et d'images, OpenAI se lance sur le marché de la génération de vidéo avec Sora. Selon le laboratoire d'IA de San Francisco, il s'agit d'une étape importante, car cela permet à l'IA de comprendre et de simuler le monde physique en mouvement. « Nous apprenons à l'IA à comprendre et à simuler le monde physique en mouvement, dans le but de former des modèles qui aident les gens à résoudre des problèmes nécessitant une interaction avec le monde réel », affirme OpenAI dans un billet de blogue. Sora intervient plus d'un an après le lancement canon de son chatbot d'IA ChatGPT (GPT-3.5).

Selon le billet de blogue d'OpenAI, Sora génère des vidéos avec un réalisme inédit et des détails précis. « Sora est capable de créer des scènes complexes avec plusieurs personnages, des types de mouvements spécifiques et des détails précis sur le sujet et l'arrière-plan. Le modèle peut comprendre comment les objets existent dans le monde physique, ainsi qu'interpréter avec précision les accessoires et générer des personnages convaincants qui expriment des émotions vibrantes », indique le billet de blogue. OpenAI a déclaré que pour l'instant, Sora ne peut générer que des séquences vidéo qui durent au plus une minute.



Une vidéo parmi plusieurs exemples présentés par OpenAI est basée sur l'invite : « une bande-annonce de film présentant les aventures d'un homme de l'espace de 30 ans portant un casque de moto en laine tricotée rouge, ciel bleu, désert de sel, style cinématographique, filmé sur pellicule 35 mm, couleurs vives ». Sora peut aussi générer une vidéo à partir d'une image fixe, ainsi que remplir les images manquantes d'une vidéo existante ou l'étendre. Les autres démonstrations d'OpenAI comprennent une scène aérienne de la Californie pendant la ruée vers l'or, une vidéo qui met en scène une chute de neige à Tokyo, etc.

Nombre d'entre elles présentent des signes révélateurs de l'IA - comme un sol qui bouge de manière suspecte dans une vidéo d'un musée - et OpenAI indique que "le modèle peut avoir du mal à simuler avec précision la physique d'une scène complexe". Cela dit, les résultats sont dans l'ensemble assez impressionnants. « Pour moi, il semble évident qu'OpenAI est en avance sur tout le monde dans tous les modèles d'IA existants : image, texte, vidéo, audio, etc. Ils n'ont tout simplement pas encore publié leurs meilleurs produits. Ils n'ont tout simplement pas encore publié leurs meilleurs produits », affirme un critique.

Selon les critiques, Sora peut révolutionner des domaines comme l'animation 3D, le cinéma, et plus encore. « La capture de mouvements fonctionne bien parce qu'il s'agit de mouvements réels, mais chaque fois que l'on essaie d'animer des humains et des animaux, même dans des films en images de synthèse à gros budget, c'est toujours manifestement faux au bout du compte. Il y a tellement de choses subtiles qui se produisent en matière d'accélération et de décélération de toutes les différentes parties d'un organisme, qu'aucun animateur n'y parvient jamais à 100 % », a fait remarquer un critique. Ce dernier ajoute :

« Aucun algorithme d'animation ne parvient à rendre les choses vraiment crédibles, mais seulement à les rendre moins mauvaises. Mais les vidéos générés par Sora semblent rendre les choses tout à fait crédibles, tant pour les humains que pour les animaux. C'est incroyable. Et bien entendu, il ne faut pas oublier qu'il s'agit d'espaces 3D tout à fait crédibles, avec une permanence de l'objet apparemment totale. Contrairement à d'autres efforts que j'ai vus et qui consistent essentiellement à animer brièvement une scène en 2D pour lui donner une vague apparence de 3D ». D'autres attendent les améliorations futures.

Sora n'est actuellement accessible qu'aux "red teamers" qui évaluent le modèle en fonction des dommages et des dangers potentiels. Les experts vont "tester" le produit, c'est-à-dire vérifier s'il est susceptible de contourner les garde-fous d'OpenAI, qui interdisent "la violence extrême, le contenu sexuel, l'imagerie haineuse, l'image d'une célébrité ou la propriété intellectuelle d'autrui". OpenAI offre également un accès à certains artistes visuels, concepteurs et cinéastes afin de recueillir leurs commentaires. L'entreprise reconnaît que le modèle d'IA actuel peut ne pas simuler correctement la physique d'une scène complexe.



Il pourrait également ne pas interpréter correctement certains cas de cause à effet. Les vidéos portent un filigrane indiquant qu'elles ont été réalisées par l'IA. Cette approche vise à empêcher les abus potentiels, comme la création de deepfakes visant à tromper les internautes ou un public cible. Au début du mois, OpenAI a ajouté des filigranes à son outil de conversion de texte en image DALL-E 3, mais précise qu'ils peuvent être facilement supprimés. À l'instar de ses autres produits d'IA, OpenAI devrait faire face aux conséquences des fausses vidéos photor...
La fin de cet article est réservée aux abonnés. Soutenez le Club Developpez.com en prenant un abonnement pour que nous puissions continuer à vous proposer des publications.

Une erreur dans cette actualité ? Signalez-nous-la !

Avatar de pierre-y
Membre chevronné https://www.developpez.com
Le 18/06/2024 à 17:50
Trop de film tue les films, j'ai pratiquement arrêté d'en regarder a cause de la baisse flagrante de qualité des films et série ainsi que du wokisme. Pas qu'avant il n'y avait pas de la merde mais ceux de qualité étaient plus mient en avant. Quand je vois star wars....
5  0 
Avatar de Aiekick
Membre extrêmement actif https://www.developpez.com
Le 17/06/2024 à 20:11
evidemment que ce sera possible et ca reduira les couts. mais qui sa interessera. une ia ne fait pas dart. c'est juste un copiste de talent..

le 7eme art dopé a l'ia ne sera plus de l'art.
2  0 
Avatar de d_d_v
Membre expérimenté https://www.developpez.com
Le 19/06/2024 à 9:33
A la place de "créativité et d’innovation", on aura surement droit à une bonne dose d'"inclusivité" et de wokisme, avec des personnages insipides et respectant les "règles" de la diversité: 30% de blancs, 30% de noirs, 20% de métisses, 10% d'asiatiques, 10% "autres". Idem pour les genres (inclure au moins deux ou trois "non-binaires", des femmes féministes avec des cheveux bleus et des piercings, etc.). Et bien entendu, aucune réplique "choquante" qui pourrait froisser les "minorités". Sans compter la promotion déguisé de l'écologisme et le réchauffisme Bref, un truc voué à l'échec.
2  0 
Avatar de melka one
Membre expérimenté https://www.developpez.com
Le 03/05/2024 à 18:40
Quel est votre avis sur le sujet ?
le mot qui me vient en tête c'est illogique il y a rien de rationnel dans le clip, que de l’étrange
1  0 
Avatar de totozor
Expert confirmé https://www.developpez.com
Le 06/05/2024 à 7:56
Citation Envoyé par Anthony Voir le message
Quel est votre avis sur le sujet ?
Pourquoi faire un clip en IA quand tu as les moyens d'en faire produire un? (Pour un petit groupe qui a peu de moyens je comprends mais lui...)
Pour ce que je penses que sa qualité, Freak on a leash de Korn (1999) partait de la même idée et a une composition plus pertinente.
Les découpages sont aléatoires et les transitions dignes de Powerpoint.
Finalement je suis rassuré que ça soit fait par une IA parce que je vois des clips amateurs mieux travaillés.
En tant qu'artiste je refuserais qu'on diffuse ça sur ma musique.
1  0 
Avatar de Jules34
Membre émérite https://www.developpez.com
Le 06/05/2024 à 9:45
Mon avis ?

Comme d'habitude on présente un truc nul comme étant de l'or en barre, histoire d'entretenir le buzz.
1  0 
Avatar de _toma_
Membre éclairé https://www.developpez.com
Le 17/06/2024 à 21:06
Bah, vu comme une partie de l'industrie cinématographique fait déjà du travail à la chaîne, ça se verra peut-être pas de trop ;-).
1  0 
Avatar de olaxius
Membre éclairé https://www.developpez.com
Le 02/12/2024 à 14:48
ps. "Cate Blanchett craint que l'IA ne soit «incroyablement destructrice» pour l'industrie du divertissement", pourquoi "ne soit" et pas soit?
Pardon je suis italienne
Il s'agit d'un "NE" explétif qui ne marque pas la négation , mais utiliser dans le langage soutenu .
1  0 
Avatar de Minato Sensei
Membre habitué https://www.developpez.com
Le 02/12/2024 à 14:57
Citation Envoyé par emilie77 Voir le message
ps. "Cate Blanchett craint que l'IA ne soit «incroyablement destructrice» pour l'industrie du divertissement", pourquoi "ne soit" et pas soit?
Pardon je suis italienne
Excellente question. En fait, le "ne" est souvent utilisé comme ne "explétif", c'est-à-dire qu'il n'exprime pas une véritable négation (et sert simplement à souligner une nuance stylistique). S'il y avait un "ne...pas", dans ce cas la phrase aurait été négative.

On peut dire par exemple :

je crains qu’il ne soit trop tard. (Facultatif, l’idée n’est pas négative.)
Elle craint qu’il ne vienne pas. (Ici, "ne" accompagne une négation réelle avec "pas".)

Ce lien expliquera peut-être mieux :

Dans un certain nombre d’emplois, par exemple dans « Pour éviter que ne soient divulgués les renseignements… », ne n’a pas de valeur proprement négative; il est dit « explétif ». Un mot explétif est un mot qui n’est pas nécessaire au sens de la phrase et dont l’usage, et non la grammaire, dicte l’emploi. Dans l’usage courant, le ne explétif est facultatif.

On trouve le ne explétif dans les subordonnées accompagnant les verbes dont le sens est : craindre, éviter, empêcher, ne pas douter. On le trouve également dans les propositions comparatives marquant l’inégalité de même qu’après les locutions conjonctives « avant que » et « à moins que ».
1  0 
Avatar de TotoParis
Membre expérimenté https://www.developpez.com
Le 19/12/2024 à 20:20
Plus on parle des dysfonctionnements des A.I. plus je trouve que ça ressemble à un gros tas d'ordures bien puantes.
Et toutes les boîtes qui peuvent licencier pour utiliser ces saloperies le font à vitesse grand V...
On verra dans un avenir proche les conséquences réelles de ce type d'escroquerie...
1  0