OpenAI met en avant les faiblesses actuelles de son modèle d’intelligence artificielle de génération de vidéos à partir d’instructions textuelles

Sora est un modèle d’intelligence artificielle qui permet de créer des vidéos avec des scènes réalistes et imaginatives à partir d’instructions textuelles. Le réalisateur Tyler Perry en dresse un éventail des capacités lorsqu’il déclare : « Je n'aurais plus à me déplacer. Si je voulais être dans la neige au Colorado, c'est du texte équivalent que je fournis. Si je voulais écrire une scène sur la lune, c'est du texte, et cette intelligence artificielle peut le générer en un rien de temps. Si je voulais avoir deux personnes dans le salon dans les montagnes, je n'aurais pas besoin de construire un décor dans les montagnes, je n'aurais pas besoin d'installer un décor sur mon terrain. Je peux m'asseoir dans un bureau et faire cela avec un ordinateur. » Illustration avec une série de courts-métrages dont celui intitulé "Air Head", créé par le studio Shy Kids.« Sora est le plus puissant lorsqu'il ne s'agit pas de reproduire l'ancien, mais de donner vie à des idées nouvelles et impossibles que nous n'aurions jamais eu l'occasion de voir autrement », indique OpenAI.« Même si Sora est très doué pour créer des objets qui semblent réels, ce qui nous enthousiasme, c'est sa capacité à créer des objets totalement surréalistes », souligne le studio Shy Kids.Avant la disponibilité d’outils comme Sora, il fallait 5 ans à 500 artistes pour réaliser un film d’animation de classe mondiale. Le fondateur de Dreamworks est d’avis qu’il ne faudra même pas 10 % de ce temps pour obtenir le même résultat avec un outil comme Sora à disposition. L’implication immédiate est celle d’une mise au rebut d’une grande partie des travailleurs humains de la filière. C’est d’ailleurs ce que confirme Tyler Perry lorsqu’il déclare : « je m'inquiète beaucoup pour tous les gens qui travaillent dans ce secteur. En regardant cela, j'ai immédiatement commencé à penser à tous les acteurs de l'industrie qui seraient concernés, y compris les acteurs, les machinistes, les électriciens, les transporteurs, les preneurs de son et les monteurs. » Tyler Perry a suspendu l'expansion de son studio de 800 millions de dollars après avoir vu Sora d'OpenAI à l’œuvre.« Le modèle actuel présente des faiblesses », a déclaré OpenAI dans un billet de blog. « Il peut avoir du mal à simuler avec précision la physique d'une scène complexe et peut ne pas comprendre des cas spécifiques de cause à effet. Par exemple, une personne peut prendre une bouchée d'un biscuit, mais après, le biscuit peut ne pas avoir de trace de morsure ».Le modèle a également des difficultés avec les détails spatiaux (par exemple, distinguer la gauche de la droite) et n'est pas très à l'aise avec les descriptions qui décrivent des changements dans le temps.Par conséquent, Sora est proposé aux "red teamers" qui continuent à tester le modèle pour déterminer s'il est nuisible, ainsi qu'à divers artistes visuels afin d'obtenir un retour d'information sur la manière dont le modèle pourrait être utile dans le cadre de leur travail.Selon OpenAI, une fois Sora intégré dans un produit public, « notre classificateur de texte vérifiera et rejettera les invites de saisie de texte qui sont en violation de nos politiques d'utilisation, comme celles qui demandent une violence extrême, un contenu sexuel, une imagerie haineuse, l'image d'une célébrité ou la propriété intellectuelle d'autrui ».Certaines critiques ont déjà été formulées.Un internaute explique par exemple : « la capture de mouvements fonctionne bien parce qu'il s'agit de mouvements réels, mais chaque fois que l'on essaie d'animer des humains et des animaux, même dans des films en images de synthèse à gros budget, c'est toujours manifestement faux au bout du compte. Il y a tellement de choses subtiles qui se produisent en matière d'accélération et de décélération de toutes les différentes parties d'un organisme, qu'aucun animateur n'y parvient jamais à 100 % ».Et de continuer en disant : « Aucun algorithme d'animation ne parvient à rendre les choses vraiment crédibles, mais seulement à les rendre moins mauvaises. Mais les vidéos générés par Sora semblent rendre les choses tout à fait crédibles, tant pour les humains que pour les animaux. C'est incroyable. Et bien entendu, il ne faut pas oublier qu'il s'agit d'espaces 3D tout à fait crédibles, avec une permanence de l'objet apparemment totale. Contrairement à d'autres efforts que j'ai vus et qui consistent essentiellement à animer brièvement une scène en 2D pour lui donner une vague apparence de 3D ». D'autres attendent les améliorations futures ».C’est la raison pour laquelle certains internautes sont d’avis que Sora ne remplacera pas les humains.Néanmoins, les évolutions en cours dans la filière laissent penser que la mise au rebut des travailleurs humains ira croissant avec le temps.Que pensez-vous de l’utilisation de l’IA par les studios dans leurs projets cinématographiques ?Quels sont les avantages et les inconvénients de Sora, le modèle d’OpenAI qui permet de créer des vidéos à partir de textes ?Comment l’industrie du cinéma peut-elle s’adapter à l’émergence de l’IA et protéger les emplois et les droits des créateurs ?Avez-vous déjà vu ou utilisé Sora ou une autre technologie d’IA similaire ? Si oui, quelle a été votre expérience ?Quel impact potentiel pourrait avoir l’IA dans le domaine de l’art et de la culture ?