La semaine dernière, OpenAI a dévoilé Sora, un modèle de conversion de texte en vidéo. À partir d'un texte, il crée une courte vidéo, d'une durée maximale d'une minute. Selon l'entreprise, Sora peut générer des scènes complexes avec plusieurs personnages qui se déplacent et interagissent avec le monde dépeint de manière cohérente. Elle précise que le modèle peut comprendre comment les objets existent dans le monde physique, ainsi qu'interpréter avec précision les accessoires et générer des personnages convaincants qui expriment des émotions vibrantes. Le super laboratoire a tweeté des exemples de sa production.
[TWITTER]<blockquote class="twitter-tweet"><p lang="en" dir="ltr">Introducing Sora, our text-to-video model.<br><br>Sora can create videos of up to 60 seconds featuring highly detailed scenes, complex camera motion, and multiple characters with vibrant emotions. <a href="https://t.co/7j2JN27M3W">https://t.co/7j2JN27M3W</a><br><br>Prompt: “Beautiful, snowy… <a href="https://t.co/ruTEWn87vf">pic.twitter.com/ruTEWn87vf</a></p>— OpenAI (@OpenAI) <a href="https://twitter.com/OpenAI/status/1758192957386342435?ref_src=twsrc%5Etfw">February 15, 2024</a></blockquote> <script async src="https://platform.twitter.com/widgets.js" charset="utf-8"></script> [/TWITTER]
Une présentation qui fait déjà réfléchir : un réalisateur envisage de revoir un de ses investissements
En tant que chef d'entreprise, Perry voit l'opportunité de ces développements, mais en tant qu'employeur, acteur et cinéaste, il souhaite également tirer la sonnette d'alarme. Lors d'une interview réalisée entre deux tournages, Perry a expliqué ses inquiétudes quant à l'impact de la technologie sur le travail et a expliqué pourquoi il souhaite que l'industrie s'unisse pour s'attaquer à l'IA : « Il doit y avoir une sorte de réglementation afin de nous protéger. Sinon, je ne vois pas comment nous pourrons survivre ».
Perry a reconnu que Sora était un « changement de jeu majeur » qui pourrait permettre aux cinéastes de produire des films et des pilotes à une fraction du coût, mais il s’est dit également très inquiet de l’impact de la technologie sur l’emploi et l’industrie. « Je suis très, très préoccupé par le fait que dans un avenir proche, beaucoup d’emplois vont être perdus », a-t-il affirmé, appelant à une régulation et à une concertation pour protéger les acteurs, les techniciens, les monteurs et tous les métiers du cinéma.
Perry a avoué qu’il avait déjà utilisé l’IA dans deux projets récents qui seront annoncés prochainement : « Cela m’a évité de passer des heures en maquillage. En post-production et sur le plateau, j’ai pu utiliser cette technologie d’IA pour éviter d’avoir à subir des heures de vieillissement ». Le créateur de Madea a précisé que, « comme tous les autres studios de la ville », il essayait « de tout comprendre ». « J’ai l’impression que tout le monde dans l’industrie court à cent à l’heure pour essayer de rattraper le retard, pour essayer de mettre en place des garde-fous et des ceintures de sécurité pour maintenir les moyens de subsistance à flot », a-t-il conclu.
Ci-dessous, un extrait de son interview.
Après avoir vu Sora, que pensez-vous de la rapidité avec laquelle la technologie de l'IA évolue et de l'impact qu'elle pourrait avoir sur le divertissement à court terme ?
J'ai suivi l'IA de très près et j'ai observé les progrès de très près. J'étais en train de planifier, depuis quatre ans, une expansion de 800 millions de dollars au studio, ce qui aurait permis d'augmenter considérablement le backlot et d'ajouter 12 scènes sonores supplémentaires. Tout cela est actuellement et indéfiniment suspendu à cause de Sora et de ce que je vois. J'ai eu vent de son arrivée l'année dernière, mais je n'en avais aucune idée jusqu'à ce que j'assiste récemment aux démonstrations de ce qu'il est capable de faire. Je suis choqué.
Qu'est-ce qui vous a particulièrement choqué dans ses capacités ?
Je n'aurais plus à me déplacer. Si je voulais être dans la neige au Colorado, c'est du texte. Si je voulais écrire une scène sur la lune, c'est du texte, et cette IA peut le générer en un rien de temps. Si je voulais avoir deux personnes dans le salon dans les montagnes, je n'aurais pas besoin de construire un décor dans les montagnes, je n'aurais pas besoin d'installer un décor sur mon terrain. Je peux m'asseoir dans un bureau et faire cela avec un ordinateur, ce qui me choque.
Je m'inquiète beaucoup pour tous les gens qui travaillent dans ce secteur. En regardant cela, j'ai immédiatement commencé à penser à tous les acteurs de l'industrie qui seraient concernés, y compris les acteurs, les machinistes, les électriciens, les transporteurs, les preneurs de son et les monteurs.
Utilisez-vous actuellement l'IA dans l'une ou l'autre de vos productions et/ou prévoyez-vous de le faire dans un avenir proche ?
Je viens d'utiliser l'IA dans deux films qui seront bientôt annoncés. Cela m'a empêché de me maquiller pendant des heures. En post-production et sur le plateau, j'ai pu utiliser cette technologie d'IA pour éviter d'avoir à passer des heures à me maquiller.
En tant que propriétaire de studio, ressentez-vous une quelconque pression pour utiliser l'IA à ce stade ?
Non. Je ne ressens absolument aucune pression pour l'utiliser, mais j'étudie les avantages et ce qu'elle apporte à la table. Cependant, je peux me concentrer sur les résultats de mon studio, qui continue à se porter extrêmement bien, et éviter la conversation, ou nous pouvons nous lancer et avoir la conversation de front pour nous assurer que nous protégeons toutes les personnes qui vont arriver. J'ai donc deux points de vue sur la question. En ce qui me concerne, je pense à mon entreprise et à ses résultats, mais je me préoccupe aussi beaucoup de toutes les personnes que j'ai formées et que j'ai conduit dans ce secteur. Je m'inquiète de ce qui va leur arriver.
Comment pensez-vous que cette convergence entre le développement rapide de l'IA et la contraction actuelle du secteur va évoluer ?
Je pense que cela va changer la donne, car si vous pouvez dépenser une fraction du coût d'un projet pilote qui aurait coûté 15, 20 ou même 35 millions de dollars pour HBO, il va de soi que ces entreprises opteront pour des coûts moindres. Je suis donc très, très préoccupée par le fait que, dans un avenir proche, de nombreux emplois vont être perdus. Je le pense vraiment, vraiment très fort.
OpenAI reconnaît les limites de son outil, qui va sans doute évoluer avec le temps
« Le modèle actuel présente des faiblesses », a déclaré OpenAI dans un billet de blog. « Il peut avoir du mal à simuler avec précision la physique d'une scène complexe et peut ne pas comprendre des cas spécifiques de cause à effet. Par exemple, une personne peut prendre une bouchée d'un biscuit, mais après, le biscuit peut ne pas avoir de trace de morsure ».
Le modèle a également des difficultés avec les détails spatiaux (par exemple, distinguer la gauche de la droite) et n'est pas très à l'aise avec les descriptions qui décrivent des changements dans le temps.
Par conséquent, Sora est proposé aux "red teamers" qui testeront le modèle pour déterminer s'il est nuisible, ainsi qu'à divers artistes visuels afin d'obtenir un retour d'information sur la manière dont le modèle pourrait être utile dans le cadre de leur travail.
Selon OpenAI, une fois Sora intégré dans un produit public, « notre classificateur de texte vérifiera et rejettera les invites de saisie de texte qui sont en violation de nos politiques d'utilisation, comme celles qui demandent une violence extrême, un contenu sexuel, une imagerie haineuse, l'image d'une célébrité ou la propriété intellectuelle d'autrui ».
Pour Jeffrey Katzenberg, le fondateur de DreamWorks, l'intelligence artificielle générative réduira le coût des films d'animation de 90 %, la technologie étant appelée à perturber gravement le secteur des médias et du divertissement :
« Si l'on se place dans une perspective historique, on constate que nous sommes passés d'un stylo, d'un pinceau, d'une presse d'imprimerie, d'un appareil photo, d'une caméra de cinéma ; ce sont des choses qui ont élargi la créativité et toutes sortes de récits de manière extraordinaire, et nous avons vu comment cela a continué à évoluer », a déclaré Katzenberg. « L'évolution a été fulgurante au cours des dix dernières années. Je pense que si l'on considère l'impact qu'a eu l'introduction de la technologie numérique sur les médias au cours des dix dernières années, ce qui se passera dans les dix prochaines années sera dix fois plus important, littéralement, par un facteur supérieur ».
Certaines critiques ont déjà été formulées.
Un internaute explique par exemple : « la capture de mouvements fonctionne bien parce qu'il s'agit de mouvements réels, mais chaque fois que l'on essaie d'animer des humains et des animaux, même dans des films en images de synthèse à gros budget, c'est toujours manifestement faux au bout du compte. Il y a tellement de choses subtiles qui se produisent en matière d'accélération et de décélération de toutes les différentes parties d'un organisme, qu'aucun animateur n'y parvient jamais à 100 % ».
Et de continuer en disant : « Aucun algorithme d'animation ne parvient à rendre les choses vraiment crédibles, mais seulement à les rendre moins mauvaises. Mais les vidéos générés par Sora semblent rendre les choses tout à fait crédibles, tant pour les humains que pour les animaux. C'est incroyable. Et bien entendu, il ne faut pas oublier qu'il s'agit d'espaces 3D tout à fait crédibles, avec une permanence de l'objet apparemment totale. Contrairement à d'autres efforts que j'ai vus et qui consistent essentiellement à animer brièvement une scène en 2D pour lui donner une vague apparence de 3D ». D'autres attendent les améliorations futures ».
L'IA générative, une menace pour l'industrie cinématographique ?
En août 2023, la grève des scénaristes et des acteurs d’Hollywood, qui durait déjà depuis plus de 100 jours, a mis en lumière un enjeu majeur pour l’industrie du divertissement : l’impact de l’intelligence artificielle générative sur la création de contenu.
« Les entreprises des secteurs du divertissement, de la technologie et des produits de consommation sont à l'avant-garde des plans visant à augmenter les dépenses génératives en IA », a déclaré Lucidworks, une société de recherche et d'analyse qui a commandé le rapport.
96 % des cadres impliqués dans les décisions en matière d'IA accordent la priorité aux investissements génératifs en IA, ce qui signifie que la plupart des entreprises dans le monde investissent. La Chine arrive en tête avec 100 % des entreprises déclarant investir dans l'IA générative, tandis que 94 % des entreprises britanniques et 95 % des entreprises françaises disent la même chose. 98 % des entreprises indiennes investissent également des ressources dans l'IA générative, tandis que 92 % des entreprises américaines affirment qu'elles le font également.
(Ces données sont basées sur ce que Lucidworks dit être la plus grande étude mondiale sur l'IA générative dans les entreprises, impliquant 6 000 répondants à l'enquête dans des entreprises de plus de 100 employés qui sont impliquées dans les décisions sur les investissements en IA.)
« L'IA générative impose des changements massifs au commerce mondial, présentant des opportunités et des défis sans précédent, et à une vitesse vertigineuse », indique le rapport Lucidworks. « Cette nouvelle technologie peut générer du contenu, des images et même des environnements virtuels entiers de manière autonome, perturbant ainsi diverses industries ».
Ce changement massif à une vitesse vertigineuse, bien sûr, est ce qui inquiète la plupart des gens. L'intelligence artificielle s'améliore si rapidement, y compris la génération vidéo complète à partir d'invites textuelles, qu'un film complet pourrait être généré à partir d'invites en quelques années seulement.
Un auteur a prédit que 90% du contenu hollywoodien pourrait être au moins en partie généré par l'IA d'ici 2025.
Sur la base des investissements que font les médias et les sociétés de divertissement, cela pourrait être possible. Selon le rapport, les entreprises de produits de consommation, les entreprises technologiques et les entreprises de construction et immobilières investissent à des niveaux similaires.
Source : HR
Et vous ?
Que pensez-vous de l’utilisation de l’IA par Tyler Perry dans ses projets cinématographiques ?
Quels sont les avantages et les inconvénients de Sora, le modèle d’OpenAI qui permet de créer des vidéos à partir de textes ?
Comment l’industrie du cinéma peut-elle s’adapter à l’émergence de l’IA et protéger les emplois et les droits des créateurs ?
Avez-vous déjà vu ou utilisé Sora ou une autre technologie d’IA similaire ? Si oui, quelle a été votre expérience ?
Quel impact potentiel pourrait avoir l’IA dans le domaine de l’art et de la culture ?