Généré à partir d'invites par le réalisateur Paul Trillo, basé à Los Angeles, il a fallu plus de 55 clips individuels assemblés dans Adobe Premiere pour obtenir la production finale. Ce qui frappe, c'est l'impressionnante cohérence des personnages tout au long de la vidéo.
La vidéo a été commandée par le chanteur indépendant Ernest Green, plus connu sous le nom de Washed Out, pour son titre The Hardest Part. Trillo a déclaré sur X : « C'est une idée que j'ai eue il y a près de 10 ans et que j'ai ensuite abandonnée. J'ai enfin pu lui donner vie ».
Ce n'est pas la première vidéo musicale de Sora, mais c'est la première réalisée à partir d'une commande. Il présente également une véritable cohérence des personnages sur l'ensemble de la vidéo.
À quoi ressemble la vidéo ?
Il s'agit d'un effet de survol, vu dans d'autres vidéos de Sora par Trillo, qui suit un couple, avec quelques scènes triviales qui donnent l'impression que nous fusionnons à travers plusieurs voitures ou que nous volons contre des murs.
Il y a quelques moments où l'intelligence artificielle est manifeste, notamment un plan où l'on a l'impression que le bébé flotte, mais ils sont peu nombreux dans ce qui est un brillant exemple d'utilisation de clips d'intelligence artificielle.
Trillo a déclaré qu'il avait fallu 55 clips assemblés pour réaliser la vidéo et les détails précédents sur le fonctionnement de Sora ont révélé qu'il fallait environ 10 minutes pour que chaque clip soit généré.
Il y a eu quelques retouches dans After Effects, mais il n'y a pas eu de changements majeurs. Cela a plus ou moins fonctionné à partir des clips créés par Sora. Ce qui n'est pas clair, c'est le nombre de clips qui ont été générés pour trouver les 55 qui ont été intégrés dans la vidéo finale.
Pourquoi Sora ?
La vidéo semble raconter l'histoire d'un couple pendant les années d'école, à la naissance d'un enfant, puis au fur et à mesure qu'ils grandissent. Elle comprend des scènes dans des couloirs d'école, des salles de classe et des supermarchés.
Certains utilisateurs de X qui ont répondu à Trillo ont souligné les économies qu'il aurait pu réaliser en filmant dans un lycée ou même en réalisant les effets spéciaux pour certains des plans les plus « excentriques ».
Sora ne remplacera peut-être pas le cinéma traditionnel dans tous les domaines, mais pour la création d'un clip vidéo sur une chanson qui n'en aurait pas eu autrement en raison des coûts, cela change la donne.
Quelle est la qualité de la vidéo ?
Une des premières réactions que l'on manifeste à la vue de la vidéo est : « C'est impossible que ce soit de l'IA ». Certains moments sont clairement dus à l'IA avec des scènes qui ne correspondent pas, des voitures qui sont étirées ou des vues qui ne semblent pas correspondre à la réalité.
La cohérence des personnages est impressionnante, mais elle n'est pas parfaite. Cependant, cela montre tout ce qu'il est possible de faire lorsque les outils d'IA sont mis entre les mains de créateurs brillants.
Et vous ?
Quel est votre avis sur le sujet ?
Pensez-vous que l'utilisation de l'IA pour la création d'un clip vidéo à moindre coût soit pertinente ou judicieuse ? Selon vous, quelles pourraient-être les implications futures d'une telle pratique sur l'industrie musicale ?
Voir aussi :
Sam Altman tente de convaincre Hollywood que Sora, l'outil de génération vidéo d'OpenAI, ne détruira pas l'industrie du cinéma. Mais des critiques tentent déjà de dénoncer une forme d'hypocrisie
Sora : OpenAI lance un modèle d'IA qui serait capable de créer une vidéo avec des scènes réalistes et imaginatives à partir d'instructions textuelles, mais la durée est limitée à 60 secondes