
La nouvelle génération du générateur vidéo d'OpenAI est arrivée. Sora 2, le dernier modèle de génération vidéo et audio de l'entreprise, présente des capacités vidéo photoréalistes améliorées, et une nouvelle application Sora est présentée comme une plateforme sociale permettant aux utilisateurs de partager, de remixer et de découvrir des vidéos générées par l'IA. S'appuyant sur la technologie précédente de génération d'images par l'IA, Sora 2 permet aux utilisateurs de créer des « caméos », ou des apparitions d'invités, d'eux-mêmes et d'autres personnes dans des vidéos. L'application Sora, alimentée par Sora 2, est désormais disponible au téléchargement sur les systèmes iOS, mais l'accès au service reste limité aux invitations.
Depuis quelques mois, une nouvelle vague de contenus inonde les réseaux sociaux : les vidéos générées par intelligence artificielle, étranges, absurdes, parfois dérangeantes, mais irrésistiblement virales. Ce phénomène a été baptisé "AI slop", littéralement la « bouillie numérique produite par IA ». Le terme n’est pas anodin : il reflète une perception de contenu industriel, bâclé, produit à la chaîne, qui n’a pas de valeur artistique intrinsèque mais qui exploite les failles des algorithmes de recommandation pour générer du clic… et de l’argent.
Pour les professionnels du numérique, ce raz-de-marée est révélateur : il illustre à la fois la puissance des outils IA grand public, la fragilité des plateformes face à la manipulation algorithmique, et la mutation du business model de la création en ligne. C'est dans ce contexte que la nouvelle génération du générateur vidéo d'OpenAI est arrivée. Sora 2, le dernier modèle de génération vidéo et audio de l'entreprise, présente des capacités vidéo photoréalistes améliorées, et une nouvelle application Sora est présentée comme une plateforme sociale permettant aux utilisateurs de partager, de remixer et de découvrir des vidéos générées par l'IA.
Lancé en février 2024, Sora est un modèle texte-vidéo développé par OpenAI. Grâce à des modèles d'IA de pointe, cette IA peut générer des vidéos de haute qualité, fluides, cohérentes, réalistes et immersives, basées sur de courtes invites descriptives, ainsi que prolonger les vidéos existantes vers l'avant ou vers l'arrière dans le temps. Sora peut générer des vidéos avec une résolution allant jusqu'à 1920 x 1080 et jusqu'à 1080 x 1920.
Présenté lors d'un livestream, Sora 2 est le dernier né d'une vague d'outils d'IA générative multimédia permettant aux utilisateurs de créer des images, des vidéos et des sons de plus en plus réalistes. S'appuyant sur la technologie précédente de génération d'images par l'IA, Sora 2 permet aux utilisateurs de créer des « caméos », ou des apparitions d'invités, d'eux-mêmes et d'autres personnes dans des vidéos. Cette fonction exige des utilisateurs qu'ils fassent un enregistrement vidéo et audio unique d'eux-mêmes pour vérifier leur identité.
À l'instar de nombreuses plateformes de médias sociaux existantes, l'application Sora proposera un flux algorithmique affichant des vidéos adaptées aux intérêts des utilisateurs, en fonction des personnes avec lesquelles ils interagissent et des sujets qu'ils sont susceptibles d'aborder. Le flux comprendra un système de « classement orientable » permettant aux utilisateurs de personnaliser davantage ce qu'ils veulent voir, selon les détails publiés par OpenAI.
Sora 2 s'appuie sur le modèle original de Sora publié en février 2024. Alors que la version initiale de Sora peinait parfois à représenter des mouvements réalistes, comme un ballon de basket rebondissant sur un panneau arrière, OpenAI a déclaré que Sora 2 « obéit mieux aux lois de la physique ». Les démonstrations présentées sur le site web d'OpenAI montrent des plans d'action photoréalistes de cascades telles que des culbutes de gymnastique et des figures de skateboard, bien qu'un clip d'un artiste martial se produisant dans un étang de carpes koï montre un bâton qui ne semble pas tenir sa forme.
Sora 2 semble également capable de générer de la parole, ce que la version précédente de Sora était incapable de faire par elle-même. « Le modèle est loin d'être parfait et comporte de nombreuses erreurs, mais il valide le fait que l'augmentation de la taille des réseaux neuronaux sur les données vidéo nous rapprochera de la simulation de la réalité », a écrit OpenAI dans son communiqué. Gabriel Petersson, chercheur à l'OpenAI, a présenté les capacités de camouflage du modèle en publiant sur X une vidéo dans laquelle on le voit chevaucher un dragon, plonger d'un cargo et courir dans les bureaux d'OpenAI avec le PDG Sam Altman.
L'application Sora, alimentée par Sora 2, est désormais disponible au téléchargement sur les systèmes iOS, mais l'accès au service reste limité aux invitations. Les utilisateurs peuvent demander l'accès par l'intermédiaire de l'application. OpenAI a indiqué qu'elle pourrait déployer lentement l'accès à travers les États-Unis et le Canada, en donnant dans un premier temps aux utilisateurs des « limites généreuses » pour la création de vidéos.
Les systèmes d'IA tels que Sora 2 requièrent une puissance de calcul considérable, de sorte que les entreprises doivent souvent limiter l'accès des utilisateurs afin de garantir que les services restent accessibles à d'autres. « En toute transparence, notre seul projet actuel est de donner aux utilisateurs la possibilité de payer une certaine somme pour générer une vidéo supplémentaire si la demande est trop importante par rapport à la puissance de calcul disponible », a écrit OpenAI dans son annonce de lancement, en faisant référence à la puissance de calcul limitée.
OpenAI a également reconnu les inquiétudes concernant les risques potentiels de l'application, en publiant un article de blog distinct sur la sécurité en même temps que l'annonce générale. Toutes les vidéos générées par Sora comprendront un filigrane, ainsi que des métadonnées standard, afin de préciser qu'elles ont été créées par l'IA, a écrit l'entreprise. Elle ajoute que les images des utilisateurs ne peuvent être transformées en caméos qu'avec leur consentement, qui peut être révoqué à tout moment. Les comptes d'adolescents sur Sora seront également soumis à des contrôles parentaux et à des limites de temps pour l'utilisation de l'application.
« Lors de la création, les garde-fous cherchent à bloquer les contenus dangereux avant qu'ils ne soient produits - y compris les contenus sexuels, la propagande terroriste et la promotion de l'automutilation - en vérifiant à la fois les invites et les sorties à travers de multiples images vidéo et transcriptions audio », a écrit OpenAI dans son billet. Pour se prémunir contre les risques potentiels, OpenAI a indiqué qu'elle renforçait également son équipe de modérateurs humains chargés d'examiner le contenu en cas d'intimidation.
OpenAI considère Sora 2 comme une étape importante vers des systèmes d'IA plus puissants. « Les modèles vidéo deviennent très bons, très rapidement », a déclaré OpenAI dans son communiqué de presse. « Les simulateurs de monde à usage général et les agents robotiques vont fondamentalement remodeler la société et accélérer l'arc du progrès humain. »
En 2024, lorsque Sora est sorti, Sam Altman s'est efforcé de convaincre Hollywood que l’outil de génération vidéo avant-gardiste de la société n’entraînera pas la fin de la production cinématographique traditionnelle, mais plutôt son amélioration. OpenAI avait même lancé une offensive de charme à Hollywood, en organisant des réunions avec les principaux studios, notamment Paramount, Universal et Warner Bros Discovery, afin de présenter sa technologie de génération vidéo Sora et de dissiper les craintes que le modèle d'intelligence artificielle ne nuise à l'industrie cinématographique.
Voici un extrait de l'annonce :
Déploiement de Sora 2
Sur le chemin des systèmes de simulation et d'intelligence artificielle polyvalents qui peuvent fonctionner dans le monde physique, nous pensons que les gens peuvent s'amuser avec les modèles que nous construisons en cours de route.
L'équipe Sora a commencé à jouer avec cette fonctionnalité « téléchargez vous-même » il y a plusieurs mois, et nous nous sommes tous amusés comme des fous. Cela ressemblait à une évolution naturelle de la communication - des messages textuels aux emojis, en passant par les notes vocales.
Aujourd'hui, nous lançons donc une nouvelle application sociale iOS appelée « Sora », alimentée par Sora 2. Dans l'application, vous pouvez créer, remixer les générations des autres, découvrir de nouvelles vidéos dans un flux Sora personnalisable, et vous introduire, vous ou vos amis, par le biais de caméos. Avec les caméos, vous pouvez vous glisser directement dans n'importe quelle scène de Sora avec une fidélité remarquable après un court enregistrement vidéo et audio unique dans l'application pour vérifier votre identité et capturer votre ressemblance.
La semaine dernière, nous avons lancé l'application en interne pour l'ensemble de l'OpenAI. Nos collègues nous ont déjà dit qu'ils se faisaient de nouveaux amis au sein de l'entreprise grâce à cette fonctionnalité. Nous pensons qu'une application sociale construite autour de cette fonction « cameos » est la meilleure façon de découvrir la magie de Sora 2.
Sur le chemin des systèmes de simulation et d'intelligence artificielle polyvalents qui peuvent fonctionner dans le monde physique, nous pensons que les gens peuvent s'amuser avec les modèles que nous construisons en cours de route.
L'équipe Sora a commencé à jouer avec cette fonctionnalité « téléchargez vous-même » il y a plusieurs mois, et nous nous sommes tous amusés comme des fous. Cela ressemblait à une évolution naturelle de la communication - des messages textuels aux emojis, en passant par les notes vocales.
Aujourd'hui, nous lançons donc une nouvelle application sociale iOS appelée « Sora », alimentée par Sora 2. Dans l'application, vous pouvez créer, remixer les générations des autres, découvrir de nouvelles vidéos dans un flux Sora personnalisable, et vous introduire, vous ou vos amis, par le biais de caméos. Avec les caméos, vous pouvez vous glisser directement dans n'importe quelle scène de Sora avec une fidélité remarquable après un court enregistrement vidéo et audio unique dans l'application pour vérifier votre identité et capturer votre ressemblance.
La semaine dernière, nous avons lancé l'application en interne pour l'ensemble de l'OpenAI. Nos collègues nous ont déjà dit qu'ils se faisaient de nouveaux amis au sein de l'entreprise grâce à cette fonctionnalité. Nous pensons qu'une application sociale construite autour de cette fonction « cameos » est la meilleure façon de découvrir la magie de Sora 2.


Voir aussi :




Vous avez lu gratuitement 356 articles depuis plus d'un an.
Soutenez le club developpez.com en souscrivant un abonnement pour que nous puissions continuer à vous proposer des publications.
Soutenez le club developpez.com en souscrivant un abonnement pour que nous puissions continuer à vous proposer des publications.