Alors que l’euphorie autour de l’intelligence artificielle semble sans limite, les dépenses d’OpenAI pour sa technologie vidéo Sora atteindraient des sommets vertigineux. Selon une enquête, l’entreprise pourrait brûler jusqu’à 15 millions de dollars… par jour. Des chiffres dignes d’une superproduction hollywoodienne pour un outil encore en phase de test, et dont l’utilité réelle reste à prouver. Entre fascination technologique et dérive budgétaire, l’affaire soulève une question brûlante : OpenAI dépense-t-elle des fortunes pour des vidéos futiles au détriment de la raison ?Pour une entreprise qui dépense plus de deux fois ce qu'elle gagne, OpenAI déploie avec enthousiasme de nouvelles façons ingénieusement imprudentes d'accumuler des pertes. Évaluée à environ 500 milliards de dollars, la géante de l'IA a annoncé jeudi un chiffre d'affaires annuel récurrent de 20 milliards de dollars. Tout cela est très bien, jusqu'à ce que l'on se souvienne qu'elle a perdu plus de 12 milliards de dollars au dernier trimestre.
Le 30 septembre, OpenAI a lancé son application de création vidéo Sora pour la plateforme iOS d'Apple, qui a enregistré un million de téléchargements en une semaine malgré un lancement sur invitation uniquement, inspirant une vague de couverture médiatique élogieuse et une avalanche de vidéos fantastiques sur la sécurité Ring, de célébrités (décédées uniquement) pétant gratuitement et de publicités vraiment dérangeantes pour des chaînes de téléachat. À Halloween, l'application avait été téléchargée 4 millions de fois, selon AppFigures, et produisait chaque jour des millions de vidéos de 10 secondes générées par l'IA.
Alors, combien d'argent OpenAI investit-il dans cette avalanche de vidéos stupides ? Plus de 5 milliards de dollars par an, soit environ 15 millions de dollars par jour, selon les estimations de Forbes et les conversations avec des experts. Lorsque Bill Peebles, responsable de Sora chez OpenAI, a déclaré le 30 octobre que « la situation économique est actuellement totalement insoutenable », il avait tout à fait raison.
Ces chiffres méritent quelques explications et s'accompagnent d'une poignée de mises en garde. OpenAI a refusé de communiquer des données d'utilisation spécifiques sur Sora et de commenter les estimations de Forbes. Cela signifie que les calculs de Forbes reposent sur des estimations et plusieurs variables, notamment les prix des GPU, l'efficacité de l'inférence, le nombre d'utilisateurs et le nombre de vidéos publiées chaque jour.
Le rêve de Sora : du court métrage de test à la machine à cash brûlant
Sora, la technologie de génération vidéo par IA dévoilée par OpenAI début 2024, avait d’abord suscité l’admiration du grand public. Capable de produire des séquences réalistes à partir d’une simple description textuelle, l’outil symbolisait la fusion parfaite entre langage et image. Mais derrière les démonstrations spectaculaires — une promenade de chien dans la neige, une scène de rue new-yorkaise au coucher du soleil — se cachait un gouffre financier abyssal.
D’après Forbes, OpenAI aurait investi des ressources colossales dans la génération de vidéos internes et de démonstrations destinées aux médias, aux investisseurs et aux créateurs. Des vidéos parfois jugées “silly” par les propres ingénieurs de l’entreprise — autrement dit, frivoles, absurdes ou inutiles — mais nécessaires pour maintenir la hype. Le coût d’exploitation quotidien atteindrait les 15 millions de dollars, essentiellement en puissance de calcul GPU et en coûts d’inférence massifs.
Il faut dire que Sora 2 et ChatGPT consomment tellement d'énergie qu'OpenAI vient de conclure un autre contrat de 10 gigawatts, une quantité d'énergie colossale qui correspond à la consommation d'électricité d'une grande ville
Comment arrive-t-on au coût global ?
Même si OpenAI n'a pas communiqué de chiffres, Forbes estime qu'il est toutefois possible d'avoir une idée du coût global. Les modèles vidéo (comme Sora 2) sont beaucoup plus chers que leurs équivalents textuels (comme GPT-5) car les données qu'ils ingèrent et restituent sont plus complexes. Pour les utilisateurs qui tentent d'accéder directement aux modèles OpenAI en masse (via son API, ou interface de programmation d'application), GPT-5 coûte environ 10 dollars pour quelque 750 000 mots.
Sora 2 est plus complexe, car il doit traiter des données en quatre dimensions (trois dimensions spatiales plus le temps) et s'assurer que les actions ont un sens sur plusieurs dizaines d'images par seconde. La génération d'une vidéo de 10 secondes, durée standard d'un clip Sora qui coûte un crédit de « génération vidéo », coûte environ 1,3 dollar à OpenAI, selon l'analyste Deepak Mathivanan de Cantor Fitzgerald. AJ Kourabi, de SemiAnalysis, a déclaré que ce chiffre « semblait raisonnable », mais qu'il dépendait également de la fréquence d'utilisation des différents modèles Sora (certains étant plus complexes que d'autres).
L'analyse de Mathivanan part du principe que chaque génération de vidéo nécessite environ 40 minutes de temps GPU total, soit 8 à 10 minutes sur quatre GPU fonctionnant simultanément, et que la location d'un GPU coûte un peu moins de 2 dollars de l'heure. En supposant qu'OpenAI n'intègre pas encore de marge bénéficiaire dans le prix de son API, cette estimation se vérifie : la société facture actuellement 1 dollar pour une vidéo de 10 secondes générée par Sora 2 (et 3 dollars pour le modèle plus avancé Sora 2 Pro).
Se pose ensuite la question du nombre de vidéos créées par les utilisateurs sur Sora
Ce nombre fluctue énormément, et nous ne savons pas encore dans quelle mesure les utilisateurs continueront à revenir pour en créer davantage, ni quand OpenAI cessera d'offrir un accès gratuit à la génération de vidéos par IA. Mais Forbes explique son raisonnement : prenons les 4,5 millions d'utilisateurs estimés de l'application Sora et supposons, selon Kourabi, que 25 % d'entre eux publient en moyenne 10 vidéos par jour. Cela représente 11,3 millions de vidéos par jour. Multipliez ce chiffre par 1,3 dollar par vidéo, ce qui signifie près de 15 millions de dollars par jour, soit 5,4 milliards de dollars par an. Ce chiffre ne tient pas compte des vidéos que Sora supprime avant leur publication parce qu'elles sont jugées illicites ou contraires à la loi, ni des brouillons qui utilisent les crédits Sora mais ne sont jamais publiés.
Permettre à n'importe qui de générer gratuitement des vidéos Sora est une décision audacieuse, mais qui n'est pas rare dans le monde de la technologie. OpenAI mise sur une perte de parts de marché et de visibilité, dans l'espoir que suffisamment de personnes utilisent Sora pour que les coûts baissent et que, une fois qu'OpenAI commencera à facturer ce service, les revenus augmentent.
Des vidéos qui font le buzz, mais pas de revenus
Les vidéos générées par Sora font le tour des réseaux sociaux, et chaque clip viral génère des millions de vues sur X, TikTok ou YouTube. Mais ces vidéos ne rapportent rien — ou presque — à OpenAI. Contrairement à ChatGPT Plus, Sora n’est pas encore commercialisé. Il ne sert ni à la production professionnelle, ni à la publicité, ni à la création de contenu rentable. C’est un pur démonstrateur, un outil d’image de marque.
En d’autres termes, OpenAI dépense des millions chaque jour pour nourrir un rêve visuel sans monétisation directe. Pire : plusieurs observateurs internes affirment que certaines vidéos utilisées en interne ou diffusées aux médias n’ont même pas de finalité de recherche, mais servent à alimenter la communication d’entreprise.
OpenAI se lance à la conquête vorace de parts de marché
« C'est une stratégie classique sur Internet que de ne pas se concentrer autant sur les coûts initiaux que sur la constitution d'une audience et la création d'un engagement, car nous avons vu à maintes reprises que ces entreprises peuvent trouver des moyens de monétiser cet engagement », explique Lloyd Walmsley, analyste chez Mizuho qui couvre Meta et Google. Walmsley et Mathivanan soulignent que le nombre de minutes GPU nécessaires pour générer une seconde de vidéo diminuera de manière exponentielle au fil du temps. Mathivanan estime que l'inférence pour les modèles vidéo pourrait devenir cinq fois moins chère d'ici l'année prochaine et trois fois moins chère qu'en 2027.
Pour l'instant, il s'agit d'une conquête de parts de marché vorace qui prépare vraisemblablement le produit à une monétisation agressive à l'avenir. Bien que le PDG d'OpenAI, Sam Altman, ait déclaré qu'un modèle publicitaire ne pourrait pas couvrir les coûts de calcul de Sora pour le moment, une combinaison de publicité et d'utilisateurs expérimentés (cinéastes ou créateurs de publicités télévisées ?) prêts à payer le prix fort pour le produit pourrait peut-être y...
La fin de cet article est réservée aux abonnés. Soutenez le Club Developpez.com en prenant un abonnement pour que nous puissions continuer à vous proposer des publications.
