À mesure que les agents IA cannibalisent le calcul disponible, les deux fers de lance de l'intelligence artificielle générative se retrouvent contraints d'arbitrer entre leurs produits phares, de revoir leurs tarifications et de préparer des introductions en bourse colossales. Le mirage de la croissance illimitée se heurte à la physique des GPU et à la logique impitoyable des investisseurs.Le 24 mars 2026, OpenAI a décidé de fermer Sora, son outil de génération vidéo par IA, à peine six mois après son lancement public. Le geste a surpris par sa brutalité, mais les chiffres derrière cette décision l'expliquent sans ambiguïté. Forbes estimait le coût d'inférence de Sora à environ 15 millions de dollars par jour à son pic d'activité pour un revenu total sur l'ensemble de sa durée de vie de 2,1 millions de dollars. Le ratio est éloquent : le produit le plus viral d'OpenAI brûlait ses ressources de calcul sans générer de retour mesurable.
Les téléchargements mensuels de l'application avaient atteint un pic de 3,33 millions en novembre 2025, avant de chuter à un peu plus d'un million en février 2026, soit une baisse d'environ 66 % en trois mois. La rétention catastrophique confirmait ce que les ingénieurs savaient depuis le début : la génération vidéo est structurellement plus coûteuse à chaque étage de la chaîne de production. Résolution, durée, complexité des scènes et nombre d'itérations ont chacun un coût en calcul. Un clip 4K est exponentiellement plus exigeant en ressources qu'une image équivalente.
La décision de fermeture a eu une victime collatérale de taille. Disney avait engagé un milliard de dollars dans le partenariat, et a appris la fermeture de Sora moins d'une heure avant l'annonce publique. L'accord est mort avec le produit. Que l'entreprise la plus capitalisée du secteur IA soit en mesure de rompre un contrat d'un milliard de dollars par manque de GPU disponibles dit beaucoup sur l'état réel de l'industrie.
La pénurie de calcul, nouveau facteur structurant
La demande croissante en agents IA autonomes entre en collision frontale avec des capacités de calcul limitées. Les prix des GPU ont bondi de près de 50 % selon les données de marché. Le boom de l'IA consomme de la puissance de calcul plus vite que l'industrie ne peut en fournir.
OpenAI a vu sa consommation de tokens sur l'API bondir de 6 milliards par minute en octobre à 15 milliards par minute fin mars, selon le Wall Street Journal. La directrice financière Sarah Friar a indiqué passer une grande partie de son temps à chercher des capacités de calcul à court terme et à prendre des décisions difficiles sur les projets à mettre en veille, faute de ressources disponibles.
Anthropic n'est pas épargnée. Depuis la mi-février, les pannes se sont accumulées avec une telle fréquence que certains clients entreprises ont commencé à migrer vers d'autres fournisseurs. GitHub a lui aussi annoncé de nouvelles limites pour Copilot le 10 avril, citant explicitement la croissance rapide, la haute concurrence et l'usage intensif comme raisons. La rareté du calcul est en train de devenir le principal facteur d'arbitrage stratégique dans tout le secteur.
OpenClaw, ou comment déguiser une hausse de prix en changement de politique
Si la fermeture de Sora a frappé les esprits par son caractère spectaculaire, la décision d'Anthropic concernant OpenClaw a été tout aussi significative pour la communauté des développeurs. Anthropic a annoncé ne plus autoriser les utilisateurs de Claude à exécuter OpenClaw sur les abonnements standard. Les utilisateurs ont été redirigés vers une tarification à l'usage nettement plus coûteuse.
Les chiffres expliquent cette politique. Un abonnement Max coûte 200 $ par mois pour une utilisation intensive de Claude. Le prix de l'API pour Claude Opus 4.6 est de 15 $ par million de jetons d'entrée et de 75 $ par million de jetons de sortie. Un agent OpenClaw actif exécutant Opus peut consommer des millions de jetons par jour, ce qui rend un abonnement forfaitaire de 200 $ profondément non rentable pour Anthropic.
Un utilisateur de X l'a clairement exprimé : « Il est assez évident que l'abonnement Claude Max n'est pas viable économiquement. La seule raison de son existence est de promouvoir l'écosystème Anthropic auprès de nouveaux utilisateurs. Ainsi, les personnes qui l'utilisent pour plusieurs comptes ou pour des produits non Anthropic (par exemple OpenClaw) sont exclues. Ce n'est que du business. » Ce ne sont que les affaires. Mais ce sont ces affaires qui poussent les utilisateurs les plus engagés (ceux qui créent des agents, ceux qui...
La fin de cet article est réservée aux abonnés. Soutenez le Club Developpez.com en prenant un abonnement pour que nous puissions continuer à vous proposer des publications.