L'âge d'or du forfait IA illimité tire à sa fin : pubs ciblées, limitations d'usage, fonctionnalités verrouillées, prix en hausse. L'IA agentique contraint les fournisseurs à changer leurs modèles économiques

Le 25 avril 2026 à 09:26, par Stéphane le calme

359PARTAGES

L'âge d'or du forfait IA illimité tire à sa fin : publicités ciblées, limitations d'usage, fonctionnalités verrouillées, prix en hausse.
L'IA agentique contraint les fournisseurs à modifier leurs modèles économiques

L'ère du forfait illimité est terminée. Derrière la guerre des modèles que se livrent les grands laboratoires d'IA se joue une bataille moins visible mais tout aussi décisive : celle de la monétisation. Le token, cette unité atomique de traitement du texte, est en train de redéfinir en profondeur les rapports entre fournisseurs, entreprises clientes et développeurs. Et les stratégies divergentes d'Anthropic et d'OpenAI révèlent deux visions radicalement différentes de ce que devrait être l'économie de l'intelligence artificielle.

Pour comprendre les enjeux économiques de l'IA en 2026, il faut d'abord saisir ce qu'est un token. Les tokens sont l'unité de base de l'usage de l'IA : les mots et caractères qui composent à la fois les requêtes envoyées par les utilisateurs et les réponses générées par les modèles. Une conversation ordinaire avec un assistant IA consomme quelques centaines de tokens par paragraphe. L'IA agentique (ces systèmes qui écrivent du code, naviguent sur le web et exécutent des flux de travail en plusieurs étapes), elle, en brûle des milliers supplémentaires par session.

C'est précisément cette explosion de la consommation agentique qui a fait voler en éclats les modèles tarifaires hérités des débuts de l'industrie. Le modèle à prix fixe a dominé les premières années de l'adoption de l'IA, avec des abonnements mensuels forfaitaires donnant accès à une utilisation généreuse ou illimitée. Ce modèle fonctionnait quand on se contentait de dialoguer avec une IA. Mais l'usage agentique a transformé ce qui coûtait des milliers de tokens par session en millions, brisant les équilibres économiques.

Le cas le plus emblématique de cette rupture est celui du plan Max d'Anthropic à 200 dollars par mois. Des données internes ont révélé que certains utilisateurs du plan Max à 200 dollars mensuels coûtaient à Anthropic plus de 50 000 dollars par mois en calcul informatique. Des développeurs avaient en effet trouvé le filon : ils routaient leur abonnement consommateur à travers des outils tiers comme OpenClaw, faisant tourner des agents autonomes en continu sur un forfait conçu pour la conversation. Une instance OpenClaw fonctionnant de manière autonome pendant une journée entière (naviguant sur le web, gérant des calendriers, exécutant du code, répondant à des messages) peut consommer l'équivalent de 1 000 à 5 000 dollars en coûts d'API. Sous un abonnement Max à 200 dollars par mois, ce transfert de coûts de l'utilisateur vers Anthropic était insoutenable.

La grande bifurcation tarifaire

Face à cette réalité, les deux leaders du marché ont adopté des postures opposées et leur divergence est lourde de sens pour l'avenir du secteur.

Anthropic a choisi la rigueur comptable. La réponse d'Anthropic a été de s'éloigner de la tarification forfaitaire pour les entreprises et d'adopter la facturation à la consommation de tokens, de sorte que les revenus collectés reflètent l'usage réel. La société a également coupé l'accès à certains outils tiers qui étaient de gros consommateurs de tokens. Les anciens contrats d'entreprise qui prévoyaient des sièges à tarif fixe avec une allocation d'usage intégrée appartiennent désormais au passé : ces formules sont désormais qualifiées de « types de sièges hérités qui ne sont plus disponibles pour les nouveaux contrats d'entreprise », selon la page d'assistance de l'entreprise. Les nouveaux plans d'entreprise facturent par siège, avec une consommation de tokens facturée aux tarifs API en supplément.

OpenAI, de son côté, a longtemps privilégié la croissance de la consommation à tout prix. Pendant qu'Anthropic opérait ce virage, OpenAI rendait l'IA moins chère et plus facile à consommer à grande échelle. Mais les signaux d'alarme se multiplient. Nick Turley, responsable de ChatGPT chez OpenAI, a reconnu publiquement lors d'un podcast que « il est possible que dans l'ère actuelle, avoir un plan illimité revienne à avoir un plan d'électricité illimité. Ça n'a tout simplement pas de sens. »

La grille tarifaire actuelle d'Anthropic illustre cette hiérarchisation de l'usage : Claude Opus 4.6, le modèle phare, est facturé à 5 dollars en entrée et 25 dollars en sortie par million de tokens ; Claude Sonnet 4.6, recommandé pour la majorité des charges de production, revient à 3 dollars en entrée et 15 dollars en sortie ; Claude Haiku 4.5, le modèle économique, est proposé à 1 dollar en entrée et 5 dollars en sortie par million de tokens.

Des pertes colossales malgré des revenus record

Derrière ces grilles tarifaires se cache une réalité financière vertigineuse : aucun des deux géants ne gagne encore de l'argent sur l'inférence. En 2025, OpenAI a généré environ 3,7 milliards de dollars de revenus et essuyé des pertes estimées à 5 milliards. L'entreprise derrière ChatGPT dépense 1,35 dollar pour chaque dollar gagné et ces pertes ne sont pas dues à la R&D ou aux effectifs, mais au coût de traitement de milliards de requêtes d'inférence par jour.

Les projections à horizon 2028 donnent le vertige. Le Wall Street Journal a publié des documents financiers confidentiels des deux entreprises en amont de leurs IPO. OpenAI projette de dépenser 121 milliards de dollars en calcul informatique en 2028 uniquement. Cette même année, même après une forte croissance des revenus, l'entreprise projette des pertes de 85 milliards de dollars. Elle n'anticipe pas d'atteindre l'équilibre avant 2030. Les coûts de formation des modèles d'Anthropic culminent quant à eux autour de 30 milliards sur la même période, environ quatre fois moins.

Le paradoxe est brutal : le coût unitaire du token ne cesse de baisser sous l'effet de la concurrence et des progrès techniques, mais les factures totales des entreprises explosent. Les coûts d'inférence représentent désormais 85 % du budget IA des entreprises, selon le rapport 2026 d'AnalyticsWeek sur l'économie de l'inférence. Le budget IA moyen des entreprises est passé de 1,2 million de dollars par an en 2024 à 7 millions en 2026. Certains groupes du Fortune 500 rapportent des factures d'inférence mensuelles se chiffrant en dizaines de millions de dollars.

La course aux revenus : Anthropic dépasse OpenAI

C'est dans ce contexte que s'est produit un événement que même les analystes les plus optimistes ne projetaient pas avant mi-2026 : Anthropic a confirmé un chiffre d'affaires annualisé de 30 milliards de dollars, contre 9 milliards à fin 2025. OpenAI de son côté a confirmé 2 milliards de dollars de revenus mensuels.

La trajectoire d'Anthropic est particulièrement saisissante : 87 millions de dollars de revenus annualisés en janvier 2024, 1 milliard en décembre 2024, 9 milliards à fin 2025, 14 milliards en février 2026, 19 milliards en mars, 30 milliards en avril. Cette dernière séquence (de 14 à 30 milliards en environ huit semaines) échappe aux catégories habituelles de la croissance logicielle.

La clé de cette ascension réside dans un choix stratégique fondamental : Anthropic a misé sur l'entreprise dès le début, évitant de subventionner massivement une base grand public. Anthropic n'a jamais vraiment eu de phase grand public. Les contrats d'API d'entreprise et les accords avec les fournisseurs de cloud (principalement Google Cloud et AWS) ont constitué la base. Huit des dix premières entreprises du Fortune 10 sont désormais clientes de Claude. Plus de 500 entreprises dépensent plus d'un million de dollars par an.

La concurrence se resserre autour des clients qui comptent le plus : les entreprises. Alors qu'OpenAI reste le chatbot grand public le plus populaire, il perd de l'argent sur cette clientèle en subventionnant le coût de leur consommation de tokens.

Le token comme révélateur d'une demande peut-être surestimée

Au-delà de la compétition entre les deux firmes, la question du token soulève un problème structurel plus profond : la demande en IA est-elle réelle, ou en partie artificielle ?

Les entreprises d'IA citent l'explosion de la consommation de tokens pour justifier les centaines de milliards dépensés en infrastructure. Mais le token est en train de devenir une métrique distordue. Meta et Shopify ont créé des classements internes mesurant le nombre de tokens consommés par leurs employés. Jensen Huang, PDG de Nvidia, a déclaré qu'il serait « profondément alarmé » si un ingénieur gagnant 500 000 dollars par an n'utilisait pas au moins 250 000 dollars de calcul, mesurant ainsi ce qu'un ingénieur dépense en IA plutôt que ce qu'il en produit.

Cette logique préoccupe les observateurs les plus avisés. Eric Glyman, PDG de Ramp (une plateforme de gestion financière qui a lancé un outil de suivi des dépenses en tokens), pointe une contradiction fondamentale : si votre modèle économique dépend de l'extraction d'un maximum de dépenses en tokens, avez-vous réellement intérêt à aider vos clients à utiliser l'IA plus efficacement ?

Salesforce a commencé à chercher une réponse à cette question en introduisant une nouvelle métrique qu'elle appelle les « unités de travail agentiques », qui mesure le travail accompli par l'IA plutôt que les tokens brûlés. Une approche qui pourrait préfigurer une recomposition plus large de la façon dont la valeur de l'IA est mesurée et facturée.

« Si votre seul objectif est de gaspiller de l'argent, il existe des moyens faciles d'y parvenir », a déclaré Ali Ghodsi, PDG de Databricks, qui traite les charges de travail d'IA pour des milliers d'entreprises. « Soumettez la requête à dix endroits différents. Mettez en place une boucle qui répète l'opération indéfiniment. Cela vous coûtera très cher sans aucun résultat. »

Jen Stave, directrice générale de l'Institut d'IA de la Harvard Business School, constate le même phénomène chez les dirigeants d'entreprise. « J'ai discuté avec une douzaine de directeurs techniques ou informatiques qui me disent tous : "J'ai beaucoup de mal à trouver un cadre d'analyse du retour sur investissement pour ce type de projet" », a-t-elle expliqué.

Vers des IPO sous haute surveillance

Les deux entreprises se préparent à entrer en Bourse dans les prochains mois, et les marchés ne manqueront pas de scruter ces dynamiques. Anthropic, en adoptant la facturation au token, disposera de données plus nettes sur ce que ses clients valorisent réellement. OpenAI aura des chiffres plus importants, mais aura davantage de mal à prouver quelle part en est réelle.

L'enjeu dépasse la simple comptabilité. Il s'agit de savoir quel modèle économique est viable à long terme pour une industrie qui subventionne massivement la consommation de ses propres produits. La fin du forfait illimité n'est pas seulement un ajustement tarifaire : c'est le moment où l'intelligence artificielle doit commencer à prouver qu'elle vaut réellement ce qu'elle coûte.

Sources : Wall Street Journal, Revenue Memo, Oplexa

Et vous ?

La tarification au token est-elle finalement plus juste pour les entreprises, ou risque-t-elle de décourager l'expérimentation et l'innovation à grande échelle ?

La course à la consommation maximale de tokens est-elle un signe de vitalité de l'IA agentique, ou révèle-t-elle une bulle économique prête à se dégonfler ?

Les entreprises françaises et européennes sont-elles suffisamment préparées à gérer des budgets IA devenus aussi imprévisibles que des factures d'électricité ?

Anthropic peut-elle maintenir son avantage sur OpenAI en se concentrant sur l'entreprise, ou la domination grand public d'OpenAI finira-t-elle par peser dans la balance ?

Voir aussi :

Anthropic bloque l'utilisation par des clients tiers des abonnements à Claude Code : la fin de l'interopérabilité et de l'ouverture des outils de dev ou simple épisode dans la bataille des assistants IA ?

Après qu'Anthropic ait bloqué brutalement Openclaw techniquement et légalement, Sam Altman l'opportuniste en profite pour récupérer le bébé dans le giron d'OpenAI

OpenAI a clôturé son dernier tour de table avec 122 milliards $ de capitaux engagés, pour une valorisation post-financement de 852 milliards $

Qui paie réellement pour votre utilisation quotidienne gratuite de ChatGPT ? OpenAI brûle plusieurs millions de dollars par jour, une facture astronomique que les offres payantes ne suffisent pas à couvrir

Vous avez lu gratuitement 5 322 articles depuis plus d'un an.
Soutenez le club developpez.com en souscrivant un abonnement pour que nous puissions continuer à vous proposer des publications.

Une erreur dans cette actualité ? Signalez-nous-la !

Votre nom : Votre e-mail :

Décrivez l'erreur que vous souhaitez porter à notre connaissance :