La start-up chinoise spécialisée dans l'IA DeepSeek a annoncé qu'elle réduisait définitivement de 75 % le prix de son modèle phare, le V4-Pro, proposant un prix au moins 34 fois inférieur à celui du GPT-5.5

Le 25 mai 2026 à 10:13, par Jade Emy

51PARTAGES

La start-up chinoise spécialisée dans l'IA DeepSeek a annoncé qu'elle réduisait définitivement de 75 % le prix de son modèle phare, le V4-Pro, proposant un prix au moins 34 fois inférieur à celui du GPT-5.5

La start-up chinoise spécialisée dans l'IA DeepSeek a annoncé qu'elle réduisait définitivement le prix de son modèle phare V4-Pro de 75 %. Dans le cadre de cette réduction permanente, un million de jetons d'entrée sans cache ne coûte que 0,435 $, tandis qu'un million de jetons de sortie coûte 0,87 $. À titre de comparaison, GPT 5.5 facture 5 $ par million de jetons d'entrée et 30 $ par million de jetons de sortie, tandis qu'Opus 4.7 se situe à 5 $ pour l'entrée et 25 $ pour la sortie. Cela rend le produit phare de Deepseek environ 11,5 fois moins cher que GPT 5.5 sur la tarification standard des entrées. Les raisons économiques derrière la remise de 75 % de DeepSeek pourraient être liées à la guerre commerciale géopolitique en cours concernant les semi-conducteurs de pointe. Alors que les restrictions américaines visaient à ralentir les progrès de la Chine en matière d'IA, elles ont eu l'effet inverse : elles ont créé un boom massif et exclusif du marché pour le plus grand concurrent national de Nvidia, Huawei.

DeepSeek est une entreprise chinoise spécialisée dans l'intelligence artificielle (IA) qui développe des grands modèles de langage (LLM). La société a lancé un chatbot éponyme parallèlement à son modèle DeepSeek-R1 en janvier 2025. DeepSeek-R1 fournissait des réponses comparables à celles d'autres LLM contemporains, tels que le GPT-4 et l'o1 d'OpenAI. Son coût de formation aurait été nettement inférieur à celui d'autres LLM. La société affirme avoir formé son modèle V3 pour 6 millions de dollars, soit bien moins que les 100 millions de dollars qu'a coûté le GPT-4 d'OpenAI en 2023, et en utilisant environ un dixième de la puissance de calcul consommée par le modèle comparable de Meta, Llama 3.1. Le succès de DeepSeek face à des rivaux plus importants et mieux établis a été qualifié de « bouleversement de l'IA ».

En avril 2026, DeepSeek a lancé DeepSeek V4 Pro et DeepSeek V4 Flash, sa première mise à jour majeure de modèle depuis plus d'un an. Les nouveaux modèles V4 introduisent une fenêtre contextuelle pouvant atteindre 1 million de jetons, ce qui permet de maintenir une meilleure cohérence dans les conversations et les documents plus longs, à moindre coût. DeepSeek V4 reste open source, ce qui permet aux utilisateurs d'inspecter, d'adapter ou de modifier le code. V4 Pro est destiné à des tâches agentiques plus complexes en plusieurs étapes. DeepSeek affirme qu'il rivalise avec les principaux modèles propriétaires en matière de raisonnement et qu'il n'est devancé que par Gemini 3.1 Pro de Google en termes de connaissance du monde. V4 Flash est la variante plus rapide, offrant des réponses plus rapides tout en restant proche de V4 Pro pour les tâches agentiques plus simples.

Récemment, la start-up chinoise spécialisée dans l'IA DeepSeek a annoncé qu'elle réduisait définitivement le prix de son modèle phare V4-Pro de 75 %. Cette baisse de prix massive ramène le coût d'utilisation de l'outil logiciel le plus puissant de DeepSeek à seulement un quart de son tarif initial. Bien que DeepSeek n'ait pas explicitement précisé ce qui lui a permis de baisser ses prix de manière aussi drastique, on suppose que la disponibilité aisée des puces Huawei pourrait être à l'origine de cette baisse.

Il convient de noter que lorsque DeepSeek a lancé V4, l'entreprise avait déclaré que la version Pro coûterait jusqu'à 12 fois plus cher que la version Flash, moins puissante, en raison de « contraintes liées à la capacité de calcul haut de gamme », limitant ainsi la disponibilité. Ainsi, le prix de la version Pro devrait baisser fortement une fois que les supernœuds Huawei Ascend 950 seront lancés en grande quantité au cours du second semestre.

DeepSeek « fait chuter » le marché des tokens

Les raisons économiques derrière la remise de 75 % de DeepSeek pourraient être liées à la guerre commerciale géopolitique en cours concernant les semi-conducteurs de pointe. Les contrôles stricts des exportations américains empêchent actuellement Nvidia de vendre ses processeurs graphiques (GPU) d'IA haut de gamme à des entreprises chinoises. Alors que ces restrictions américaines visaient à ralentir les progrès de la Chine en matière d'IA, elles ont eu l'effet inverse : elles ont créé un boom massif et exclusif du marché pour le plus grand concurrent national de Nvidia, Huawei.

DeepSeek s'appuie fortement sur les puces Ascend 950 développées en interne par Huawei pour alimenter et optimiser les performances de ses modèles V4. En optimisant son logiciel pour qu'il fonctionne sur des puces chinoises locales plutôt que de dépendre du matériel Nvidia, coûteux, soumis à des restrictions ou disponible au marché noir, DeepSeek a pu réduire considérablement ses coûts d'infrastructure opérationnelle.

Selon un communiqué officiel de la société, DeepSeek a réduit les coûts de son interface de programmation d'applications (API) pour le modèle V4-Pro à un montant compris entre 0,025 et 6 yuans par million de tokens, en fonction du type de déploiement. Auparavant, ces mêmes charges de travail coûtaient aux développeurs entre 0,1 et 24 yuans. Dans le secteur de l’IA, un « token » est une fraction de mot ou une unité de texte traitée par un grand modèle de langage. En ramenant le coût des tokens à une fraction de centime, DeepSeek vise à devancer à la fois ses concurrents nationaux et les entreprises occidentales d’IA, rendant l’intégration avancée de l’IA incroyablement bon marché pour les développeurs de logiciels.

Dans le cadre de cette réduction permanente, un million de jetons d'entrée sans cache ne coûte que 0,435 $, tandis qu'un million de jetons de sortie coûte 0,87 $. Les accès au cache font baisser encore davantage le prix d'entrée. À titre de comparaison, GPT 5.5 facture 5 $ par million de jetons d'entrée et 30 $ par million de jetons de sortie, tandis qu'Opus 4.7 se situe à 5 $ pour l'entrée et 25 $ pour la sortie. Cela rend le produit phare de Deepseek environ 11,5 fois moins cher que GPT 5.5 sur la tarification standard des entrées. L'écart est bien plus important en sortie, où Deepseek V4 Pro est environ 34,5 fois moins cher. Par rapport à la tarification de GPT 5.5 pour les contextes longs de plus de 272 000 tokens, Deepseek V4 Pro est environ 23 fois moins cher en entrée et environ 51,7 fois moins cher en sortie. Deepseek V4 Flash est encore moins cher.

Le prix brut par token n'est toutefois qu'une partie du tableau. La consommation de tokens par tâche est tout aussi importante. C'est un peu comme le prix de l'essence : un prix bas au litre ne sert à rien si votre moteur consomme beaucoup de carburant. Gemini Flash 3.5 de Google en est un bon exemple. Sur le papier, il est moins cher et offre des performances similaires à celles du modèle Pro 3.1 précédent, mais il consomme beaucoup plus de tokens, ce qui le rend potentiellement plus coûteux dans la pratique. Le modèle Opus 4.7 d'Anthropic semble lui aussi moins cher sur le papier que le GPT-5.5, mais il utilise plus de jetons que son prédécesseur. Le GPT-5.5, en revanche, consomme moins de jetons que le GPT-5.4. Pourtant, ces deux modèles se sont avérés 30 à 90 % plus chers que les modèles qu'ils ont remplacés.

Deepseek V4 est clairement à la traîne par rapport aux modèles de pointe GPT-5.5 et Opus 4.7 en termes de performances brutes. L'écart exact dépend de la tâche, et les benchmarks ne reflètent qu'une partie de la réalité ; seule l'utilisation en conditions réelles permettra de se prononcer. Mais l'écart de prix est considérable, en particulier pour les systèmes d'IA agentique qui consomment plusieurs fois plus de tokens qu'un chatbot standard. Et à mesure que l'utilisation de l'IA se généralise, les entreprises deviennent plus sensibles aux prix. Tant que le retour sur investissement des dépenses en IA restera difficile à mesurer, de nombreuses entreprises pourraient changer de stratégie : elles délaisseraient le meilleur modèle au profit du moins cher qui reste néanmoins suffisamment performant.

Voici un extrait de l'annonce de Deepseek :

API DeepSeek V4 Pro : la réduction de 75 % devient permanente

DeepSeek a rendu permanente la réduction de prix temporaire de 75 % appliquée à son API V4 Pro. Cette décision place DeepSeek V4 Pro en position de force sur la frontière de Pareto entre l'indice d'intelligence et le coût d'exploitation de l'intelligence, où il figure aux côtés de V4 Flash parmi les modèles de raisonnement de pointe les plus rentables du marché.

Pourquoi DeepSeek peut-il faire cela ?

Une réduction permanente de 75 % n’est pas une promotion éphémère — c’est une déclaration sur l’économie unitaire. Trois facteurs la rendent durable :

- L’efficacité du MoE. L’architecture Mixture-of-Experts (MoE) clairsemée de V4, avec 1,6 T de paramètres, n’active qu’une petite partie du réseau par token. Le coût d’inférence évolue en fonction des paramètres actifs, et non du nombre total de paramètres.

- Attention compressée. Le mécanisme d’attention compressée intégré à V4 réduit considérablement la pression sur la mémoire du cache KV — le principal coût de l’inférence à long contexte.

- Mise en cache agressive des préfixes. Le nouveau tarif de 0,0036 $/1 million d’entrées mises en cache (soit une réduction d’environ 99,8 % par rapport aux entrées non mises en cache) rend les workflows agentiques, les systèmes RAG et les longues invites système pratiquement gratuits du côté des entrées. C'est ce levier qui fait baisser le prix moyen à 0,18 $.

Combiné au tour de table de 10 milliards de dollars récemment annoncé par DeepSeek, l'entreprise dispose à la fois de la capacité financière et de l'avantage architectural nécessaires pour résister à la pression sur les prix dans le segment de pointe.

Ce que cela signifie pour les développeurs

Si vous développez des produits d'IA en production, la donne vient de changer :

- Systèmes agentiques : les agents en plusieurs étapes qui coûtaient auparavant entre 5 et 20 $ par tâche sur Claude Opus ou GPT-5.5 peuvent désormais fonctionner sur V4 Pro pour quelques centimes.

- RAG à long contexte : la mise en cache des préfixes à 0,0036 $/1 million rend économiquement viables les invites système de plus de 100 000 tokens.

- Raisonnement à grande échelle : les charges de travail pour lesquelles vous deviez auparavant vous rabattre sur la série R ou sur des modèles sans raisonnement, uniquement pour des raisons de coût, ne nécessitent plus de compromis.

- Rechute à poids ouvert : comme V4 est à poids ouvert, vous pouvez héberger vous-même la même architecture si les tarifs des fournisseurs directs venaient à changer — une protection qu'aucun laboratoire fermé n'offre.

Comparaison entre V4 Pro et la concurrence

Conclusion

Rendre permanente cette réduction de 75 % redéfinit l'ensemble de la courbe des coûts de l'IA de pointe. V4 Pro n'est plus simplement « bon marché pour ce qu'il est » : à environ 0,18 $ par million de tokens, il redéfinit de manière significative le coût d'exploitation du raisonnement de pointe. Les laboratoires occidentaux sont désormais confrontés à un choix : s'aligner sur les tarifs, se différencier par leurs capacités, ou assister à la migration des charges de travail agentiques et à haut volume vers l'API de DeepSeek.

Source : Deepseek

Et vous ?

Pensez-vous que cette annonce est crédible ou pertinente ?

Quel est votre avis sur le sujet ?

Voir aussi :

L'âge d'or du forfait IA illimité tire à sa fin : pubs ciblées, limitations d'usage, fonctionnalités verrouillées, prix en hausse. L'IA agentique contraint les fournisseurs à changer leurs modèles économiques

L'adoption mondiale des modèles d'IA open source chinois a presque triplé, passant de 13 % à environ 30 % de l'utilisation totale en 2025, sous l'impulsion de DeepSeek et de Qwen d'Alibaba

Nvidia avait 95 % du marché chinois de GPU dédié à l'IA, mais sa part a désormais chuté à moins de 60 % tandis que le gouvernement encourage les centres de données à utiliser des puces nationales

Vous avez lu gratuitement 10 839 articles depuis plus d'un an.
Soutenez le club developpez.com en souscrivant un abonnement pour que nous puissions continuer à vous proposer des publications.

Une erreur dans cette actualité ? Signalez-nous-la !

Votre nom : Votre e-mail :

Décrivez l'erreur que vous souhaitez porter à notre connaissance :

Identifiez-vous

Créer un compte

La start-up chinoise spécialisée dans l'IA DeepSeek a annoncé qu'elle réduisait définitivement de 75 % le prix de son modèle phare, le V4-Pro, proposant un prix au moins 34 fois inférieur à celui du GPT-5.5

Identifiant
Mot de passe

Mot de passe oublié ?