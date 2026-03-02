DeepSeek s'apprêterait à dévoiler son prochain modèle d'IA. Selon un article du Financial Times, la société se prépare à lancer son prochain modèle majeur, le V4. Contrairement aux versions précédentes, V4 devrait être « multimodal », ce qui signifie qu'il ne se contentera pas de traiter du texte, mais qu'il sera également capable de comprendre et de générer des images et des vidéos, à l'instar de Google Gemini 3.0. DeepSeek aurait optimisé V4 pour qu'il fonctionne sur du matériel fabriqué en Chine par des entreprises telles que Huawei et Cambricon.
DeepSeek est une entreprise chinoise spécialisée dans l'intelligence artificielle (IA) qui développe des grands modèles de langage (LLM). DeepSeek a été fondée en juillet 2023 et en a lancé un chatbot éponyme parallèlement à son modèle DeepSeek-R1 janvier 2025. Publié sous licence MIT, DeepSeek-R1 fournit des réponses comparables à celles d'autres modèle, tels que GPT-4 et o1 d'OpenAI. Son coût de formation serait nettement inférieur à celui des autres LLM. La société affirme avoir formé son modèle V3 pour 6 millions de dollars, soit bien moins que les 100 millions de dollars qu'a coûté le GPT-4 d'OpenAI en 2023, et en utilisant environ un dixième de la puissance de calcul consommée par le modèle comparable de Meta, Llama 3.1.
Lapparition de DeepSeek a fait voler en éclats le mythe dun monopole technologique américain sur lintelligence artificielle. En moins de deux ans, cette entreprise chinoise a réussi à réduire considérablement lécart qui la séparait des géants américains de lIA, notamment grâce à une stratégie open source audacieuse. DeepSeek est devenue l'application gratuite la plus téléchargée aux États-Unis une semaine seulement après son lancement.
L'émergence de l'application chinoise d'intelligence artificielle DeepSeek a choqué les marchés financiers, le cours de l'action Nvidia a fortement chuté, perdant 600 milliards de dollars américains en valeur boursière, ce qui représente la plus forte baisse jamais enregistrée pour une seule entreprise dans l'histoire du marché boursier américain. Le président américain Donald Trump a même qualifié de « signal d'alarme » pour l'industrie technologique américaine le succès de DeepSeek.
Récemment, un rapport a révélé que DeepSeek s'apprêterait à dévoiler son prochain modèle d'IA. Selon un article du Financial Times, la société se prépare à lancer son prochain modèle majeur, le V4. L'article indique que cette sortie marque un moment crucial pour l'industrie technologique chinoise, qui tente de prouver une fois de plus qu'elle peut rivaliser avec les géants américains malgré les restrictions strictes imposées par les États-Unis sur les puces informatiques haut de gamme.
Contrairement aux versions précédentes, V4 devrait être « multimodal », ce qui signifie qu'il ne se contentera pas de traiter du texte, mais qu'il sera également capable de comprendre et de générer des images et des vidéos, à l'instar de Google Gemini 3.0. Il s'agit de la première initiative majeure de DeepSeek depuis janvier 2025, lorsque son modèle « R1 » avait surpris le monde entier. La raison en était l'affirmation de DeepSeek selon laquelle il avait construit une IA aussi intelligente que les meilleurs modèles de la Silicon Valley, mais en utilisant seulement une infime partie de la puissance et du coût.
Cette affirmation a semé la panique parmi les investisseurs, qui craignaient que les puces coûteuses de Nvidia ne soient plus le seul moyen de construire une IA puissante, ce qui a fait chuter les actions de Nvidia. En outre, un défenseur de lopen source a décrit DeepSeek : « Ce nest pas juste un modèle, cest un mouvement ». Dans un climat où lIA est dominée par des géants comme OpenAI, Google, et Anthropic, lapparition de DeepSeek est perçue comme une réplique communautaire, radicalement différente par sa philosophie : ouverture, collaboration, transparence.
DeepSeek aurait optimisé V4 pour qu'il fonctionne sur du matériel fabriqué en Chine par des entreprises telles que Huawei et Cambricon, alors même que les géants américains s'appuient sur les puces Nvidia, un scénario quelque peu similaire. En utilisant des puces locales, DeepSeek contourne les contrôles à l'exportation américains qui empêchent la Chine d'acheter les derniers processeurs Nvidia et AMD, une initiative qui devrait accélérer la transition de la Chine vers l'abandon des technologies occidentales pour l'« inférence », le processus par lequel une IA génère une réponse pour un utilisateur.
L'ascension de DeepSeek n'a pas été sans heurts. La société américaine d'IA Anthropic a récemment accusé DeepSeek de « distillation attacks », une pratique consistant pour une entreprise à utiliser les réponses d'une IA plus avancée (comme Claude d'Anthropic) pour « enseigner » à son propre modèle, plus petit, comment se comporter. Le rapport souligne également que, alors que DeepSeek était auparavant salué pour son « ouverture » et le partage de ses techniques d'ingénierie secrètes, il devrait se montrer plus prudent cette fois-ci, ne publiant qu'une brève note technique à l'occasion du lancement de la version V4.
Source : The Financial Times
