Nvidia rejette la menace DeepSeek et affirme que l'IA chinoise a toujours besoin de ses puces alors que ses actions ont dévissé de 17 %,

Effaçant 600 milliards de dollars de sa capitalisation boursière

Le 28 janvier 2025 à 15:36, par Mathis Lucas

158PARTAGES

DeepSeek s'annonce-t-il comme le pire cauchemar de Nvidia ? La startup chinoise vient de publier un modèle d'IA dont les performances semblent aussi remarquables que celles du modèle o1 d'OpenAI pour 95 % moins cher. La nouvelle a provoqué une hécatombe à Wall Street, faisant dévisser les actions d'entreprises telles que Nvidia (17 %) et Broadcom (17,4 %). Cependant, Nvidia n'a pas l'air inquiété par la spéculation selon laquelle DeepSeek menace sa domination sur le marché des puces. Pour Nvidia, les prouesses de DeepSeek indiquent au contraire que la startup chinoise aura besoin davantage de puces d'IA à l'avenir pour faire progresser ses services.

DeepSeek remet en cause l'avenir des puces à haute performance de Nvidia

Le 20 janvier, DeepSeek, dirigé par le gestionnaire de fonds spéculatifs chinois Liang Wenfeng, a publié le modèle d'IA R1 sous une licence MIT ouverte, la plus grande version contenant 671 milliards de paramètres. Elle a pris la Silicon Valley et tout le monde de l'IA par surprise, car, selon un document rédigé par l'entreprise, DeepSeek-R1 bat les principaux modèles du secteur, comme OpenAI o1, sur plusieurs critères mathématiques et de raisonnement.

En fait, sur de nombreux critères importants (capacité, coût, ouverture), DeepSeek donne du fil à retordre aux géants occidentaux de l'IA. DeepSeek affirme avoir créé un modèle de niveau o1 qui fonctionne à 95 % du coût. Si o1 coûte 15 $ par million de jetons d'entrée et 60 $ par million de jetons de sortie (un jeton représente environ 4 caractères), DeepSeek est estimé à environ 0,55 $ et 2,19 $ par million de jetons d'entrée et de sortie, respectivement.

DeepSeek peut fonctionner sur des puces moins avancées. Dans un article publié fin décembre, les chercheurs de DeepSeek ont estimé qu'ils avaient construit et entraîné leur modèle V3 pour moins de 6 millions de dollars en utilisant environ 2 000 puces Nvidia H800. Les informations publiées par DeepSeek ont créé la panique sur le marché. Les investisseurs semblent se demander si la demande pour les puces haut de gamme de Nvidia n'est pas exagérée.

Le fait que R1 soit open source permettra aux développeurs de s'en inspirer et d'apprendre de DeepSeek, voire de l'améliorer. La frénésie autour du modèle R1 de DeepSeek a considérablement augmenté ces derniers jours. Le modèle de DeepSeek s'est hissé en tête du classement des applications les plus téléchargées de l'App Store d'Apple. DeepSeek a battu le chabot d'IA ChatGPT d'OpenAI sur l'App Store, provoquant une chute brutale des actions liées à l'IA.

Les actions de Nvidia ont été malmenées lors de la première séance du marché cette semaine, chutant de 17 %. Les actions d'AMD, le rival de Nvidia, ont également chuté de plus de 6 %. Les actions d'autres géants des semiconducteurs ont également chuté, notamment Broadcom (17,4 %) et TSMC (9.88 %).

Le fait que DeepSeek semble avoir construit son dernier modèle en utilisant des puces moins performantes et moins chères exerce une pression sur Nvidia. Les investisseurs craignent que d'autres entreprises du secteur des grandes technologies réduisent leur demande pour les produits les plus avancés de Nvidia.

Nvidia ne craint pas DeepSeek et y voit plutôt une opportunité pour ses puces

Nvidia ne voit pas DeepSeek comme une menace et a tenu à rassurer les investisseurs après l'hécatombe sur les marchés. Nvidia estime que les progrès de DeepSeek montrent l'utilité de ses puces pour le marché chinois et que davantage de ses puces seront nécessaires à l'avenir pour répondre à la demande des services de DeepSeek. Mais les sanctions imposées à la Chine par Washington limitent la capacité de Nvidia à exporter ses puces vers ce pays.

Nvidia a expliqué dans un communiqué : « le travail de DeepSeek illustre comment de nouveaux modèles peuvent être créés en utilisant cette technique, en tirant parti de modèles largement disponibles et d'un calcul qui est entièrement conforme au contrôle des exportations ». Les sanctions américaines ont été conçues pour empêcher la Chine de créer des superordinateurs pouvant être utilisés par l'armée chinois ou pour développer des outils d'IA avancés.

La fin de cet article est réservée aux abonnés. Soutenez le Club Developpez.com en prenant un abonnement pour que nous puissions continuer à vous proposer des publications.