DeepSeek remet en cause l'avenir des puces à haute performance de Nvidia
Le 20 janvier, DeepSeek, dirigé par le gestionnaire de fonds spéculatifs chinois Liang Wenfeng, a publié le modèle d'IA R1 sous une licence MIT ouverte, la plus grande version contenant 671 milliards de paramètres. Elle a pris la Silicon Valley et tout le monde de l'IA par surprise, car, selon un document rédigé par l'entreprise, DeepSeek-R1 bat les principaux modèles du secteur, comme OpenAI o1, sur plusieurs critères mathématiques et de raisonnement.
En fait, sur de nombreux critères importants (capacité, coût, ouverture), DeepSeek donne du fil à retordre aux géants occidentaux de l'IA. DeepSeek affirme avoir créé un modèle de niveau o1 qui fonctionne à 95 % du coût. Si o1 coûte 15 $ par million de jetons d'entrée et 60 $ par million de jetons de sortie (un jeton représente environ 4 caractères), DeepSeek est estimé à environ 0,55 $ et 2,19 $ par million de jetons d'entrée et de sortie, respectivement.
DeepSeek peut fonctionner sur des puces moins avancées. Dans un article publié fin décembre, les chercheurs de DeepSeek ont estimé qu'ils avaient construit et entraîné leur modèle V3 pour moins de 6 millions de dollars en utilisant environ 2 000 puces Nvidia H800. Les informations publiées par DeepSeek ont créé la panique sur le marché. Les investisseurs semblent se demander si la demande pour les puces haut de gamme de Nvidia n'est pas exagérée.
Le fait que R1 soit open source permettra aux développeurs de s'en inspirer et d'apprendre de DeepSeek, voire de l'améliorer. La frénésie autour du modèle R1 de DeepSeek a considérablement augmenté ces derniers jours. Le modèle de DeepSeek s'est hissé en tête du classement des applications les plus téléchargées de l'App Store d'Apple. DeepSeek a battu le chabot d'IA ChatGPT d'OpenAI sur l'App Store, provoquant une chute brutale des actions liées à l'IA.
Les actions de Nvidia ont été malmenées lors de la première séance du marché cette semaine, chutant de 17 %. Les actions d'AMD, le rival de Nvidia, ont également chuté de plus de 6 %. Les actions d'autres géants des semiconducteurs ont également chuté, notamment Broadcom (17,4 %) et TSMC (9.88 %).
Le fait que DeepSeek semble avoir construit son dernier modèle en utilisant des puces moins performantes et moins chères exerce une pression sur Nvidia. Les investisseurs craignent que d'autres entreprises du secteur des grandes technologies réduisent leur demande pour les produits les plus avancés de Nvidia.
Nvidia ne craint pas DeepSeek et y voit plutôt une opportunité pour ses puces
Nvidia ne voit pas DeepSeek comme une menace et a tenu à rassurer les investisseurs après l'hécatombe sur les marchés. Nvidia estime que les progrès de DeepSeek montrent l'utilité de ses puces pour le marché chinois et que davantage de ses puces seront nécessaires à l'avenir pour répondre à la demande des services de DeepSeek. Mais les sanctions imposées à la Chine par Washington limitent la capacité de Nvidia à exporter ses puces vers ce pays.
Nvidia a expliqué dans un communiqué : « le travail de DeepSeek illustre comment de nouveaux modèles peuvent être créés en utilisant cette technique, en tirant parti de modèles largement disponibles et d'un calcul qui est entièrement conforme au contrôle des exportations ». Les sanctions américaines ont été conçues pour empêcher la Chine de créer des superordinateurs pouvant être utilisés par l'armée chinois ou pour développer des outils d'IA avancés.
Deepseek R1 is AI's Sputnik moment.
— Marc Andreessen 🇺🇸 (@pmarca) January 26, 2025
Malgré les inquiétudes relatives à une bulle dans le secteur de l'IA, les actions de Nvidia ont grimpé ces dernières années, faisant brièvement du fabricant de puces l'entreprise la plus valorisée au monde. Nvidia a le monopole du marché des puces d'IA et est la première entreprise à développer de puissants GPU nécessaires à l'entraînement et à la maintenance des modèles d'IA. En raison de l'offre limitée de ces puces d'IA, les actions de Nvidia ont bondi.
Certains s'inquiètent du fait que les États-Unis, qui ont longtemps pensé être à la pointe du développement de l'IA, sont en réalité en retard sur la Chine. « Si la Chine rattrape rapidement les États-Unis dans la course à l'IA, l'économie de l'IA sera bouleversée », a déclaré Kathleen Brooks, directrice de recherche chez XTB, à ses clients. Marc Andreessen, le légendaire investisseur en technologie, a posté sur X : « Deepseek R1 est le moment Spoutnik de l'IA ».
« Les investisseurs craignent que la capacité de DeepSeek à travailler avec des puces d'IA moins puissantes ne nuise à la domination de Nvidia dans le domaine du matériel d'IA, d'autant plus que sa valorisation dépend fortement de la demande d'IA », a déclaré Kate Leaman, analyste en chef du marché chez AvaTrade. Jusqu'à présent, Nvidia a été l'un des plus grands bénéficiaires de la course à l'IA. Il a continuellement dépassé les attentes de Wall Street.
Jimmy Goodrich, conseiller principal auprès de la RAND Corp pour l'analyse technologique, a déclaré qu'il existe au moins une douzaine de superordinateurs majeurs en Chine équipés d'un grand nombre de puces Nvidia dont l'achat était légal au moment où DeepSeek les a utilisés pour apprendre à devenir plus efficace. Les entreprises américaines spécialisées dans l'IA se sont également intéressées à l'efficacité de leurs systèmes d'IA respectifs.
« DeepSeek n'a pas surgi de nulle part - ils construisent des modèles depuis des années. On sait depuis longtemps que DeepSeek dispose d'une très bonne équipe, et si elle avait accès à encore plus d'ordinateurs, Dieu sait de quoi elle serait capable », a déclaré Jimmy Goodrich.
Impacts potentiels de DeepSeek sur les Big Tech et sur l'industrie à long terme
DeepSeek pourrait remettre en question les arguments avancés par les Big Tech selon lesquels l'augmentation des dépenses se traduit par de meilleurs résultats pour les modèles d'IA. Le nouveau modèle de DeepSeek pose un sérieux défi au modèle o1 d'OpenAI axé sur le raisonnement, mais il a été développé à un coût inférieur. Selon certaines estimations, le modèle R1 aurait coûté seulement 3 à 5 % du montant injecté dans le développement du modèle o1.
Cette situation a suscité des inquiétudes dans toute la Silicon Valley. Meta aurait réagi en mettant en place quatre cellules de crise pour analyser DeepSeek et tenter de comprendre comment la startup chinoise a réussi cette prouesse, notamment comment elle a réduit les coûts de formation et quelles données elle a pu utiliser. Certains observateurs chevronnés du marché s'attendent également à ce que les actions des fabricants de puces baissent davantage.
L'impact à long terme de DeepSeek reste à débattre, car il existe toujours une forte demande aux États-Unis pour des puces d'IA avancées de Nvidia. Meta a récemment annoncé qu'il portait ses dépenses d'investissement à 65 milliards de dollars pour se concentrer sur l'infrastructure de l'IA. Microsoft viserait des investissements similaires. De son côté, OpenAI codirige le projet faramineux Stargate, d'une valeur estimée à plus de 500 milliards de dollars.Jevons paradox strikes again! As AI gets more efficient and accessible, we will see its use skyrocket, turning it into a commodity we just can't get enough of. https://t.co/omEcOPhdIz
— Satya Nadella (@satyanadella) January 27, 2025
« À court terme, les annonces de DeepSeek pourraient avoir plus d'implications qu'à long terme », a déclaré Javier Correonero, analyste des actions chez Morningstar. Dan Ives, de Wedbush, a rejeté les inquiétudes concernant la chute des cours, la qualifiant plutôt d'opportunité « d'achat en or » pour Nvidia.
Javier Correonero a ajouté : « si les Big Tech réduisent leurs perspectives d'investissement, cela se répercutera en amont dans l'industrie, affectant tous les acteurs et les taux de croissance à court terme dans l'ensemble de l'espace. Cependant, il y a aussi un aspect haussier, car une plus grande efficacité de calcul pourrait entraîner une baisse des coûts et une adoption encore plus large de l'IA à long terme, ce que l'on appelle le paradoxe de Jevons ».
Source : Nvidia
Et vous ?
Quel est votre avis sur le sujet ?
Que pensez-vous de la frénésie suscitée par le modèle chinois DeepSeek-R1 ?
DeepSeek remet-il en cause les pratiques de développement des grands modèles de langage ?
Quels impacts DeepSeek pourrait-il avoir sur le secteur de l'IA à court terme et à long terme, notamment sur Nvidia ?
Les sanctions américaines étaient destinées à empêcher la Chine d'atteindre ce niveau. Comment expliquez-vous l'échec des États-Unis ?
Comment l'Europe, en particulier la France, doit-elle se positionner dans cette course à l'IA ? Sur quels leviers la France peut-elle se baser ?
Voir aussi
L'IA française Lucie, conçue avec le soutien de l'État, est moquée et qualifiée « d'inutile et de stupide » en raison de ses réponses absurdes, elle a été mise hors ligne deux jours après son lancement
Avec l'apprentissage par renforcement, le LLM open source DeepSeek-R1 correspondrait à o1 d'OpenAI pour 95 % moins cher. R1 est déjà numéro un des téléchargements Apple Store, suivi par ChatGPT
Le laboratoire d'IA chinois DeepSeek a publié sa nouvelle famille de modèles R1 sous une licence MIT ouverte, affirmant que le modèle présente des performances comparables au raisonnement simulé o1 d'OpenAI