IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)

Vous êtes nouveau sur Developpez.com ? Créez votre compte ou connectez-vous afin de pouvoir participer !

Vous devez avoir un compte Developpez.com et être connecté pour pouvoir participer aux discussions.

Vous n'avez pas encore de compte Developpez.com ? Créez-en un en quelques instants, c'est entièrement gratuit !

Si vous disposez déjà d'un compte et qu'il est bien activé, connectez-vous à l'aide du formulaire ci-dessous.

Identifiez-vous
Identifiant
Mot de passe
Mot de passe oublié ?
Créer un compte

L'inscription est gratuite et ne vous prendra que quelques instants !

Je m'inscris !

Nvidia rejette la menace DeepSeek et affirme que l'IA chinoise a toujours besoin de ses puces alors que ses actions ont dévissé de 17 %,
Effaçant 600 milliards de dollars de sa capitalisation boursière

Le , par Mathis Lucas

7PARTAGES

4  0 
DeepSeek s'annonce-t-il comme le pire cauchemar de Nvidia ? La startup chinoise vient de publier un modèle d'IA dont les performances semblent aussi remarquables que celles du modèle o1 d'OpenAI pour 95 % moins cher. La nouvelle a provoqué une hécatombe à Wall Street, faisant dévisser les actions d'entreprises telles que Nvidia (17 %) et Broadcom (17,4 %). Cependant, Nvidia n'a pas l'air inquiété par la spéculation selon laquelle DeepSeek menace sa domination sur le marché des puces. Pour Nvidia, les prouesses de DeepSeek indiquent au contraire que la startup chinoise aura besoin davantage de puces d'IA à l'avenir pour faire progresser ses services.

DeepSeek remet en cause l'avenir des puces à haute performance de Nvidia

Le 20 janvier, DeepSeek, dirigé par le gestionnaire de fonds spéculatifs chinois Liang Wenfeng, a publié le modèle d'IA R1 sous une licence MIT ouverte, la plus grande version contenant 671 milliards de paramètres. Elle a pris la Silicon Valley et tout le monde de l'IA par surprise, car, selon un document rédigé par l'entreprise, DeepSeek-R1 bat les principaux modèles du secteur, comme OpenAI o1, sur plusieurs critères mathématiques et de raisonnement.


En fait, sur de nombreux critères importants (capacité, coût, ouverture), DeepSeek donne du fil à retordre aux géants occidentaux de l'IA. DeepSeek affirme avoir créé un modèle de niveau o1 qui fonctionne à 95 % du coût. Si o1 coûte 15 $ par million de jetons d'entrée et 60 $ par million de jetons de sortie (un jeton représente environ 4 caractères), DeepSeek est estimé à environ 0,55 $ et 2,19 $ par million de jetons d'entrée et de sortie, respectivement.

DeepSeek peut fonctionner sur des puces moins avancées. Dans un article publié fin décembre, les chercheurs de DeepSeek ont estimé qu'ils avaient construit et entraîné leur modèle V3 pour moins de 6 millions de dollars en utilisant environ 2 000 puces Nvidia H800. Les informations publiées par DeepSeek ont créé la panique sur le marché. Les investisseurs semblent se demander si la demande pour les puces haut de gamme de Nvidia n'est pas exagérée.

Le fait que R1 soit open source permettra aux développeurs de s'en inspirer et d'apprendre de DeepSeek, voire de l'améliorer. La frénésie autour du modèle R1 de DeepSeek a considérablement augmenté ces derniers jours. Le modèle de DeepSeek s'est hissé en tête du classement des applications les plus téléchargées de l'App Store d'Apple. DeepSeek a battu le chabot d'IA ChatGPT d'OpenAI sur l'App Store, provoquant une chute brutale des actions liées à l'IA.


Les actions de Nvidia ont été malmenées lors de la première séance du marché cette semaine, chutant de 17 %. Les actions d'AMD, le rival de Nvidia, ont également chuté de plus de 6 %. Les actions d'autres géants des semiconducteurs ont également chuté, notamment Broadcom (17,4 %) et TSMC (9.88 %).

Le fait que DeepSeek semble avoir construit son dernier modèle en utilisant des puces moins performantes et moins chères exerce une pression sur Nvidia. Les investisseurs craignent que d'autres entreprises du secteur des grandes technologies réduisent leur demande pour les produits les plus avancés de Nvidia.

Nvidia ne craint pas DeepSeek et y voit plutôt une opportunité pour ses puces

Nvidia ne voit pas DeepSeek comme une menace et a tenu à rassurer les investisseurs après l'hécatombe sur les marchés. Nvidia estime que les progrès de DeepSeek montrent l'utilité de ses puces pour le marché chinois et que davantage de ses puces seront nécessaires à l'avenir pour répondre à la demande des services de DeepSeek. Mais les sanctions imposées à la Chine par Washington limitent la capacité de Nvidia à exporter ses puces vers ce pays.

Nvidia a expliqué dans un communiqué : « le travail de DeepSeek illustre comment de nouveaux modèles peuvent être créés en utilisant cette technique, en tirant parti de modèles largement disponibles et d'un calcul qui est entièrement conforme au contrôle des exportations ». Les sanctions américaines ont été conçues pour empêcher la Chine de créer des superordinateurs pouvant être utilisés par l'armée chinois ou pour développer des outils d'IA avancés.


Malgré les inquiétudes relatives à une bulle dans le secteur de l'IA, les actions de Nvidia ont grimpé ces dernières années, faisant brièvement du fabricant de puces l'entreprise la plus valorisée au monde. Nvidia a le monopole du marché des puces d'IA et est la première entreprise à développer de puissants GPU nécessaires à l'entraînement et à la maintenance des modèles d'IA. En raison de l'offre limitée de ces puces d'IA, les actions de Nvidia ont bondi.

Certains s'inquiètent du fait que les États-Unis, qui ont longtemps pensé être à la pointe du développement de l'IA, sont en réalité en retard sur la Chine. « Si la Chine rattrape rapidement les États-Unis dans la course à l'IA, l'économie de l'IA sera bouleversée », a déclaré Kathleen Brooks, directrice de recherche chez XTB, à ses clients. Marc Andreessen, le légendaire investisseur en technologie, a posté sur X : « Deepseek R1 est le moment Spoutnik de l'IA ».

« Les investisseurs craignent que la capacité de DeepSeek à travailler avec des puces d'IA moins puissantes ne nuise à la domination de Nvidia dans le domaine du matériel d'IA, d'autant plus que sa valorisation dépend fortement de la demande d'IA », a déclaré Kate Leaman, analyste en chef du marché chez AvaTrade. Jusqu'à présent, Nvidia a été l'un des plus grands bénéficiaires de la course à l'IA. Il a continuellement dépassé les attentes de Wall Street.


Jimmy Goodrich, conseiller principal auprès de la RAND Corp pour l'analyse technologique, a déclaré qu'il existe au moins une douzaine de superordinateurs majeurs en Chine équipés d'un grand nombre de puces Nvidia dont l'achat était légal au moment où DeepSeek les a utilisés pour apprendre à devenir plus efficace. Les entreprises américaines spécialisées dans l'IA se sont également intéressées à l'efficacité de leurs systèmes d'IA respectifs.

« DeepSeek n'a pas surgi de nulle part - ils construisent des modèles depuis des années. On sait depuis longtemps que DeepSeek dispose d'une très bonne équipe, et si elle avait accès à encore plus d'ordinateurs, Dieu sait de quoi elle serait capable », a déclaré Jimmy Goodrich.

Impacts potentiels de DeepSeek sur les Big Tech et sur l'industrie à long terme

DeepSeek pourrait remettre en question les arguments avancés par les Big Tech selon lesquels l'augmentation des dépenses se traduit par de meilleurs résultats pour les modèles d'IA. Le nouveau modèle de DeepSeek pose un sérieux défi au modèle o1 d'OpenAI axé sur le raisonnement, mais il a été développé à un coût inférieur. Selon certaines estimations, le modèle R1 aurait coûté seulement 3 à 5 % du montant injecté dans le développement du modèle o1.

Cette situation a suscité des inquiétudes dans toute la Silicon Valley. Meta aurait réagi en mettant en place quatre cellules de crise pour analyser DeepSeek et tenter de comprendre comment la startup chinoise a réussi cette prouesse, notamment comment elle a réduit les coûts de formation et quelles données elle a pu utiliser. Certains observateurs chevronnés du marché s'attendent également à ce que les actions des fabricants de puces baissent davantage.

L'impact à long terme de DeepSeek reste à débattre, car il existe toujours une forte demande aux États-Unis pour des puces d'IA avancées de Nvidia. Meta a récemment annoncé qu'il portait ses dépenses d'investissement à 65 milliards de dollars pour se concentrer sur l'infrastructure de l'IA. Microsoft viserait des investissements similaires. De son côté, OpenAI codirige le projet faramineux Stargate, d'une valeur estimée à plus de 500 milliards de dollars.

« À court terme, les annonces de DeepSeek pourraient avoir plus d'implications qu'à long terme », a déclaré Javier Correonero, analyste des actions chez Morningstar. Dan Ives, de Wedbush, a rejeté les inquiétudes concernant la chute des cours, la qualifiant plutôt d'opportunité « d'achat en or » pour Nvidia.

Javier Correonero a ajouté : « si les Big Tech réduisent leurs perspectives d'investissement, cela se répercutera en amont dans l'industrie, affectant tous les acteurs et les taux de croissance à court terme dans l'ensemble de l'espace. Cependant, il y a aussi un aspect haussier, car une plus grande efficacité de calcul pourrait entraîner une baisse des coûts et une adoption encore plus large de l'IA à long terme, ce que l'on appelle le paradoxe de Jevons ».

Source : Nvidia

Et vous ?

Quel est votre avis sur le sujet ?
Que pensez-vous de la frénésie suscitée par le modèle chinois DeepSeek-R1 ?
DeepSeek remet-il en cause les pratiques de développement des grands modèles de langage ?
Quels impacts DeepSeek pourrait-il avoir sur le secteur de l'IA à court terme et à long terme, notamment sur Nvidia ?
Les sanctions américaines étaient destinées à empêcher la Chine d'atteindre ce niveau. Comment expliquez-vous l'échec des États-Unis ?
Comment l'Europe, en particulier la France, doit-elle se positionner dans cette course à l'IA ? Sur quels leviers la France peut-elle se baser ?

Voir aussi

L'IA française Lucie, conçue avec le soutien de l'État, est moquée et qualifiée « d'inutile et de stupide » en raison de ses réponses absurdes, elle a été mise hors ligne deux jours après son lancement

Avec l'apprentissage par renforcement, le LLM open source DeepSeek-R1 correspondrait à o1 d'OpenAI pour 95 % moins cher. R1 est déjà numéro un des téléchargements Apple Store, suivi par ChatGPT

Le laboratoire d'IA chinois DeepSeek a publié sa nouvelle famille de modèles R1 sous une licence MIT ouverte, affirmant que le modèle présente des performances comparables au raisonnement simulé o1 d'OpenAI

Une erreur dans cette actualité ? Signalez-nous-la !

Avatar de Fluxgraveon
Membre actif https://www.developpez.com
Le 28/01/2025 à 16:30
« DeepSeek n'a pas surgi de nulle part - ils construisent des modèles depuis des années. On sait depuis longtemps que DeepSeek dispose d'une très bonne équipe, et si elle avait accès à encore plus d'ordinateurs, Dieu sait de quoi elle serait capable », a déclaré Jimmy Goodrich.
Et donc les équipes chinoises (ici une startup "dirigée") offriraient en licence ouverte ce qu'elles ont de plus avancé ?
Ou plutôt une indication de ce qu'est ici et là cette économie "spéculative" ?
C'est intéressant.
1  0 
Avatar de rust2code
Nouveau membre du Club https://www.developpez.com
Le 28/01/2025 à 17:42
Pour une fois que les Américains se ramassent une pair de claque en règle. Cachez ce sourire narquois s'il vous plait!

J'en profite pour souhaiter bon courage aux Chinois avec la prise d'otage TikTok et les nouvelles taxes qu'ils vont se prendre d'ici une semaine.
1  0 
Avatar de marsupial
Expert éminent https://www.developpez.com
Le 28/01/2025 à 17:54
De toutes les manières la question ne se pose même pas puisque les Etats-Unis interdisent l'export de puces haute performance vers la Chine et la Russie.
1  0 
Avatar de Fluxgraveon
Membre actif https://www.developpez.com
Le 29/01/2025 à 10:05
Citation Envoyé par Jade Emy Voir le message
DeepSeek a déclaré que sa nouvelle application populaire a été victime d'une cyberattaque, ce qui a contraint l'entreprise chinoise à limiter temporairement les inscriptions. DeepSeek a déclaré avoir été victime d'une "attaque malveillante à grande échelle". Ces attaques interviennent après que la popularité de ses nouveaux modèles d'IA ait explosé.
Pas étonnant, une signature d'affrontement de blocs au sein d'une zone de domination concurrentielle, empruntant, qui plus est, des voies de développement opposées (force brute, optimisation process, en gros mais aussi enrichissement personnel, enrichissement communautaire) et paradoxalement complémentaires.
Vieux comme le monde.
1  0 
Avatar de Fluxgraveon
Membre actif https://www.developpez.com
Le 29/01/2025 à 14:36
Pendant ce temps là, le copain de Macron (Alexandre Zapolsky) pond Lucie qui ressemble plus à Lucie Castets que Lucy (film de Besson)
En France, la recherche sur l'IA est essentiellement militaire et "classée secret défense", non ?
1  0 
Avatar de NotABread
Membre actif https://www.developpez.com
Le 29/01/2025 à 15:54
Je suis loin d'être juriste ni d'avoir les détails techniques derrières tout ça, mais puisque les sorties des IA sont la propriété de personne, et que l'utilisation de contenu sous droit d'auteur pour la formation de réseau de neurone est du fair use d'après OpenAI:
- comment la distillation relève dans ce cas est une violation du droit d'auteur ? La sortie est libre de droit
- selon les principes d'OpenAI, pourquoi la distillation ne serait pas du fair use ?
- est-ce que refuser la distillation n'est pas un obstacle à la mission annoncée d'OpenAI (l’avènement d'une AIG) ?
- quelles sont les preuves OpenAI et peut-on démontrer que ce n'est pas lié à un jeu d'entrainement similaire ? Avec la reproduction ouverte de DeepSeck, il devrait être possible de trouver ces preuves, non ?
1  0 
Avatar de OuftiBoy
Membre éprouvé https://www.developpez.com
Le 29/01/2025 à 18:28


Il est quand même sans gêne ce Altman.

Il trouve normal d'utiliser des données ayant un droit d'auteur gratuitement pour alimenter son IA, mais si on se sert de son droit d'auteur à lui, il est pas content le Monsieur. C'est un peu l'hopital qui se fout de la charité .

C'est un peu la jungle avec les IA. Si je demande à une IA de me montrer en direct un match de foot, je "bypass" les droits d'auteurs de la "chaîne TV" ayant chèrement payer ces droits, et cela serait légal ? Et si c'est illégale, pourquoi le reste de ce qui est pompé et recracher par l'IA ne le serait-il pas ?

Si je filme le match (qui sort d'une "machine", ici la TV) avec une super caméra (une autre machine) et que je diffuse cela en direct streaming sur "Internet" (qui repose au final sur des machines), c'est donc légal ?

Bref, les grands de ce monde vont arranger tout cela à leur prochaine réunion à Davos, et tous les autres seront raquetés. Deux poids, deux mesures. Les (quelques) forts d'un côté et la masse des faibles gueux de l'autre.

Elle est pas belle la vie .

BàV et Peace & Love.
1  0 
Avatar de noremorse
Membre actif https://www.developpez.com
Le 29/01/2025 à 12:15
Pendant ce temps là, le copain de Macron (Alexandre Zapolsky) pond Lucie qui ressemble plus à Lucie Castets que Lucy (film de Besson)

1  1 
Avatar de gabi7756
Membre confirmé https://www.developpez.com
Le 29/01/2025 à 16:43
Citation Envoyé par Fluxgraveon Voir le message
En France, la recherche sur l'IA est essentiellement militaire et "classée secret défense", non ?
Bah non ...
Lucie ( gros navet)
Mistral ...
Bref il y a pas besoin de toucher à des sujets sensible pour trouver des IA françaises
0  0 
Avatar de marsupial
Expert éminent https://www.developpez.com
Le 29/01/2025 à 16:54
Citation Envoyé par Fluxgraveon Voir le message
En France, la recherche sur l'IA est essentiellement militaire et "classée secret défense", non ?
L'IA pour domaine critique (ça ne se limite pas au militaire) n'est pas de l'IA générative mais une véritable 'intelligence' capable d'apprendre à partir de très peu de données et de 'raisonner'. Elle ne s'appuie pas sur des données humaines mais sur des données machines (logs, instructions binaires, capteurs, etc... ). Donc elle est sans biais, sécurisée et fiable à 100% (il le faut pour les domaines auxquels elle s'applique), j'y ai veillé dès sa création. Thales a ensuite développé, optimisé autour tel que je lui ai conseillé. Je leur ai fourni le cahier des charges et les différentes formules à appliquer en 2015.

https://www.thalesgroup.com
0  0