IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)

Vous êtes nouveau sur Developpez.com ? Créez votre compte ou connectez-vous afin de pouvoir participer !

Vous devez avoir un compte Developpez.com et être connecté pour pouvoir participer aux discussions.

Vous n'avez pas encore de compte Developpez.com ? Créez-en un en quelques instants, c'est entièrement gratuit !

Si vous disposez déjà d'un compte et qu'il est bien activé, connectez-vous à l'aide du formulaire ci-dessous.

Identifiez-vous
Identifiant
Mot de passe
Mot de passe oublié ?
Créer un compte

L'inscription est gratuite et ne vous prendra que quelques instants !

Je m'inscris !

SemiAnalysis affirme que DeepSeek a dépensé plus de 500 millions de dollars en puces Nvidia malgré les allégations au sujet d'une IA à bas prix,
Suscitant des interrogations sur la transparence de DeepSeek

Le , par Mathis Lucas

15PARTAGES

6  1 
DeepSeek a provoqué une hécatombe à Wall Street le 27 janvier à la suite des informations selon lesquelles les performances de son modèle d'IA R1 égalent celles du modèle o1 d'OpenAI pour une fraction du prix, soit 5,6 millions de dollars. Et la startup chinoise n'aurait eu besoin que de 2 048 puces Nvidia H800 pour atteindre ce résultat. Cependant, la société d'analyse SemiAnalysis indique que DeepSeek, qui a été créée en 2023, a dépensé plus de 500 millions de dollars en GPU au cours de son histoire. Cette information a suscité des interrogations sur la transparence de DeepSeek. Elle ne semble pas toutefois remettre en cause ses efforts.

Les données financières publiées par le chinois DeepSeek suscitent la polémique

En décembre 2024, DeepSeek a publié le grand modèle de langage (LLM) appelé « V3 ». Selon DeepSeek, V3 est aussi performant que les modèles de dernière génération de Google et OpenAI, mais n'a nécessité qu'une fraction du budget de ses rivaux américains, soit 5,6 millions de dollars. DeepSeek précise n'avoir utilisé que 2 048 puces Nvidia H800, des puces moins avancées que les accélérateurs Nvidia H100 et initialement conçues pour le marché chinois.

Puis, le 20 janvier 2025, DeepSeek a dévoilé son dernier modèle R1, qui est un modèle axé sur le raisonnement comparable au modèle o1 d'OpenAI. L'annonce a fait l'effet d'une bombe à Wall Street et a provoqué une chute brutale et importante des actions de nombreuses entreprises technologiques américaines engagées dans la course à l'IA. L'action Nvidia a dévissé de 17 %, effaçant 600 milliards de dollars de la capitalisation boursière de l'entreprise.


Mais les analystes de SemiAnalysis ont tenu à apporter quelques nuances aux déclarations de DeepSeek. SemiAnalysis est une société indépendante de recherche et d'analyse spécialisée dans les secteurs des semiconducteurs et de l'IA. Dylan Patel, analyste en chef chez SemiAnalysis, affirme que DeepSeek et sa société sœur, le fonds spéculatif High-Flyer, ont accès à des dizaines de milliers de GPU Nvidia, qui ont servi à entraîner les prédécesseurs de R1.

« DeepSeek a dépensé plus de 500 millions de dollars en GPU au cours de son histoire. Bien que leur programme d'entraînement ait été très efficace, il a nécessité une expérimentation et des tests importants pour fonctionner », a déclaré Dylan Patel.

Il a ajouté que la réduction des coûts de formation et d'exploitation des modèles d'IA permettrait à long terme aux entreprises et aux consommateurs d'adopter à moindre coût les applications d'IA. Nvidia a fait valoir que les innovations de DeepSeek profiteraient à ses activités, et qu'elles ne les feraient exploser.

Dan Hutcheson, de TechInsights, a déclaré que la réaction du marché ne reflétait pas qui était le plus exposé à la percée de DeepSeek. « Je ne vois pas cela comme un gros coup pour Nvidia, je vois cela comme un gros problème pour les entreprises comme OpenAI qui essaient de vendre ces services », a-t-il déclaré.

Cette controverse remet-elle en question les prouesses techniques de DeepSeek ?

Ces informations contradictoires rendent difficile l'évaluation précise des dépenses réelles de DeepSeek en matière de matériel et ses dépenses relatives à l'entraînement de ses systèmes d'IA. Selon certains analystes, il est possible que les 500 millions de dollars mentionnés incluent des investissements à long terme ou des dépenses liées à d'autres projets au sein de la startup. Une analyse plus approfondie serait nécessaire pour clarifier ces divergences.

Pour effrayer davantage les investisseurs, DeepSeek a déclaré que ses ingénieurs ont été mesure de débloquer de meilleures performances en écrivant du code sans s'appuyer sur la plateforme logicielle CUDA de Nvidia. CUDA est considérée comme cruciale pour la domination du fabricant de Nvidia dans le développement de l'IA. Les prouesses de DeepSeek ont été largement saluées dans l'industrie, y compris Sam Altman, PDG d'OpenAI, et Nvidia lui-même.


Nvidia a déclaré : « DeepSeek est une excellente avancée en matière d'IA et un exemple parfait de test Time Scaling. L'inférence nécessite un nombre important de GPU Nvidia et un réseau de haute performance ». La déclaration de Nvidia suggère qu'en repoussant les limites de ce qui est possible avec les modèles d'IA open source, DeepSeek a en fait augmenté la demande pour les puces de pointe qui sont utilisées pour faire fonctionner ses systèmes.

Si certains analystes contestent l'idée que l'IA révolutionnaire de DeepSeek soit si peu coûteuse à construire, ils ne semblent pas remettre en cause les prouesses techniques de la startup. L'IA de DeepSeek est open source, ce qui signifie que n'importe qui peut la disséquer et vérifier ses performances.

L'investisseur en capital-risque Marc Andreessen a qualifié le nouveau modèle R1 de la startup chinoise de « moment Spoutnik de l'IA », établissant ainsi une comparaison avec la manière dont l'Union soviétique a pris de court les États-Unis en mettant le premier satellite en orbite en octobre 1957.

Certains acteurs de l'industrie considèrent d'ailleurs l'IA de DeepSeek comme le triomphe de l'open source. Le président américain Donald Trump a déclaré que « DeepSeek devrait être un signal d'alarme pour les entreprises américaines, qui doivent se concentrer sur la concurrence pour gagner ».

DeepSeek-R1 : une victoire de l'open source et du logiciel libre ?

Yann LeCun, responsable scientifique de la division IA chez Meta, a donné son avis sur le succès de DeepSeek. Selon lui, ce qu'il faut retenir est la volonté de DeepSeek de maintenir ses modèles d'IA open source afin que tout le monde puisse en bénéficier. Yann LeCun a fait remarquer que la réussite de DeepSeek ne consistait pas à placer la Chine devant les États-Unis dans le secteur de l'IA, mais à s'assurer que les modèles open source restent en tête.

« Ce n'est pas que l'IA chinoise surpasse les États-Unis, mais plutôt que les modèles open source surpassent les modèles propriétaires », a déclaré Yann LeCun. Selon lui, DeepSeek a bénéficié de l'open source et de la recherche ouverte. « Ils ont trouvé de nouvelles idées et les ont développées en s'appuyant sur le travail d'autres personnes. Comme leur travail est publié et qu'il s'agit d'une source ouverte, tout le monde peut en profiter », a déclaré Yann LeCun.

« C'est la force de la recherche ouverte et de l'open source », a-t-il ajouté. DeepSeek partage les mêmes attributs que le modèle Llama de Meta, les deux étant open source. Yann LeCun affirme depuis longtemps que l'open source est la seule voie pour développer une IA sûre et profitable à tous.

Dans un récent message publié sur LinkedIn, Pat Gelsinger, récemment évincé de son poste de PDG d'Intel, a déclaré : « la réaction du marché est erronée : la baisse du coût de l'IA élargira le marché. DeepSeek est un incroyable travail d'ingénierie qui va permettre une plus grande adoption de l'IA ».

Quoi qu'il en soit, DeepSeek a remis en cause le concept de « mise à l'échelle de l'IA », popularisé par des dirigeants de startups d'IA telles qu'OpenAI et Anthropic. Ce concept suggère que les modèles d'IA deviennent plus « intelligents » à mesure qu'ils sont alimentés en données et en ressources informatiques.

Le chatbot DeepSeek s'est hissé en tête du classement de l'App Store d'Apple aux États-Unis quelques jours après son lancement, dépassant son rival ChatGPT. Outre Nvidia, DeepSeek a provoqué la chute des actions d'autres entreprises technologiques telles que Broadcom (17,4 %) et TSMC (9.88 %).

Source : Dylan Patel, analyste en chef chez SemiAnalysis

Et vous ?

Quel est votre avis sur le sujet ?
Que pensez-vous de la polémique concernant les dépenses réelles de la startup chinoise DeepSeek ?
DeepSeek aurait dépensé plus de 500 millions de dollars en GPU jusqu'à présent. Qu'en pensez-vous ?
La controverse autour des dépenses de DeepSeek remet-elle en cause ses prouesses techniques ?

Voir aussi

Nvidia rejette la menace DeepSeek et affirme que l'IA chinoise a toujours besoin de ses puces alors que ses actions ont dévissé de 17 %, effaçant 600 milliards de dollars de sa capitalisation boursière

L'entreprise technologique chinoise Alibaba a lancé une nouvelle version de son modèle d'IA Qwen 2.5-Max, affirmant qu'il surpasse DeepSeek : "Qwen 2.5-Max surpasse GPT-4o, DeepSeek-V3 et Llama-3.1-405B"

Avec l'apprentissage par renforcement, le LLM open source DeepSeek-R1 correspondrait à o1 d'OpenAI pour 95 % moins cher. R1 est déjà numéro un des téléchargements Apple Store, suivi par ChatGPT

Une erreur dans cette actualité ? Signalez-nous-la !

Avatar de noremorse
Membre actif https://www.developpez.com
Le 29/01/2025 à 20:48
Malgré cela, la somme dépensée par DeepSeek reste largement inférieure aux montants faramineux que comptent dépenser les occidentaux
5  0 
Avatar de rust2code
Membre régulier https://www.developpez.com
Le 29/01/2025 à 22:57
Citation Envoyé par Developpez.com
Mais les analystes de SemiAnalysis ont tenu à apporter quelques nuances aux déclarations de DeepSeek. SemiAnalysis est une société indépendante de recherche et d'analyse spécialisée dans les secteurs des semiconducteurs et de l'IA.
Citation Envoyé par SemiAnalysis
All matters arising out of or relating to these Terms are governed by and construed in accordance with the internal laws of the State of Florida without giving effect to any choice or conflict of law provision or rule (whether of the State of Florida or any other jurisdiction) that would cause the application of the laws of any jurisdiction other than those of the State of Florida.
Entreprise américaine 100% indépendante et impartiale. Mais tout à fait!
4  0 
Avatar de OrthodoxWindows
Membre expert https://www.developpez.com
Le 02/02/2025 à 17:47
Outre le domaine de la sécurité, DeepSeek est accusé d'appliquer une censure stricte sur des sujets politiquement sensibles en Chine. Les utilisateurs ont vu le chatbot chinois répondre, puis se censurer en temps réel. Pour certains critiques, il s'agit d'un aperçu saisissant du contrôle exercé par la Chine sur l'information, mais d'autres rappellent que n'importe qui peut télécharger le modèle open source de DeepSeek et l'adapter pour supprimer les restrictions de Pékin.
Ce qui veut aussi dire que n'importe qui peu télécharger n'importe quel modèle open-source pour supprimer les restrictions de sécurité, y compris concernant ce que Cisco nomme "six catégories de comportements nuisibles, dont la cybercriminalité, la désinformation, les activités illégales et le préjudice général"

De plus, DeepSeek n'est pas le premier modèle open-source à être sorti non-censuré là dessus. Il y a déjà eu plusieurs modèles de Mistral.
Pourtant, il me semble que la criminalité n'a pas sensiblement augmenté de part le monde de manière significative, la cybercriminalité non plus, et la Terre ne s'est pas arrêtée de tourner... Du coup, l'on est sérieusement en droit de se demander si Cisco n'exagère pas énormément en parlant de résultats "alarmants".
Et cela en prenant en compte le fait que de toute façon, à partir du moment où un modèle est open-source, n'importe qui peu le modifier...

Le vrai danger de l'IA ne sera pas lié au péquin lambda qui veut générer n'importe quel instruction illégale sur son ordi ou son portable. Les deux vrais danger de l'IA sont les entreprises qui cherchent à s’approprier à elle-seule certains algorithmes, afin de rendre dépendant des milliers de personnes et d'entreprises dans le monde. Et surtout, que des régimes autoritaires, voir totalitaires, s'en servent pour contrôler et surveiller les gens, censurer du contenu dynamiquement, et faire la guerre avec des robots tueurs.
4  0 
Avatar de rust2code
Membre régulier https://www.developpez.com
Le 03/02/2025 à 8:34
D'abord DeepSeek est critiqué pour sa censure, ensuite pour le fait qu'il n'est pas assez sécurisé contre son détournement.

Que DeepSeek puisse être jailbreaké n'est pas mon problème ni celui d'une majorité d'utilisateurs, qui ne savent même pas de quoi il s'agit. Et ce ne sont pas les armes qui font les criminels, mais ceux qui les utilisent à mauvais dessein.

Par ailleurs, le fait que la Chine censure des éléments de sa politique interne dans DeepSeek n'a rien de surprenant ni d'illégal. Ce n'est pas comme si dans ChatGPT régnait la transparence et la liberté d'expression. Loin de là. Certains devraient cesser de juger de leur propre vertu.

Et franchement, qui passe ses journées à formuler des prompts à propos de la politique de la Chine, que ce soit sur DeepSeek ou ChatGPT ? Est-ce que la censure chinoise a une quelconque influence sur votre quotidien ?

Tout cela ressemble à une campagne de dénigrement qui ne dit pas son nom. C'est tout petit et tout moche. Très occidental en soi.
2  0 
Avatar de PomFritz
Membre confirmé https://www.developpez.com
Le 04/02/2025 à 19:57
Citation Envoyé par noremorse Voir le message
Nouveau coup dur pour les sanctions américaines : La Russie et la Chine multiplient par 800 les performances de NVIDIA

Des scientifiques des deux pays ont mis au point un algorithme révolutionnaire à partir d'informations issues de la rétroconception d'accélérateurs de cartes vidéo. Cet algorithme permet d'utiliser les GPU de jeu pour le calcul scientifique.


Cette innovation a été réalisée par des spécialistes de l'université MSU-BIT de Shenzhen, cofondée par l'université d'État de Moscou Lomonossov et l'Institut de technologie de Pékin.

Cela permet à la Russie et à la Chine de réduire leur dépendance vis-à-vis des GPU NVIDIA et d'atténuer l'impact des sanctions américaines.

Cela signifie également que la Russie et la Chine doivent acheter moins de GPU NVIDIA, ce qui a probablement conduit à l'effondrement du prix de l'action NVIDIA, a déclaré à Sputnik Valentin Makarov, président de l'association Russoft.

Selon lui, les recherches en cours comprennent de nouveaux algorithmes d'apprentissage automatique et un GPU de nouvelle génération en cours de développement en Russie.

Ces avancées mettent en évidence l'expertise technologique de la Russie, ce qui permet une collaboration avec la Chine et de futurs partenariats potentiels avec l'Inde.

PS : Les sanctions c’est pour les cons
C'est une info? Une opinion? Une déclaration? Des détails?
2  0 
Avatar de OuftiBoy
Membre éprouvé https://www.developpez.com
Le 03/02/2025 à 12:03
Citation Envoyé par jpdeniel Voir le message
Franchement dire qu'ils ont volé quelque chose a OpenAI c'est une farce non (ClosedAI j'insiste). Les américains sorte la grosse artillerie 500 milliards de $) mais les chinois sont hyper motivés.
La "force brute" n'est pas toujours le meilleur moyen de gagner.

D'un côté, les USA vont la jouer Shwartzenager, Stallone, Willis ou Van Damme (tant qu'ils ont la maîtrise de "la" monnaie mondiale (le $), ils peuvent le faire). De l'autre côté, les chinois vont faire ce qu'ils ont toujours fait, copier ce qu'ils n'ont pas les moyens de créer, ajouter un petit brin bien à eux, le faire faire pour trois croutons et 2 bol de riz, et innonder le marché. Tant qu'on les laissent faire, pourquoi feraient-ils autrement ? Il n'y a pas si longtemps, on se moquait d'eux, mais depuis 10 à 20 ans, ils sont aussi devenus un "pays riche", et personne n'osera s'opposer frontalement à eux.

Citation Envoyé par jpdeniel Voir le message
Nous sommes face a la conquête de la lune bis. Mais en toute sincérité je n'ai rien contre les chinois pas plus que contre les américains.
Moi non plus, ils jouent chacuns avec leur moyens , qui ne ferait pas pareil ? Ah, si, l'Europe

Citation Envoyé par jpdeniel Voir le message
Non, j'en ai contre la France qui fait n'importe quoi.
La France, elle est musellée par l'Europe, qui elle-même s'est vendue au reste du monde pour le profit de quelques un. La "Commission Européenne" n'est pas démocratique (quelqu'un a voté pour Ursula VanMachin ?) et nous en payons tous le prix.

La seule solution pour les européens, c'est soit de changer de cap et de se défendre, soit (pour ceux qui le peuvent) sortir de l'Europe "Oligarchique". Militairement, seule la France pourrait le faire (car elle a l'arme nucléaire), comme l'ont fait les British. Mais votre Président, avec tout mon respect, est le premier défenseur de l'Europe, et aura fait un mal fou à votre pays quant il s'en ira.

Je ne suis pas contre une 'union européenne', mais pas sous la forme qu'elle a actuellement. Elle a prouvé son 'incompétence' (ou pire, qu'elle n'est qu'une petite dictature douce et mielleuse) a défendre ses citoyens. Changeons d'Europe, et cela ira déjà mieux.

Citation Envoyé par jpdeniel Voir le message
On pourrait avoir tout ce qu'on veut mais ça sera encore des médiocres aux commandes.
Cela reste a prouver (d'avoir tout ce que vous voulez). C'est d'ailleur la source de tous les soucis de ce monde. Chacuns veut tout, même ce dont il n'a pas besoin. Mais je suis d'accord avec la deuxième partie

Citation Envoyé par jpdeniel Voir le message
Enfin tant qu'on a des sacs a main a vendre ou des montres de Luxe.
Si ça fonctionne (les sacs et les montres), ce serait dommage de s'en priver, il reste si peu de "l'aura" française...

Citation Envoyé par jpdeniel Voir le message
Mais qui porte encore une montre se luxe franchement. A si, des mecs qui ont besoin de ça pour exister.
Chacun peut encore faire se qu'il veut de l'argent qu'on lui laisse dans les poches, non ? Si quelqu'un a les moyens, et quelque soit la raison, c'est son "choix". Le problème est autre, il provient de ceux qui n'ont pas les moyen et veulent ce dont ils n'ont pas besoin. Et donc crédit, donc "mains liées". A un niveau de classe inférieure, il faut avoir une plus belle voitute que le voisin, etc...

Bah, on ne peut rien y changer.

BàV et Peace & Love.
1  0 
Avatar de Rep.Movs
Membre actif https://www.developpez.com
Le 03/02/2025 à 16:35
Mon expérience avec Copilot? "Je préfère ne pas continuer cette discussion". Pour tout et n'importe quoi. Même de la génération de programme. C'est moitié utilisable.
Deepseek fourni un produit, Microsoft vous fait acheter un service - dont il ne sait même pas si c'est un produit et ce qu'il faut en faire.
1  0 
Avatar de OrthodoxWindows
Membre expert https://www.developpez.com
Le 04/02/2025 à 1:13
Citation Envoyé par Rep.Movs Voir le message
Mon expérience avec Copilot? "Je préfère ne pas continuer cette discussion". Pour tout et n'importe quoi. Même de la génération de programme. C'est moitié utilisable.
Deepseek fourni un produit, Microsoft vous fait acheter un service - dont il ne sait même pas si c'est un produit et ce qu'il faut en faire.
Je pari assez chère sur le destin funeste de Copilot ; le même que Microsoft BOB, Clippy et Cortana
1  0 
Avatar de jpdeniel
Membre à l'essai https://www.developpez.com
Le 30/01/2025 à 10:14
Alors d'après le spécialiste indépendant et autoproclamé que je suis je pense que 6 millions est le coût de l'entraînement de leur développement de superbes astuces techniques pour réaliser ce prodige. Évidemment l'histoire de deepsseek n'a pas commencé que avec deepseek R1. Les versions précédentes avaient déjà cette tendance à donner d'excellents résultats pour moins cher. Les ingénieurs de deepseek ont cassé des regles établies par les autres et bien je dis bravo. Avec un peu de chance on arrivera à faire tourner une bonne IA sans gpu sur des vieux mac ou même sur des smartphones et pas des machines hors de prix. S'ils y arrivent ça sera très bon pour tout le monde ... Sauf peut-être pour OpenAI (ClosedAI plutôt) et Microsoft (Nanosoft plutôt qu'ils retournent a la poussière ceux la)
1  1 
Avatar de Fluxgraveon
Membre actif https://www.developpez.com
Le 30/01/2025 à 10:20
Citation Envoyé par L33tige Voir le message
de la machine...
Et la machine, elle vient d'où ?
1  1