IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)

Vous êtes nouveau sur Developpez.com ? Créez votre compte ou connectez-vous afin de pouvoir participer !

Vous devez avoir un compte Developpez.com et être connecté pour pouvoir participer aux discussions.

Vous n'avez pas encore de compte Developpez.com ? Créez-en un en quelques instants, c'est entièrement gratuit !

Si vous disposez déjà d'un compte et qu'il est bien activé, connectez-vous à l'aide du formulaire ci-dessous.

Identifiez-vous
Identifiant
Mot de passe
Mot de passe oublié ?
Créer un compte

L'inscription est gratuite et ne vous prendra que quelques instants !

Je m'inscris !

Jensen Huang voudrait faire évoluer Nvidia d'un simple vendeur de puces IA à un fabricant de serveurs IA complets, afin de contrôler l'ensemble de la pile matérielle et d'accroître les marges de l'entreprise

Le , par Mathis Lucas

0PARTAGES

5  0 
Nvidia contrôle près de 90 % des parts de marché des puces ou accélérateurs pour l'IA. Mais le PDG Jensen Huang en veut toujours plus. Un analyste de JP Morgan rapporte que Nvidia s'efforce de passer à une stratégie de serveurs IA à l'échelle d'un rack, et au lieu de se contenter d'être responsable d'une partie de la chaîne d'approvisionnement, l'entreprise cherche à obtenir « tout le gâteau ». Nvidia fournirait désormais des systèmes complets aux fournisseurs, en unifiant les conceptions de racks pour un déploiement plus rapide. Cette approche permet à Nvidia de réaliser des marges plus élevées, tout en réduisant celles des principaux OEM et ODM.

Pour ceux qui ne le savent pas, la chaîne d'approvisionnement IA de Nvidia repose sur plusieurs partenaires responsables de divers éléments des produits finaux. En ce qui concerne les racks de serveurs IA, des entreprises taïwanaises telles que Foxconn, Quanta et Wistron représentent une part importante des étapes de fabrication. Cependant, les choses pourraient changer à partir du lancement de la plateforme Vera Rubin pour l'IA et le HPC en 2026.

Dans l'approche conventionnelle, Nvidia ne fournissait que des composants tels que des GPU IA ou les cartes nécessaires à la configuration des serveurs, comme le Bianca Port UPB. Cependant, lors de la présentation des résultats financiers du troisième trimestre de Wistron Corporation, un ODM taïwanais, un analyste de JP Morgan a mentionné que Nvidia s'oriente vers la « fourniture directe » de systèmes complets, ce qui aura un impact considérable.

Si l'approche conventionnelle s'est initialement avérée fructueuse pour Nvidia, les configurations à l'échelle du rack n'étant pas aussi importantes qu'aujourd'hui, il semble que la société cherche à changer de stratégie. Nvidia souhaiterait unifier les conceptions de racks et réduire les délais de mise sur le marché.

Cette approche pourrait entraîner des changements importants dans la chaîne d'approvisionnement en matériel informatique dédié à l'IA. En effet, selon JP Morgan (via @Jukanlosreve), Nvidia prévoit à l'avenir de fournir à ses partenaires des plateaux informatiques VR200 Level-10 (L10) entièrement assemblés, avec tout le matériel informatique, les systèmes de refroidissement et les interfaces préinstallés. À ce stade, cette information reste officieuse.


Si l'on résume cette évolution, il semble que Nvidia fournira désormais des « plans » à des partenaires tels que Wistron, Foxconn et Quanta, que ceux-ci devront respecter lors de la production de systèmes d'IA. Cela empêchera les fournisseurs de concevoir des architectures de rack individuelles. Il ne serait pas faux de dire que Nvidia avait déjà l'intention d'adopter cette approche lorsqu'il a introduit son « architecture de référence modulaire MGX ».

Dans un récent rapport, JP Morgan a dénoncé les dépenses excessives consacrées à l'IA. La banque estime qu'il faudra que l'IA générative génère environ 650 milliards de dollars de revenus annuels pour que l'industrie obtienne un rendement de seulement 10 % sur le développement de l'IA.

Nvidia veut contrôler de la chaîne d'approvisionnement IA

La plateforme MGX définit l'architecture physique et électrique de l'ensemble du serveur, passant d'un nœud unique à des « usines d'IA » à l'échelle d'un rack complet. Le concept a été testé avec le module de calcul GB200, lorsque Nvidia a fourni la carte Bianca avec les composants clés préinstallés. Cependant, à l’époque, cela pouvait être considéré comme une intégration L7–L8, tandis qu’aujourd’hui, l'entreprise envisagerait de passer à L10.

Plus précisément, Nvidia envisage de vendre l'ensemble du plateau, y compris les accélérateurs, le processeur, la mémoire, les cartes réseau, le matériel d'alimentation, les interfaces midplane et les plaques de refroidissement liquide. L'ensemble sera expédié sous forme de module préassemblé et testé.

Si ces informations sont exactes et que Nvidia fournit effectivement à ses partenaires des plateaux de calcul L10 (qui représentent environ 90 % du coût d'un serveur), alors Nvidia ne laissera aux principaux ODM que l'intégration au niveau du rack plutôt que la conception du serveur. Les partenaires tels que Foxconn et Wistron auront très peu de travail comparativement à l'approche conventionnelle de Nvidia, ce qui réduirait également leurs marges.

Les principaux ODM continueront à construire le châssis extérieur, à intégrer les alimentations en fonction des besoins, à installer des sidecars ou des CDU pour le refroidissement au niveau du rack, à ajouter leur propre BMC et leur propre pile de gestion, et à effectuer l'assemblage final et les tests. Cependant, bien que tâches soient importantes sur le plan opérationnel, elles ne permettent pas de différencier le matériel de manière significative.

Grâce à cette approche, Nvidia réduit les délais de déploiement, qui passent de 9 à 12 mois à seulement 90 jours, puisque 80 % du système est prédéfini et validé par Nvidia. Cela signifie que les nouvelles architectures seront livrées beaucoup plus rapidement aux clients. Nvidia pourra ainsi réaliser des marges plus élevées, car il est responsable de la vente de l'ensemble du système. Cela permet aussi à Nvidia d'augmenter son chiffre d'affaires total.

Les performances de Nvidia malgré la fragilité du secteur de l'IA

Les actions de Nvidia ont augmenté de plus de 3 % le 29 septembre 2025, faisant du géant des puces la première entreprise à franchir le seuil des 5 000 milliards de dollars de valeur boursière. Cette étape extraordinaire reflète l'ascension remarquable de l'entreprise au cours des dernières années et intervient après que le PDG Jensen Huang a annoncé que Nvidia a obtenu plus de 500 milliards de dollars de commandes de puces d'IA jusqu'en 2026.


La flambée du cours de l'action Nvidia reflète une vague d'optimisme plus large à Wall Street quant à l'avenir de l'IA générative. Les dernières puces de l'entreprise sont devenues indispensables pour former et faire fonctionner les modèles de langage (LLM) les plus avancés et les plus sophistiqués, alimentant une course entre les géants de la technologie pour construire des centres de données puissants et dominer « la prochaine ère de l'informatique ».

Microsoft, Amazon, Meta, Alphabet (Google), OpenAI et Tesla sont tous en concurrence pour développer leur propre infrastructure d'IA, et le matériel spécialisé de Nvidia est au cœur de cette transformation. Les GPU Blackwell de Nvidia restent la colonne vertébrale des centres de données hyperscales. En raison de cette demande élevée, le cours de l'action de Nvidia a augmenté de plus de 50 % en 2025 et de plus de 85 % au cours des six derniers mois.

En outre, Nvidia a annoncé cette année l'expansion de sa production nationale en Arizona et de nouveaux partenariats avec Nokia et Oracle pour soutenir des projets de télécommunications et de supercalculateurs fédéraux. Apple et Microsoft viennent tous deux de rejoindre le club des entreprises valorisées à 4 000 milliards de dollars, mais la dernière flambée de Nvidia a établi une nouvelle référence en matière de leadership sur le marché à l'ère de l'IA.

La reprise vertigineuse des actions américaines intervient malgré les inquiétudes persistantes concernant une bulle, d'autant plus que les dépenses liées à l'IA ont conduit à des transactions et des valorisations record. Le Fonds monétaire international et la Banque d'Angleterre ont été les dernières institutions financières à avertir que les marchés boursiers mondiaux pourraient être en difficulté si l'engouement des investisseurs pour l'IA venait à s'essouffler.

La bulle de l'IA serait 17 fois plus importante que la bulle Internet

Selon Torsten Slok, économiste en chef chez Apollo Global Management, la bulle de l'IA est pire que la bulle Internet. Il a souligné que les dix principales actions liées à l'IA sont beaucoup plus éloignées de la réalité que ne l'étaient les entreprises dans les années 1990, et que l'histoire est sur le point de se répéter. Même Sam Altman, PDG d'OpenAI, reconnaît les similitudes. Voici un rappel sur les effets qui ont conduit à l'éclatement de la bulle Internet.

De son côté, Julien Garran, analyste chez MacroStrategy Partnership, explique que la bulle de l'IA est 17 fois plus importante que la tristement célèbre bulle Internet, provoquée à l'époque par l'engouement excessif des investisseurs pour Internet. Pire encore, Julien Garran a déclaré que l'IA représente aujourd'hui plus de quatre fois la richesse piégée dans la bulle des subprimes de 2008, qui a entraîné des années de crise prolongée à travers le monde.

Selon une analyse publiée en mars 2025, l'éclatement de la bulle de l'IA pourrait anéantir les sociétés de capital-risque de la Silicon Valley et provoquer la chute des...
La fin de cet article est réservée aux abonnés. Soutenez le Club Developpez.com en prenant un abonnement pour que nous puissions continuer à vous proposer des publications.

Une erreur dans cette actualité ? Signalez-nous-la !