
Les nouvelles puces d'intelligence artificielle (IA) Blackwell de Nvidia, qui ont déjà subi des retards, ont rencontré des problèmes de surchauffe des serveurs qui les accompagnent, ce qui fait craindre à certains clients qu'ils n'aient pas assez de temps pour mettre en place de nouveaux centres de données, a rapporté le journal The Information le 17 novembre 2024.
Dévoilé par Nvidia lors de son premier événement GTC depuis près de cinq ans, le GPU Blackwell B200 a été présenté comme "la puce la plus puissante au monde" pour l'IA. Les nouveaux processeurs B100, B200 et GB200 de l'architecture Blackwell promettent des performances d'inférence jusqu'à 30 fois supérieures et une consommation d'énergie 25 fois inférieure par rapport à un H100 pour les modèles d'IA massifs, selon l'entreprise.
Cependant, comme l'indique le rapport de The Information, citant des sources familières avec le problème, les unités de traitement graphique Blackwell surchauffent lorsqu'elles sont connectées ensemble dans des racks de serveurs conçus pour contenir jusqu'à 72 puces.
Le fabricant de puces a demandé à ses fournisseurs de modifier la conception des racks à plusieurs reprises pour résoudre les problèmes de surchauffe, selon des employés de Nvidia qui ont travaillé sur la question, ainsi que des clients et des fournisseurs ayant connaissance du problème, a indiqué le rapport sans nommer les fournisseurs.
« Nvidia travaille avec des fournisseurs de services cloud de premier plan en tant que partie intégrante de notre équipe d'ingénierie et de notre processus. Les itérations d'ingénierie sont normales et attendues », a déclaré un porte-parole de l'entreprise dans un communiqué.
En mars, Nvidia a dévoilé les puces Blackwell et avait annoncé qu'elles seraient livrées au cours du deuxième trimestre avant de subir des retards, ce qui pourrait affecter des clients tels que Meta Platforms, Google (Alphabet) et Microsoft.
Plus récemment, Nvidia a déclaré que SoftBank Group sera le premier client à utiliser ses puces Blackwell, en exploitant la technologie pour développer le superordinateur d'IA le plus puissant du Japon. Le PDG de Nvidia a déclaré que la collaboration avec SoftBank constituait une étape cruciale dans l'ambition du Japon de mener la révolution de l'IA : « le Japon saute dans la révolution industrielle de l'IA pour devenir un leader mondial, conduisant une nouvelle ère de croissance dans les télécommunications, les transports, la robotique et les industries de la santé d'une manière qui bénéficiera grandement à l'humanité à l'ère de l'IA. »
La puce Blackwell de Nvidia combine deux carrés de silicium de la taille de la précédente offre de l'entreprise en un seul composant qui est 30 fois plus rapide pour des tâches telles que la fourniture de réponses par des chatbots.
Source : The Information
Et vous ?


Voir aussi :



Vous avez lu gratuitement 1 articles depuis plus d'un an.
Soutenez le club developpez.com en souscrivant un abonnement pour que nous puissions continuer à vous proposer des publications.
Soutenez le club developpez.com en souscrivant un abonnement pour que nous puissions continuer à vous proposer des publications.