Dévoilé par Nvidia lors de son premier événement GTC depuis près de cinq ans, le GPU Blackwell B200 a été présenté comme "la puce la plus puissante au monde" pour l'IA. Les nouveaux processeurs B100, B200 et GB200 de l'architecture Blackwell promettent des performances d'inférence jusqu'à 30 fois supérieures et une consommation d'énergie 25 fois inférieure par rapport à un H100 pour les modèles d'IA massifs, selon l'entreprise.
Cependant, comme l'indique le rapport de The Information, citant des sources familières avec le problème, les unités de traitement graphique Blackwell surchauffent lorsqu'elles sont connectées ensemble dans des racks de serveurs conçus pour contenir jusqu'à 72 puces.
Le fabricant de puces a demandé à ses fournisseurs de modifier la conception des racks à plusieurs reprises pour résoudre les problèmes de surchauffe, selon des employés de Nvidia qui ont travaillé sur la question, ainsi que des clients et des fournisseurs ayant connaissance du problème, a indiqué le rapport sans nommer les fournisseurs.
« Nvidia travaille avec des fournisseurs de services cloud de premier plan en tant que partie intégrante de notre équipe d'ingénierie et de notre processus. Les itérations d'ingénierie sont normales et attendues », a déclaré un porte-parole de l'entreprise dans un communiqué.
En mars, Nvidia a dévoilé les puces Blackwell et avait annoncé qu'elles seraient livrées au cours du deuxième trimestre avant de subir des retards, ce qui pourrait affecter des clients tels que Meta Platforms, Google (Alphabet) et Microsoft.
Plus récemment, Nvidia a déclaré que SoftBank Group sera le premier client à utiliser ses puces Blackwell, en exploitant la technologie pour développer le superordinateur d'IA le plus puissant du Japon. Le PDG de Nvidia a déclaré que la collaboration avec SoftBank constituait une étape cruciale dans l'ambition du Japon de mener la révolution de l'IA : « le Japon saute dans la révolution industrielle de l'IA pour devenir un leader mondial, conduisant une nouvelle ère de croissance dans les télécommunications, les transports, la robotique et les industries de la santé d'une manière qui bénéficiera grandement à l'humanité à l'ère de l'IA. »
La puce Blackwell de Nvidia combine deux carrés de silicium de la taille de la précédente offre de l'entreprise en un seul composant qui est 30 fois plus rapide pour des tâches telles que la fourniture de réponses par des chatbots.
Source : The Information
Et vous ?
Quel est votre avis sur le sujet ?
Pensez-vous que les avantages potentiels des puces Blackwell de Nvidia l'emportent sur les problèmes techniques actuels ?
Voir aussi :
Nvidia dévoile le GPU Blackwell B200, la "puce la plus puissante au monde" pour l'IA, qui "réduit les coûts et la consommation d'énergie jusqu'à 25 fois" par rapport à un H100, selon Nvidia
Les actions de Nvidia bondissent après que le PDG Jensen Huang a déclaré que la demande était "folle" pour la puce Blackwell, la "puce la plus puissante au monde" pour l'IA d'après Nvidia
Le PDG de Nvidia annonce que la dernière puce d'IA de l'entreprise coûtera entre 30 000 et 40 000 dollars l'unité, une fourchette de prix similaire à celle de la précédente puce H100