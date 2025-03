Nvidia annonce que ses puces d'IA de nouvelle génération « Rubin Ultra » et « Feynman » arriveront respectivement en 2027 et en 2028

bientôt des robots et des milliards d'agents d'IA

Vera Rubin

Rubin Ultra

Blackwell Ultra B300

La feuille de route optimiste de Nvidia pour l'avenir de l'IA



L'événement GPU Technology Conference (GTC) de Nvidia se tient du 17 au 21 mars 2025 à San Jose, en Californie. De nombreuses annonces ont été faites juste jusque-là et Nvidia a présenté son nouveau robot humanoïde « Blue » inspiré de Star Wars . Blue se déplace avec un réalisme impactant, rapprochant la robotique de science-fiction de la réalité. Mais les annonces concernant la prochaine génération de puces de Nvidia ont attiré davantage l'attention.Le PDG Jensen Huang a révélé de nouveaux accélérateurs d'IA que Nvidia prévoit de lancer au cours des mois et des années à venir. Il a également révélé d'autres spécifications concernant des puces déjà annoncées. Cette nouvelle gamme comprend les puces Blackwell Ultra B300, Vera Rubin et Rubin Ultra.La pièce maîtresse de l'annonce est Vera Rubin, dont la sortie a été annoncée pour la première fois au Computex 2024 et est désormais prévue pour le second semestre 2026. Ce GPU, qui porte le nom d'un célèbre astronome, disposera de 288 gigaoctets de mémoire et sera accompagné d'un processeur personnalisé conçu par Nvidia et baptisé Vera. La puce Vera Rubin est conçue pour accélérer significativement l'entraînement et l'inférence des systèmes d'IA.D'après Nvidia, Vera Rubin offrira des améliorations significatives en termes de performances par rapport à son prédécesseur, Grace Blackwell. Le fabricant de puces a également annoncé que le processeur personnalisé Vera de la puce Vera Rubin comprend 88 cœurs Arm personnalisés avec 176 threads.Vera Rubin intègre deux puces sur une seule matrice, avec 50 pétaflops de performance d'inférence FP4 par puce. Dans une configuration de rack NVL144, Vera Rubin peut fournir 3,6 exaflops de calcul d'inférence FP4, soit 3,3 fois plus que Blackwell Ultra (1,1 exaflop) dans une configuration de rack similaire.S'appuyant sur l'architecture de Vera Rubin, Rubin Ultra devrait être lancé au second semestre 2027. Il utilisera la configuration en rack NVL576, chaque GPU étant doté de quatre matrices de la taille d'un réticule, délivrant 100 pétaflops de précision FP4 par puce. Selon Nvidia, la puce Rubin Ultra promet 15 exaflops de calcul d'inférence FP4 et 5 exaflops de performance d'entraînement FP8, dépassant ainsi de manière significative les capacités de Vera Rubin.Chaque GPU Rubin Ultra comprendra 1 To de mémoire HBM4e, contribuant ainsi à 365 To de mémoire rapide sur l'ensemble du rack. Au cours de la conférence, le PDG de Nvidia a également présenté une architecture GPU de nouvelle génération appelée « Feynman », qui devrait être lancée en 2028 aux côtés du processeur Vera. Bien que les détails restent rares, Feynman devrait permettre à Nvidia d'améliorer encore les capacités de calcul de ses GPU d'IA.Nvidia prévoit de lancer le Blackwell Ultra B300 au cours du second semestre 2025. Cette puce comprend deux GPU offrant 15 pétaflops de performance de calcul dense FP4 par puce. Lorsqu'il est configuré dans un rack NVL72 complet, Blackwell Ultra fournit 1,1 exaflops de calcul d'inférence FP4 dense, soit 1,5 fois plus que la configuration Blackwell B200 actuelle. Chaque GPU B300 dispose de 288 gigaoctets de mémoire HBM3e, contre 192 Go pour Blackwell.Le Blackwell Ultra B300 n'est pas seulement un GPU autonome. Outre la version B300, Nvidia présente de nouvelles solutions de rack serveur B300 NVL16, la station GB300 DGX et le système de rack complet GB300 NV72L. Selon Nvidia, la combinaison de huit racks NV72L forme le Blackwell Ultra DGX SuperPOD complet, avec 288 CPU Grace, 576 GPU Blackwell Ultra, 300 To de mémoire HBM3e et une impressionnante puissance de calcul FP4 de 11,5 exaflops.Au cours de la conférence, Jensen Huang a présenté une feuille de route optimiste pour l'avenir de l'IA en décrivant les centres de données comme des « usines d'IA » qui produisent des jetons (les unités de données que les modèles d'IA traitent actuellement) au lieu d'objets physiques. Hensen Huang a partagé sa vision de l'avenir d'une « IA physique », qui permettra un jour à des robots humanoïdes d'effectuer des tâches semblables à celles d'un être humain.Nvidia fournit actuellement des plateformes logicielles qui aident les modèles d'IA contrôlant les robots à s'entraîner dans des mondes virtuels. En attendant, Jensen Huang pense que les puces d'IA de Nvidia propulseront bientôt « 10 milliards d'agents numériques » qui effectueront des tâches utiles pour les humains, et il a indiqué que d'ici la fin de l'année, 100 % des ingénieurs de Nvidia seront assistés par des modèles d'IA dans leur travail dans l'entreprise. Nvidia a annoncé Isaac GR00T N1 , son premier modèle de fondation open source entièrement personnalisable, pour apporter des compétences et un « raisonnement » généralisés aux robots humanoïdes. Nvidia a également annoncé des cadres de simulation pour accélérer le développement des robots.Nvidia collabore avec Google DeepMind et Disney Research pour développer le moteur physique open source Newton de nouvelle génération. En outre, Nvidia a présenté Blueprint Omniverse pour la génération de données synthétiques, alors les sources de données pour l'entraînement de l'IA se tarissent.Source : Nvidia Quel est votre avis sur le sujet ?Que pensez-vous de la prochaine génération de puces d'IA de Nvidia ?