IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)

Vous êtes nouveau sur Developpez.com ? Créez votre compte ou connectez-vous afin de pouvoir participer !

Vous devez avoir un compte Developpez.com et être connecté pour pouvoir participer aux discussions.

Vous n'avez pas encore de compte Developpez.com ? Créez-en un en quelques instants, c'est entièrement gratuit !

Si vous disposez déjà d'un compte et qu'il est bien activé, connectez-vous à l'aide du formulaire ci-dessous.

Identifiez-vous
Identifiant
Mot de passe
Mot de passe oublié ?
Créer un compte

L'inscription est gratuite et ne vous prendra que quelques instants !

Je m'inscris !

NVIDIA lance le processeur Vera, le premier processeur spécialement conçu pour les charges de travail d'IA agentique, offrant une efficacité deux fois supérieure et des performances 50 % plus rapides

Le , par Jade Emy

28PARTAGES

6  0 
Nvidia a annoncé le processeur Vera ainsi que sa plateforme Vera Rubin lors de la conférence GTC 2026, combinant de nouveaux composants matériels (processeur, carte graphique, réseau et stockage) au sein d’une architecture à l’échelle de rack destinée à l’IA agentique, à l’apprentissage par renforcement et à l’inférence. Les spécifications sont impressionnantes : une efficacité deux fois supérieure et des performances 50 % plus rapides que les processeurs traditionnels à l’échelle de rack, selon l’annonce de Nvidia. Alors que des concurrents comme Intel et AMD continuent d'affiner leurs puces pour serveurs à usage général, Nvidia parie que les agents autonomes ont besoin de puces fondamentalement différentes.

Nvidia Corporation est une entreprise technologique américaine dont le siège social est situé à Santa Clara, en Californie. Fondée en 1993 par Jensen Huang, Chris Malachowsky et Curtis Priem, elle développe des processeurs graphiques (GPU), des systèmes sur puce (SoC) et des interfaces de programmation d'applications (API) destinés à la science des données, au calcul haute performance, aux jeux vidéo, ainsi qu'aux applications mobiles et automobiles.

Initialement axée sur les GPU destinés aux jeux vidéo, Nvidia a élargi leur utilisation à d'autres marchés, notamment l'intelligence artificielle (IA), la visualisation professionnelle et le calcul intensif. Au premier trimestre 2025, Nvidia détenait 92 % des parts du marché des GPU discrets pour ordinateurs de bureau et portables. Nvidia vient de faire son geste le plus audacieux à ce jour au-delà des GPU.

Le fabricant de puces a récemment dévoilé le processeur Vera, le présentant comme le premier processeur au monde spécialement conçu pour l’IA agentique et l’apprentissage par renforcement. Les spécifications sont impressionnantes : une efficacité deux fois supérieure et des performances 50 % plus rapides que les processeurs traditionnels à l’échelle de rack, selon l’annonce de Nvidia. Ce lancement marque l’entrée stratégique de Nvidia sur le marché des processeurs IA spécialisés, alors que les agents autonomes deviennent une infrastructure d’entreprise.


Alors que des concurrents comme Intel et AMD continuent d'affiner leurs puces pour serveurs à usage général, Nvidia parie que les agents autonomes ont besoin de puces fondamentalement différentes. Le timing révèle la lecture que fait Nvidia du marché. Alors qu'OpenAI, Anthropic et Google ont démontré des agents IA de plus en plus performants dans des contextes de recherche, 2026 marque l'année où les entreprises ont réellement commencé à les déployer à grande échelle. Des bots de service client qui gèrent l'intégralité des workflows de résolution, des assistants de codage qui déboguent et déploient de manière autonome, des agents de chaîne d'approvisionnement qui renégocient les contrats : ce ne sont plus des démonstrations.

Nvidia a annoncé le processeur Vera ainsi que sa plateforme Vera Rubin lors de la conférence GTC 2026, combinant de nouveaux composants matériels (processeur, carte graphique, réseau et stockage) au sein d’une architecture à l’échelle de rack destinée à l’IA agentique, à l’apprentissage par renforcement et à l’inférence. La société décrit Vera comme son premier processeur spécialement conçu pour ces charges de travail, tandis que Vera Rubin regroupe sept puces et plusieurs types de racks au sein d’une plateforme modulaire destinée aux usines d’IA.

Vera intègre 88 cœurs NVIDIA Olympus personnalisés, chaque cœur étant capable d'exécuter deux tâches grâce à ce que NVIDIA appelle le « Spatial Multithreading ». La puce utilise une mémoire LPDDR5X et offre jusqu'à 1,2 To/s de bande passante mémoire. NVIDIA affirme que Vera est 50 % plus rapide et deux fois plus efficace que les processeurs traditionnels à l'échelle d'un rack, et qu'associée aux GPU Rubin via NVLink-C2C, elle peut atteindre 1,8 To/s de bande passante cohérente, bien au-delà du PCIe Gen 6.


NVIDIA présente également un rack de processeurs Vera composé de 256 processeurs refroidis par liquide. Selon l'entreprise, un seul rack peut prendre en charge plus de 22 500 environnements CPU simultanés à pleine performance, ciblant l'orchestration, l'inférence agentique, l'apprentissage par renforcement, le traitement des données, la gestion du stockage et les charges de travail HPC. Les serveurs basés sur Vera intégreront également des SuperNIC ConnectX et des DPU BlueField-4, avec des systèmes à un ou deux sockets prévus par les partenaires.

La plateforme Vera Rubin élargie ajoute des racks de GPU Rubin NVL72, des racks de stockage BlueField-4 STX, des racks Ethernet Spectrum-6 SPX et un nouveau rack d'inférence LPX. NVIDIA indique que la conception du NVL72 combine 72 GPU Rubin et 36 CPU Vera, et permet de former des modèles « mixture-of-experts » avec quatre fois moins de GPU que ceux requis par Blackwell, tout en offrant un débit d'inférence par watt jusqu'à 10 fois supérieur et un coût par token dix fois inférieur.

La société a également présenté les logiciels DSX Max-Q et DSX Flex, qui, selon elle, peuvent améliorer la répartition de l'énergie au sein des usines d'IA et élargir les options de déploiement dans les centres de données soumis à des contraintes énergétiques.

La prise en charge de la plateforme s'étend aux fournisseurs de cloud, aux laboratoires d'IA et aux fabricants de serveurs. NVIDIA a cité Amazon Web Services, Google Cloud, Microsoft Azure, Oracle Cloud Infrastructure, Alibaba, ByteDance, CoreWeave, Lambda, Nebius, OpenAI, Anthropic, Meta et Mistral AI parmi les entreprises travaillant avec les systèmes Vera ou Vera Rubin. Côté matériel, Dell, HPE, Lenovo, Supermicro, ASUS, Foxconn, GIGABYTE, QCT, Wistron et Wiwynn font partie des partenaires qui fourniront des systèmes. NVIDIA précise que Vera est déjà en pleine production et que les systèmes seront disponibles auprès des partenaires à partir du second semestre 2026.


Voici l'annonce de Nvidia :

NVIDIA lance le processeur Vera, spécialement conçu pour l'IA agentique

NVIDIA a lancé aujourd’hui le processeur NVIDIA Vera, le premier processeur au monde spécialement conçu pour l’ère de l’IA agentique et de l’apprentissage par renforcement...
La fin de cet article est réservée aux abonnés. Soutenez le Club Developpez.com en prenant un abonnement pour que nous puissions continuer à vous proposer des publications.

Une erreur dans cette actualité ? Signalez-nous-la !