Un grand modèle de langage (LLM) est un modèle de langage entraîné à l'aide d'un apprentissage automatique auto-supervisé sur une grande quantité de texte, conçu pour les tâches de traitement du langage naturel, en particulier la génération de langage. Les LLM les plus grands et les plus performants sont des transformateurs génératifs pré-entraînés (GPT) qui fournissent les capacités de base des chatbots modernes. Les LLM peuvent être affinés pour des tâches spécifiques ou guidés par l'ingénierie rapide. Ces modèles acquièrent un pouvoir prédictif concernant la syntaxe, la sémantique et les ontologies inhérentes aux corpus linguistiques humains, mais ils héritent également des inexactitudes et des biais présents dans les données sur lesquelles ils sont entraînés.
NVIDIA Nemotron est une famille de modèles, d'ensembles de données et de technologies ouverts qui vous permettent de créer des systèmes d'agents IA efficaces, précis et spécialisés. Conçus pour le raisonnement avancé, le codage, la compréhension visuelle, les tâches agentives, la sécurité et la recherche d'informations, les modèles Nemotron sont librement accessibles et intégrés à l'écosystème de l'IA, ce qui permet de les déployer partout, de la périphérie au cloud. Grâce à des données d'entraînement transparentes et à une large prise en charge des plateformes, notamment RTX PRO et DGX Spark, Nemotron facilite la création et le déploiement d'agents IA fiables et performants.
Récemment, NVIDIA a présenté la famille de modèles ouverts Nemotron 3, ainsi que des ensembles de données et des bibliothèques visant à faire progresser l'IA agentielle dans tous les secteurs. Les modèles utilisent une architecture hybride de mélange latent d'experts conçue pour réduire la surcharge de communication, limiter la dérive contextuelle et diminuer les coûts d'inférence tout en prenant en charge des systèmes multi-agents évolutifs.
La gamme comprend trois variantes : Nemotron 3 Nano avec 30 milliards de paramètres et 3 milliards actifs par tâche, Super avec 100 milliards de paramètres et 10 milliards actifs par jeton, et Ultra avec 500 milliards de paramètres et 50 milliards actifs par jeton. Cette gamme permet aux développeurs d'aligner leur choix de modèle sur la complexité de la charge de travail et les objectifs de coût. Par rapport à Nemotron 2 Nano, le modèle Nano offre un débit jusqu'à quatre fois supérieur, réduit la génération de jetons de raisonnement jusqu'à 60 % et prend en charge les tâches à long terme avec une fenêtre contextuelle d'un million de jetons.
Des benchmarks indépendants placent Nemotron 3 Nano en tête de sa catégorie en termes d'ouverture, d'efficacité et de précision. Nemotron 3 Super et Ultra utilisent l'entraînement NVFP4 à quatre bits sur l'architecture NVIDIA Blackwell afin de réduire l'utilisation de la mémoire et d'accélérer l'entraînement. Nemotron 3 Nano est disponible via Hugging Face, plusieurs fournisseurs d'inférence tels que Together AI, OpenRouter ou Fireworks AI, et en tant que microservice NVIDIA NIM, tandis que Super et Ultra sont attendus au cours du premier semestre 2026.
Cette annonce intervient alors que le PDG de Nvidia, Jensen Huang, a sévèrement réprimandé les cadres qui exhortaient les employés à réduire l'utilisation de l'IA, soulignant son intégration dans toutes les opérations. Il a assuré au personnel que l'adoption de l'IA n'entraînerait pas de pertes d'emplois, soulignant l'expansion et les embauches continues de NVIDIA. La croissance impressionnante du chiffre d'affaires et la domination du marché de l'entreprise soulignent son engagement à accélérer l'IA.
Voici l'annonce de Nvidia :
NVIDIA lance la famille de modèles ouverts Nemotron 3
NVIDIA a annoncé aujourd'hui la gamme NVIDIA Nemotro 3 de modèles, données et bibliothèques ouverts conçus pour permettre le développement transparent, efficace et spécialisé d'une IA agentielle dans tous les secteurs.
Les modèles Nemotron 3, disponibles en tailles Nano, Super et Ultra, introduisent une architecture hybride révolutionnaire de mélange d'experts latents (MoE) qui aide les développeurs à créer et à déployer des systèmes multi-agents fiables à grande échelle.
Alors que les entreprises passent des chatbots à modèle unique à des systèmes d'IA multi-agents collaboratifs, les développeurs sont confrontés à des défis croissants, notamment la surcharge de communication, la dérive contextuelle et les coûts d'inférence élevés. De plus, les développeurs ont besoin de transparence pour faire confiance aux modèles qui automatiseront leurs workflows complexes. Nemotron 3 répond directement à ces défis en offrant les performances et l'ouverture dont les clients ont besoin pour créer une IA agentielle spécialisée.
« L'innovation ouverte est le fondement du progrès de l'IA », a déclaré Jensen Huang, fondateur et PDG de NVIDIA. « Avec Nemotron, nous transformons l'IA avancée en une plateforme ouverte qui offre aux développeurs la transparence et l'efficacité dont ils ont besoin pour créer des systèmes agentiels à grande échelle. »
NVIDIA Nemotron soutient les efforts plus larges de NVIDIA en matière d'IA souveraine, avec des organisations d'Europe et de Corée du Sud qui adoptent des modèles ouverts, transparents et efficaces leur permettant de créer des systèmes d'IA adaptés à leurs propres données, réglementations et valeurs.
Les premiers utilisateurs, notamment Accenture, Cadence, CrowdStrike, Cursor, Deloitte, EY, Oracle Cloud Infrastructure, Palantir, Perplexity, ServiceNow, Siemens, Synopsys et Zoom, intègrent les modèles de la famille Nemotron pour alimenter les flux de travail IA dans les secteurs de la fabrication, de la cybersécurité, du développement logiciel, des médias, des communications et d'autres industries.
« NVIDIA et ServiceNow façonnent l'avenir de l'IA depuis des années, et le meilleur reste à venir », a déclaré Bill McDermott, président-directeur général de ServiceNow. « Aujourd'hui, nous faisons un grand pas en avant en donnant aux dirigeants de tous les secteurs les moyens d'accélérer leur stratégie d'IA agentielle. L'automatisation intelligente des workflows de ServiceNow, combinée à NVIDIA Nemotron 3, continuera à définir la norme avec une efficacité, une rapidité et une précision inégalées. »
À mesure que les systèmes d'IA multi-agents se développent, les développeurs s'appuient de plus en plus sur des modèles propriétaires pour bénéficier d'un raisonnement de pointe, tout en utilisant des modèles ouverts plus efficaces et personnalisables afin de réduire les coûts. Le routage des tâches entre les modèles de pointe et Nemotron dans un workflow unique offre aux agents une intelligence optimale tout en optimisant l'utilisation des jetons.
« Perplexity repose sur l'idée que la curiosité humaine sera amplifiée par une IA précise intégrée à des outils exceptionnels, tels que les assistants IA », a déclaré Aravind Srinivas, PDG de Perplexity. « Grâce à notre routeur d'agents, nous pouvons diriger les charges de travail vers les modèles ouverts les mieux adaptés, tels que Nemotron 3 Ultra, ou tirer parti des modèles propriétaires de pointe lorsque les tâches bénéficient de leurs capacités uniques, garantissant ainsi que nos assistants IA fonctionnent avec une vitesse, une efficacité et une échelle exceptionnelles. »
Les modèles ouverts Nemotron 3 permettent aux startups de créer et d'itérer plus rapidement sur des agents IA et d'accélérer l'innovation, du prototype au déploiement en entreprise. Les sociétés du portefeuille de General Catalyst, Mayfield et Sierra Ventures explorent Nemotron 3 pour créer des coéquipiers IA qui soutiennent la collaboration entre l'homme et l'IA.
« La pile de modèles ouverts de NVIDIA et le programme NVIDIA Inception fournissent aux entreprises en phase de démarrage les modèles, les outils et une infrastructure rentable pour expérimenter, se différencier et évoluer rapidement », a déclaré Navin Chaddha, associé directeur chez Mayfield. « Nemotron 3 permet aux fondateurs de se lancer rapidement dans la création d'applications d'IA agentielle et de coéquipiers IA, et les aide à tirer parti de l'énorme base installée de NVIDIA. »
Nemotron 3 réinvente l'IA multi-agents avec efficacité et précision
La famille de modèles MoE Nemotron 3 comprend trois tailles :
- Nemotron 3 Nano, un petit modèle de 30 milliards de paramètres qui active jusqu'à 3 milliards de paramètres à la fois pour des tâches ciblées et hautement efficaces.
- Nemotron 3 Super, un modèle de raisonnement de haute précision avec environ 100 milliards de paramètres et jusqu'à 10 milliards actifs par jeton, pour les applications multi-agents.
- Nemotron 3 Ultra, un grand moteur de raisonnement avec environ 500 milliards de paramètres et jusqu'à 50 milliards actifs par jeton, pour les applications d'IA complexes.
Disponible dès aujourd'hui, Nemotron 3 Nano est le modèle le plus rentable en termes de calcul, optimisé pour des tâches telles que le débogage de logiciels, la synthèse de contenu, les workflows d'assistants IA et la recherche d'informations à faible coût d'inférence. Le modèle utilise une architecture MoE hybride unique pour offrir des gains d'efficacité et d'évolutivité.
Cette conception permet d'atteindre un débit de jetons jusqu'à 4 fois supérieur à celui de Nemotron 2 Nano et de réduire la génération de jetons de raisonnement jusqu'à 60 %, ce qui diminue considérablement les coûts d'inférence. Avec une fenêtre contextuelle d'un million de jetons, Nemotron 3 Nano mémorise davantage, ce qui le rend plus précis et plus apte à relier des...
