En 2018, Amazon avait annoncé qu’il entend mettre sur pied une nouvelle puce personnalisée qu’il utilisera pour faire fonctionner ses serveurs et faire baisser sa dépendance vis-à-vis de Intel. L'objectif étant de renforcer sa position au sein des GAFAM (Google, Apple, Facebook, Amazon et Microsoft) qui sont les principaux acteurs du secteur technologique avec des chiffres d’affaires colossaux chaque année.
6 ans plus tard, Amazon annonce enfin qu'il prépare sa nouvelle puce d'IA. Amazon développe ses propres puces d'IA sous la direction de son laboratoire Annapurna Labs. La nouvelle puce Trainium 2 vise à former des modèles d'IA plus rapidement et à réduire la dépendance d'Amazon à l'égard de Nvidia.
Nvidia pourrait être confronté à une concurrence sérieuse dans le domaine des puces d'IA. Amazon et d'autres géants de la technologie investissent massivement pour améliorer les performances de l'IA et l'infrastructure des données. Amazon cherche désormais à commercialiser ses propres puces, afin de se démarquer du géant de la fabrication de puces.
Cet effort est mené par Annapurna Labs, qu'Amazon a acheté en 2015 pour 350 millions de dollars. L'entreprise est surtout connue pour avoir fourni aux services Web d'Amazon (AWS) son hyperviseur (gestion des machines virtuelles), Nitro. Elle a également construit Graviton, une alternative de moindre puissance basée sur ARM aux puces serveur traditionnelles d'AMD et d'Intel.
Actuellement, Annapurna teste Trainium 2, le tout dernier kit destiné à consolider la position d'Amazon dans la sphère de l'IA. Dévoilé en 2023, le nom "Trainium" fait référence à son rôle dans le pipeline AWS. Amazon a l'intention d'entraîner des modèles d'IA, censés fournir un entraînement quatre fois plus rapide que la version précédente, qui a été lancée en 2020.
Anthropic, l'entreprise à l'origine du chabot d'IA Claude, alternatif à ChatGPT, teste actuellement le Trainium 2. Le concurrent d'OpenAI a reçu un investissement de 4 milliards de dollars de la part d'Amazon. Il tente également de conclure un accord avec Anthropic pour que l'entreprise entraîne ses modèles d'IA sur le nouveau Trainium 2, même s'il préfère le matériel Nvidia.
Amazon, à l'instar d'OpenAI et de Microsoft, tente désespérément de construire son propre ensemble de puces. En supprimant Nvidia de l'équation, l'entreprise vise à réduire non seulement les dépenses liées à la production, mais aussi celles liées à l'exploitation des puces. Dans une interview, Dave Brown, vice-président des services de calcul et de réseau chez AWS, a déclaré : "Lorsque vous économisez 40 % de 1 000 dollars, cela n'a pas vraiment d'incidence sur votre choix. Mais lorsque vous économisez 40 % sur des dizaines de millions de dollars, c'est le cas".
Nvidia domine actuellement le marché, avec un chiffre d'affaires de 26,3 milliards de dollars au deuxième trimestre 2024. De plus, les analystes estiment que Nvidia détient actuellement 98 % du marché des GPU pour centres de données. La pénurie mondiale de GPU Nvidia a été accentuée par l'intérêt croissant pour l'IA. Bien que Nvidia continue de dominer, AMD pourrait réduire sa part de marché à 94 - 96 % avec la popularité croissante de ses produits Instinct. Intel est également présent, mais sa compétitivité reste en question.
Et vous ?
Pensez-vous que cette annonce est crédible ou pertinente ?
Quel est votre avis sur le sujet ?
Voir aussi :
Graviton3E, la nouvelle puce d'Amazon fait entrer AWS dans le calcul haute performance. L'entreprise lance sa nouvelle puce à base de processeur Arm pour les charges de travail HPC
Après l'échec des efforts d'Amazon avec sa propre IA pour sauver Alexa, vous devrez finalement payer pour parler à "Claude" car Amazon s'appuie sur Anthropic
Amazon mise 150 milliards de dollars sur les centres de données nécessaires au boom de l'IA, son expansion sur le marché du cloud suscite à la fois l'admiration et des préoccupations sur ses impacts