La course aux puces d'IA vient de prendre un nouveau tournant. En mars 2024, Nvidia a dévoilé sa nouvelle architecture GPU Blackwell, dédiée à l'intelligence artificielle (IA). À l'époque, Nvidia annonçait que la puce Blackwell est "la puce la plus puissante au monde" pour l'IA avec des performances d'inférence jusqu'à 30 fois supérieures tout en consommant 25 fois moins d'énergie pour les modèles d'IA massifs.
En réponse à la puce Blackwell de Nvidia, AMD a récemment dévoilé sa dernière puce d'IA, l'Instinct MI325X, pour concurrencer directement les processeurs graphiques pour centres de données de Nvidia. Lors de l'annonce, AMD a déclaré que la production du MI325X débutera d'ici la fin de l'année 2024, marquant une étape importante dans les efforts de l'entreprise pour capturer une plus grande part du marché florissant des puces d'IA.
La demande de technologies d'IA générative avancées, telles que le ChatGPT d'OpenAI, ne cessant de croître, la nécessité de disposer de GPU puissants dans les centres de données s'est intensifiée. Lisa Su, PDG d'AMD, a indiqué que "la demande en matière d'IA a continué à décoller et à dépasser les attentes", signalant un climat d'investissement solide dans l'IA dans divers secteurs.
Actuellement, Nvidia domine le marché des GPU pour centres de données, dont elle détient environ 90 %. AMD est toutefois déterminé à accroître sa présence sur ce marché qui devrait représenter 500 milliards de dollars d'ici 2028.
Bien que les détails spécifiques concernant les clients du cloud ou de l'internet pour le MI325X n'aient pas été divulgués, AMD a précédemment indiqué que des géants de la technologie comme Meta et Microsoft utilisent ses GPU d'IA, et OpenAI les utiliserait également pour des applications sélectionnées. Le prix de la nouvelle puce n'a pas été dévoilé, car AMD vend généralement ces GPU dans le cadre de solutions de serveur complètes.
Pour mieux concurrencer Nvidia, AMD prévoit d'accélérer son calendrier de lancement de produits, avec des sorties annuelles de puces pour capitaliser sur le boom de l'IA. Le MI325X fait suite au MI300X, qui a commencé à être livré à la fin de l'année 2023, et les futures puces, y compris le MI350 pour 2025 et le MI400 pour 2026, sont déjà dans le pipeline.
L'introduction du MI325X le mettra en concurrence directe avec les prochaines puces Blackwell de Nvidia, qui devraient être livrées en grandes quantités au début de l'année prochaine. Un lancement réussi pourrait susciter l'intérêt des investisseurs pour AMD, dont l'action n'a augmenté que de 20 % cette année, ce qui contraste fortement avec l'impressionnante hausse de 175 % de Nvidia.
Malgré l'optimisme entourant la nouvelle puce d'IA, AMD est confronté à des difficultés liées au langage de programmation CUDA de Nvidia, qui enferme de nombreux développeurs dans son écosystème. Pour y remédier, AMD améliore son logiciel ROCm afin de faciliter les transitions pour les développeurs qui souhaitent migrer leurs modèles d'IA vers les accélérateurs d'AMD.
Les accélérateurs d'IA d'AMD sont particulièrement appréciés pour les applications impliquant la création de contenu et l'analyse prédictive, en partie grâce à leur technologie de mémoire avancée. Lisa Su affirme que le MI325X peut fournir jusqu'à 40 % de performances d'inférence en plus que le H200 de Nvidia lors de l'exécution du modèle d'IA Llama de Meta.
Alors que les accélérateurs d'IA retiennent l'attention, le cœur de métier d'AMD reste les processeurs centraux (CPU), indispensables à la quasi-totalité des serveurs dans le monde. L'entreprise a déclaré que ses ventes dans les centres de données ont dépassé 2,8 milliards de dollars au cours du trimestre de juin, doublant d'une année sur l'autre, bien que les puces d'IA n'aient représenté qu'environ 1 milliard de dollars de ce chiffre.
AMD représente environ 34 % des dépenses totales en CPU pour centres de données, toujours derrière la gamme Xeon d'Intel. Pour remettre en cause cette domination, AMD a présenté ses nouveaux processeurs EPYC 5th Gen lors du même événement. La nouvelle gamme propose différentes configurations, d'une puce économique à 8 cœurs au prix de 527 dollars à un processeur à 192 cœurs et 500 watts conçu pour les supercalculateurs au prix de 14 813 dollars l'unité.
Lisa Su a souligné que "l'IA d'aujourd'hui est vraiment une question de capacité de CPU", soulignant l'importance des CPU pour alimenter les charges de travail d'IA et les applications d'analyse de données.
Et vous ?
Que pensez-vous de cette nouvelle puce d'AMD ?
Voir aussi :
AMD lance de nouvelles puces d'IA, les accélérateurs MI325X, et détaille son plan de développement de puces d'IA au cours des deux prochaines années, dans le but de défier le leader du secteur, NVIDIA
Nvidia détient désormais 88 % du marché des GPU après avoir enregistré une hausse de 8 % de sa part de marché au cours du dernier trimestre, réduisant de 7 % la part de marché d'AMD, soit 19 %
Le chiffre d'affaires mondial des puces d'IA devrait augmenter de 33 % pour atteindre 71 milliards de dollars en 2024. L'IA générative alimentant la demande de puces d'IA hautes performances, selon Gartner