La bataille autour des processeurs dédiés à l’intelligence artificielle ne se joue plus uniquement dans la Silicon Valley. Avec la présentation par Alibaba, via sa filiale T-Head, d’une nouvelle puce IA capable de rivaliser avec la NVIDIA H20, la Chine affiche une volonté claire : s’affranchir des dépendances technologiques occidentales et s’imposer comme un acteur crédible dans le domaine du hardware pour l’IA. L’annonce, relayée par la télévision d’État chinoise CCTV et confirmée par plusieurs médias spécialisés, survient dans un contexte de fortes restrictions américaines sur les exportations de GPU vers la Chine, notamment les A100, H100 et plus récemment les H20.Cette puce, désignée pour l’instant comme une “PPU” (Processing Power Unit), symbolise à la fois une prouesse technique et un signal politique. Elle vise à offrir aux centres de données chinois et aux géants du cloud locaux une alternative locale aux cartes NVIDIA, aujourd’hui incontournables pour l’entraînement de grands modèles de langage et de vision artificielle.
La division semi-conducteurs d'Alibaba, T-Head, aurait développé un nouveau processeur IA qui, selon elle, égale les performances du H20 de Nvidia, le GPU spécialement conçu pour le marché chinois qui se trouve actuellement dans une impasse géopolitique.
La démonstration a été diffusée mardi 16 septembre sur la chaîne China Central Television (CCTV), lors d'une émission consacrée à la visite du Premier ministre Li Qiang au centre de calcul intelligent Sanjiangyuan Energy de China Umicom, dans la province du Qinghai. Dans ce reportage, le nouvel accélérateur « PPU » de T-Head a été directement comparé aux processeurs H20 et A800 de Nvidia, ainsi qu'à l'Ascend 910B de Huawei, avec un graphique suggérant une parité de performances entre les composants d'Alibaba et ceux de Nvidia.
Selon les spécifications affichées à l'écran et rapportées par le South China Morning Post, cette puce ASIC conçue pour les charges de travail IA dispose de 96 Go de mémoire HBM2e, d'une interconnexion puce à puce de 700 Go/s, d'une prise en charge PCIe et d'une puissance de 400 W. Bien que l'émission n'ait pas divulgué les détails de la méthodologie de test utilisée ni publié les chiffres bruts, il s'agit du premier benchmark public plaçant le matériel d'Alibaba dans la même catégorie que les GPU pour centres de données de Nvidia.
Selon Reuters, China Unicom a déjà déployé 16 384 cartes PPU d'Alibaba dans son infrastructure, ce qui représente plus de la moitié des quelque 23 000 accélérateurs nationaux actuellement installés dans les installations de Qinghai. Ensemble, ces cartes offrent une puissance de calcul de 3 579 pétaflops, et le site devrait passer à plus de 20 000 pétaflops une fois toutes les phases terminées.
La comparaison avec la H20 de NVIDIA : un duel asymétrique
Comparer la PPU d’Alibaba avec la H20 de NVIDIA revient à mettre face à face deux philosophies.
La NVIDIA H20, conçue comme une alternative « bridée » mais performante pour contourner partiellement les restrictions américaines, reste une carte de calcul haut de gamme. Elle bénéficie du vaste écosystème logiciel CUDA et de l’expérience accumulée par NVIDIA dans l’optimisation des frameworks IA. En pratique, cela garantit une intégration fluide dans les pipelines d’entraînement et d’inférence des grandes entreprises technologiques.
De son côté, la puce d’Alibaba cherche à répliquer les standards matériels tout en se démarquant par son efficacité énergétique et sa bande passante inter-puces. Mais son défi principal ne réside pas uniquement dans la performance brute. L’enjeu est de bâtir un écosystème logiciel capable de rivaliser avec CUDA, ou au minimum de proposer une compatibilité satisfaisante avec les frameworks IA dominants (PyTorch, TensorFlow, JAX). Sans cet aspect, même la meilleure des puces risque de rester sous-exploité.
La démonstration de CCTV s'inscrit autant dans un contexte géopolitique que technique.
Le H20 de Nvidia a été introduit pour se conformer aux contrôles à l'exportation américains limitant la vente de silicium haute performance à la Chine. Basé sur l'architecture Hopper mais réduit pour répondre aux restrictions, le H20 est livré avec 96 Go de HBM3 et environ 4,0 To/s de bande passante mémoire. Cela donne une certaine perspective à la capacité correspondante de 96 Go HBM2e d'Alibaba, mais pas nécessairement à ses performances réelles.
La plus grande inconnue à l'heure actuelle concerne le logiciel. Si Alibaba est naturellement impatient de montrer qu'il peut répondre en interne aux besoins en matériel d'IA, la société n'a pas divulgué de détails sur les frameworks, les chaînes d'outils ou la compatibilité avec les piles de modèles existantes. Tant que des benchmarks indépendants et une assistance aux développeurs ne se concrétisent pas, la parité du PPU avec le matériel de Nvidia n'est qu'une affirmation soutenue par la télévision d'État chinoise et approuvée par le gouvernement chinois.
Derrière les chiffres, l’annonce d’Alibaba a une forte portée symbolique. Depuis 2022, les restrictions imposées par Washington sur l’exportation de GPU haut de gamme vers la Chine...
La fin de cet article est réservée aux abonnés. Soutenez le Club Developpez.com en prenant un abonnement pour que nous puissions continuer à vous proposer des publications.
