
La demande en matière de centres de données pour l'IA s'effondrerait en Chine
L'engouement du marché chinois pour l'IA serait en train de faiblir. Selon un rapport du MIT Technology Review, il y a quelques mois à peine, la construction de centres de données était en plein essor sous l'impulsion d'investisseurs publics et privés. Cependant, de nombreuses installations nouvellement construites sont aujourd'hui vides. Des sources locales affirment que la plupart des entreprises qui gèrent ces centres de données luttent pour rester à flot.
Les médias chinois Jiazi Guangnian et 36Kr affirment que « jusqu'à 80 % des infrastructures informatiques nouvellement construites en Chine restent inutilisées ». Il s'agit en effet d'un tableau particulièrement décevant et inquiétant si l'on considère toutes les promesses qui ont été faites par les entreprises d'IA.
En 2023, des entrepreneurs chinois sont parvenus à obtenir des GPU Nvidia, essentiels à l'entraînement des modèles d'IA, malgré les restrictions strictes des États-Unis. Les GPU Nvidia ont été acheminés en Chine par des voies détournées et leur vente rapportait énormément d'argent aux marchands. Selon le rapport, au plus fort de la demande, une seule puce Nvidia H100 pouvait se vendre jusqu'à 200 000 yuans (soit 28 000 dollars) sur le marché noir.
Aujourd'hui, les prix sont redescendus sur terre. Entre-temps, des projets de centres de données peinent à obtenir des financements supplémentaires de la part d'investisseurs qui anticipent de faibles rendements, ce qui oblige les responsables des projets à vendre les GPU excédentaires. « Il semble que tout le monde vende, mais que peu achètent », a déclaré au média l'entrepreneur immobilier Xiao Li, devenu chef de projet dans un centre de données.
Cette tendance illustre les inquiétudes exprimées par le président d'Alibaba, Joe Tsai, lors d'un récent sommet. Il a mis en garde contre la formation d'une bulle dans la construction de centres de données pour l'IA, avertissant que ces projets sont construits sans que les clients soient clairement identifiés.
« Je commence à voir le début d'une sorte de bulle. Je commence à m'inquiéter lorsque les gens construisent des centres de données sur mesure. Il y a un certain nombre de personnes qui se présentent, des fonds qui sortent, pour lever des milliards ou des millions de capitaux », a déclaré Joe Tsai.
DeepSeek : une approche qui pourrait provoquer l'éclatement de la bulle de l'IA
DeepSeek est une startup chinoise spécialisée dans l'IA et fondée en 2023 sous l'impulsion du fonds spéculatif chinois High-Flyer. DeepSeek était un acteur relativement discret sur le marché de l'IA jusqu'à la publication en janvier 2025 de son modèle axé sur le raisonnement DeepSeek-R1. Ce dernier a égalé les performances du modèle phare o1 d'OpenAI, avec un coût inférieur de 95 %. L'annonce de DeepSeek-R1 a provoqué une hécatombe à Wall Street.
La location de GPU aux entreprises, le principal modèle commercial de la nouvelle vague de centres de données, était autrefois considérée comme une valeur sûre. Toutefois, avec la montée en puissance de DeepSeek et un changement soudain dans l'économie de l'IA, l'industrie est en train de vaciller.
« DeepSeek est un moment décisif pour l'industrie chinoise de l'IA. La question brûlante n'est plus "qui peut créer le meilleur modèle de langage étendu ?", mais "qui peut mieux l'utiliser ?" », a déclaré Hancheng Cao, professeur adjoint de systèmes d'information à l'université Emory, en Géorgie, aux États-Unis.
L'explosion de la demande attendue par les entrepreneurs ne s'est finalement pas produite. « Les difficultés croissantes que connaît l'industrie chinoise de l'IA sont en grande partie dues au fait que des acteurs inexpérimentés - entreprises et gouvernements locaux - ont pris le train en marche et construit des installations qui ne sont pas optimales pour les besoins actuels », explique Jimmy Goodrich, conseiller principal en technologie à la RAND Corporation.
« En conséquence, les projets échouent, l'énergie est gaspillée et les centres de données sont devenus des actifs en difficulté dont les investisseurs sont désireux de se débarrasser à des taux inférieurs à ceux du marché. La situation pourrait finir par provoquer une intervention du gouvernement. Le gouvernement chinois est susceptible d'intervenir, de prendre le contrôle et de confier les centres de données à des opérateurs plus compétents », a-t-il ajouté.
La Chine a apporté une réponse rapide à l'avènement de ChatGPT. Pékin a fait de l'infrastructure de l'IA une priorité nationale, exhortant les gouvernements locaux à accélérer le développement des centres de calcul intelligents, un terme inventé pour décrire les centres de données axés sur l'IA.
Selon KZ Consulting, un cabinet d'études de marché, en 2023 et 2024, plus de 500 nouveaux projets de centres de données ont été annoncés partout, de la Mongolie intérieure au Guangdong. Mais alors même que la construction de ces projets se poursuit, la frénésie suscitée par l'IA s'essouffle.
Il y a un risque élevé que les investissements massifs ne soient pas rentabilisés
Selon le China Communications Industry Association Data Center Committee, une association industrielle affiliée à l'État, au moins 150 des centres de données nouvellement construits étaient terminés et opérationnels à la fin de 2024. Les entreprises d'État, les sociétés cotées en bourse et les fonds affiliés à l'État ont fait la queue pour investir dans ces centres, dans l'espoir de se positionner en tant que précurseurs de l'IA. Mais où en est-on aujourd'hui ?
Rien qu'en 2024, plus de 144 entreprises se sont inscrites auprès de la Cyberspace Administration of China - l'autorité centrale de régulation d'Internet du pays - pour développer leurs propres LLM. Pourtant, selon Economic Observer, une publication chinoise, seulement 10 % de ces entreprises investissaient encore activement dans la formation de modèles à grande échelle à la fin de l'année. « L'IA a fait l'effet d'une poussée d'adrénaline », explique Xiao Li.
Il a ajouté : « beaucoup d'argent qui était investi dans l'immobilier est maintenant investi dans les centres de données d'IA ». Pour ne rien arranger, les chefs de projet se sont souvent appuyés sur des intermédiaires et des courtiers, dont certains ont exagéré les prévisions de demande ou manipulé les processus d'approvisionnement pour empocher des subventions gouvernementales, selon les sources. Aujourd'hui, les experts craignent un éclatement de la bulle.
À la fin de l'année 2024, l'enthousiasme qui avait entouré le boom des centres de données en Chine s'est transformé en déception. De nombreuses installations se sont retrouvées sous-utilisées ou abandonnées. La raison en est simple : la location de GPU n'est plus une activité particulièrement lucrative.
« C'est paradoxal : la Chine doit faire face aux coûts d'acquisition les plus élevés pour les puces Nvidia, alors que les prix de location des GPU sont extraordinairement bas », explique M. Li. Il y a une offre excédentaire de puissance de calcul, mais en même temps, il y a une pénurie de puces de pointe.
Impacts de l'essor des modèles d'IA axés sur le raisonnement tes que R1 et o1
L'essor de modèles axés sur le raisonnement tels que R1 de DeepSeek et ChatGPT o1 et o3 d'OpenAI a également modifié ce que les entreprises attendent d'un centre de données. Avec l'arrivée des modèles axés sur le raisonnement, la plupart des besoins informatiques proviennent de « la conduite de déductions logiques étape par étape » en réponse aux requêtes des utilisateurs, et non du processus de formation et de création du modèle en premier lieu.
Ce processus de raisonnement donne souvent de meilleurs résultats, mais prend beaucoup plus de temps. Il est donc primordial pour les entreprises de disposer d'un matériel à faible latence. Les centres de données doivent être situés à proximité des principaux centres technologiques afin de minimiser les délais de transmission et de garantir l'accès à un personnel d'exploitation et de maintenance hautement qualifié. L'impact a été dévastateur pour certains.
De nombreux centres de données construits dans le centre, l'ouest et les zones rurales de la Chine, où l'électricité et le terrain sont moins chers, perdent de leur attrait pour les entreprises d'IA. À Zhengzhou, une ville de la province du Henan, un centre de données nouvellement construit distribue même des bons de calcul gratuits aux entreprises technologiques locales, mais il peine encore à attirer des clients. Il est difficile de prédire si les choses vont s'arranger.
En outre, une grande partie des nouveaux centres de données qui ont vu le jour ces dernières années ont été optimisés pour les charges de travail de préformation plutôt que pour l'inférence, le processus d'exécution de modèles axés sur le raisonnement formés pour répondre aux entrées de l'utilisateur en temps réel. Le matériel adapté à l'inférence diffère de celui traditionnellement utilisé pour l'apprentissage de l'IA à grande échelle.
Les GPU tels que les Nvidia H100 et A100 sont conçus pour le traitement de données massives, privilégiant la vitesse et la capacité de mémoire. Mais comme l'IA évolue vers le raisonnement en temps réel, l'industrie recherche des puces plus efficaces, plus réactives et plus rentables. Même une erreur mineure dans le calcul des besoins en infrastructure peut rendre un centre...
La fin de cet article est réservée aux abonnés. Soutenez le Club Developpez.com en prenant un abonnement pour que nous puissions continuer à vous proposer des publications.