De nombreux centres de données construits à la hâte du pays sont mal adaptés aux tâches d'inférence
Tl; dr: À la suite des débuts explosifs de Chatgpt à la fin de 2022, l'industrie de l'IA chinoise a connu une vague d'excitation et d'investissement. Cependant, cette ferveur initiale a cédé la place à une réalité qui donne à réfléchir alors que le pays est aux prises avec une offre excédentaire de centres de données sous-utilisés et de la dynamique du marché changeant.
Xiao Li, un ancien entrepreneur immobilier qui a pivoté dans des infrastructures d'IA en 2023, a été témoin de cette transformation de première main grâce à la demande fluctuante de GPU NVIDIA. Il y a un an, les commerçants de son réseau se sont vantés d'acquérir des GPU NVIDIA de haute performance malgré les restrictions d'exportation américaines. Beaucoup de ces jetons ont été canalisés illégalement dans Shenzhen par le biais de canaux internationaux. Au sommet du marché, un NVIDIA H100 – crucial pour la formation des modèles d'IA – pourrait récupérer jusqu'à 200 000 yuans (28 000 $) sur le marché noir.
Aujourd'hui, Li a remarqué que les commerçants sont devenus plus discrets et que les prix des GPU se sont stabilisés. De plus, deux projets de centres de données dont il connaît des difficultés ont du mal à attirer de nouveaux investisseurs, car les bailleurs de fonds prévoient de faibles rendements. Cette tension financière a forcé les chefs de projet à décharger des GPU excédentaires. « Tout le monde semble se vendre, mais il n'y a pas beaucoup d'acheteurs », a-t-il déclaré à MIT Technology Review.
En bref, le location de GPU aux entreprises pour la formation des modèles d'IA – une stratégie de base pour la dernière génération de centres de données – a autrefois été considéré comme un succès garanti. Cependant, l'émergence des facteurs économiques profonds et changeants dans le secteur de l'IA a mis l'industrie du centre de données du pays sur un terrain instable.
La construction rapide des centres de données à travers la Chine, de la Mongolie intérieure à Guangdong, a été alimentée par une combinaison de directives gouvernementales et d'investissement privé. Plus de 500 nouveaux projets ont été annoncés en 2023 et 2024, avec au moins 150 achevés d'ici la fin de 2024. Cependant, ce boom du bâtiment a conduit à une situation paradoxale: une abondance de puissance de calcul, en particulier dans la Chine centrale et occidentale, associée à une pénurie de puces qui répondent aux besoins actuels de réalités d'inférence et de réglementation.
La montée en puissance de Deepseek, une entreprise qui a développé un modèle de raisonnement open source correspondant aux performances de Chatgpt mais à une fraction du coût, a encore perturbé le marché. Hancheng Cao, professeur adjoint à l'Université Emory, a noté que cette percée est passée à l'orientation du développement du modèle aux applications pratiques. « La question brûlante est passée de » Qui peut faire le meilleur modèle de langue large? » à « Qui peut les utiliser mieux? » «
Ce changement a exposé les limites de nombreux centres de données construits à la hâte. De nombreuses installations optimisées pour la formation d'IA à grande échelle sont mal adaptées aux exigences à faible latence des tâches d'inférence nécessaires aux modèles de raisonnement en temps réel. En conséquence, les centres de données dans des zones éloignées avec une électricité et des terres moins chers perdent leur appel aux sociétés d'IA.
L'offre excédentaire de la puissance de calcul a entraîné une baisse spectaculaire des prix de location des GPU. Un serveur NVIDIA H100 avec huit GPU loue désormais 75 000 yuans par mois (environ 10 345 $), contre des sommets précédents d'environ 180 000 yuans (25141 $). Certains opérateurs de centres de données ont choisi de laisser leurs installations inactives plutôt que d'opérer à perte.
Jimmy Goodrich, conseiller en technologie senior de la Rand Corporation, attribue cette situation à des joueurs inexpérimentés sautant dans le train en marche de l'IA. « La douleur croissante de l'industrie de l'IA de la Chine est en grande partie le résultat de joueurs inexpérimentés – les sociétés et les gouvernements locaux – sauter dans le train de battage médiatique, la construction d'installations qui ne sont pas optimales pour les besoins d'aujourd'hui », explique-t-il.
Le système politique chinois, en mettant l'accent sur les projets économiques à court terme pour l'avancement de la carrière, a joué un rôle important dans le boom du centre de données. Les responsables locaux, cherchant à stimuler leur carrière politique et à stimuler l'économie face à un ralentissement post-pandemique, se sont tournés vers l'infrastructure d'IA en tant que nouveau moteur de croissance.
Cette approche descendante ignorait souvent la demande réelle ou la faisabilité technique. De nombreux projets étaient dirigés par des dirigeants et des investisseurs ayant une expertise limitée dans les infrastructures d'IA, ce qui a entraîné des installations à la hâte en debout des normes de l'industrie.
La montée en puissance des modèles de raisonnement comme le R1 de Deepseek et le Chatgpt d'Openai a changé les besoins informatiques de la formation à grande échelle à une inférence en temps réel. Ce changement nécessite du matériel avec une faible latence, souvent situé à proximité des principaux centres technologiques, pour minimiser les retards de transmission et garantir l'accès au personnel qualifié.
En conséquence, de nombreux centres de données construits dans la Chine centrale, occidentale et rurale ont du mal à attirer des clients. Certains, comme une installation nouvellement construite à Zhengzhou, distribuent même des bons informatiques gratuits aux entreprises technologiques locales, mais ont toujours du mal à trouver des utilisateurs.
Malgré les défis, le gouvernement central de la Chine priorise le développement des infrastructures de l'IA. Au début de 2025, il a convoqué un symposium de l'industrie de l'IA soulignant l'importance de l'autosuffisance dans cette technologie.
Les grandes sociétés technologiques comme Alibaba et Bytedance ont annoncé des investissements importants dans le cloud computing et l'infrastructure matérielle d'IA.
Goodrich suggère que le gouvernement chinois considère la situation actuelle comme une douleur croissante nécessaire. « Le gouvernement central chinois verra probablement (des centres de données sous-utilisés) comme un mal nécessaire pour développer une capacité importante … ils voient la fin, pas les moyens », dit-il.
À mesure que l'industrie évolue, la demande reste forte pour les puces Nvidia, en particulier le modèle H20 conçu pour le marché chinois. Cependant, pour beaucoup dans le domaine, comme le chef de projet du centre de données Fang Cunbao, l'état actuel du marché a provoqué une réévaluation.
Au début de l'année, Fang a complètement quitté l'industrie du centre de données. « Le marché est trop chaotique. Les premiers adoptants ont profité, mais maintenant ce ne sont que des gens qui courent des lacunes politiques », explique-t-il. Il déplace maintenant son objectif vers l'éducation de l'IA.