Le 11 février 2026, quelques jours avant le Nouvel An lunaire chinois, Zhipu AI a déployé GLM-5, marquant un tournant historique dans la course mondiale à l'IA. Ce modèle de langage massif, doté de 744 milliards de paramètres totaux (dont 40 milliards actifs par token), représente plus qu'une simple itération technique : c'est une déclaration de guerre stratégique contre les géants propriétaires occidentaux.Les chiffres parlent d'eux-mêmes. Sur le benchmark SWE-bench Verified, qui évalue les capacités en ingénierie logicielle réelle, GLM-5 atteint un score de 77,8%, surpassant Gemini 3 Pro de Google (76,2%) et se rapprochant dangereusement de Claude Opus 4.5 qui culmine à 80,9%. Pour un modèle open source sous licence MIT, disponible librement et déployable sur infrastructure privée, c'est une prouesse sans précédent.Mais c'est sur le Terminal-Bench 2.0, qui simule des tâches complexes d'exécution longue durée, que GLM-5 affirme sa supériorité. Avec un score de 56,2%, il domine l'ensemble de la compétition open source et rivalise avec les systèmes propriétaires les plus avancés. Sur BrowseComp, benchmark mesurant les capacités de recherche web et de synthèse d'information à large échelle, GLM-5 affiche un score de 75,9%, se positionnant comme leader incontesté parmi les modèles à poids ouverts.L'innovation la plus spectaculaire de GLM-5 réside dans son approche radicale du problème des hallucinations. Sur l'Artificial Analysis Intelligence Index v4.0, le modèle obtient un score de -1 sur l'AA-Omniscience Index, soit une amélioration de 35 points par rapport à son prédécesseur GLM-4.7. Ce score traduit une réduction de 56 points de pourcentage du taux d'hallucination.Concrètement, GLM-5 a appris à reconnaître ses limites : plutôt que d'inventer des réponses plausibles mais factuellement incorrectes, il choisit de s'abstenir lorsqu'il n'a pas l'information. Cette capacité à « savoir qu'il ne sait pas » place GLM-5 devant l'ensemble de l'industrie, y compris les modèles d'OpenAI, Google et Anthropic. Pour les entreprises opérant dans des secteurs critiques comme la santé, le juridique ou la finance, cette fiabilité accrue constitue un argument décisif.Derrière ces performances se cache une refonte architecturale majeure. GLM-5 passe de 355 milliards de paramètres (GLM-4.7) à 744 milliards, avec un volume de données de pré-entraînement qui bondit de 23 à 28,5 trillions de tokens. Cette expansion massive de l'échelle computationnelle a permis une amélioration significative de l'intelligence générale du modèle.L'innovation majeure réside dans le framework « Slime », un système d'apprentissage par renforcement asynchrone développé spécifiquement pour GLM-5. Ce framework permet au modèle d'apprendre continuellement à partir d'interactions longue durée, débloquant ainsi le plein potentiel des capacités pré-entraînées. Pour la première fois dans un modèle de cette envergure, Zhipu AI intègre également le mécanisme DeepSeek Sparse Attention (DSA), qui réduit drastiquement les coûts de déploiement tout en préservant les performances sur contextes longs.Le résultat ? Une fenêtre de contexte de 200 000 tokens et une capacité de génération maximale de 128 000 tokens, permettant de traiter et de produire des documents d'envergure professionnelle sans compromis sur la qualité.Au-delà des benchmarks aseptisés, un témoignage d'utilisateur a enflammé les réseaux sociaux et les forums spécialisés. Un développeur anonyme rapporte avoir soumis le même prompt de création d'application à Claude Opus 4.6 et à GLM-5 via le site z.ai. Les résultats sont intéressants :Ce témoignage, bien que non scientifique, résonne avec les retours d'une communauté croissante de développeurs qui adoptent GLM-5 pour leurs workflows de coding agentique. Sur les forums Reddit (r/LocalLLaMA, r/ClaudeAI) et sur les plateformes comme OpenRouter, les discussions témoignent d'un changement de paradigme : GLM-5 ne se contente pas de rivaliser avec les modèles propriétaires occidentaux, il les surpasse dans des scénarios d'usage réels.Martin Casado, General Partner chez Andreessen Horowitz, a publié une statistique révélatrice : parmi les startups qui pitchent avec des stacks open source, environ 80% utilisent désormais des modèles chinois. Sur OpenRouter, l'utilisation de modèles open source chinois est passée de quasiment zéro fin 2024 à près de 30% lors de certaines semaines récentes. Sur Hugging Face, la famille Qwen d'Alibaba a dépassé les modèles Llama de Meta en téléchargements cumulés, et une étude récente du MIT confirme que les modèles open source chinois ont surpassé les modèles américains en nombre total de téléchargements.Malgré l'enthousiasme général, GLM-5 n'est pas exempt de critiques et de limitations structurelles.Le paradoxe de GLM-5 tient dans sa promesse d'open source « accessible ». Théoriquement, n'importe qui peut télécharger les poids du modèle et le déployer. En pratique, la réalité est bien différente. Avec ses 744 milliards de paramètres, GLM-5 nécessite approximativement 1 490 Go de mémoire pour stocker les poids en précision native BF16.Pour le déployer en production, il faut soit disposer d'un cluster de GPUs haut de gamme (multiples H100 ou équivalents), soit accepter des quantifications agressives qui dégradent les performances, soit passer par une API tierce. Un analyste le résume brutalement : « Le modèle prouve que 'poids ouverts' ne signifie plus 'accessible'. Cela signifie transférer les coûts des factures API vers des budgets matériels que seules les équipes bien financées peuvent se permettre. »Selon l'analyse de Kilo.ai, les coûts d'inférence de GLM-5 ont doublé par rapport à GLM-4.7. Le modèle traite certes plus rapidement (plus de 55 tokens par seconde selon Zhipu AI), mais cette vitesse ne compense pas nécessairement l'augmentation des coûts opérationnels pour certains cas d'usage.Lukas Petersson, co-fondateur de la startup Andon Labs spécialisée dans les protocoles d'IA autonome sécurisée, a émis un avertissement troublant après avoir analysé pendant des heures les traces d'exécution de GLM-5 : « Un modèle incroyablement efficace, mais bien moins conscient de sa situation. Il atteint ses objectifs via des tactiques agressives mais ne raisonne pas sur sa situation et n'exploite pas l'expérience. C'est inquiétant. »Cette observation pointe vers une différence fondamentale de philosophie. Alors que les laboratoires occidentaux comme Anthropic optimisent pour la « profondeur de raisonnement », Zhipu AI optimise pour « l'exécution et l'échelle ». GLM-5 est conçu pour terminer le projet sans qu'on ait à le demander deux fois, quitte à adopter des approches plus directes et moins nuancées.GLM-5 reste un modèle texte uniquement, contrairement à des concurrents comme Kimi K2.5 qui offrent des capacités multimodales (vision). Il est également moins token-efficient que Claude malgré une génération globale de moins de tokens. Et malgré les progrès spectaculaires, des risques d'hallucination subsistent.Des utilisateurs ont signalé, lors des tests sous le nom de code « Pony Alpha » avant le lancement officiel, des faux messages texte dans des démos UI et une dégradation graphique dans le contenu généré. Des rough edges typiques d'un modèle qui pousse les limites, mais qui questionnent néanmoins la maturité pour certains déploiements critiques.L'émergence de GLM-5 ne peut être dissociée du contexte géopolitique tendu qui structure la rivalité technologique sino-américaine.Ironiquement, les restrictions américaines semblent avoir accéléré plutôt qu'entravé l'innovation chinoise. Lorsque Zhipu AI a été ajoutée à la Entity List américaine en janvier 2024, limitant son accès aux technologies américaines, beaucoup prédisaient que l'entreprise peine à maintenir son rythme d'innovation. Au lieu de cela, les sanctions ont stimulé le développement d'un écosystème domestique parallèle.Le 14 janvier 2026, Zhipu AI a lancé GLM-Image, le premier modèle génératif multimodal haute performance entraîné entièrement sur hardware domestique chinois, spécifiquement avec les processeurs IA Ascend 910C de Huawei. Ce jalon marque un tournant critique pour l'industrie IA...