IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)

Vous êtes nouveau sur Developpez.com ? Créez votre compte ou connectez-vous afin de pouvoir participer !

Vous devez avoir un compte Developpez.com et être connecté pour pouvoir participer aux discussions.

Vous n'avez pas encore de compte Developpez.com ? Créez-en un en quelques instants, c'est entièrement gratuit !

Si vous disposez déjà d'un compte et qu'il est bien activé, connectez-vous à l'aide du formulaire ci-dessous.

Identifiez-vous
Identifiant
Mot de passe
Mot de passe oublié ?
Créer un compte

L'inscription est gratuite et ne vous prendra que quelques instants !

Je m'inscris !

Le nouveau modèle GLM-5.2 de Z.ai devient la référence sur le marché des IA open source. Il surpasse GPT-5.5 d'OpenAI sur plusieurs benchmarks de codage à long terme, pour un coût six fois moindre

Le , par Mathis Lucas

429PARTAGES

4  0 
Le nouveau modèle GLM-5.2 de Z.ai devient la référence sur le marché des IA open source. Il surpasse GPT-5.5 d'OpenAI sur plusieurs benchmarks de codage à long terme, pour un coût six fois moindre

Le nouveau modèle GLM-5.2 s'impose désormais comme la référence dominante parmi les IA en accès libre. Bien qu'il conserve la même architecture que son prédécesseur, GLM-5.2 affiche des progrès fulgurants en matière de raisonnement scientifique et de capacités agentiques, rivalisant même avec des modèles propriétaires de premier plan. Son efficacité repose sur une fenêtre de contexte élargie à un million de tokens et une précision accrue qui réduit significativement les hallucinations. Le nouveau modèle GLM-5.2 à poids ouverts de Z.ai surpasse le GPT-5.5 d'OpenAI dans plusieurs tests de performance en codage à long terme, pour un coût six fois moindre.

Z.ai (anciennement Zhipu AI) est une entreprise chinoise spécialisée dans l'IA générative. Elle développe la série GLM composée de grands modèles de langage (LLM) hautement performants et rivalisant avec les meilleurs modèles. La série GLM se distingue par son format de modèle ouvert, qui permet à tout un chacun de télécharger ces modèles. GLM-5.1, lancé en avril 2026, est un modèle ouvert qui a surpassé Claude Opus 4.6 lors de certains tests.

Z.ai vient d'annoncer la sortie de GLM-5.2, un nouveau modèle de langage à poids ouverts comptant 744 milliards de paramètres, spécialement conçu pour exceller dans les tâches d’ingénierie et de codage autonome à long terme. Disponible sur Hugging Face, via l'API Z.ai et dans plus de 20 environnements de codage tiers, GLM-5.2 offre une fenêtre de contexte stable d'un million de tokens, ainsi que des formules d'abonnement pour les entreprises.

Pour les décideurs techniques en entreprise, le modèle GLM-5.2 de Z.ai offre une solution très performante pour héberger localement une IA de pointe, en contournant entièrement les barrières géographiques et les restrictions commerciales. Cela vous permet également d'avoir un contrôle total sur vos données.

Améliorations techniques et capacités de raisonnement

Le modèle GLM-5.2 s'impose comme le nouveau chef de file des modèles à poids ouverts sur la version 4.1 de l'Artificial Analysis Intelligence Index avec un score de 51. Il parvient à surpasser ses principaux concurrents directs à poids ouverts comme MiniMax-M3 et DeepSeek V4 Pro qui plafonnent à 44, ainsi que Kimi K2.6 et ses 43 points. Selon Z.ai, ces performances sont le fruit de nouvelles améliorations techniques et capacités de raisonnement.


Bien que GML-5.2 conserve exactement la même structure que son prédécesseur GLM-5.1, avec un total de 744 milliards de paramètres pour 40 milliards de paramètres actifs, il améliore son score global de onze points sur cet indice d'intelligence. Les avancées du modèle sont particulièrement notables dans le domaine du raisonnement scientifique, avec des scores impressionnants sur les benchmarks ou évaluations spécialisées comme CritPt et HLE.

GLM-5.2 affiche aussi de bien meilleurs résultats sur toute une série de tests complexes incluant AA-LCR, tau3-Banking, SciCode, TerminalBench v2.1 et GPQA Diamond. En outre, son score sur l'indice AA-Omniscience est passé de 2 à 4, une progression rendue possible par une hausse de la précision globale et une baisse du taux d'hallucination qui tombe à 28,1 %. Par ailleurs, une autre évolution technique majeure concerne sa fenêtre de contexte.

Elle a été nettement élargie pour gérer jusqu'à un million de tokens, contre seulement 200 000 pour la version précédente. Toutefois, GLM-5.2 consomme plus de tokens que son prédécesseur. En dépit de son haut niveau de performance, GLM-5.2 est moins économe en tokens que certains de ses pairs, puisqu'il consomme environ 43 000 tokens de sortie par tâche, dont 37 000 sont exclusivement dédiés au processus de raisonnement.

Efficacité du modèle, consommation de tokens et coûts

Selon Z.ai, les innovations apportées à GML-5.2 permet de réduire de 2,9 fois le nombre de FLOPs par token. Sa consommation accrue de tokens le désavantage légèrement en termes d'efficacité pure face à des modèles concurrents qui nécessitent moins de ressources pour générer une réponse. Néanmoins, GLM-5.2 se positionne de manière très compétitive sur la frontière de Pareto qui évalue le rapport entre l'intelligence et le coût par tâche.


Avec un coût estimé à 0,46 dollar par tâche, il propose le tarif le plus bas parmi les modèles de son calibre intellectuel, et ses coûts d'utilisation d'API restent alignés sur ceux de la version 5.1. Le modèle intègre aussi une couche améliorée de prédiction multitokens (MTP) pour le décodage spéculatif, augmentant la longueur des tokens acceptés jusqu’à 20 % lors de l’inférence. Et Z.ai a mis en place des « modes de réflexion » flexibles et sélectionnables.

Ainsi, les utilisateurs peuvent basculer l’effort de raisonnement de GML-5.2 entre l'option « Max », conçue pour repousser les limites de la résolution logique de problèmes, et « High », qui établit un équilibre prudent entre des performances haut de gamme et une efficacité des tokens sensible à la latence.

L'un des atouts majeurs de GLM-5.2 réside dans ses capacités d'agent autonome en situation réelle, mesurées par le référentiel GDPval-AA v2, où il obtient le score impressionnant de 1524. Ce résultat exceptionnel lui permet de dominer tous les autres modèles à poids ouverts et de faire jeu égal avec des modèles propriétaires très avancés tels que le GPT-5.5. Le nouveau modèle de Z.ai démontre que « l'IA open source rattrape rapidement son retard ».

Des performances de pointe pour un modèle open source

GLM-5.2 est distribué sous licence MIT, ce qui garantit une grande flexibilité d'accès. Outre l'API directe proposée par Z.ai, les développeurs peuvent s'appuyer sur de multiples fournisseurs tiers pour le déployer, incluant notamment DeepInfra, Novita, Nebius, Parasail, Siliconflow, Baseten, Fireworks... Lors de tests de performance, GLM-5.2 affiche des performances supérieures à celles de la plupart des modèles phares open source, y compris DeepSeek v4.


GML-5.2 obtient des scores proches ou supérieurs à ceux de ses concurrents aux paramètres fermés, à savoir le GPT-5.5 d’OpenAI et le Claude Opus 4.8 d’Anthropic. Il excelle particulièrement dans l’utilisation d’outils de manière autonome et dans les tâches d’ingénierie logicielle à long terme :

  • SWE-bench Pro : GLM-5.2 a obtenu un score de 62,1, devançant largement GPT-5.5 (58,6) et son prédécesseur, GLM-5.1 (58,4) ;
  • FrontierSWE (Dominance) : sur ce benchmark conçu pour tester la réalisation de tâches à long terme, GLM-5.2 a atteint 74,4 %, surpassant GPT-5.5 (72,6 %) et terminant à égalité quasi parfaite avec Claude Opus 4.8 (75,1 %) ;
  • MCP-Atlas : lors de cette évaluation sur l’utilisation d’outils, GLM-5.2 a obtenu un score de 77,0, devançant GPT-5.5 (75,3) et se plaçant juste derrière Claude Opus 4.8 (77,8) ;
  • Humanity’s Last Exam (avec outils) : lorsqu’il est équipé d’outils externes, GLM-5.2 a atteint un score de 54,7, devançant GPT-5.5 (52,2) et talonnant de près Claude Opus 4.8 (57,9) ;
  • PostTrainBench et SWE-Marathon : lors de charges de travail d’ingénierie prolongées, s’étalant sur plusieurs heures, GLM-5.2 a systématiquement devancé GPT-5.5, avec un score de 34,3 % contre 25,0 % pour GPT-5.5 sur PostTrainBench, et de 13,0 % contre 12,0 % pour GPT-5.5 sur SWE-Marathon.


Si le GLM-5.2 est légèrement devancé par Claude Opus 4.8 et GPT-5.5 en matière de scores bruts sur Terminal-Bench 2.1 (81,0 contre 85,0 et 84,0, respectivement), il surpasse largement le modèle Gemini 3.1 Pro de Google (74,0). En outre, GLM-5.2 a décroché la première place sur Design Arena, consacré aux tâches de conception participatives, devançant même le modèle de pointe susmentionné Claude Fable 5 avec un score ELO de 1 360.

L’impact des « modes de réflexion » sélectionnables de Z.ai est clairement visible dans les données : au niveau « Max », GLM-5.2 atteint son pic d’intelligence, mais utilise près de 85 000 tokens de sortie par tâche. Le passage à « High » n’entraîne qu’une perte de quelques points de performance tout en réduisant de moitié le nombre de tokens de sortie requis, ce qui constitue un levier d’optimisation crucial pour les applications sensibles à la latence.

Réponse à la suspension de l'accès à Mythos 5 et Fable 5

Z.ai a annoncé le GLM-5.2 le 13 juin 2026, le jour même où les modèles de pointe Mythos 5 et Fable 5 d’Anthropic ont été mis hors service sur ordre du gouvernement américain. Cela suggère que l’annonce de GLM-5.2 était une réponse à la mise hors service des modèles Claude Mythos 5 et Claude Fable 5. Le fondateur de la société a d'ailleurs réagi au blocage soudain des modèles d'Anthropic, dénonçant l'attitude des États-Unis sur la question.


Jie Tang, chercheur en IA et fondateur de Z.ai, a commenté le lancement de GLM-5.2 en déclarant : « nous regrettons profondément les restrictions soudaines imposées à certains modèles de pointe. Le refus soudain d’accès à ces modèles de pointe pour des raisons non techniques renforce notre conviction que la science doit être mondiale. La voie vers l’AGI (intelligence artificielle générale) ne doit pas être entravée par des barrières des barrières ».

« Elle nécessite la coopération de l’humanité tout entière. Nous sommes attachés à une approche ouverte. L’intelligence de pointe doit être open source, accessible, modulable et au service de tous les développeurs passionnés », soulignant ainsi l’importance de la mise à disposition de GLM-5.2 en tant que modèle ouvert. Cet incident a durablement érodé la confiance internationale envers les fournisseurs américains de produits et services numériques.

Le verrouillage des modèles Fable 5 et Mythos 5 par l'administration Trump donne raison aux partisans de l'IA open source et non américaine. Face à cette démonstration de force, le Royaume-Uni et la France pressent désormais le pas vers la souveraineté numérique, érigée en impératif de sécurité nationale. L'émergence de solutions locales et de modèles open source devient une priorité pour garantir un accès permanent à ces outils essentiels.

Les réactions de la communauté au lancement de GML-5.2

GML-5.2 a été bien accueilli parmi les développeurs d’IA et les créateurs d’outils. La réaction des développeurs à sa sortie a été immédiate et extrêmement positive. L’équipe de Kilo Code a confirmé l’intégration dès le premier jour, en publiant sur X : « GLM-5.2 fonctionne dans Kilo Code dès le premier jour. La fenêtre de contexte de 1 million et le mode “Max effort” sont tous deux opérationnels. Configurez votre environnement et c’est parti ! ».


L’environnement de codage open source Cline IDE s’est fait l’écho de ce sentiment, soulignant l’avantage économique : « GLM-5.2 est le premier modèle à poids ouverts à dépasser les 80 % sur Terminal-Bench, et il surpasse tous les autres modèles ouverts disponibles. Il surpasse Gemini, ce qui en fait un modèle de pointe pour un coût bien moindre. Les poids ouverts sont de retour. Il change la donne. Il est disponible dès maintenant dans Cline ! ».

Le caractère open source de GML-5.2 remet en cause le modèle économique des API propriétaires. GLM-5.2 repose sur une architecture Mixture-of-Experts de 744 milliards de paramètres avec une fenêtre de contexte d'un million de tokens, des capacités jusqu'ici réservées aux offres payantes d'OpenAI ou d'Anthropic. GML-5.2 prouve la possibilité d'offrir des performances de haut niveau à une fraction du coût matériel des grands systèmes centralisés.

Pour OpenAI, cela signifie une érosion potentielle de sa base d'utilisateurs, notamment chez les développeurs et les entreprises sensibles aux coûts. Alors que la domination écrasante de ChatGPT commence à s'effriter face à la concurrence, le lancement de GML-5.2 représente un nouveau défi pour OpenAI. Le laboratoire de San Francisco fait déjà face à des coûts insoutenables que même la croissance fulgurante de son chiffre d'affaires ne parvient pas à couvrir.

Conclusion

L'avènement de GLM-5.2 marque un tournant technologique majeur : les modèles d'IA open source parviennent désormais à rivaliser concrètement avec les modèles propriétaires d'Anthropic et d'OpenAI sur les benchmarks les plus populaires, en particulier sur des tâches autonomes longues et complexes. Les laboratoires privés continuent de repousser toujours plus loin les limites de l'état de l'art technologique, mais l'open source suit de très près.

GLM-5.2 s'attaque directement le segment phare de l'industrie : le codage. Le codage est précisément le marché sur lequel OpenAI génère le plus de revenus via Codex, ChatGPT Enterprise et ses intégrations IDE. Un modèle concurrent à poids ouverts capte ces développeurs sans qu'ils paient un centime à OpenAI.

Mais malgré les avantages des modèles open sources chinois, des risques géopolitiques pourraient freiner leur adoption massive ou en entreprise. Des rapports soulignent des relations étroites entre Z.ai et le parti communiste chinois (PCC). Puis, en mai 2026, des législateurs américains ont ouvert une enquête formelle sur les risques de cybersécurité posés par des modèles d'origine chinoise dans les infrastructures critiques, citant nommément Z.ai.

En Europe, les politiques prennent du temps à se mettre en place pour assurer la souveraineté numérique du continent. À la suite du blocage de Fable 5 et Mythos 5, l'ancien Premier ministre Gabriel Attal a qualifié cette interruption de commencement de la « guerre de l'IA ». Il a comparé cette restriction d'accès à un blocus stratégique comparable à celui du détroit d'Ormuz, une inquiétude partagée par l'ensemble de la classe politique française.

Sources : GML-5.2, Z.ai API

Et vous ?

Quel est votre avis sur le sujet ?
Que pensez-vous des capacités et des performances du modèle GML-5.2 ?
GML-5.2 rivalise avec ChatGPT et Claude sur presque tous les benchmarks. Qu'en pensez-vous ?
Quels impacts le lancement de GML-5.2 pourrait avoir sur les modèles propriétaires d'Anthropic et d'OpenAI ?
La nationalité chinoise de GML-5.2 pourrait avoir un impact sur son adoption. Qu'en pensez-vous ?
Selon vous, pourquoi les modèles d'IA européens peinent à rivaliser avec les modèles de pointe américains ?

Voir aussi

Les risques financiers qui planent sur l'introduction en bourse de SpaceX pourraient provoquer son effondrement spectaculaire : « le véritable génie de Musk réside dans sa capacité à créer des mythes »

Le blocage de l'accès aux modèles Fable 5 et Mythos 5 d'Anthropic par l'administration Trump donne raison aux partisans de l'IA open source et non américaine, « la guerre de l'IA est désormais lancée »

Des documents financiers divulgués révèlent qu'OpenAI perd des milliards de dollars par an. La croissance du chiffre d'affaires est largement éclipsée par les dépenses de R&D et autres coûts
Vous avez lu gratuitement 13 726 articles depuis plus d'un an.
Soutenez le club developpez.com en souscrivant un abonnement pour que nous puissions continuer à vous proposer des publications.

Une erreur dans cette actualité ? Signalez-nous-la !