La startup chinoise Moonshot AI publie Kimi K2, un modèle libre et open source qui surpasse GPT-4 dans les tâches de codage et le raisonnement mathématique,

Il est optimisé pour les applications agentiques

Le 14 juillet 2025 à 19:06, par Mathis Lucas

42PARTAGES

Les entreprises d'IA chinoises accentuent la pression sur leurs rivaux occidentaux. Après que DeepSeek a mis fin au mythe du contrôle de l'IA par la Silicon Valley avec son modèle d'IA R1, c'est maintenant au tour de Moonshot AI de faire parler de lui. Moonshot AI lance son nouveau modèle Kimi K2, doté de 32 milliards de paramètres activés sur un total de 1 000 milliards. Il affiche des performances élevées dans les tâches de codage et d'agent autonome, surpasse la plupart des modèles open source et certains des propriétaires tels que GPT-4 sur plusieurs benchmarks. Il est libre et open source, accessible pour la recherche, le réglage fin et les applications personnalisées.

Moonshot AI est une entreprise d'IA fondée en 2023 et basée à Pékin, en Chine. L'entreprise construit de grands modèles de langage (LLM) et est engagée dans la course à l'intelligence artificielle générale (AGI). En octobre 2023, l'entreprise a lancé son chatbot, Kimi. Moonshot AI vient de publier Kimi K2, un nouveau modèle open source qui dispose de capacités de codage améliorées et excelle dans les tâches générales d'agent et l'intégration d'outils.

Moonshot AI a annoncé que son modèle Kimi K2 surpasse les modèles open source traditionnels dans certains domaines, notamment DeepSeek-V3, et les capacités concurrentes des principaux modèles américains tels que ceux d'Anthropic et OpenAI dans certaines fonctions telles que le codage.

Selon Moonshot AI, Kimi-K2 est spécialement conçu pour les applications agentiques. Il peut exécuter des commandes, appeler des outils externes, générer et déboguer du code, etc. Lors d'une démonstration, Kimi-K2 a analysé les données salariales pour les emplois à distance, effectué des évaluations statistiques et créé une page HTML interactive avec un outil de recommandation personnalisable, le tout dans le cadre d'un seul processus agentique.

Les principales caractéristiques et les performances de Kimi K2

Kimi K2 est un grand modèle de langage avancé de type Mixture of Experts (MoE) avec 32 milliards de paramètres activés sur 1 000 milliards au total. L'entreprise propose deux versions : un modèle de base destiné aux chercheurs et les développeurs, et une variante adaptée aux instructions, optimisée pour les applications de chat et d'agents autonomes. Selon Moonshot AI, Kimi K2 a été méticuleusement optimisé pour les capacités agentiques.

« Kimi K2 ne se contente pas de répondre, il agit. Avec Kimi K2, l'intelligence agentique avancée est plus ouverte et accessible que jamais. Nous sommes impatients de voir ce que vous allez construire », a déclaré l'entreprise dans un blogue présentant son nouveau modèle de langage.

Il s'agit de la capacité d'un modèle de langage à utiliser des outils de manière autonome, d'écrire et d'exécuter du code, et d'accomplir des tâches complexes en plusieurs étapes sans intervention humaine. Dans les tests de référence, Kimi K2 a atteint une précision de 65,8 % sur SWE-bench Verified, un benchmark de génie logiciel difficile, surpassant la plupart des alternatives open source et égalant certains modèles propriétaires.

Moonshot AI a comparé ses mesures aux principaux modèles du marché. Kimi K2-Instruct ne se contente pas de rivaliser avec les grands acteurs : il les surpasse systématiquement dans les tâches les plus importantes pour les entreprises. Sur LiveCodeBench, l'un des benchmarks de codage les plus populaires dans la communauté, Kimi K2 a atteint une précision de 53,7 %, battant de manière décisive les 46,9 % de DeepSeek-V3 et les 44,7 % de GPT-4.1.

En outre, Kimi K2-Instruct a obtenu un score de 97,4 % sur le benchmark MATH-500, contre 92,4 % pour GPT-4.1, ce qui suggère que Moonshot AI a découvert un élément fondamental du raisonnement mathématique qui a échappé à des concurrents plus importants et mieux financés. Il se classe également parmi les meilleurs modèles dans les tests multilingues tels que MMLU-Pro. Moonshot AI présente les capacités de codage de Kimi-K2 sur X (ex-Twitter).

Lors d'un test non officiel réalisé par le développeur de logiciels open source Simon Willison, Kimi-K2 a réussi à générer un SVG représentant un pélican à vélo, une tâche qui pose souvent problème aux autres modèles de langage, qui ont tendance à ne produire que des formes abstraites.

Une démonstration des capacités agentiques de Kimi K2

Les démos partagées par Moonshot AI révèlent quelque chose de plus important que des capacités techniques : elles montrent que l'IA passe enfin des tours de passe-passe à l'utilité pratique. Prenons l'exemple de l'analyse des salaires : Kimi K2 ne s'est pas contenté de répondre à des questions sur les données, il a exécuté de manière autonome 16 opérations Python pour générer des analyses statistiques et des visualisations interactives.

La démo de l'organisation d'un concert à Londres a nécessité 17 appels d'outils sur plusieurs plates-formes : recherche, calendrier, courrier électronique, vols, hébergement et réservations de restaurants. Il ne s'agit pas de démonstrations conçues pour impressionner, mais d'exemples de systèmes d'IA qui accomplissent le type de flux de travail complexe et à plusieurs étapes que les travailleurs du savoir effectuent quotidiennement.

Il s'agit d'une évolution par rapport à la génération actuelle d'assistants d'IA qui excellent dans la conversation, mais peinent dans l'exécution. Alors que ses rivaux s'efforcent de rendre leurs modèles plus humains, Moonshot AI a pour priorité de les rendre plus utiles. Cette distinction est importante, car les entreprises n'ont pas besoin d'une IA capable de passer le test de Turing, elles ont besoin d'une IA capable de passer le test de la productivité.

Kimi K2 a coûté une fraction du prix de ses rivaux occidentaux

DeepSeek a bouleversé les marchés financiers et incité le président américain Donald Trump à le qualifier de « signal d'alarme » pour l'industrie technologique américaine. Le modèle DeepSeek-R1 a égalé les performances des meilleurs modèles de la Silicon Valley et n'a coûté qu'une fraction du coût de ces derniers. Cette révélation a soulevé des questions sur l'avenir de l'ensemble du secteur et a fait chuter la valeur de certains géants de la course à l'IA.

Le 20 janvier, DeepSeek a dévoilé R1, un modèle d’IA aussi performant que la dernière version de ChatGPT, mais développé pour une fraction du coût. Mis gratuitement à disposition de la communauté de l'IA, avec ses poids publiés en ligne, R1 est immédiatement devenu un objet de fascination. Marc Andreessen l’a décrit comme le « moment Spoutnik de l’IA », et TechCrunch a titré sur « la première crise de panique de la Silicon Valley en 2025 ».

Aujourd'hui, Kimi K2 de Moonshot AI semble emprunter la même voie. Moonshot AI obtient ces résultats impressionnants avec un modèle qui ne coûte qu'une fraction de ce que les concurrents actuels dépensent pour la formation et l'inférence de leurs modèles. Alors qu'OpenAI dépense des centaines de millions en calcul pour des améliorations progressives, Moonshot AI semble avoir trouvé un moyen plus efficace d'atteindre les mêmes performances.

C'est le dilemme classique de l'innovateur qui se déroule en temps réel : le petit outsider ne se contente pas d'égaler les performances de l'opérateur historique, il le fait mieux, plus rapidement et à moindre coût. Les clients attendent des systèmes d'IA capables de mener à bien des flux de travail complexes de manière autonome, et pas seulement de produire des démonstrations. Moonshot AI laisse entendre que Kimi K2 peut enfin tenir cette promesse.

MuonClip : un optimiseur pour révolutionner la formation de l'IA

La documentation technique de Moonshot AI contient un détail qui pourrait s'avérer plus important que les scores de référence de Kimi K2 : le développement de l'optimiseur MuonClip, qui a permis l'apprentissage stable d'un modèle à 1 000 milliards de paramètres « sans aucune instabilité de l'apprentissage ». Selon certains experts, il ne s'agit pas seulement d'une prouesse technique, mais potentiellement d'un changement de paradigme.

L'instabilité de l'apprentissage a été la taxe cachée sur le développement de grands modèles de langage, obligeant les entreprises à recommencer des cycles d'apprentissage coûteux, à mettre en œuvre des mesures de sécurité onéreuses et à accepter des performances sous-optimales pour éviter les accidents.

La solution de Moonshot AI s'attaque directement à l'explosion des logits d'attention en remettant à l'échelle les matrices de poids dans les projections de requêtes et de clés, résolvant ainsi le problème à la source plutôt que d'appliquer des pansements en aval. Les implications économiques sont énormes. Si MuonClip s'avère généralisable, la technique pourrait réduire considérablement les frais généraux de calcul liés à la formation de grands modèles.

Moonshot AI suggère que sa méthode peut être étendue à l'échelle de l'industrie. Dans un secteur où les coûts de formation se mesurent en dizaines de millions de dollars, des gains d'efficacité même modestes se traduisent par des avantages concurrentiels qui se mesurent en trimestres et non en années.

L'industrie chinoise de l'IA mise massivement sur l'open source

Alors que les entreprises américaines investissent des milliards pour créer des modèles d’IA, l’efficacité de DeepSeek a jeté un doute profond sur la pertinence de ces dépenses. Selon certaines sources, le coût total de DeepSeek-R1 équivaudrait au salaire annuel d’un cadre supérieur de Google. En une semaine, l’application s’est hissée en tête des classements sur iPhone et Android. De plus, le modèle est open source et accessible à tous gratuitement.

L'industrie chinoise de l'IA se sert de l'open source comme arme concurrentielle : la stratégie de prix radicale de DeepSeek et de Moonshot AI cible les centres de profit des grandes entreprises technologiques occidentales. La décision de Moonshot AI d'ouvrir Kimi K2 tout en offrant un accès à l'API à un prix compétitif révèle une compréhension sophistiquée de la dynamique du marché qui va bien au-delà des principes altruistes de l'open source.

À 0,15 $ par million de jetons d'entrée pour les accès au cache et à 2,50 $ par million de jetons de sortie, Moonshot AI affiche un prix agressif inférieur à celui d'OpenAI et d'Anthropic tout en offrant des performances comparables, et dans certains cas supérieures. Les entreprises peuvent commencer avec l'API pour un déploiement immédiat, puis migrer vers des versions autohébergées pour optimiser les coûts ou répondre aux exigences de conformité.

Ce plan tarifaire crée en effet un piège pour les fournisseurs en place. S'ils s'alignent sur les prix de Moonshot AI, ils compriment leurs propres marges sur ce qui a été leur ligne de produits la plus rentable. S'ils ne le font pas, ils risquent de perdre des clients au profit d'un modèle tout aussi performant pour une fraction du coût. Pendant ce temps, Moonshot AI gagne des parts de marché et l'adoption de l'écosystème par les deux canaux simultanément.

La composante open source n'est pas de la charité, c'est de l'acquisition de clients. Chaque développeur qui télécharge et expérimente Kimi K2 devient un client potentiel de l'entreprise. Chaque amélioration apportée par la communauté réduit les coûts de développement de Moonshot AI. C'est une roue d'inertie qui tire parti de la communauté mondiale des développeurs pour accélérer l'innovation tout en renforçant la compétitivité de l'entreprise.

L'IA open source rattrape rapidement son retard sur les Big Tech

Dans une session de questions-réponses sur Reddit en mars 2025, le PDG d'OpenAI, Sam Altman, a déclaré qu'il pense qu'OpenAI a pris le mauvais parti de l'open source pour ses technologies. L'entreprise avait évoqué des raisons commerciales pour abandonner son statut open source. Cela lui a valu des critiques et une action en justice intentée par le cofondateur Elon Musk ; [URL="https://droit.developpez.com/actu...

La fin de cet article est réservée aux abonnés. Soutenez le Club Developpez.com en prenant un abonnement pour que nous puissions continuer à vous proposer des publications.

Une erreur dans cette actualité ? Signalez-nous-la !

Votre nom : Votre e-mail :

Décrivez l'erreur que vous souhaitez porter à notre connaissance :

Identifiez-vous

Créer un compte

La startup chinoise Moonshot AI publie Kimi K2, un modèle libre et open source qui surpasse GPT-4 dans les tâches de codage et le raisonnement mathématique,

Il est optimisé pour les applications agentiques

Identifiant
Mot de passe

Mot de passe oublié ?

Identifiez-vous

Créer un compte

La startup chinoise Moonshot AI publie Kimi K2, un modèle libre et open source qui surpasse GPT-4 dans les tâches de codage et le raisonnement mathématique, Il est optimisé pour les applications agentiques

La startup chinoise Moonshot AI publie Kimi K2, un modèle libre et open source qui surpasse GPT-4 dans les tâches de codage et le raisonnement mathématique,

Il est optimisé pour les applications agentiques