IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)

Vous êtes nouveau sur Developpez.com ? Créez votre compte ou connectez-vous afin de pouvoir participer !

Vous devez avoir un compte Developpez.com et être connecté pour pouvoir participer aux discussions.

Vous n'avez pas encore de compte Developpez.com ? Créez-en un en quelques instants, c'est entièrement gratuit !

Si vous disposez déjà d'un compte et qu'il est bien activé, connectez-vous à l'aide du formulaire ci-dessous.

Identifiez-vous
Identifiant
Mot de passe
Mot de passe oublié ?
Créer un compte

L'inscription est gratuite et ne vous prendra que quelques instants !

Je m'inscris !

La startup chinoise Moonshot AI publie Kimi K2, un modèle libre et open source qui surpasse GPT-4 dans les tâches de codage et le raisonnement mathématique,
Il est optimisé pour les applications agentiques

Le , par Mathis Lucas

74PARTAGES

4  0 
Les entreprises d'IA chinoises accentuent la pression sur leurs rivaux occidentaux. Après que DeepSeek a mis fin au mythe du contrôle de l'IA par la Silicon Valley avec son modèle d'IA R1, c'est maintenant au tour de Moonshot AI de faire parler de lui. Moonshot AI lance son nouveau modèle Kimi K2, doté de 32 milliards de paramètres activés sur un total de 1 000 milliards. Il affiche des performances élevées dans les tâches de codage et d'agent autonome, surpasse la plupart des modèles open source et certains des propriétaires tels que GPT-4 sur plusieurs benchmarks. Il est libre et open source, accessible pour la recherche, le réglage fin et les applications personnalisées.

Moonshot AI est une entreprise d'IA fondée en 2023 et basée à Pékin, en Chine. L'entreprise construit de grands modèles de langage (LLM) et est engagée dans la course à l'intelligence artificielle générale (AGI). En octobre 2023, l'entreprise a lancé son chatbot, Kimi. Moonshot AI vient de publier Kimi K2, un nouveau modèle open source qui dispose de capacités de codage améliorées et excelle dans les tâches générales d'agent et l'intégration d'outils.

Moonshot AI a annoncé que son modèle Kimi K2 surpasse les modèles open source traditionnels dans certains domaines, notamment DeepSeek-V3, et les capacités concurrentes des principaux modèles américains tels que ceux d'Anthropic et OpenAI dans certaines fonctions telles que le codage.

Selon Moonshot AI, Kimi-K2 est spécialement conçu pour les applications agentiques. Il peut exécuter des commandes, appeler des outils externes, générer et déboguer du code, etc. Lors d'une démonstration, Kimi-K2 a analysé les données salariales pour les emplois à distance, effectué des évaluations statistiques et créé une page HTML interactive avec un outil de recommandation personnalisable, le tout dans le cadre d'un seul processus agentique.

Les principales caractéristiques et les performances de Kimi K2

Kimi K2 est un grand modèle de langage avancé de type Mixture of Experts (MoE) avec 32 milliards de paramètres activés sur 1 000 milliards au total. L'entreprise propose deux versions : un modèle de base destiné aux chercheurs et les développeurs, et une variante adaptée aux instructions, optimisée pour les applications de chat et d'agents autonomes. Selon Moonshot AI, Kimi K2 a été méticuleusement optimisé pour les capacités agentiques.


« Kimi K2 ne se contente pas de répondre, il agit. Avec Kimi K2, l'intelligence agentique avancée est plus ouverte et accessible que jamais. Nous sommes impatients de voir ce que vous allez construire », a déclaré l'entreprise dans un blogue présentant son nouveau modèle de langage.

Il s'agit de la capacité d'un modèle de langage à utiliser des outils de manière autonome, d'écrire et d'exécuter du code, et d'accomplir des tâches complexes en plusieurs étapes sans intervention humaine. Dans les tests de référence, Kimi K2 a atteint une précision de 65,8 % sur SWE-bench Verified, un benchmark de génie logiciel difficile, surpassant la plupart des alternatives open source et égalant certains modèles propriétaires.

Moonshot AI a comparé ses mesures aux principaux modèles du marché. Kimi K2-Instruct ne se contente pas de rivaliser avec les grands acteurs : il les surpasse systématiquement dans les tâches les plus importantes pour les entreprises. Sur LiveCodeBench, l'un des benchmarks de codage les plus populaires dans la communauté, Kimi K2 a atteint une précision de 53,7 %, battant de manière décisive les 46,9 % de DeepSeek-V3 et les 44,7 % de GPT-4.1.

En outre, Kimi K2-Instruct a obtenu un score de 97,4 % sur le benchmark MATH-500, contre 92,4 % pour GPT-4.1, ce qui suggère que Moonshot AI a découvert un élément fondamental du raisonnement mathématique qui a échappé à des concurrents plus importants et mieux financés. Il se classe également parmi les meilleurs modèles dans les tests multilingues tels que MMLU-Pro. Moonshot AI présente les capacités de codage de Kimi-K2 sur X (ex-Twitter).

Lors d'un test non officiel réalisé par le développeur de logiciels open source Simon Willison, Kimi-K2 a réussi à générer un SVG représentant un pélican à vélo, une tâche qui pose souvent problème aux autres modèles de langage, qui ont tendance à ne produire que des formes abstraites.

Une démonstration des capacités agentiques de Kimi K2

Les démos partagées par Moonshot AI révèlent quelque chose de plus important que des capacités techniques : elles montrent que l'IA passe enfin des tours de passe-passe à l'utilité pratique. Prenons l'exemple de l'analyse des salaires : Kimi K2 ne s'est pas contenté de répondre à des questions sur les données, il a exécuté de manière autonome 16 opérations Python pour générer des analyses statistiques et des visualisations interactives.


La démo de l'organisation d'un concert à Londres a nécessité 17 appels d'outils sur plusieurs plates-formes : recherche, calendrier, courrier électronique, vols, hébergement et réservations de restaurants. Il ne s'agit pas de démonstrations conçues pour impressionner, mais d'exemples de systèmes d'IA qui accomplissent le type de flux de travail complexe et à plusieurs étapes que les travailleurs du savoir effectuent quotidiennement.

Il s'agit d'une évolution par rapport à la génération actuelle d'assistants d'IA qui excellent dans la conversation, mais peinent dans l'exécution. Alors que ses rivaux s'efforcent de rendre leurs modèles plus humains, Moonshot AI a pour priorité de les rendre plus utiles. Cette distinction est importante, car les entreprises n'ont pas besoin d'une IA capable de passer le test de Turing, elles ont besoin d'une IA capable de passer le test de la productivité.

Kimi K2 a coûté une fraction du prix de ses rivaux occidentaux

DeepSeek a bouleversé les marchés financiers et incité le président américain Donald Trump à le qualifier de « signal d'alarme » pour l'industrie technologique américaine. Le modèle DeepSeek-R1 a égalé les performances des meilleurs modèles de la Silicon Valley et n'a coûté qu'une fraction du coût de ces derniers. Cette révélation a soulevé des questions sur l'avenir de l'ensemble du secteur et a fait chuter la valeur de certains géants de la course à l'IA.

Le 20 janvier, DeepSeek a dévoilé R1, un modèle d’IA aussi performant que la dernière version de ChatGPT, mais développé pour une fraction du coût. Mis gratuitement à disposition de la communauté de l'IA, avec ses poids publiés en ligne, R1 est immédiatement devenu un objet de fascination. Marc Andreessen l’a décrit comme le « moment Spoutnik de l’IA », et TechCrunch a titré sur « la première crise de panique de la Silicon Valley en 2025 ».

Aujourd'hui, Kimi K2 de Moonshot AI semble emprunter la même voie. Moonshot AI obtient ces résultats...
La fin de cet article est réservée aux abonnés. Soutenez le Club Developpez.com en prenant un abonnement pour que nous puissions continuer à vous proposer des publications.

Une erreur dans cette actualité ? Signalez-nous-la !