
Mistral AI présente Devstral, son grand modèle de langage (LLM) agentique pour les tâches d'ingénierie logicielle. Devstral est le fruit d'une collaboration entre Mistral AI et All Hands AI, et surpasse tous les modèles open-source sur SWE-Bench Verified. Le modèle d'intelligence artificielle (IA) Devstral est publié sous la licence Apache 2.0.
Le fabricant français de modèles d'IA Mistral, bien financé, s'est toujours distingué depuis le lancement de son propre modèle de fondation open source puissant à l'automne 2023 - mais il a essuyé quelques critiques parmi les développeurs sur X récemment pour sa dernière version d'un grand modèle de langage (LLM) propriétaire appelé Medium 3, que certains ont considéré comme une trahison de ses racines et de son engagement en matière d'open source.
Mais ce 21 mai, Mistral est de retour et s'engage à nouveau auprès de la communauté de l'IA open source, et du développement de logiciels alimentés par l'IA en particulier, d'une manière importante. La société s'est associée à la startup open source All Hands IA, créatrice d'Open Devin, pour lancer Devstral, un nouveau modèle de langage open source avec 24 milliards de paramètres - beaucoup plus petit que de nombreux modèles rivaux et nécessitant donc beaucoup moins de puissance de calcul, de sorte qu'il peut être exécuté sur un ordinateur portable - conçu spécialement pour le développement de l'IA agentique.
LLM agentiques pour le développement de logiciels
Si les LLM classiques sont excellents pour les tâches de codage atomique telles que l'écriture de fonctions autonomes ou la complétion de code, ils peinent actuellement à résoudre les problèmes de génie logiciel du monde réel. Le développement dans le monde réel nécessite de contextualiser le code au sein d'une vaste base de code, d'identifier les relations entre des composants disparates et d'identifier des bogues subtils dans des fonctions complexes.
Devstral est conçu pour résoudre ce problème. Devstral est entraîné à résoudre des problèmes réels sur GitHub ; il s'exécute sur des échafaudages d'agents de codage tels que OpenHands ou SWE-Agent, qui définissent l'interface entre le modèle et les cas de test. Les performances de Devstral sur le populaire benchmark SWE-Bench Verified, un ensemble de données de 500 problèmes GitHub réels dont l'exactitude a été vérifiée manuellement, sont fournies ci-dessous.
Devstral obtient un score de 46,8 % sur SWE-Bench Verified, surpassant de plus de 6 % les modèles SoTA open-source précédents. Lorsqu'il est évalué sur le même ensemble de test (OpenHands, fourni par All Hands AI), Devstral dépasse des modèles bien plus importants tels que Deepseek-V3-0324 (671B) et Qwen3 232B-A22B.
Dans le tableau ci-dessous, Devstral est également comparé à des modèles fermés et ouverts évalués sous n'importe quel ensemble de tests (y compris ceux qui sont personnalisés pour le modèle). On constate que Devstral obtient des performances nettement supérieures à celles d'un certain nombre d'alternatives à source fermée. Par exemple, Devstral surpasse le récent GPT-4.1-mini de plus de 20 %.
Polyvalence : déploiement local <-> utilisation en entreprise <-> copilotes
Devstral est suffisamment léger pour fonctionner sur une simple RTX 4090 ou un Mac avec 32 Go de RAM, ce qui en fait un choix idéal pour un déploiement local et une utilisation sur l'appareil. Des plateformes de codage telles que OpenHands peuvent permettre au modèle d'interagir avec les bases de code locales et de fournir une résolution rapide des problèmes.
Les performances du modèle en font également un choix approprié pour le codage agentique sur des référentiels sensibles à la confidentialité dans les entreprises, en particulier celles qui sont soumises à des exigences strictes en matière de sécurité et de conformité.
Enfin, si un utilisateur construit ou utilise un EDI, un plugin ou un environnement de codage agentique, Devstral est un excellent choix à ajouter au sélecteur de modèle.
Disponibilité
Mistral AI publie le modèle Devstral gratuitement sous une licence Apache 2.0 pour que la communauté puisse le développer, le personnaliser et accélérer le développement de logiciels autonomes.
Le modèle est également disponible sur l'API de Mistral AI sous le nom devstral-small-2505 au même prix que Mistral Small 3.1 : 0,1 $/M jetons d'entrée et 0,3 $/M jetons de sortie.
Si l'utilisateur choisit l'auto-déploiement, il peut télécharger le modèle sur HuggingFace, Ollama, Kaggle, Unsloth, LM Studio dès aujourd'hui.
Pour les déploiements d'entreprise qui nécessitent un réglage fin sur des bases de code privées, ou une personnalisation plus fidèle telle que le pré-entraînement continu ou la distillation des capacités de Devstral dans d'autres modèles, il est recommandé de contacter l'équipe d'IA appliquée de Mistral AI.
Mistral AI indique que Devstral est un aperçu de la recherche et que l'entreprise travaille d'arrache-pied à la construction d'un modèle de codage agentique plus large qui sera disponible dans les semaines à venir.
Et vous ?


Voir aussi :



Vous avez lu gratuitement 846 articles depuis plus d'un an.
Soutenez le club developpez.com en souscrivant un abonnement pour que nous puissions continuer à vous proposer des publications.
Soutenez le club developpez.com en souscrivant un abonnement pour que nous puissions continuer à vous proposer des publications.