IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)

Vous êtes nouveau sur Developpez.com ? Créez votre compte ou connectez-vous afin de pouvoir participer !

Vous devez avoir un compte Developpez.com et être connecté pour pouvoir participer aux discussions.

Vous n'avez pas encore de compte Developpez.com ? Créez-en un en quelques instants, c'est entièrement gratuit !

Si vous disposez déjà d'un compte et qu'il est bien activé, connectez-vous à l'aide du formulaire ci-dessous.

Identifiez-vous
Identifiant
Mot de passe
Mot de passe oublié ?
Créer un compte

L'inscription est gratuite et ne vous prendra que quelques instants !

Je m'inscris !

La startup française d'intelligence artificielle (IA) Mistral AI a dévoilé Mistral Small 3.1, son nouveau modèle léger open source
Qui battrait Gemma 3, Claude et GPT-4o

Le , par Jade Emy

8PARTAGES

7  0 
La startup française d'intelligence artificielle (IA) Mistral AI a dévoilé Mistral Small 3.1, son nouveau modèle léger open source qui battrait Gemma 3, Claude et GPT-4o

La startup française d'intelligence artificielle Mistral AI a dévoilé un nouveau modèle open-source qui, selon la société, surpasse les offres similaires de Google et d'OpenAI, ouvrant ainsi la voie à une concurrence accrue sur un marché dominé par les géants américains de la technologie. Le modèle, appelé Mistral Small 3.1, traite à la fois le texte et les images avec seulement 24 milliards de paramètres, soit une fraction de la taille des principaux modèles propriétaires, tout en égalant ou en dépassant leurs performances, selon l'entreprise.

Fin janvier 2025, Mistral AI a dévoilé Mistral Small 3, son nouveau modèle d'IA à 24 milliards de paramètres, développé dans un souci de haute performance et de faible latence. Pour rappel, Mistral AI est une entreprise française fondée en avril 2023, spécialisée dans l'intelligence artificielle générative. Elle développe des grands modèles de langages open source et propriétaires. Mistral AI est considérée comme l'un des leaders européens de l'intelligence artificielle (IA).

Avec une structure optimisée, Mistral Small 3 se positionne comme une alternative ouverte et transparente aux modèles propriétaires, offrant des résultats comparables à des modèles beaucoup plus grands tels que Llama 3.3 70B et Qwen 32B. Caractérisé par une efficacité de calcul, Small 3 serait un choix idéal pour 80 % des applications génératives basées sur l'IA, garantissant des temps de réponse rapides sans compromettre la précision.

Récemment, Mistral AI a lancé un nouveau modèle léger appelé Mistral Small 3.1. Small 3.1 est open-source et capable de traiter du texte et des images avec seulement 24 milliards de paramètres. C'est une fraction de la taille des modèles les plus avancés sur le marché. Par rapport à son prédécesseur Small 3, Small 3.1 offre "des performances textuelles améliorées, une compréhension multimodale et un nombre de jetons étendu (128 000)".

En outre, il peut traiter des données à une vitesse de 150 jetons par seconde. Cette "impressionnante réussite technique" serait due à la stratégie alternative employée par Mistral. L'accent est mis sur les améliorations algorithmiques et l'optimisation de la formation, plutôt que sur le déploiement de toujours plus de GPU pour les nouveaux modèles.

Le fait que Mistral rende ses modèles open-source prouve une fois de plus que l'entreprise souhaite rendre l'IA accessible et n'opte pas pour des modèles fermés comme ceux d'OpenAI. Dans le même temps, elle bénéficie des opportunités de recherche et de développement de la communauté de l'IA au sens large. Cette approche porte ses fruits, puisqu'avec une valeur proche des 6 milliards d'euros, elle peut se targuer d'être la plus importante entreprise d'IA en Europe.


Voici un extrait de l'annonce de Mistral AI :

Nous annonçons aujourd'hui Mistral Small 3.1 : le meilleur modèle dans sa catégorie de poids.

S'appuyant sur Mistral Small 3, ce nouveau modèle est doté de performances textuelles améliorées, d'une compréhension multimodale et d'une fenêtre contextuelle élargie pouvant contenir jusqu'à 128k tokens. Le modèle surpasse des modèles comparables tels que Gemma 3 et GPT-4o Mini, tout en offrant des vitesses d'inférence de 150 tokens par seconde.

Mistral Small 3.1 est publié sous licence Apache 2.0.

Les applications modernes d'intelligence artificielle exigent un mélange de capacités de traitement de texte, de compréhension d'entrées multimodales, de prise en charge de plusieurs langues et de gestion de contextes longs, avec une faible latence et un bon rapport coût-efficacité. Comme le montre le tableau ci-dessous, Mistral Small 3.1 est le premier modèle open source qui non seulement atteint, mais surpasse les performances des principaux petits modèles propriétaires dans tous ces domaines.


Présentation de Mistral Small 3.1

Mistral Small 3.1 est un modèle polyvalent conçu pour gérer un large éventail de tâches d'IA générative, notamment le suivi d'instructions, l'assistance à la conversation, la compréhension d'images et l'appel de fonctions. Il constitue une base solide pour les applications d'IA d'entreprise et grand public.

Mistral Small 3.1 peut être utilisé dans diverses applications d'entreprise et grand public qui nécessitent une compréhension multimodale, telles que la vérification de documents, les diagnostics, le traitement d'images sur appareil, l'inspection visuelle pour les contrôles de qualité, la détection d'objets dans les systèmes de sécurité, l'assistance clientèle basée sur l'image et l'assistance générale.

Voici les principales caractéristiques et capacités du modèle, selon Mistral AI :

  • Léger : Mistral Small 3.1 pourrait fonctionner avec une seule RTX 4090 ou un Mac avec 32 Go de RAM. Cela en fait un outil idéal pour les cas d'utilisation sur l'appareil.
  • Assistance conversationnelle à réponse rapide : Idéale pour les assistants virtuels et autres applications où des réponses rapides et précises sont essentielles.
  • Appel de fonction à faible latence : Capable d'exécuter rapidement des fonctions dans le cadre de flux de travail automatisés ou agentiques
  • Ajustement précis pour les domaines spécialisés : Mistral Small 3.1 peut être affiné pour se spécialiser dans des domaines spécifiques, créant ainsi des experts en la matière. Ceci est particulièrement utile dans des domaines tels que les conseils juridiques, les diagnostics médicaux et l'assistance technique.
  • Une base pour le raisonnement avancé : Nous continuons à être impressionnés par la façon dont la communauté construit sur les modèles ouverts de Mistral. Au cours des dernières semaines, nous avons vu plusieurs excellents modèles de raisonnement construits sur Mistral Small 3, tels que DeepHermes 24B de Nous Research. À cette fin, nous publions des points de contrôle de base et d'instruction pour Mistral Small 3.1 afin de permettre une personnalisation plus poussée du modèle en aval.


Concernant les performances du modèle, voici les résultats publiés par Mistral AI :

  • Benchmarks d'instruction de texte

  • Multilingue

  • Contexte long


Disponibilité

Mistral Small 3.1 est disponible au téléchargement sur le site web de huggingface Mistral Small 3.1 Base et Mistral Small 3.1 Instruct. Il est également possible d'essayer le modèle via l'API ans le playground des développeurs de Mistral AI, La Plateforme. Le modèle est également disponible sur Google Cloud Vertex AI. Mistral Small 3.1 sera également disponible sur NVIDIA NIM dans les semaines à venir.

Source : Mistral AI

Et vous ?

Pensez-vous que ce nouveau modèle est crédible ou pertinent ?
Quel est votre avis sur le sujet ?

Voir aussi :

La société française Mistral AI lance son API OCR pour la reconnaissance optique de caractères, qui permet d'extraire avec précision des textes structurés et des médias et surpasserait la concurrence

Google lance Gemma 3 : "le modèle d'IA le plus puissant que vous pouvez faire tourner sur un GPU", une IA open source avec un contexte de 128K optimisée pour fonctionner sur presque tout, du GPU au smartphone

OpenAI change de cap et annule le lancement de son modèle d'IA o3 au profit d'une version « unifiée » baptisée GPT-5, Sam Altman évoque un souci de simplification mais certains y voient un problème de coûts
Vous avez lu gratuitement 0 articles depuis plus d'un an.
Soutenez le club developpez.com en souscrivant un abonnement pour que nous puissions continuer à vous proposer des publications.

Une erreur dans cette actualité ? Signalez-nous-la !

Avatar de gabi7756
Membre confirmé https://www.developpez.com
Le 19/03/2025 à 16:45
https://www.hibyrd.fr/actualites/que...t-limites.html
On parlera d'IA quand un raisonnement sera réellement fait ... Et pas un ensemble de génération hasardeuse basé sur de la probabilité et des hallucinations.
2  0 
Avatar de _informix_
Membre actif https://www.developpez.com
Le 19/03/2025 à 14:24
non mistral, tu nous surprend là

"
Le nombre 9.10 est plus grand que 9.9. En mathématiques, lorsque vous comparez des nombres décimaux, vous comparez d'abord les parties entières, puis les chiffres après la virgule, de gauche à droite. Ainsi, 9.10 est plus grand que 9.9 parce que le chiffre après la virgule dans 9.10 est 1, qui est plus grand que le chiffre 9 dans 9.9.
"

https://www.dropbox.com/scl/fi/ub0lv...rdam9gch9&dl=0

"Les nombres 9.9 et 9.010 sont en fait égaux. En mathématiques, les zéros à la fin d'un nombre décimal n'affectent pas sa valeur. Ainsi, 9.010 est équivalent à 9.01, qui est inférieur à 9.9. Donc, 9.9 est plus grand que 9.010."

https://www.dropbox.com/scl/fi/p66ga...3xt3d529b&dl=0
1  0 
Avatar de der§en
Membre expérimenté https://www.developpez.com
Le 19/03/2025 à 17:21
De mémoire, en primaire, on nous disais que 9.9 est égale à 9.90 et même 9.900000000000, tout les zéros à droite non aucune signification !
1  0 
Avatar de jnspunk
Membre habitué https://www.developpez.com
Le 20/03/2025 à 5:05
Citation Envoyé par _informix_ Voir le message
non mistral, tu nous surprend là

"
Le nombre 9.10 est plus grand que 9.9. En mathématiques, lorsque vous comparez des nombres décimaux, vous comparez d'abord les parties entières, puis les chiffres après la virgule, de gauche à droite. Ainsi, 9.10 est plus grand que 9.9 parce que le chiffre après la virgule dans 9.10 est 1, qui est plus grand que le chiffre 9 dans 9.9.
"

https://www.dropbox.com/scl/fi/ub0lv...rdam9gch9&dl=0

"Les nombres 9.9 et 9.010 sont en fait égaux. En mathématiques, les zéros à la fin d'un nombre décimal n'affectent pas sa valeur. Ainsi, 9.010 est équivalent à 9.01, qui est inférieur à 9.9. Donc, 9.9 est plus grand que 9.010."

https://www.dropbox.com/scl/fi/p66ga...3xt3d529b&dl=0

Pour utiliser efficacement un outil, on doit d'abord apprendre à s'en servir.
Pour obtenir une bonne réponse d'un modèle de langage, on doit d'abord écrire une bonne question et là, votre question, bien qu'elle paraisse claire pour un humain, ne l'est pas du tout pour le modèle de langage.
Une astuce, bien que ça ne corrige pas le problème initial, qui est que la question est mauvaise, est d'ajouter "prouve-le" à la fin, comme on peut le voir sur la capture d'écran que j'ai mise.
1  0 
Avatar de jnspunk
Membre habitué https://www.developpez.com
Le 21/03/2025 à 6:39
Citation Envoyé par pyros Voir le message
Ah, c'est pas un bug, c'est une feature donc ?
Non c'est un problème entre la chaise et le clavier, comme il arrive parfois.
Dans une voiture, si vous mettez la marche arrière puis que vous vous étonnez de ne pas avancer, ce n'est pas un problème venant de la voiture si vous voyez ce que je veux dire.
C'est vrai que ce message peut sembler insultant, mais en réalité, la faute ne vous revient pas vraiment. Car l'ensemble de la presse a tendance à parler d'intelligence artificielle alors que ce n'en est pas du tout une, et induit ainsi en erreur les gens qui ont peu de connaissances sur le sujet.
1  0 
Avatar de pyros
Membre expérimenté https://www.developpez.com
Le 20/03/2025 à 9:55
Pour utiliser efficacement un outil, on doit d'abord apprendre à s'en servir.
Pour obtenir une bonne réponse d'un modèle de langage, on doit d'abord écrire une bonne question et là, votre question, bien qu'elle paraisse claire pour un humain, ne l'est pas du tout pour le modèle de langage.
Une astuce, bien que ça ne corrige pas le problème initial, qui est que la question est mauvaise, est d'ajouter "prouve-le" à la fin, comme on peut le voir sur la capture d'écran que j'ai mise.
Ah, c'est pas un bug, c'est une feature donc ?
0  0 
Avatar de calvaire
Expert éminent https://www.developpez.com
Le 20/03/2025 à 18:21
pour les commentaires du dessus.

Es ce que vous utilisez chatgpt pour calculer l'itinéraire sur le gps ? heureusement que non, il existe mieux comme ia pour ca.
l'ia c'est d'ailleurs des milliers de process et algorithmes (et variantes) qui existe, les llm ne sont d'ailleurs qu'un type particulier d'ia, qui n'est pas performant ou optimisé pour pleins de cas.

On le sait tous que ces outils sont mauvais en mathématique, mais par contre il y'a énormément de use case ou ces outils sont formidable a utiliser au quotidien.
0  0 
Avatar de pyros
Membre expérimenté https://www.developpez.com
Le 21/03/2025 à 10:08
Citation Envoyé par jnspunk Voir le message
Non c'est un problème entre la chaise et le clavier, comme il arrive parfois.
Dans une voiture, si vous mettez la marche arrière puis que vous vous étonnez de ne pas avancer, ce n'est pas un problème venant de la voiture si vous voyez ce que je veux dire.
C'est vrai que ce message peut sembler insultant, mais en réalité, la faute ne vous revient pas vraiment. Car l'ensemble de la presse a tendance à parler d'intelligence artificielle alors que ce n'en est pas du tout une, et induit ainsi en erreur les gens qui ont peu de connaissances sur le sujet.
C'était du 2nd degré, mais ça souligne le décalage ancestrale entre les développeurs et les utilisateurs.

Un programme fait toujours ce pour quoi il a été programmé (mise à part cas limite des rayon cosmique qui viennent changer les bit de mémoire, les "out of ressource" et autres problèmes materiel). A partir de là, Il y a 2 types de bug:
  • Le programme ne fait pas ce que le développeur pensait avoir programmé.
  • Le programme ne fait pas ce que à quoi l'utilisateur s'attend.


Et le problème, c'est que ces 2 types de bug ne sont pas forcément équivalent. Un comportement buggé du point de vue développeur peut être perçu comme normal par l'utilisateur, et un comportement normal du programme peut être vue comme annormal du point de vue utilisateur. Et il ne faut pas oublier que l'on développe des programmes avant tout pour les utilisateurs, pas pour les développeurs.
0  0