Mistral AI est une société française spécialisée dans les produits d'intelligence artificielle (IA). Fondée en avril 2023 par d'anciens employés de Meta Platforms et de Google DeepMind, l'entreprise s'est rapidement imposée dans le secteur de l'IA. L'entreprise se concentre sur la production de grands modèles de langage open source, soulignant l'importance fondatrice des logiciels libres et open-source, et se positionnant comme une alternative aux modèles propriétaires.
En juin 2024, Mistral AI a levé 640 millions de dollars dans le cadre d'un tour de table de série B mené par General Catalyst. L'investissement, composé de 503 millions de dollars de capitaux propres et de 142 millions de dollars de dettes, a propulsé la valorisation de l'entreprise à un niveau impressionnant de 6 milliards de dollars, un an seulement après sa création. Ce tour de table, mené par General Catalyst, avec des contributions de plusieurs investisseurs nouveaux et existants, représente un vote de confiance majeur dans la poursuite par Mistral d'une technologie d'IA de pointe.
Récemment, Mistral AI vient de lancer son tout premier modèle multimodal appelé Pixtral 12B, en concurrence avec des entreprises comme OpenAI et Anthropic. Ce modèle de 12 milliards de paramètres est capable de traiter à la fois des images et du texte, et utilise actuellement son modèle textuel Nemo 12B. Le modèle aurait une taille de 24 Go et devrait en théorie être capable d'effectuer des tâches telles que légender des images et compter le nombre d'objets sur une photo. Le compte officiel de Mistral sur X, anciennement twitter, a dévoilé le modèle d'IA dans un post en partageant son lien.
Performances et accessibilité de Pixtral 12BYou can download the model via the torrent link. It'll be available on le Chat and la Plateforme soon.
— Sophia Yang, Ph.D. (@sophiamyang) September 11, 2024
Pixtral 12B devrait être intégré au chatbot de l'entreprise, Le Chat, et à la plateforme API, La Platforme, selon le responsable des relations avec les développeurs de l'entreprise. Pixtral 12B est disponible au téléchargement, à l'ajustement et à l'utilisation sous une licence Apache 2.0 sans restrictions. Il peut être obtenu via un lien torrent sur GitHub et la plateforme de développement de l'IA et de l'apprentissage automatique, Hugging Face.
Un utilisateur a partagé les résultats des tests de Pixtral 12B, qui semblent montrer que le modèle de langage surpasse à la fois Claude-3 Haiku et Phi-3 Vision en termes de capacités multimodales sur le test ChartQA. Il dépasserait également les performances des modèles d'IA concurrents en matière de connaissances et de raisonnement multimodaux sur le benchmark Massive Multitask Language Understanding (MMLU).
Performances de Pixtral 12B
Comparaison des performances de Pixtral 12B avec d'autres modèles
La société soutenue par Amazon est déjà connue pour Codestral, un grand modèle de langage qui aide les développeurs à coder, ainsi que pour Mistral Large. Mistral Large est décrit comme un "modèle de génération de texte de pointe" doté de "capacités de raisonnement de premier ordre".
La plupart des modèles d'IA générative, tels que ceux de Mistral, utilisent de grandes quantités de données publiques provenant du web, qui sont souvent soumises à des droits d'auteur. Alors que certains fournisseurs de ces modèles affirment que le "fair use" leur permet de collecter n'importe quelle donnée publique, de nombreux détenteurs de droits d'auteur contestent cette pratique. En conséquence, des entreprises d'IA comme OpenAI et Midjourney ont fait l'objet de poursuites judiciaires visant à mettre un terme à cette pratique.
En décembre, la startup open-source a reçu un financement de 414 millions de dollars, clôturant la fenêtre d'investissement avec une évaluation de 2 milliards de dollars. En mai, la société basée à Paris a pu clôturer un tour de table de 645 millions de dollars mené par General Catalyst, ce qui a valorisé l'entreprise à 6 milliards de dollars.
Lien de téléchargement de Pixtral 12B est disponible ici.
Source : Mistral AI
Et vous ?
Quel est votre avis sur ce nouveau produit de Mistral AI ?
Voir aussi :
La startup française Mistral AI annonce la sortie de Large 2, son nouveau LLM phare avec 123 milliards de paramètres qui serait meilleur pour générer du code, des mathématiques et du raisonnement
Qualité vs prix : Mistral 8x7B est le modèle d'IA le plus rapide et le plus accessible en matière de coût, tandis que GPT-4 Turbo et Claude 3 Opus fournissent des réponses de meilleure qualité
GPT-4o arrive en tête du classement des modèles d'IA les plus performants de LMSYS Chatbot Arena avec un score Elo de 1 289, surpassant ainsi Gemini Pro 1.5 de Google et Claude 3 Opus d'Anthropic