Mistral AI est une entreprise française qui vend des produits d'intelligence artificielle (IA). Pour concurrencer des acteurs majeurs comme OpenAI et Anthropic, Mistral AI a levé 640 millions de dollars lors d'un tour de table de série B mené par General Catalyst propulsant sa valorisation à plus 6 milliards de dollars. Récement, Mistral AI a lancé son nouveau modèle multimodal puissant, Pixtral Large, intégré à son assistant de travail, "le Chat", offrant des capacités améliorées telles que la recherche web, le traitement de documents et la génération d'images.
Les principales mises à jour comprennent l'outil de collaboration "Canvas" pour la création de documents et de présentations, une analyse plus rapide et plus précise des documents, et "le Chat Agents" pour automatiser les flux de travail répétitifs tels que le traitement des factures et le résumé des réunions. Les mises à jour sont disponibles gratuitement en version bêta. Pixtral Large dispose d'une fenêtre contextuelle de 128 000 et prend en charge l'analyse de PDF et d'images complexes en conjonction avec un modèle d'IA expérimental.
Mistral AI met à jour le Chat pour offrir un concurrent gratuit à ChatGPTWe're proud to introduce the next generation of le Chat. Search, PDF upload, coding, image generation, le Canevas... All in one place: https://t.co/0P2NfFqULn https://t.co/qYTHs6vXX9
— Mistral AI (@MistralAI) November 18, 2024
Mistral AI vient d'annoncer le plus grand nombre de changements apportés à son assistant de travail d'IA générative "le Chat", tout en détaillant le tout nouveau modèle Pixtral Large. La startup parisienne spécialisée dans l'IA vient d'étoffer son offre, avec l'introduction du nouveau Pixtral Large. Ce modèle multimodal est dit "significativement plus puissant" que la version précédente et il a été intégré dans le Chat.
Il s'agit d'un modèle à poids ouvert de 124 000 milliards de jetons construit sur Mistral Large 2, ce qui en fait le deuxième modèle de la famille multimodale. Il dispose d'une fenêtre contextuelle de 128 000, qui permet d'intégrer un minimum de 30 images haute résolution. L'équipe n'a pas seulement travaillé sur le nouveau modèle, mais aussi sur de nouvelles fonctions pour l'assistant de travail qui seront disponibles en version bêta.
Il s'agit notamment de la possibilité de faire des recherches sur le web, l'outil ayant désormais des connaissances en matière de formation à la recherche sur internet, ce qui vise à aider les utilisateurs lorsqu'il s'agit d'apprendre, de faire des recherches et de travailler sur le web. Une autre amélioration est Canvas, une nouvelle interface qui apparaîtra dans la fenêtre le Chat lorsque les gens "ont besoin d'aller au-delà des conversations et de passer à l'idéation". Il s'agit d'un outil de collaboration où les équipes peuvent créer des documents, des présentations, du code, des maquettes, etc.
Le Chat est également décrit comme ayant désormais une compréhension plus rapide et plus précise des documents, car il peut "traiter des documents PDF et des images complexes et de grande taille, à des fins d'analyse et de synthèse". Ceci est dû à Pixtral Large qui travaille en conjonction avec un modèle expérimental qui, selon l'entreprise, sera expliqué dans quelques semaines.
Grâce à la capacité de compréhension des documents, les utilisateurs peuvent : "Il suffit d'attacher des documents à votre barre de chat pour obtenir des informations sur n'importe quoi : graphiques, tableaux, diagrammes, texte, formules, équations... en fait, sur l'intégralité du document." La startup s'est également associée à Black Forest Labs pour apporter ses modèles de génération d'images à le Chat, qui peut désormais être complété par l'assistant IA.
Enfin, le dernier changement inclut les agents le Chat pour automatiser les flux de travail répétitifs. "Si vous vous retrouvez à réutiliser des invites, ou si vous avez identifié certains modèles de travail créatif que vous préférez automatiser, vous pouvez codifier ces flux de travail sous forme d'agents. Parmi les cas d'utilisation les plus courants, on peut citer la numérisation des reçus pour les notes de frais, la création de résumés de longs comptes rendus de réunions et le traitement des factures."
Voici la présentation des mises à jour apportées à "Le Chat" :
Envoyé par Mistral AI
Pour faciliter les cas d'utilisation centrés dans la recheche sur Internet, Mistral AI a complété les connaissances de formation de le Chat. Avec des modèles de langage qui ont accès aux connaissances et aux événements les plus récents, le Chat est un outil puissant pour améliorer l'apprentissage, la recherche et le travail.
Canvas
Canvas est une nouvelle interface qui apparaît dans la fenêtre de chat lorsque vous avez besoin d'aller au-delà des conversations et de passer à l'idéation. Elle permet de collaborer avec les LLM de Mistral sur des résultats partagés, permettant la création et l'idéation pour le travail de connaissance. Canvas ne se limite plus aux conversations bidirectionnelles, il vous permet de modifier, d'éditer ou de transformer directement le contenu en vous appuyant sur les puissantes capacités de raisonnement des LLM.
Vous pouvez utiliser Canvas pour créer des documents, des présentations, du code, des maquettes, etc. Vous pouvez modifier son contenu en place sans régénérer les réponses, versionner vos brouillons et prévisualiser vos conceptions.
Compréhension rapide et précise des documents
Le Chat est désormais capable de traiter des documents PDF et des images complexes et volumineux, à des fins d'analyse et de synthèse. Il suffit de joindre des documents à votre barre de chat pour obtenir des informations sur n'importe quel élément : graphiques, tableaux, diagrammes, texte, formules, équations... en fait, l'intégralité du document.
Ces fonctionnalités avancées sont rendues possibles par le nouveau Pixtral Large, un modèle multimodal de pointe qui est plus puissant que le précédent modèle de vision, Pixtral 12B, en conjonction avec un modèle expérimental.
Génération d'images
Mistral AI annonce collaborer avec Black Forest Labs pour apporter leurs modèles de génération d'images à Le Chat. Vous pouvez désormais générer des images directement depuis le Chat.
Agents Le Chat pour automatiser les flux de travail répétitifs
Si vous vous retrouvez à réutiliser des invites, ou si vous avez identifié certains modèles de travail créatif que vous préférez automatiser, vous pouvez codifier ces flux de travail sous forme d'agents. Les agents peuvent être publiés et partagés avec vos collègues.
Pixtral Large : un modèle multimodal de pointe
Mistral AI a également annoncé Pixtral Large, un modèle multimodal à poids ouvert de 124 000 milliards de paramètres construit sur la base de Mistral Large 2. Pixtral Large est le deuxième modèle de la famille multimodale et est doté d'une compréhension des images. Le modèle serait donc capable de comprendre des documents, des graphiques et des images naturelles, tout en conservant la meilleure compréhension textuelle de Mistral Large 2.
Concernant les performances du modèle : sur MathVista, qui évalue le raisonnement mathématique complexe sur des données visuelles, Pixtral Large atteint 69,4 %. Pour évaluer les capacités de raisonnement sur des graphiques et des documents complexes, Mistral AI a utilisé les benchmarks ChartQA et DocVQA, où Pixtral Large a surpassé GPT-4o et Gemini-1.5 Pro. Enfin, Pixtral Large démontre des capacités compétitives sur MM-MT-Bench, surpassant Claude-3.5 Sonnet, Gemini-1.5 Pro et GPT-4o. MM-MT-Bench est une évaluation ouverte, basée sur des juges, destinée à refléter les cas d'utilisation réels des LLM multimodaux.
Mistral AI conclut en partageant la disponibilité de ces mises à jour :
Actuellement, toutes ces fonctionnalités sont introduites en tant qu'offres bêta gratuites. Chez Mistral AI, notre approche de l'IA est différente - nous ne poursuivons pas l'AGI à tout prix ; notre mission est plutôt de placer l'IA de pointe entre vos mains, afin que vous puissiez décider de ce que vous voulez faire avec les capacités avancées de l'IA. Cette approche nous a permis de gérer notre capital avec parcimonie, tout en proposant des capacités d'avant-garde à des prix abordables. Sur le Chat, nous proposons un niveau gratuit généreux avec ces fonctionnalités bêta et nous travaillons sur des niveaux premium avec des garanties de service plus élevées.
Toutes les nouvelles fonctionnalités seront déployées progressivement au cours des prochaines semaines - n'oubliez pas de nous faire part de vos commentaires !
Toutes les nouvelles fonctionnalités seront déployées progressivement au cours des prochaines semaines - n'oubliez pas de nous faire part de vos commentaires !
Et vous ?
Pensez-vous que ces mises à jour sont crédibles ou pertinentes ?
Quel est votre avis sur le sujet ?
Voir aussi :
Les agents de Mistral AI, des systèmes autonomes alimentés par des LLM, peuvent planifier, utiliser des outils, effectuer des étapes de traitement pour atteindre des objectifs spécifiques
L'avance d'OpenAI sur les autres entreprises d'IA a largement disparu après la sortie de Claude d'Anthropic, Gemini de Google, Grok de X, ainsi que Llama de Meta, selon un rapport sur l'état de l'IA
Le laboratoire d'IA privé français PleIAs annonce un ensemble de données multilingues entièrement ouvert pour la formation de LLM, contenant plus de 2 000 milliards de jetons de contenu sous licence autorisée
Flux, une nouvelle IA générative texte-image open-source avec 12 milliards de paramètres, bat Midjourney, Stable Diffusion 3 et Auraflow, par Black Forest Labs, l'équipe de l'original Stable Diffusion