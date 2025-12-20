Mistral AI lance Mistral OCR 3 offre une avancée majeure en matière de précision et d'efficacité pour l'extraction de texte et d'images









Mistral AI est une entreprise française fondée en avril 2023, spécialisée dans l'intelligence artificielle générative. Elle développe de grands modèles de langages de logiciel libre et propriétaires. Durant sa première année d'existence, elle réalise trois levées de fonds successives, d'un montant total de plus d'un milliard d'euros. Sa dernière levée en septembre 2025 la valorise à plus de onze milliards d'euros. Mistral est considérée comme l'un des leaders européens de l'intelligence artificielle.Récemment, Mistral a lancé OCR 3, établissant une nouvelle norme en matière de précision et d'efficacité dans le traitement des documents. Le modèle mis à jour extrait à la fois le texte et les images intégrées d'un large éventail de documents avec une grande fidélité. Il introduit la sortie Markdown, ainsi que la reconstruction de tableaux au format HTML, permettant aux systèmes en aval de préserver la structure et le contenu des documents.Mistral OCR 3 surpasse son prédécesseur, avec un taux de réussite de 74 % supérieur à celui de Mistral OCR 2 dans des domaines difficiles tels que les formulaires, les documents numérisés, les tableaux complexes et l'écriture manuscrite. Le modèle améliore considérablement l'interprétation des annotations cursives et mixtes, des entrées manuscrites superposées sur des formulaires imprimés, ainsi que la détection des cases, des étiquettes et des mises en page denses. Sa robustesse a également été renforcée, offrant une plus grande résistance aux artefacts de compression, à l'inclinaison, à la distorsion des documents, à la faible densité de points par pouce et au bruit de fond. Mistral OCR 3 permet une reconstruction avancée des tableaux. Il prend désormais en charge la reconnaissance des en-têtes, des cellules fusionnées, des blocs à plusieurs lignes et des hiérarchies basées sur des colonnes.Le modèle d'IA mis à jour est accessible via l'intégration d'une API ou l'interface utilisateur Document AI mise à jour dans Mistral AI Studio, offrant une extraction instantanée sous forme de texte brut ou de JSON structuré pour les développeurs et les utilisateurs professionnels. Cette version offre des mises à niveau pour toutes les langues et tous les types de documents. Le prix commence à 2 dollars pour 1 000 pages, et descend à 1 dollar en mode batch. Mistral OCR 3 est entièrement rétrocompatible avec OCR 2.Mistral OCR 3 est conçu pour extraire du texte et des images intégrées à partir d'un large éventail de documents avec une fidélité exceptionnelle. Il prend en charge la sortie Markdown enrichie par la reconstruction de tableaux basée sur HTML, ce qui permet aux systèmes en aval de comprendre non seulement le contenu des documents, mais aussi leur structure. Modèle beaucoup plus petit que la plupart des solutions concurrentes, il est disponible à un prix leader sur le marché de 2 $ pour 1 000 pages, avec une remise de 50 % sur l'API par lots, ce qui réduit le coût à 1 $ pour 1 000 pages.Les développeurs peuvent intégrer le modèle (mistral-ocr-2512) via l'API, et les utilisateurs peuvent tirer parti de Document AI, une interface utilisateur qui analyse instantanément les documents en texte ou en JSON structuré.Pour placer la barre plus haut, ils ont introduit des benchmarks internes plus exigeants, basés sur des exemples concrets d'utilisation par nos clients. Ils ont ensuite évalué plusieurs modèles dans les domaines présentés ci-dessous, en comparant leurs résultats à la vérité terrain à l'aide d'une métrique de correspondance floue pour en vérifier la précision.Alors que la plupart des solutions OCR actuelles sont spécialisées dans des types de documents spécifiques, Mistral OCR 3 est conçu pour exceller dans le traitement de la grande majorité des types de documents utilisés dans les organisations et les situations quotidiennes.- Écriture manuscrite : Mistral OCR interprète avec précision les annotations cursives, mixtes et manuscrites superposées à des formulaires imprimés.- Formulaires : détection améliorée des cases, des étiquettes, des entrées manuscrites et des mises en page denses. Fonctionne bien sur les factures, les reçus, les formulaires de conformité, les documents gouvernementaux, etc.- Documents numérisés et complexes : nettement plus robuste face aux artefacts de compression, aux distorsions, aux faibles résolutions et aux bruits de fond.- Tableaux complexes : reconstruit les structures des tableaux avec des en-têtes, des cellules fusionnées, des blocs à plusieurs lignes et des hiérarchies de colonnes. Génère des balises HTML avec colspan/rowspan pour préserver entièrement la mise en page.Mistral OCR 3 est une mise à niveau significative par rapport à Mistral OCR 2 pour toutes les langues et tous les formats de documents.Mistral OCR 3 est idéal pour les pipelines d'entreprise à haut volume et les flux de travail de documents interactifs. Les développeurs peuvent l'utiliser pour :- Extraire du texte et des images dans Markdown pour les agents en aval et les systèmes de connaissances- Analyser automatiquement des formulaires, des factures et des documents opérationnels- Des pipelines de compréhension de documents de bout en bout- Numériser des documents manuscrits ou historiques- Toute autre application de transformation de documents en connaissances.Les premiers clients utilisent Mistral OCR 3 pour traiter des factures dans des champs structurés, numériser des archives d'entreprise, extraire du texte propre à partir de rapports techniques et scientifiques, et améliorer la recherche d'entreprise. Tim Law, directeur de recherche chez IDC pour l'IA et l'automatisation, a déclaré :