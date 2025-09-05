Dans larène dominée par les modèles américains et chinois
La Suisse vient de lever le voile sur Apertus, son premier modèle de langage multilingue entièrement open source. Ce dernier rejoint la famille de modèles dIA du Français Mistral dans une arène marquée par la domination américaine et chinoise de l'IA. Apertus se veut être une alternative axée sur la confidentialité et conçue pour la transparence et le respect de la réglementation européenne en la matière. Cest un tournant clé dans la course mondiale à lintelligence artificielle étant donné que la Suisse rejoint le mouvement des pays qui uvrent pour assurer leur souveraineté en matière dinfrastructure IA.
Comment Apertus se positionne-t-il par rapport à lexistant ?
Apertus et les modèles de la famille Mistral sont tous des grands modèles de langage open source, mais ils divergent considérablement dans leurs approches techniques, réglementaires et linguistiques. Apertus se distingue principalement par son ouverture complète, sa documentation transparente et sa forte concentration sur la confidentialité et la réglementation, tandis que ceux de Mistral sont connus connu pour leurs options de déploiement modulaires et leur conception axée sur les performances pour les contextes d'entreprise.
Apertus offre une transparence totale : le processus de formation, les pondérations du modèle, l'architecture, les sources de données et les points de contrôle intermédiaires sont tous publics, permettant une reproductibilité complète et des audits indépendants de la conformité et de la qualité du modèle.
Mistral fournit des pondérations de modèles et une documentation ouvertes, mais ne publie généralement pas tous les détails concernant le corpus de formation, la gestion des droits d'auteur ou la reproductibilité étape par étape ; Mistral se concentre sur la flexibilité des développeurs et les ensembles d'outils modulaires, et non sur une transparence réglementaire approfondie.
Apertus a été conçu pour respecter la législation suisse sur la protection des données et la loi européenne sur l'IA, avec curation des données avec suppression des données personnelles et mécanismes de désinscription. Il s'agit du premier LLM à publier des résumés conformes des données de formation et de la politique de droits d'auteur, conformément aux nouvelles règles de l'UE. Spécifiquement filtré avant la formation, il respecte les obligations réglementaires et de confidentialité, réduisant ainsi les risques en n'incluant jamais de données problématiques.
Mistral pour sa part fournit des canaux de déploiement ouverts (locaux, cloud, API) pour les industries à forte exigence de conformité, mais son approche de la confidentialité et du droit d'auteur est moins explicite ; il ne publie pas le même niveau de données ou de documentation réglementaire qu'Apertus et se concentre davantage sur l'utilité technique et les contrôles d'entreprise à faible latence.
Apertus est entraîné sur 15 000 milliards de jetons dans plus de 1000 langues, dont 40 % des données sont dédiées à des langues autres que l'anglais, y compris des langues sous-représentées comme le suisse allemand et le romanche, démontrant ainsi une approche linguistique unique, tant au niveau mondial qu'européen.
Mistral prend en charge les tâches multilingues de manière compétitive, avec d'excellentes performances dans les langues européennes et mondiales grâce à ses modèles polyvalents et spécifiques à chaque secteur. Cependant, la composition détaillée de ses données linguistiques n'est pas aussi ouverte ; l'accent est mis sur les cas d'utilisation pratiques plutôt que sur la préservation linguistique.
Apertus est comparable au modèle Llama 3 2024 de Meta, daprès des rapports. Le modèle a été conçu pour respecter les lois de l'Union européenne sur le droit d'auteur et le code de bonnes pratiques volontaire en matière d'intelligence artificielle, que certaines entreprises d'IA basées aux USA ont déclaré avoir signé à contrecur, affirmant que ces réglementations freineraient l'innovation et le déploiement de l'IA. Selon les développeurs, les données d'entraînement d'Apertus ont été restreintes aux sources publiques, tout en respectant les demandes de désactivation des robots d'exploration de l'IA sur certains sites web.
Apertus croule sous les railleries des utilisateurs comme Bing (animé par ChatGPT) à ses débuts
Lancé mardi matin, leur modèle de langage souverain Apertus a rapidement été testé par des internautes curieux de connaître ses capacités. Et le moins que lon puisse dire, cest que certains sont déçus, voire consternés par ce quils ont sous les yeux. Le chatbot créé sur la base dApertus offre des résultats de qualité parfois discutable et commet de nombreuses erreurs.
« Désolé ce LLM est une honte nous avons besoin dun peu plus de rigueur surtout de la part de notre EPF Ce LLM est le pire jamais testé lors de son lancement les hallucinations sont fréquentes et sa dernière mise à jour date de mars 2024 et surtout pour la transparence il ne donne aucune indication sur son raisonnement De telles choses ne sont plus possibles aujourdhui », écrit ainsi Xavier Comtesse, président du groupe de réflexion Manufacture Thinking.
Cest le même tableau auquel lon a eu droit suite à lannonce de la disponibilité de nouvelles moutures de Bing et de Microsoft Edge animées par une mise à jour de ChatGPT. Les premiers retours dexpérience navaient pas été à la hauteur des attentes : Bing avait affiché 2,5 milliards de personnes en réponse à la question de savoir quelle est la population sur la planète Mars.
Selon une étude, les modèles d'intelligence artificielle vont toujours halluciner et il va falloir s'en accommoder surtout quun autre rapport fait état de ce que cette propension de lintelligence artificielle à produire du contenu erroné va aller croissant avec sa sophistication. Le phénomène dhallucination réduit ainsi considérablement la valeur de lintelligence artificielle générative en tant que technologie.
