La Suisse lance son propre modèle d'IA formé sur des données publiques : Apertus rejoint la famille de modèles d'IA du Français Mistral

Dans une arène dominée par les modèles américains et chinois

Le 5 septembre 2025 à 10:52, par Patrick Ruiz

118PARTAGES

La Suisse lance son propre modèle d’IA formé sur des données publiques : Apertus rejoint la famille de modèles d’IA du Français Mistral
Dans l’arène dominée par les modèles américains et chinois

La Suisse vient de lever le voile sur Apertus, son premier modèle de langage multilingue entièrement open source. Ce dernier rejoint la famille de modèles d’IA du Français Mistral dans une arène marquée par la domination américaine et chinoise de l'IA. Apertus se veut être une alternative axée sur la confidentialité et conçue pour la transparence et le respect de la réglementation européenne en la matière. C’est un tournant clé dans la course mondiale à l’intelligence artificielle étant donné que la Suisse rejoint le mouvement des pays qui œuvrent pour assurer leur souveraineté en matière d’infrastructure IA.

🚀 Avec l'ETH Zürich et le CSCS, nous avons annoncé aujourd’hui la sortie d’Apertus, le premier LLM de grande ampleur, multilingue et open source développé en 🇨🇭. Il représente une étape majeure pour la transparence et la diversité dans l’IA générative.https://t.co/yHnhsT7N8p
— EPFL (@EPFL) September 2, 2025

Comment Apertus se positionne-t-il par rapport à l’existant ?

Apertus et les modèles de la famille Mistral sont tous des grands modèles de langage open source, mais ils divergent considérablement dans leurs approches techniques, réglementaires et linguistiques. Apertus se distingue principalement par son ouverture complète, sa documentation transparente et sa forte concentration sur la confidentialité et la réglementation, tandis que ceux de Mistral sont connus connu pour leurs options de déploiement modulaires et leur conception axée sur les performances pour les contextes d'entreprise.

Apertus offre une transparence totale : le processus de formation, les pondérations du modèle, l'architecture, les sources de données et les points de contrôle intermédiaires sont tous publics, permettant une reproductibilité complète et des audits indépendants de la conformité et de la qualité du modèle.

Mistral fournit des pondérations de modèles et une documentation ouvertes, mais ne publie généralement pas tous les détails concernant le corpus de formation, la gestion des droits d'auteur ou la reproductibilité étape par étape ; Mistral se concentre sur la flexibilité des développeurs et les ensembles d'outils modulaires, et non sur une transparence réglementaire approfondie.

Apertus a été conçu pour respecter la législation suisse sur la protection des données et la loi européenne sur l'IA, avec curation des données avec suppression des données personnelles et mécanismes de désinscription. Il s'agit du premier LLM à publier des résumés conformes des données de formation et de la politique de droits d'auteur, conformément aux nouvelles règles de l'UE. Spécifiquement filtré avant la formation, il respecte les obligations réglementaires et de confidentialité, réduisant ainsi les risques en n'incluant jamais de données problématiques.

Mistral pour sa part fournit des canaux de déploiement ouverts (locaux, cloud, API) pour les industries à forte exigence de conformité, mais son approche de la confidentialité et du droit d'auteur est moins explicite ; il ne publie pas le même niveau de données ou de documentation réglementaire qu'Apertus et se concentre davantage sur l'utilité technique et les contrôles d'entreprise à faible latence.

Apertus est entraîné sur 15 000 milliards de jetons dans plus de 1000 langues, dont 40 % des données sont dédiées à des langues autres que l'anglais, y compris des langues sous-représentées comme le suisse allemand et le romanche, démontrant ainsi une approche linguistique unique, tant au niveau mondial qu'européen.

Mistral prend en charge les tâches multilingues de manière compétitive, avec d'excellentes performances dans les langues européennes et mondiales grâce à ses modèles polyvalents et spécifiques à chaque secteur. Cependant, la composition détaillée de ses données linguistiques n'est pas aussi ouverte ; l'accent est mis sur les cas d'utilisation pratiques plutôt que sur la préservation linguistique.

Apertus est comparable au modèle Llama 3 2024 de Meta, d’après des rapports. Le modèle a été conçu pour respecter les lois de l'Union européenne sur le droit d'auteur et le code de bonnes pratiques volontaire en matière d'intelligence artificielle, que certaines entreprises d'IA basées aux USA ont déclaré avoir signé à contrecœur, affirmant que ces réglementations freineraient l'innovation et le déploiement de l'IA. Selon les développeurs, les données d'entraînement d'Apertus ont été restreintes aux sources publiques, tout en respectant les demandes de désactivation des robots d'exploration de l'IA sur certains sites web.

Apertus croule sous les railleries des utilisateurs comme Bing (animé par ChatGPT) à ses débuts

Lancé mardi matin, leur modèle de langage souverain Apertus a rapidement été testé par des internautes curieux de connaître ses capacités. Et le moins que l’on puisse dire, c’est que certains sont déçus, voire consternés par ce qu’ils ont sous les yeux. Le chatbot créé sur la base d’Apertus offre des résultats de qualité parfois discutable et commet de nombreuses erreurs.

« Désolé ce LLM est une honte… nous avons besoin d’un peu plus de rigueur surtout de la part de notre EPF… Ce LLM est le pire jamais testé lors de son lancement… les hallucinations sont fréquentes et sa dernière mise à jour date de mars 2024 et surtout pour la transparence il ne donne aucune indication sur son raisonnement… De telles choses ne sont plus possibles aujourd’hui », écrit ainsi Xavier Comtesse, président du groupe de réflexion Manufacture Thinking.

C’est le même tableau auquel l’on a eu droit suite à l’annonce de la disponibilité de nouvelles moutures de Bing et de Microsoft Edge animées par une mise à jour de ChatGPT. Les premiers retours d’expérience n’avaient pas été à la hauteur des attentes : Bing avait affiché 2,5 milliards de personnes en réponse à la question de savoir quelle est la population sur la planète Mars.

Selon une étude, les modèles d'intelligence artificielle vont toujours halluciner et il va falloir s'en accommoder surtout qu’un autre rapport fait état de ce que cette propension de l’intelligence artificielle à produire du contenu erroné va aller croissant avec sa sophistication. Le phénomène d’hallucination réduit ainsi considérablement la valeur de l’intelligence artificielle générative en tant que technologie.

Sources : Apertus, Linkedin

Et vous ?

Quelle appréciation faites-vous de la disponibilité de ce modèle d’intelligence artificielle dénommé Apertus ?

Quel crédit accordez-vous à la filière intelligence artificielle compte tenu du phénomène des hallucinations ? Partagez-vous les avis selon lesquels l’IA c’est de la poudre de Perlimpinpin ?

Voir aussi :

OpenAI est perplexe parce que ses nouveaux modèles o3 et o4-mini affichent des taux d'hallucination nettement plus élevés que les modèles précédents, ce qui réduit la précision et la fiabilité de ces modèles

Les outils d'IA de codage inventent des noms de paquets inexistants qui menacent la chaîne d'approvisionnement en logiciels : les attaquants publient des paquets malveillants avec ces noms sur npm ou PyPI

Les LLM IA auront toujours des hallucinations, et nous devons nous en accommoder, car les hallucinations découlent de la structure mathématique et logique fondamentale des LLM, selon une étude

Vous avez lu gratuitement 16 923 articles depuis plus d'un an.
Soutenez le club developpez.com en souscrivant un abonnement pour que nous puissions continuer à vous proposer des publications.

Une erreur dans cette actualité ? Signalez-nous-la !

Votre nom : Votre e-mail :

Décrivez l'erreur que vous souhaitez porter à notre connaissance :