Wikimedia Enterprise signe des accords payants avec Microsoft, Meta, Amazon, Perplexity et Mistral AI pour former leurs IAWikipédia peut-elle rester libre quand l’IA transforme le savoir en avantage concurrentiel ?
Pendant des années, Wikipédia a prospéré comme un symbole rare de l’Internet d’avant la captation généralisée de la valeur : un savoir produit collectivement, accessible gratuitement, protégé par des licences ouvertes. L’irruption de l’intelligence artificielle générative bouleverse cet équilibre. En acceptant de négocier des accords de licence avec des entreprises de l’IA, l’encyclopédie libre ne trahit pas frontalement ses principes, mais elle admet une réalité plus dérangeante : le web ouvert ne survit plus dans un écosystème où l’IA industrielle consomme sans rendre.
Le problème n’est pas nouveau, mais il a changé d’échelle. Depuis que les modèles de langage se sont imposés comme produits commerciaux, Wikipédia est devenue une cible privilégiée pour l’aspiration automatisée de contenus. Là où le trafic humain progressait lentement, les requêtes machine explosent. Ce sont des grappes de serveurs, des pipelines d’entraînement et des processus d’indexation qui frappent à la porte, jour et nuit.
Pour la fondation Wikimedia, cette pression n’est pas théorique. Elle se traduit par des coûts opérationnels bien réels, supportés par des dons individuels et par une organisation à but non lucratif. Autrement dit, des millions de contributeurs et de donateurs financent indirectement la matière première de produits d’IA propriétaires, parfois valorisés en dizaines de milliards de dollars. Le déséquilibre économique est devenu trop visible pour être ignoré.
En fait, les internautes adoptent de plus en plus l'IA pour la recherche en ligne. Bien que les hallucinations des modèles d'IA restent un problème majeur, davantage d'internautes préfèrent passer par les chatbots pour obtenir une réponse immédiate et simplifiée à leurs questions. En raison de ce phénomène, les clics sur les liens contenus dans la page de résultats d'un moteur de recherche (SERP) diminuent, ce qui se traduit par la baisse du trafic des sites.
La Fondation Wikimédia a tiré la sonnette d'alarme : Wikipédia constate une baisse significative du trafic humain vers l'encyclopédie en ligne. Dans un billet de blog, Marshall Miller, directeur principal des produits de la Fondation Wikimédia, a abordé cette question. « Avec moins de visites sur Wikipédia, moins de bénévoles pourraient développer et enrichir le contenu, et moins de donateurs individuels pourraient soutenir ce travail », a-t-il déclaré.
Cela représente une diminution d'environ 8 % par rapport aux mêmes mois en 2024. « Nous pensons que cette baisse reflète l'impact de l'IA générative et des réseaux sociaux sur la manière dont les gens recherchent des informations, en particulier avec les moteurs de recherche qui fournissent des réponses directes aux utilisateurs, souvent basées sur le contenu de Wikipédia », a déclaré Marshall Miller. Les choses pourraient rapidement s'aggraver.
La licence comme aveu d’impuissance structurelle
Jeudi, la Fondation Wikimedia a annoncé la conclusion d'accords de licence avec Microsoft, Meta, Amazon, Perplexity et Mistral AI, élargissant ainsi ses efforts visant à faire payer les grandes entreprises technologiques pour l'utilisation du contenu de Wikipédia afin de former les modèles d'IA qui alimentent les assistants IA tels que Microsoft Copilot et ChatGPT d'OpenAI.
Alors que ces mêmes entreprises récupéraient auparavant le contenu de Wikipédia sans autorisation, ces accords signifient que la plupart des grands développeurs d'IA ont désormais adhéré au programme Wikimedia Enterprise de la fondation, une filiale commerciale qui vend un accès API aux 65 millions d'articles de Wikipédia à des vitesses et des volumes supérieurs à ceux offerts par les API publiques gratuites. La fondation n'a pas divulgué les conditions financières de ces accords.
Les nouveaux partenaires rejoignent Google, qui a signé un accord avec Wikimedia Enterprise en 2022, ainsi que des entreprises plus petites telles qu'Ecosia, Nomic, Pleias, ProRata et Reef Media. Les revenus contribuent à compenser les coûts d'infrastructure de l'organisation à but non lucratif, qui dépend autrement de petits dons publics tout en voyant son contenu devenir un élément essentiel des données d'entraînement pour les modèles d'IA.
« Wikipédia est un élément essentiel du travail de ces entreprises technologiques, qui doivent trouver le moyen de le soutenir financièrement », a déclaré Lane Becker, président de Wikimedia Enterprise, à Reuters. « Il nous a fallu un certain temps pour comprendre quelles étaient les fonctionnalités et les caractéristiques à proposer si nous voulions faire passer ces entreprises de notre plateforme gratuite à une plateforme commerciale... mais tous nos partenaires Big Tech comprennent vraiment la nécessité de s'engager à soutenir le travail de Wikipédia. »
La fondation ne ferme pas l’accès aux contenus. Elle tente de distinguer l’usage individuel et éducatif de l’exploitation industrielle à grande échelle. Cette nuance est juridiquement défendable, mais politiquement fragile. Elle entérine l’idée que le web ouvert a besoin de péages sélectifs pour survivre face à des acteurs capables d’absorber des volumes colossaux de données sans friction.
Le coût de la connaissance « gratuite »
La pression en faveur des licences payantes fait suite à des années d'augmentation des coûts d'infrastructure, les entreprises d'IA ayant récupéré le contenu de Wikipédia à une échelle industrielle. En avril 2025, la fondation a signalé que la bande passante utilisée pour télécharger du contenu multimédia avait augmenté de 50 % depuis janvier 2024, les robots représentant 65 % des requêtes les plus coûteuses pour l'infrastructure centrale, alors qu'ils ne représentaient que 35 % du nombre total de pages vues.
En octobre, la Fondation Wikimedia a révélé que le trafic humain vers Wikipédia avait chuté d'environ 8 % d'une année sur l'autre après que l'organisation ait mis à jour ses systèmes de détection des robots et découvert qu'une grande partie de ce qui semblait être des visiteurs humains était en fait des scrapers automatisés conçus pour échapper à la détection.
La baisse du trafic menace la boucle de rétroaction qui soutient Wikipédia depuis un quart de siècle : les lecteurs visitent le site, certains deviennent éditeurs ou donateurs, et le contenu s'améliore ostensiblement. Mais aujourd'hui, de nombreux chatbots IA et résumés de moteurs de recherche répondent aux questions en utilisant le contenu de Wikipédia sans renvoyer les utilisateurs vers le site lui-même.
Jimmy Wales et la défense d’un idéal sous contrainte
Jimmy Wales continue de marteler que l’indépendance éditoriale et communautaire de Wikipédia n’est pas négociable. Aucun accord de licence, affirme-t-il, ne donnera un droit de regard aux entreprises de l’IA sur le contenu ou la gouvernance. Cette ligne est essentielle, mais elle révèle aussi la tension centrale du moment : l’idéal est intact, le contexte ne l’est plus.
Car même sans contrôle éditorial, l’influence économique existe. Lorsque des acteurs commerciaux deviennent des partenaires financiers, même indirects, la tentation d’adapter les priorités techniques ou l’accès aux données est réelle. Wikipédia marche ici sur une ligne de crête où chaque décision sera scrutée par une communauté historiquement méfiante envers toute forme de marchandisation.
Une communauté face au risque de dépossession symbolique
Du point de vue des contributeurs, le malaise est palpable. Beaucoup acceptent l’idée que les entreprises d’IA doivent payer pour un usage intensif et automatisé. D’autres redoutent un glissement progressif : aujourd’hui la licence, demain des API privilégiées, après-demain une hiérarchisation implicite des usages.
Le cœur du problème est symbolique autant que financier. Wikipédia n’est pas seulement un site web, c’est une promesse : celle qu’un savoir produit par des bénévoles reste au service du public. Voir ce savoir devenir une ligne comptable dans des négociations avec des entreprises d’IA fragilise cette promesse, même si les intentions affichées restent vertueuses.
L’IA comme prédatrice des communs numériques
Ce qui se joue ici dépasse largement Wikipédia. Le cas de l’encyclopédie met en lumière un modèle économique de l’IA fondamentalement extractif. Les systèmes génératifs prospèrent en absorbant des décennies de travail collectif, souvent sans compensation, puis en enfermant les résultats dans des services payants ou fermés.
Si Wikipédia, symbole mondial du savoir libre, estime nécessaire de facturer certains usages, c’est un signal d’alarme pour tout l’écosystème du web ouvert. Blogs, forums, projets open source et bases de données publiques sont confrontés au même dilemme : rester ouverts au risque d’être vidés de leur valeur, ou instaurer des barrières au risque de renier leur ADN.
Un précédent qui dérange plus qu’il ne rassure
La décision de Wikipédia n’est ni une trahison ni une solution miracle. Elle est le symptôme d’un Internet arrivé à un point de rupture. En tentant de monétiser partiellement l’usage industriel de ses contenus, l’encyclopédie cherche à survivre sans se renier. Mais elle révèle surtout une vérité inconfortable : l’IA contemporaine ne sait pas coexister naturellement avec les biens communs.
La question n’est donc pas de savoir si Wikipédia a raison ou tort, mais ce que cette décision annonce. Si le web ouvert doit désormais se protéger contre ceux qui en tirent le plus de valeur, alors c’est tout le récit d’un Internet libre et collaboratif qui vacille. Et avec lui, l’idée que le progrès technologique peut encore s’appuyer durablement sur le bénévolat et la confiance collective.
Source : Wikimedia Foundation
Et vous ?
La décision de Wikipédia de conclure des accords de licence avec des acteurs de l’IA marque-t-elle une adaptation lucide à un nouvel équilibre économique ou l’aveu que le modèle du web ouvert est devenu intenable face à l’industrialisation de l’intelligence artificielle ?
Qu'en est-il des auteurs bénévoles à qui on n'a pas demandé l'avis ?
Peut-on encore parler de « savoir libre » lorsque ce même savoir devient une ressource stratégique monétisée dans des négociations avec des entreprises privées, même si l’accès grand public reste officiellement gratuit ?
Les licences payantes pour l’IA créent-elles une distinction légitime entre usages humains et usages industriels, ou ouvrent-elles la voie à une hiérarchisation implicite des utilisateurs du web ?
En acceptant de faire payer les entreprises d’IA, Wikipédia ne risque-t-elle pas de déplacer le problème sans le résoudre, en légitimant un modèle d’IA fondamentalement extractif plutôt qu’en le remettant en cause ?Voir aussi :
Wikipedia demande enfin aux grandes entreprises de payer : Wikimedia Enterprise offrira de nouvelles options aux entreprises qui utilisent son contenu, mais Wikipedia et son API resteront gratuits
Abstract Wikipedia, le projet expérimental de l'encyclopédie en ligne, utilise un langage de description pour générer du contenu dans d'autres langues
Vous avez lu gratuitement 796 articles depuis plus d'un an.
Soutenez le club developpez.com en souscrivant un abonnement pour que nous puissions continuer à vous proposer des publications.
Soutenez le club developpez.com en souscrivant un abonnement pour que nous puissions continuer à vous proposer des publications.

