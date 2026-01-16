Le problème nest pas nouveau, mais il a changé déchelle. Depuis que les modèles de langage se sont imposés comme produits commerciaux, Wikipédia est devenue une cible privilégiée pour laspiration automatisée de contenus. Là où le trafic humain progressait lentement, les requêtes machine explosent. Ce sont des grappes de serveurs, des pipelines dentraînement et des processus dindexation qui frappent à la porte, jour et nuit.
Pour la fondation Wikimedia, cette pression nest pas théorique. Elle se traduit par des coûts opérationnels bien réels, supportés par des dons individuels et par une organisation à but non lucratif. Autrement dit, des millions de contributeurs et de donateurs financent indirectement la matière première de produits dIA propriétaires, parfois valorisés en dizaines de milliards de dollars. Le déséquilibre économique est devenu trop visible pour être ignoré.
En fait, les internautes adoptent de plus en plus l'IA pour la recherche en ligne. Bien que les hallucinations des modèles d'IA restent un problème majeur, davantage d'internautes préfèrent passer par les chatbots pour obtenir une réponse immédiate et simplifiée à leurs questions. En raison de ce phénomène, les clics sur les liens contenus dans la page de résultats d'un moteur de recherche (SERP) diminuent, ce qui se traduit par la baisse du trafic des sites.
La Fondation Wikimédia a tiré la sonnette d'alarme : Wikipédia constate une baisse significative du trafic humain vers l'encyclopédie en ligne. Dans un billet de blog, Marshall Miller, directeur principal des produits de la Fondation Wikimédia, a abordé cette question. « Avec moins de visites sur Wikipédia, moins de bénévoles pourraient développer et enrichir le contenu, et moins de donateurs individuels pourraient soutenir ce travail », a-t-il déclaré.
Envoyé par Marshall Miller
Cela représente une diminution d'environ 8 % par rapport aux mêmes mois en 2024. « Nous pensons que cette baisse reflète l'impact de l'IA générative et des réseaux sociaux sur la manière dont les gens recherchent des informations, en particulier avec les moteurs de recherche qui fournissent des réponses directes aux utilisateurs, souvent basées sur le contenu de Wikipédia », a déclaré Marshall Miller. Les choses pourraient rapidement s'aggraver.
La licence comme aveu dimpuissance structurelle
Jeudi, la Fondation Wikimedia a annoncé la conclusion d'accords de licence avec Microsoft, Meta, Amazon, Perplexity et Mistral AI, élargissant ainsi ses efforts visant à faire payer les grandes entreprises technologiques pour l'utilisation du contenu de Wikipédia afin de former les modèles d'IA qui alimentent les assistants IA tels que Microsoft Copilot et ChatGPT d'OpenAI.
Alors que ces mêmes entreprises récupéraient auparavant le contenu de Wikipédia sans autorisation, ces accords signifient que la plupart des grands développeurs d'IA ont désormais adhéré au programme Wikimedia Enterprise de la fondation, une filiale commerciale qui vend un accès API aux 65 millions d'articles de Wikipédia à des vitesses et des volumes supérieurs à ceux offerts par les API publiques gratuites. La fondation n'a pas divulgué les conditions financières de ces accords.
Les nouveaux partenaires rejoignent Google, qui a signé un accord avec Wikimedia Enterprise en 2022, ainsi que des entreprises plus petites telles qu'Ecosia, Nomic, Pleias, ProRata et Reef Media. Les revenus contribuent à compenser les coûts d'infrastructure de l'organisation à but non lucratif, qui dépend autrement de petits dons publics tout en voyant son contenu devenir un élément essentiel des données d'entraînement pour les modèles d'IA.
« Wikipédia est un élément essentiel du travail de ces entreprises technologiques, qui doivent trouver le moyen de le soutenir financièrement », a déclaré Lane Becker, président de Wikimedia Enterprise, à Reuters. « Il nous a fallu un certain temps pour comprendre quelles étaient les fonctionnalités et les caractéristiques à proposer si nous voulions faire passer ces entreprises de notre plateforme gratuite à une plateforme commerciale... mais tous nos partenaires Big Tech comprennent vraiment la nécessité de s'engager à soutenir le travail de Wikipédia. »
Envoyé par Wikimedia
La fondation ne ferme pas laccès aux contenus. Elle tente de distinguer lusage individuel et éducatif de lexploitation industrielle à grande échelle. Cette nuance est juridiquement défendable, mais politiquement fragile. Elle entérine lidée que le web ouvert a besoin de péages sélectifs pour survivre face à des acteurs capables dabsorber des volumes colossaux de données sans friction.
Le coût de la connaissance « gratuite »
La pression en faveur des licences payantes fait suite à des années d'augmentation des coûts d'infrastructure, les entreprises d'IA ayant récupéré le contenu de Wikipédia à une échelle industrielle. En avril 2025, la fondation a signalé que la bande passante utilisée pour télécharger du contenu multimédia avait augmenté de 50 % depuis janvier 2024, les robots représentant 65 % des requêtes les plus coûteuses pour l'infrastructure centrale, alors qu'ils ne représentaient que 35 % du nombre total de pages vues.
En octobre, la Fondation Wikimedia a révélé que le trafic humain vers Wikipédia avait chuté d'environ 8 % d'une année sur l'autre après que l'organisation ait mis à jour ses systèmes de détection des robots et découvert qu'une grande partie de ce qui semblait être des visiteurs humains était en fait des scrapers automatisés conçus pour échapper à la détection.
La baisse du trafic menace la boucle de rétroaction qui soutient Wikipédia depuis un quart de siècle : les lecteurs visitent le site, certains deviennent éditeurs ou donateurs, et le contenu s'améliore ostensiblement. Mais aujourd'hui, de nombreux chatbots IA et résumés de moteurs de recherche répondent aux questions en utilisant le contenu de Wikipédia sans renvoyer les utilisateurs vers le site lui-même.
Jimmy Wales et la défense dun idéal sous contrainte
Jimmy Wales continue de marteler que lindépendance éditoriale et communautaire de Wikipédia nest pas négociable. Aucun accord de licence, affirme-t-il, ne donnera un droit de regard aux entreprises de lIA sur le contenu ou la gouvernance. Cette ligne est essentielle, mais elle révèle aussi la tension centrale du moment : lidéal est intact, le contexte ne lest plus.
Car même sans contrôle éditorial, linfluence économique existe. Lorsque des acteurs commerciaux deviennent des partenaires...
La fin de cet article est réservée aux abonnés. Soutenez le Club Developpez.com en prenant un abonnement pour que nous puissions continuer à vous proposer des publications.