IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)

Vous êtes nouveau sur Developpez.com ? Créez votre compte ou connectez-vous afin de pouvoir participer !

Vous devez avoir un compte Developpez.com et être connecté pour pouvoir participer aux discussions.

Vous n'avez pas encore de compte Developpez.com ? Créez-en un en quelques instants, c'est entièrement gratuit !

Si vous disposez déjà d'un compte et qu'il est bien activé, connectez-vous à l'aide du formulaire ci-dessous.

Identifiez-vous
Identifiant
Mot de passe
Mot de passe oublié ?
Créer un compte

L'inscription est gratuite et ne vous prendra que quelques instants !

Je m'inscris !

Wikimedia Enterprise signe des accords payants avec Microsoft, Meta, Amazon, Perplexity et Mistral AI pour former leurs IA.
Wikipédia peut-elle rester libre quand l'IA transforme le savoir en avantage ?

Le , par Stéphane le calme

0PARTAGES

5  0 
Pendant des années, Wikipédia a prospéré comme un symbole rare de l’Internet d’avant la captation généralisée de la valeur : un savoir produit collectivement, accessible gratuitement, protégé par des licences ouvertes. L’irruption de l’intelligence artificielle générative bouleverse cet équilibre. En acceptant de négocier des accords de licence avec des entreprises de l’IA, l’encyclopédie libre ne trahit pas frontalement ses principes, mais elle admet une réalité plus dérangeante : le web ouvert ne survit plus dans un écosystème où l’IA industrielle consomme sans rendre.

Le problème n’est pas nouveau, mais il a changé d’échelle. Depuis que les modèles de langage se sont imposés comme produits commerciaux, Wikipédia est devenue une cible privilégiée pour l’aspiration automatisée de contenus. Là où le trafic humain progressait lentement, les requêtes machine explosent. Ce sont des grappes de serveurs, des pipelines d’entraînement et des processus d’indexation qui frappent à la porte, jour et nuit.

Pour la fondation Wikimedia, cette pression n’est pas théorique. Elle se traduit par des coûts opérationnels bien réels, supportés par des dons individuels et par une organisation à but non lucratif. Autrement dit, des millions de contributeurs et de donateurs financent indirectement la matière première de produits d’IA propriétaires, parfois valorisés en dizaines de milliards de dollars. Le déséquilibre économique est devenu trop visible pour être ignoré.

En fait, les internautes adoptent de plus en plus l'IA pour la recherche en ligne. Bien que les hallucinations des modèles d'IA restent un problème majeur, davantage d'internautes préfèrent passer par les chatbots pour obtenir une réponse immédiate et simplifiée à leurs questions. En raison de ce phénomène, les clics sur les liens contenus dans la page de résultats d'un moteur de recherche (SERP) diminuent, ce qui se traduit par la baisse du trafic des sites.

La Fondation Wikimédia a tiré la sonnette d'alarme : Wikipédia constate une baisse significative du trafic humain vers l'encyclopédie en ligne. Dans un billet de blog, Marshall Miller, directeur principal des produits de la Fondation Wikimédia, a abordé cette question. « Avec moins de visites sur Wikipédia, moins de bénévoles pourraient développer et enrichir le contenu, et moins de donateurs individuels pourraient soutenir ce travail », a-t-il déclaré.

Citation Envoyé par Marshall Miller
Nous saluons les nouvelles façons dont les gens acquièrent des connaissances. Cependant, les chatbots d'IA, les moteurs de recherche et les plateformes sociales qui utilisent le contenu de Wikipédia doivent encourager davantage de visiteurs à se rendre sur Wikipédia, afin que les connaissances libres dont dépendent tant de personnes et de plateformes puissent continuer à circuler de manière durable.
Marshall Miller a déclaré qu'en mai 2025, Wikipédia avait remarqué un trafic humain anormalement élevé provenant principalement du Brésil. Il n'est pas entré dans les détails, mais a expliqué que cela avait conduit la Fondation Wikimédia à mettre à jour ses systèmes de détection des robots. Après avoir procédé à cette révision, Wikipédia a constaté une baisse du nombre de pages vues par les utilisateurs sur Wikipédia au cours des derniers mois.

Cela représente une diminution d'environ 8 % par rapport aux mêmes mois en 2024. « Nous pensons que cette baisse reflète l'impact de l'IA générative et des réseaux sociaux sur la manière dont les gens recherchent des informations, en particulier avec les moteurs de recherche qui fournissent des réponses directes aux utilisateurs, souvent basées sur le contenu de Wikipédia », a déclaré Marshall Miller. Les choses pourraient rapidement s'aggraver.


La licence comme aveu d’impuissance structurelle

Jeudi, la Fondation Wikimedia a annoncé la conclusion d'accords de licence avec Microsoft, Meta, Amazon, Perplexity et Mistral AI, élargissant ainsi ses efforts visant à faire payer les grandes entreprises technologiques pour l'utilisation du contenu de Wikipédia afin de former les modèles d'IA qui alimentent les assistants IA tels que Microsoft Copilot et ChatGPT d'OpenAI.

Alors que ces mêmes entreprises récupéraient auparavant le contenu de Wikipédia sans autorisation, ces accords signifient que la plupart des grands développeurs d'IA ont désormais adhéré au programme Wikimedia Enterprise de la fondation, une filiale commerciale qui vend un accès API aux 65 millions d'articles de Wikipédia à des vitesses et des volumes supérieurs à ceux offerts par les API publiques gratuites. La fondation n'a pas divulgué les conditions financières de ces accords.

Les nouveaux partenaires rejoignent Google, qui a signé un accord avec Wikimedia Enterprise en 2022, ainsi que des entreprises plus petites telles qu'Ecosia, Nomic, Pleias, ProRata et Reef Media. Les revenus contribuent à compenser les coûts d'infrastructure de l'organisation à but non lucratif, qui dépend autrement de petits dons publics tout en voyant son contenu devenir un élément essentiel des données d'entraînement pour les modèles d'IA.

« Wikipédia est un élément essentiel du travail de ces entreprises technologiques, qui doivent trouver le moyen de le soutenir financièrement », a déclaré Lane Becker, président de Wikimedia Enterprise, à Reuters. « Il nous a fallu un certain temps pour comprendre quelles étaient les fonctionnalités et les caractéristiques à proposer si nous voulions faire passer ces entreprises de notre plateforme gratuite à une plateforme commerciale... mais tous nos partenaires Big Tech comprennent vraiment la nécessité de s'engager à soutenir le travail de Wikipédia. »

Citation Envoyé par Wikimedia
Les progrès réalisés par Wikipédia au cours des 25 dernières années soulignent son importance croissante dans le monde en ligne d'aujourd'hui. Voici quelques-unes des façons dont elle s'est développée et a évolué au fil des ans :
  • De nouveaux partenariats avec des entreprises technologiques soutiennent la pérennité de Wikipédia : les entreprises technologiques qui s'appuient sur le contenu de Wikipédia doivent l'utiliser de manière responsable et contribuer à la pérennité de Wikipédia pour l'avenir. La plateforme Wikimedia Enterprise est un moyen essentiel d'y parvenir. Développée par la Fondation Wikimedia, Wikimedia Enterprise est un produit commercial destiné aux grands réutilisateurs et distributeurs de contenu provenant des projets Wikimedia. Au cours de l'année écoulée, plusieurs entreprises, dont Ecosia, Microsoft, Mistral AI, Perplexity, Pleias et ProRata, sont devenues de nouveaux partenaires de Wikimedia Enterprise, rejoignant ainsi des partenaires existants tels qu'Amazon, Google et Meta. Ils peuvent accéder au contenu des projets Wikimedia à un volume et à une vitesse spécialement adaptés à leurs besoins, tout en soutenant directement notre mission à but non lucratif.
  • Mettre en œuvre une stratégie d'IA qui donne la priorité à l'humain : la récente stratégie d'IA de la Fondation oriente les investissements et les développements futurs dans le domaine de l'IA afin de soutenir les contributeurs humains qui sont au cœur de Wikipédia, afin qu'ils puissent consacrer leur temps précieux à ce qu'ils veulent accomplir et non à la manière d'y parvenir techniquement.

Présentés comme un simple ajustement pragmatique, les accords de licence constituent en réalité un aveu plus profond : les licences ouvertes ne suffisent plus à protéger les communs numériques face à l’industrialisation de l’IA. En théorie, tout le monde peut réutiliser Wikipédia. En pratique, seuls les acteurs disposant d’une puissance de calcul massive peuvent transformer ce savoir en avantage concurrentiel durable.

La fondation ne ferme pas l’accès aux contenus. Elle tente de distinguer l’usage individuel et éducatif de l’exploitation industrielle à grande échelle. Cette nuance est juridiquement défendable, mais politiquement fragile. Elle entérine l’idée que le web ouvert a besoin de péages sélectifs pour survivre face à des acteurs capables d’absorber des volumes colossaux de données sans friction.


Le coût de la connaissance « gratuite »

La pression en faveur des licences payantes fait suite à des années d'augmentation des coûts d'infrastructure, les entreprises d'IA ayant récupéré le contenu de Wikipédia à une échelle industrielle. En avril 2025, la fondation a signalé que la bande passante utilisée pour télécharger du contenu multimédia avait augmenté de 50 % depuis janvier 2024, les robots représentant 65 % des requêtes les plus coûteuses pour l'infrastructure centrale, alors qu'ils ne représentaient que 35 % du nombre total de pages vues.

En octobre, la Fondation Wikimedia a révélé que le trafic humain vers Wikipédia avait chuté d'environ 8 % d'une année sur l'autre après que l'organisation ait mis à jour ses systèmes de détection des robots et découvert qu'une grande partie de ce qui semblait être des visiteurs humains était en fait des scrapers automatisés conçus pour échapper à la détection.

La baisse du trafic menace la boucle de rétroaction qui soutient Wikipédia depuis un quart de siècle : les lecteurs visitent le site, certains deviennent éditeurs ou donateurs, et le contenu s'améliore ostensiblement. Mais aujourd'hui, de nombreux chatbots IA et résumés de moteurs de recherche répondent aux questions en utilisant le contenu de Wikipédia sans renvoyer les utilisateurs vers le site lui-même.

Jimmy Wales et la défense d’un idéal sous contrainte

Jimmy Wales continue de marteler que l’indépendance éditoriale et communautaire de Wikipédia n’est pas négociable. Aucun accord de licence, affirme-t-il, ne donnera un droit de regard aux entreprises de l’IA sur le contenu ou la gouvernance. Cette ligne est essentielle, mais elle révèle aussi la tension centrale du moment : l’idéal est intact, le contexte ne l’est plus.

Car même sans contrôle éditorial, l’influence économique existe. Lorsque des acteurs commerciaux deviennent des partenaires...
La fin de cet article est réservée aux abonnés. Soutenez le Club Developpez.com en prenant un abonnement pour que nous puissions continuer à vous proposer des publications.

Une erreur dans cette actualité ? Signalez-nous-la !