IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)

Vous êtes nouveau sur Developpez.com ? Créez votre compte ou connectez-vous afin de pouvoir participer !

Vous devez avoir un compte Developpez.com et être connecté pour pouvoir participer aux discussions.

Vous n'avez pas encore de compte Developpez.com ? Créez-en un en quelques instants, c'est entièrement gratuit !

Si vous disposez déjà d'un compte et qu'il est bien activé, connectez-vous à l'aide du formulaire ci-dessous.

Identifiez-vous
Identifiant
Mot de passe
Mot de passe oublié ?
Créer un compte

L'inscription est gratuite et ne vous prendra que quelques instants !

Je m'inscris !

Wikimedia Enterprise signe des accords payants avec Microsoft, Meta, Amazon, Perplexity et Mistral AI pour former leurs IA.
Wikipédia peut-elle rester libre quand l'IA transforme le savoir en avantage ?

Le , par Stéphane le calme

95PARTAGES

18  0 
Wikimedia Enterprise signe des accords payants avec Microsoft, Meta, Amazon, Perplexity et Mistral AI pour former leurs IA
Wikipédia peut-elle rester libre quand l’IA transforme le savoir en avantage concurrentiel ?

Pendant des années, Wikipédia a prospéré comme un symbole rare de l’Internet d’avant la captation généralisée de la valeur : un savoir produit collectivement, accessible gratuitement, protégé par des licences ouvertes. L’irruption de l’intelligence artificielle générative bouleverse cet équilibre. En acceptant de négocier des accords de licence avec des entreprises de l’IA, l’encyclopédie libre ne trahit pas frontalement ses principes, mais elle admet une réalité plus dérangeante : le web ouvert ne survit plus dans un écosystème où l’IA industrielle consomme sans rendre.

Le problème n’est pas nouveau, mais il a changé d’échelle. Depuis que les modèles de langage se sont imposés comme produits commerciaux, Wikipédia est devenue une cible privilégiée pour l’aspiration automatisée de contenus. Là où le trafic humain progressait lentement, les requêtes machine explosent. Ce sont des grappes de serveurs, des pipelines d’entraînement et des processus d’indexation qui frappent à la porte, jour et nuit.

Pour la fondation Wikimedia, cette pression n’est pas théorique. Elle se traduit par des coûts opérationnels bien réels, supportés par des dons individuels et par une organisation à but non lucratif. Autrement dit, des millions de contributeurs et de donateurs financent indirectement la matière première de produits d’IA propriétaires, parfois valorisés en dizaines de milliards de dollars. Le déséquilibre économique est devenu trop visible pour être ignoré.

En fait, les internautes adoptent de plus en plus l'IA pour la recherche en ligne. Bien que les hallucinations des modèles d'IA restent un problème majeur, davantage d'internautes préfèrent passer par les chatbots pour obtenir une réponse immédiate et simplifiée à leurs questions. En raison de ce phénomène, les clics sur les liens contenus dans la page de résultats d'un moteur de recherche (SERP) diminuent, ce qui se traduit par la baisse du trafic des sites.

La Fondation Wikimédia a tiré la sonnette d'alarme : Wikipédia constate une baisse significative du trafic humain vers l'encyclopédie en ligne. Dans un billet de blog, Marshall Miller, directeur principal des produits de la Fondation Wikimédia, a abordé cette question. « Avec moins de visites sur Wikipédia, moins de bénévoles pourraient développer et enrichir le contenu, et moins de donateurs individuels pourraient soutenir ce travail », a-t-il déclaré.

Citation Envoyé par Marshall Miller
Nous saluons les nouvelles façons dont les gens acquièrent des connaissances. Cependant, les chatbots d'IA, les moteurs de recherche et les plateformes sociales qui utilisent le contenu de Wikipédia doivent encourager davantage de visiteurs à se rendre sur Wikipédia, afin que les connaissances libres dont dépendent tant de personnes et de plateformes puissent continuer à circuler de manière durable.
Marshall Miller a déclaré qu'en mai 2025, Wikipédia avait remarqué un trafic humain anormalement élevé provenant principalement du Brésil. Il n'est pas entré dans les détails, mais a expliqué que cela avait conduit la Fondation Wikimédia à mettre à jour ses systèmes de détection des robots. Après avoir procédé à cette révision, Wikipédia a constaté une baisse du nombre de pages vues par les utilisateurs sur Wikipédia au cours des derniers mois.

Cela représente une diminution d'environ 8 % par rapport aux mêmes mois en 2024. « Nous pensons que cette baisse reflète l'impact de l'IA générative et des réseaux sociaux sur la manière dont les gens recherchent des informations, en particulier avec les moteurs de recherche qui fournissent des réponses directes aux utilisateurs, souvent basées sur le contenu de Wikipédia », a déclaré Marshall Miller. Les choses pourraient rapidement s'aggraver.


La licence comme aveu d’impuissance structurelle

Jeudi, la Fondation Wikimedia a annoncé la conclusion d'accords de licence avec Microsoft, Meta, Amazon, Perplexity et Mistral AI, élargissant ainsi ses efforts visant à faire payer les grandes entreprises technologiques pour l'utilisation du contenu de Wikipédia afin de former les modèles d'IA qui alimentent les assistants IA tels que Microsoft Copilot et ChatGPT d'OpenAI.

Alors que ces mêmes entreprises récupéraient auparavant le contenu de Wikipédia sans autorisation, ces accords signifient que la plupart des grands développeurs d'IA ont désormais adhéré au programme Wikimedia Enterprise de la fondation, une filiale commerciale qui vend un accès API aux 65 millions d'articles de Wikipédia à des vitesses et des volumes supérieurs à ceux offerts par les API publiques gratuites. La fondation n'a pas divulgué les conditions financières de ces accords.

Les nouveaux partenaires rejoignent Google, qui a signé un accord avec Wikimedia Enterprise en 2022, ainsi que des entreprises plus petites telles qu'Ecosia, Nomic, Pleias, ProRata et Reef Media. Les revenus contribuent à compenser les coûts d'infrastructure de l'organisation à but non lucratif, qui dépend autrement de petits dons publics tout en voyant son contenu devenir un élément essentiel des données d'entraînement pour les modèles d'IA.

« Wikipédia est un élément essentiel du travail de ces entreprises technologiques, qui doivent trouver le moyen de le soutenir financièrement », a déclaré Lane Becker, président de Wikimedia Enterprise, à Reuters. « Il nous a fallu un certain temps pour comprendre quelles étaient les fonctionnalités et les caractéristiques à proposer si nous voulions faire passer ces entreprises de notre plateforme gratuite à une plateforme commerciale... mais tous nos partenaires Big Tech comprennent vraiment la nécessité de s'engager à soutenir le travail de Wikipédia. »

Citation Envoyé par Wikimedia
Les progrès réalisés par Wikipédia au cours des 25 dernières années soulignent son importance croissante dans le monde en ligne d'aujourd'hui. Voici quelques-unes des façons dont elle s'est développée et a évolué au fil des ans :
  • De nouveaux partenariats avec des entreprises technologiques soutiennent la pérennité de Wikipédia : les entreprises technologiques qui s'appuient sur le contenu de Wikipédia doivent l'utiliser de manière responsable et contribuer à la pérennité de Wikipédia pour l'avenir. La plateforme Wikimedia Enterprise est un moyen essentiel d'y parvenir. Développée par la Fondation Wikimedia, Wikimedia Enterprise est un produit commercial destiné aux grands réutilisateurs et distributeurs de contenu provenant des projets Wikimedia. Au cours de l'année écoulée, plusieurs entreprises, dont Ecosia, Microsoft, Mistral AI, Perplexity, Pleias et ProRata, sont devenues de nouveaux partenaires de Wikimedia Enterprise, rejoignant ainsi des partenaires existants tels qu'Amazon, Google et Meta. Ils peuvent accéder au contenu des projets Wikimedia à un volume et à une vitesse spécialement adaptés à leurs besoins, tout en soutenant directement notre mission à but non lucratif.
  • Mettre en œuvre une stratégie d'IA qui donne la priorité à l'humain : la récente stratégie d'IA de la Fondation oriente les investissements et les développements futurs dans le domaine de l'IA afin de soutenir les contributeurs humains qui sont au cœur de Wikipédia, afin qu'ils puissent consacrer leur temps précieux à ce qu'ils veulent accomplir et non à la manière d'y parvenir techniquement.

Présentés comme un simple ajustement pragmatique, les accords de licence constituent en réalité un aveu plus profond : les licences ouvertes ne suffisent plus à protéger les communs numériques face à l’industrialisation de l’IA. En théorie, tout le monde peut réutiliser Wikipédia. En pratique, seuls les acteurs disposant d’une puissance de calcul massive peuvent transformer ce savoir en avantage concurrentiel durable.

La fondation ne ferme pas l’accès aux contenus. Elle tente de distinguer l’usage individuel et éducatif de l’exploitation industrielle à grande échelle. Cette nuance est juridiquement défendable, mais politiquement fragile. Elle entérine l’idée que le web ouvert a besoin de péages sélectifs pour survivre face à des acteurs capables d’absorber des volumes colossaux de données sans friction.


Le coût de la connaissance « gratuite »

La pression en faveur des licences payantes fait suite à des années d'augmentation des coûts d'infrastructure, les entreprises d'IA ayant récupéré le contenu de Wikipédia à une échelle industrielle. En avril 2025, la fondation a signalé que la bande passante utilisée pour télécharger du contenu multimédia avait augmenté de 50 % depuis janvier 2024, les robots représentant 65 % des requêtes les plus coûteuses pour l'infrastructure centrale, alors qu'ils ne représentaient que 35 % du nombre total de pages vues.

En octobre, la Fondation Wikimedia a révélé que le trafic humain vers Wikipédia avait chuté d'environ 8 % d'une année sur l'autre après que l'organisation ait mis à jour ses systèmes de détection des robots et découvert qu'une grande partie de ce qui semblait être des visiteurs humains était en fait des scrapers automatisés conçus pour échapper à la détection.

La baisse du trafic menace la boucle de rétroaction qui soutient Wikipédia depuis un quart de siècle : les lecteurs visitent le site, certains deviennent éditeurs ou donateurs, et le contenu s'améliore ostensiblement. Mais aujourd'hui, de nombreux chatbots IA et résumés de moteurs de recherche répondent aux questions en utilisant le contenu de Wikipédia sans renvoyer les utilisateurs vers le site lui-même.

Jimmy Wales et la défense d’un idéal sous contrainte

Jimmy Wales continue de marteler que l’indépendance éditoriale et communautaire de Wikipédia n’est pas négociable. Aucun accord de licence, affirme-t-il, ne donnera un droit de regard aux entreprises de l’IA sur le contenu ou la gouvernance. Cette ligne est essentielle, mais elle révèle aussi la tension centrale du moment : l’idéal est intact, le contexte ne l’est plus.

Car même sans contrôle éditorial, l’influence économique existe. Lorsque des acteurs commerciaux deviennent des partenaires financiers, même indirects, la tentation d’adapter les priorités techniques ou l’accès aux données est réelle. Wikipédia marche ici sur une ligne de crête où chaque décision sera scrutée par une communauté historiquement méfiante envers toute forme de marchandisation.

Une communauté face au risque de dépossession symbolique

Du point de vue des contributeurs, le malaise est palpable. Beaucoup acceptent l’idée que les entreprises d’IA doivent payer pour un usage intensif et automatisé. D’autres redoutent un glissement progressif : aujourd’hui la licence, demain des API privilégiées, après-demain une hiérarchisation implicite des usages.

Le cœur du problème est symbolique autant que financier. Wikipédia n’est pas seulement un site web, c’est une promesse : celle qu’un savoir produit par des bénévoles reste au service du public. Voir ce savoir devenir une ligne comptable dans des négociations avec des entreprises d’IA fragilise cette promesse, même si les intentions affichées restent vertueuses.

L’IA comme prédatrice des communs numériques

Ce qui se joue ici dépasse largement Wikipédia. Le cas de l’encyclopédie met en lumière un modèle économique de l’IA fondamentalement extractif. Les systèmes génératifs prospèrent en absorbant des décennies de travail collectif, souvent sans compensation, puis en enfermant les résultats dans des services payants ou fermés.

Si Wikipédia, symbole mondial du savoir libre, estime nécessaire de facturer certains usages, c’est un signal d’alarme pour tout l’écosystème du web ouvert. Blogs, forums, projets open source et bases de données publiques sont confrontés au même dilemme : rester ouverts au risque d’être vidés de leur valeur, ou instaurer des barrières au risque de renier leur ADN.

Un précédent qui dérange plus qu’il ne rassure

La décision de Wikipédia n’est ni une trahison ni une solution miracle. Elle est le symptôme d’un Internet arrivé à un point de rupture. En tentant de monétiser partiellement l’usage industriel de ses contenus, l’encyclopédie cherche à survivre sans se renier. Mais elle révèle surtout une vérité inconfortable : l’IA contemporaine ne sait pas coexister naturellement avec les biens communs.

La question n’est donc pas de savoir si Wikipédia a raison ou tort, mais ce que cette décision annonce. Si le web ouvert doit désormais se protéger contre ceux qui en tirent le plus de valeur, alors c’est tout le récit d’un Internet libre et collaboratif qui vacille. Et avec lui, l’idée que le progrès technologique peut encore s’appuyer durablement sur le bénévolat et la confiance collective.

Source : Wikimedia Foundation

Et vous ?

La décision de Wikipédia de conclure des accords de licence avec des acteurs de l’IA marque-t-elle une adaptation lucide à un nouvel équilibre économique ou l’aveu que le modèle du web ouvert est devenu intenable face à l’industrialisation de l’intelligence artificielle ?

Qu'en est-il des auteurs bénévoles à qui on n'a pas demandé l'avis ?

Peut-on encore parler de « savoir libre » lorsque ce même savoir devient une ressource stratégique monétisée dans des négociations avec des entreprises privées, même si l’accès grand public reste officiellement gratuit ?

Les licences payantes pour l’IA créent-elles une distinction légitime entre usages humains et usages industriels, ou ouvrent-elles la voie à une hiérarchisation implicite des utilisateurs du web ?

En acceptant de faire payer les entreprises d’IA, Wikipédia ne risque-t-elle pas de déplacer le problème sans le résoudre, en légitimant un modèle d’IA fondamentalement extractif plutôt qu’en le remettant en cause ?

Voir aussi :

Wikipedia demande enfin aux grandes entreprises de payer : Wikimedia Enterprise offrira de nouvelles options aux entreprises qui utilisent son contenu, mais Wikipedia et son API resteront gratuits

Abstract Wikipedia, le projet expérimental de l'encyclopédie en ligne, utilise un langage de description pour générer du contenu dans d'autres langues
Vous avez lu gratuitement 796 articles depuis plus d'un an.
Soutenez le club developpez.com en souscrivant un abonnement pour que nous puissions continuer à vous proposer des publications.

Une erreur dans cette actualité ? Signalez-nous-la !

Avatar de Daïmanu
Membre émérite https://www.developpez.com
Le 26/03/2026 à 15:29
Sur ce point, je note la transparence du Wikipedia anglais, avec tout un historique de point de vue sur l'IAg : https://en.wikipedia.org/wiki/Wikipe...ssion_timeline, qui a évolué de pas de promotion, à interdiction.

En version francophone, l'usage actuel est vivement déconseillé avec tout de même quelques tolérances (résumer un source, reformuler du texte, corrections orthographiques, typographiques et syntaxiques, et vérifier le sens d'un mot étranger).
1  0 
Avatar de _toma_
Membre éclairé https://www.developpez.com
Le 28/03/2026 à 9:34
Citation Envoyé par der§en Voir le message
Si les IA sont logique et pas malmenés par le wokisme, et autre crétinerie du même acabit ,l’orientation idéologique de Wikipedia va bien changer dans les prochains mois
Qu'est-ce qu'il faut pas lire comme connerie.
Pour rappel, Woke ça veut dire "éveillé", ce qui veut dire que t'es fier d'avoir choisi un camp qui se revendique lui-même comme étant attardé (on se croirait dans une cours de récré où les gens insultent un mec d'intello).
J'imagine que ce que tu appelles woke c'est un "excès" de tolérance envers les gens qui ne sont pas comme toi (couleur de peau, orientation sexuelle et compagnie). Tu peux me donner un exemple d'article qui justifie une telle réaction de ta part stp ?

Sinon, je comprends pas la logique de ta phrase (t'es sûr que t'étais réveillé quand t'as posté ?) :
D'après cet article, Wikipedia veut arrêter d'utiliser des générateurs de contenus artificiels, pas se mettre à les utiliser plein pot.
2  1 
Avatar de Christophe
Responsable Systèmes https://www.developpez.com
Le 17/01/2026 à 8:07
Il s'agit d'un prob de survie de Wikipedia à long terme.

Je suis d'accord avec toi sur l'usage commercial-non commercial, bien que les géants de l'IA ont souvent une version gratuite d'appel et une version payante, et la version gratuite sert fort probablement pour entrainer et améliorer la version payante.

Les gens risquent de perdre le réflexe d'aller sur Wikipedia pour prompter, on en est pas encore là mais bon.

Il est normal que les géants de l'IA utilisant massivement Wikipedia y contribuent financièrement.

Wikipedia permet de toute façon de télécharger offline tout leur contenu
0  0 
Avatar de AnteMeridiam
Nouveau Candidat au Club https://www.developpez.com
Le 26/03/2026 à 18:03
Je trouve ça assez étrange : pour moi, les règles de Wikipédia (transparence, clarté...) suffisent, sans qu'il n'y ait besoin d'une règle restrictive anti-IA, qui interdirait aussi un usage rasionné.
0  0 
Avatar de calvaire
Expert éminent https://www.developpez.com
Le 27/03/2026 à 8:35
comment ils vont savoir si c'est du texte généré par ia ou par un humain ?
sachant que les modèles d'aujourd'hui sont capable d’imiter un humain et à l'inverse les humains parlent/écrivent de plus en plus comme chatgpt (voir Contamination linguistique).
0  0 
Avatar de der§en
Membre expérimenté https://www.developpez.com
Le 27/03/2026 à 9:53
Si les IA sont logique et pas malmenés par le wokisme, et autre crétinerie du même acabit ,l’orientation idéologique de Wikipedia va bien changer dans les prochains mois
1  1 
Avatar de der§en
Membre expérimenté https://www.developpez.com
Le 16/01/2026 à 16:21
Peux-t-on vraiment affirmer être libre quand on est aussi orienté politiquement que Wikipédia ?
1  2 
Avatar de Matthieu Vergne
Expert éminent https://www.developpez.com
Le 16/01/2026 à 21:45
Je me place en faux vis à vis de l'article. Le contenu de Wikipedia est un commun, accessible gratuitement, mais nombre de LLMs le sont tout autant : il suffit d'aller sur Hugging Face pour les récupérer gratuitement. On reste dans la même zone. Là où les entreprises interviennent avec leurs pratiques commerciales, c'est pour la création du modèle et son exécution. En tant qu'utilisateur, on peut récupérer le modèle gratuitement et le faire tourner soit-même.

Qu'on me comprenne bien : je me place en faux vis à vis de l'article, pas de Wikimedia. Wikimedia a raison de les faire payer : ce n'est qu'un juste retour des choses puisque ça leur permet d'étendre leur business. Mais présenter ça comme le premier clou dans le cercueil des communs me semble fallacieux.

On pourra me rétorquer que les modèles qui tournent chez les grandes firmes sont sans commune mesure avec ce qu'on peut faire tourner localement, mais je répondrai que "justement" sans ces firmes on serait de toutes façon incapable de faire tourner ces gigantesques modèles. Ce sont les utilisateurs qui courent après toujours plus gros qui sont bien obligés de compter sur d'autres pour l'obtenir. Mais en ont-ils seulement besoin ? Avec un modèle à 7B de paramètres qui tourne sur mon ordi à 6GB de VRAM, ça me suffit largement à faire du chat et de l'autocomplétion quand je code. Je peux même pousser à 30B mais sur CPU, car j'ai poussé ma RAM à 64GB, mais ça reste bien plus lent que le 7B sur GPU. C'est un choix. Avec ça je continue d'aller sur Wikipedia régulièrement. Et franchement, je n'ai pas besoin de plus. De toute façon, même énorme un modèle peut toujours déblatérer des sottises, et on ne sait jamais quand. Donc autant rester à un niveau raisonnable en sachant ça et continuer à aller voir les sources.

Et l'agentique, pas pour moi tant qu'on restera sur la techno actuelle de LLM. Car faut forcément passer derrière pour vérifier et j'ai autre chose à faire de mon temps que de le passer sur un brouhaha plus verbeux que nécessaire. Quand on aura une techno fiable, là ça m'intéressera, et pas dit qu'il soit nécessaire d'être énorme non plus.
1  3