La Fondation Wikimedia a exhorté les grandes entreprises spécialisées dans l'intelligence artificielle (IA), notamment Google, OpenAI et Meta, à cesser de récupérer les données de Wikipédia et à utiliser à la place son API Wikimedia Enterprise payante. L'organisation a déclaré que cette mesure visait à préserver la viabilité de Wikipédia alors que le nombre de visites humaines diminue, en offrant un accès structuré aux données qui réduit la charge sur les serveurs tout en soutenant sa mission à but non lucratif et les éditeurs qui gèrent le contenu de la plateforme.La Wikimedia Foundation, Inc. (WMF) est une organisation américaine à but non lucratif dont le siège social est situé à San Francisco, en Californie, où elle est enregistrée en tant que fondation caritative. Elle héberge Wikipédia, l'un des sites web les plus visités au monde. Elle héberge également quatorze projets collaboratifs ouverts connexes et soutient le développement de MediaWiki, le logiciel wiki qui les sous-tend tous. La fondation a été créée en 2003 à Saint-Pétersbourg, en Floride, par Jimmy Wales, dans le but de financer de manière non lucrative Wikipédia et d'autres projets wiki qui étaient auparavant hébergés par Bomis, la société à but lucratif de Jimmy Wales.
La Fondation Wikimedia a officiellement demandé aux grandes entreprises spécialisées dans l'IA de cesser de récupérer les données de Wikipédia et d'accéder à son contenu via l'API Wikimedia Enterprise payante. Cette décision s’inscrit dans un contexte où Wikipédia est submergé par le trafic des robots d’IA. Depuis 2024, la Fondation signale que les crawlers destinés à entraîner les modèles d’IA consomment près de 65 % de ses ressources, provoquant une hausse de 50 % de la bande passante utilisée et des coûts techniques considérables, sans contrepartie financière ni attribution équitable du contenu.
L'organisation a déclaré que ce modèle d'accès payant via l'API Wikimedia Enterprise contribuait à soutenir Wikipédia alors que le trafic d'origine humaine diminue, permettant aux entreprises un accès structuré et à grande échelle tout en réduisant la charge sur les serveurs et en soutenant sa mission à but non lucratif. Des entreprises telles que Google, OpenAI, Meta, Anthropic, Microsoft, Perplexity, DeepSeek et xAI ont été contactées, mais aucune n'a fait de commentaire public.
Wikimedia a averti que l'utilisation croissante des chatbots IA tels que ChatGPT réduit le nombre de visites directes sur Wikipédia, menaçant ainsi son modèle de financement basé sur les dons. La fondation a constaté que les robots IA avaient gonflé le trafic au début de l'année, tandis que le nombre de pages vues par les humains avait chuté de 8 % par rapport à l'année précédente, ce qui a suscité des inquiétudes quant à la baisse de l'engagement et du nombre de contributions bénévoles. Comme de plus en plus d'utilisateurs se fient aux réponses générées par l'IA au lieu de visiter le site, les dons pourraient diminuer, ce qui constitue un problème grave compte tenu des 179 millions de dollars de coûts d'exploitation annuels financés principalement par des contributions publiques, le site fonctionnant sans publicité.
En plus de demander un accès payant et transparent aux données, Wikimedia a demandé aux entreprises d'IA de créditer les éditeurs dont le travail soutient leurs modèles. La fondation a présenté cela comme une ligne directrice éthique pour un développement responsable de l'IA, évitant les menaces juridiques et s'alignant sur une pression plus large des créateurs de contenu qui exigent une compensation lorsque les systèmes d'IA réutilisent du matériel en ligne sans autorisation, tout en encourageant une collaboration équitable.
Voici l'annonce de la Fondation Wikimedia :
L'IA s'appuie sur des ressources de connaissances documentées par des humains, telles que Wikipédia. Grâce à la capacité de l'IA générative à créer des textes et des vidéos, le monde en ligne a fondamentalement changé.
Cependant, beaucoup de gens ne se rendent pas compte qu'il y a quelque chose de distinctement familier derrière tout ce contenu généré par l'IA : des connaissances sélectionnées, débattues et documentées par des humains.
C'est pourquoi le rôle de Wikipédia en tant que pilier de toutes les connaissances sur Internet n'a jamais été aussi important.
Les connaissances créées par l'homme ne sont pas remplaçables
Le communicateur scientifique Hank Green s'est récemment interrogé sur l'avenir de l'IA et sur la possibilité qu'elle finisse par s'autodétruire. En effet, l'IA générative ne peut exister sans les connaissances créées par l'homme, qui doivent être continuellement mises à jour. Sans elles, les systèmes d'IA s'effondreraient.
La force de Wikipédia réside dans ses communautés d'éditeurs bénévoles, fortes de plusieurs centaines de milliers de membres, qui améliorent constamment les informations du site. La Wikimedia Foundation, l'organisation à but non lucratif qui soutient Wikipédia, fournit une assistance technologique et juridique, mais ne rédige ni ne contrôle le contenu de Wikipédia ; ce sont les éditeurs bénévoles qui s'en chargent.
Les humains apportent à la création de connaissances des éléments que l'IA ne peut remplacer. Les outils d'IA générative actuels sont peut-être capables de synthétiser ou de résumer les connaissances existantes, mais ils ne peuvent pas s'engager dans le processus de discussion, de débat et de consensus que les éditeurs bénévoles de Wikipédia entreprennent chaque jour. Ils ne sont pas capables de découvrir des éléments enfouis dans des archives, ni de prendre une photo d'un événement ou d'un lieu sous-documenté pour aider à améliorer ces connaissances. De plus, les projets Wikimedia sont disponibles dans plus de 300 langues, souvent rédigés par des locuteurs natifs, fournissant ainsi un corpus multilingue qui soutient le développement de modèles d'IA inclusifs et sensibles à la culture. Cette approche centrée sur l'humain de la création de connaissances fournit des informations fiables et de haute qualité qui, grâce à une collaboration éditoriale régulière et à des désaccords, aboutissent à des articles plus neutres et plus complets. Plus les humains participent à Wikipédia, plus les connaissances sur Internet s'améliorent.
Wikipédia excelle également en matière de transparence. Tout le monde voit exactement les mêmes informations sur Wikipédia ; aucun algorithme ne suit votre comportement ni ne vous propose du contenu dans le but de générer des profits. Lorsque vous lisez ces informations, les citations qui les accompagnent renvoient à des sources fiables où vous pouvez vérifier qui les a initialement rapportées. Si vous souhaitez en savoir plus sur les raisons pour lesquelles ces informations figurent dans l'article, les processus de Wikipédia et les actions entreprises par ses bénévoles peuvent être consultés par tout le monde, car ils sont enregistrés publiquement sur le site web. Vous pouvez également ajouter des informations à Wikipédia, conformément aux politiques et directives du site, afin de garantir la mise à jour continue de cette ressource de connaissances vivante. C'est grâce à son ouverture que Wikipédia reste l'une des plateformes les plus fiables au monde. À l'inverse, les systèmes d'IA générative peuvent « halluciner » des informations en réponse à des questions, un phénomène qui consiste à présenter des informations fausses mais plausibles comme des faits.
Wikipédia utilise-t-elle l'IA ?
La Fondation Wikimedia reconnait le potentiel de l'IA pour l'aider à réaliser sa mission, qui consiste à rendre des informations fiables plus accessibles à un plus grand nombre de personnes. Cependant, cela doit être fait à la manière de Wikipédia, c'est-à-dire en aidant les humains à créer et à partager des connaissances, et non en les remplaçant.
Par exemple, la Fondation Wikimedia affirme être conscient qu'une grande partie du temps consacré par les bénévoles de Wikipédia est consacrée à des tâches banales telles que le signalement des actes de vandalisme. Cela peut détourner l'attention de tâches plus complexes telles que la création de contenu et la révision des modifications. C'est pourquoi une grande partie de la stratégie de la Fondation en matière d'IA pour les éditeurs, publiée plus tôt cette année, se concentre sur les moyens de donner à ces éditeurs plus de temps pour effectuer ce type de travail encyclopédique essentiel.
Dans tous les cas, les bénévoles créent et appliquent des directives pour une utilisation responsable des outils d'IA sur Wikipédia, en veillant à ce qu'ils soient utilisés de manière à soutenir au mieux les contributeurs humains.
L'IA dépend de Wikipédia
L'IA ne peut exister sans l'effort humain qui consiste à créer des sources d'information ouvertes et à but non lucratif telles que Wikipédia. C'est pourquoi Wikipédia est l'une des bases de données de la plus haute qualité au monde pour l'entraînement de l'IA, et lorsque les développeurs d'IA tentent de l'omettre, les réponses obtenues sont nettement moins précises, moins diversifiées et moins vérifiables.
C'est également la raison pour laquelle la Fondation Wikimedia appelle les développeurs d'IA et les autres réutilisateurs de contenu qui accèdent à son contenu à l'utiliser de manière responsable et à soutenir Wikipédia. Ils peuvent y parvenir grâce à deux actions simples : l'attribution et le soutien financier.
L'attribution signifie que l'IA générative reconnaît les contributions humaines qu'elle utilise pour créer ses résultats. Cela permet de maintenir un cercle vertueux qui perpétue les contributions humaines qui créent les données d'entraînement sur lesquelles s'appuient ces nouvelles technologies. Pour que les gens aient confiance dans les informations partagées sur Internet, les...
La fin de cet article est réservée aux abonnés. Soutenez le Club Developpez.com en prenant un abonnement pour que nous puissions continuer à vous proposer des publications.