Wikipédia alerte sur l'impact de l'IA sur la plateforme : l'encyclopédie en ligne est confrontée à une baisse significative du trafic humain. De plus en plus d'internautes obtiennent les informations contenues dans Wikipédia via des chatbots d'IA générative tels que ChatGPT et Gemini. Les chatbots répondent directement, en s’appuyant sur les contenus existants, sans rediriger vers les créateurs. L'IA ruine le trafic et le modèle économique des sites Web, tout en transformant la toile en une immense base de contenus recyclés par des bots, sans originalité. La Fondation Wikimédia affirme que cela représente un risque pour la viabilité à long terme de Wikipédia.Les internautes adoptent de plus en plus l'IA pour la recherche en ligne. Bien que les hallucinations des modèles d'IA restent un problème majeur, davantage d'internautes préfèrent passer par les chatbots pour obtenir une réponse immédiate et simplifiée à leurs questions. En raison de ce phénomène, les clics sur les liens contenus dans la page de résultats d'un moteur de recherche (SERP) diminuent, ce qui se traduit par la baisse du trafic des sites.
La Fondation Wikimédia tire la sonnette d'alarme : Wikipédia constate une baisse significative du trafic humain vers l'encyclopédie en ligne. Dans un billet de blogue récent, Marshall Miller, directeur principal des produits de la Fondation Wikimédia, a abordé cette question. « Avec moins de visites sur Wikipédia, moins de bénévoles pourraient développer et enrichir le contenu, et moins de donateurs individuels pourraient soutenir ce travail », a-t-il déclaré.
Cela représente une diminution d'environ 8 % par rapport aux mêmes mois en 2024. « Nous pensons que cette baisse reflète l'impact de l'IA générative et des réseaux sociaux sur la manière dont les gens recherchent des informations, en particulier avec les moteurs de recherche qui fournissent des réponses directes aux utilisateurs, souvent basées sur le contenu de Wikipédia », a déclaré Marshall Miller. Les choses pourraient rapidement s'aggraver.
L'IA menace la survie des sources de ses données d'entraînement
C'est la survie même des créateurs de contenus et du Web ouvert qui est en jeu. Paradoxalement, l'IA générative est entraînée à partir des articles, images, vidéos... produits par des humains collectés sur des milliards de sites Web. Ces données sont très précieuses pour les développeurs de grands modèles de langes (LLM). Ainsi, si les créateurs de contenus abandonnent en raison de baisse du trafic, cela signera également la mort de l'IA générative.
Les articles de Wikipédia font partie des données d'entraînement les plus courantes des modèles d'IA, et Google et d'autres plateformes exploitent depuis des années les articles de Wikipédia pour alimenter leurs extraits et leurs panneaux de connaissances, qui détournent le trafic de Wikipédia elle-même.
En avril 2025, Wikimédia avait déjà signalé qu'elle était victime de scraping de la part des bots IA, un problème qui touche également les bibliothèques, les archives et les musées. Les éditeurs de Wikipédia sont également très conscients du risque que représente l'IA générative pour la fiabilité des articles de Wikipédia si son utilisation n'est pas modérée efficacement. En août, ils ont rejeté l'intégration des chatbots d'IA en tant qu'outils d'édition.
Wikipédia met en place...
La fin de cet article est réservée aux abonnés. Soutenez le Club Developpez.com en prenant un abonnement pour que nous puissions continuer à vous proposer des publications.

