IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)

Vous êtes nouveau sur Developpez.com ? Créez votre compte ou connectez-vous afin de pouvoir participer !

Vous devez avoir un compte Developpez.com et être connecté pour pouvoir participer aux discussions.

Vous n'avez pas encore de compte Developpez.com ? Créez-en un en quelques instants, c'est entièrement gratuit !

Si vous disposez déjà d'un compte et qu'il est bien activé, connectez-vous à l'aide du formulaire ci-dessous.

Identifiez-vous
Identifiant
Mot de passe
Mot de passe oublié ?
Créer un compte

L'inscription est gratuite et ne vous prendra que quelques instants !

Je m'inscris !

Empoisonner les données d'une IA est-il un crime ou un acte de résistance légitime face au pillage numérique des créateurs ? Glaze, Nightshade, LightShed ou le jeu du chat et de la souris algorithmique

Le , par Stéphane le calme

51PARTAGES

7  0 
Empoisonner les données d'une IA est-il un crime ou un acte de résistance légitime face au pillage numérique des créateurs ?
Glaze, Nightshade, LightShed ou le jeu du chat et de la souris qui révèle les failles du droit d'auteur à l'ère de l'IA générative

Alors que les géants de la tech aspirent massivement les œuvres en ligne pour entraîner leurs modèles d'IA sans consentement ni rémunération, une contre-offensive technique s'organise dans les communautés d'artistes et de développeurs. Des outils comme Nightshade ou Glaze permettent de « contaminer » les données d'entraînement pour rendre les modèles défaillants. Acte de sabotage illégal ou forme moderne de désobéissance civile ? La question divise juristes, philosophes et ingénieurs.

L'équation est simple dans son injustice : des entreprises valant des centaines de milliards de dollars entraînent leurs modèles génératifs sur des milliards d'images, de textes et de lignes de code récupérés sur le web, souvent sans demander la permission des auteurs, sans les rémunérer et en contournant allègrement les directives robots.txt censées signaler les contenus non soumis à la collecte automatisée. Face à cette situation, et dans l'attente d'un cadre juridique qui tarde à se matérialiser, une frange croissante de créateurs a décidé de ne plus attendre et de riposter par les mêmes moyens : les données elles-mêmes.

Des chercheurs ont développé plusieurs outils d'empoisonnement des données qui exploitent les vulnérabilités des modèles d'IA. Glaze et Nightshade permettent aux artistes de produire des images visuellement altérées qui ne peuvent pas être utilisées comme données d'entraînement. L'outil CoProtector, lui, protège les dépôts de code open source comme GitHub contre leur exploitation. Quant à Silverer, développé par l'Université Monash et la Police fédérale australienne, il permet aux utilisateurs de réseaux sociaux de modifier leurs images personnelles pour éviter qu'elles ne servent à créer des hypertrucages (deepfakes).

Glaze et Nightshade sont les deux outils les plus emblématiques de cette résistance numérique. Tous deux ont été développés par une équipe de l'Université de Chicago, conduite par le professeur Ben Zhao, à partir de 2022, après que des artistes ont contacté le laboratoire pour chercher des solutions techniques face au pillage de leur production créative.


Glaze défend, Nightshade attaque

Ces deux programmes modifient les pixels d'une image de manière subtile et systématique, d'une façon imperceptible pour l'œil humain mais déconcertante pour un modèle d'IA. Comme des illusions d'optique qui trompent la vision humaine, de minuscules retouches visuelles peuvent entièrement changer la manière dont l'IA perçoit une image.

Glaze est un outil défensif que les artistes individuels peuvent utiliser pour se protéger contre les attaques par imitation de style, tandis que Nightshade est un outil offensif que les artistes peuvent utiliser collectivement pour perturber les modèles qui aspirent leurs images sans consentement. Nightshade transforme les images en échantillons « empoisonnés », de sorte que les modèles entraînés sur ces données sans autorisation apprennent des comportements imprévisibles s'écartant des normes attendues; par exemple, une requête demandant une vache volant dans l'espace pourrait générer un sac à main flottant dans le cosmos.

Concrètement, Glaze fait croire au modèle qu'un dessin photoréaliste est de l'art abstrait moderne, neutralisant ainsi la capacité du modèle à mémoriser et reproduire un style donné. Nightshade va plus loin : il corrompt activement le processus d'apprentissage, en associant le style d'un artiste à des concepts sans aucun rapport. Les données empoisonnées sont très difficiles à retirer, car elles obligent les entreprises technologiques à identifier et supprimer laborieusement chaque échantillon corrompu.

L'adoption a été massive : Glaze et Nightshade ont été téléchargés près de neuf millions de fois au total. Nightshade est également passé en open source, ce qui a permis à d'autres équipes de s'en emparer pour en développer leurs propres variantes.


Une pratique ancienne, un contexte nouveau

Le recadrage philosophique de ces pratiques est peut-être ce qui rend le débat le plus saisissant. Certains estiment que l'empoisonnement des données n'est pas simplement un acte immoral de cybercriminalité. Si les entreprises d'IA opèrent avec l'aval des États d'une manière qui porte atteinte aux droits des citoyens en matière de vie privée, de droits d'auteur, de sécurité au travail et d'éducation de qualité, cette pratique pourrait constituer une forme éthique de désobéissance civile.

L'analogie avec les luttes sociales historiques est directe. Rosa Parks refusant de céder sa place dans un bus, des travailleurs hôteliers mettant du sel dans les sucriers, des ouvriers agricoles sabotant des machines : l'empoisonnement des données peut être vu comme une version moderne de ces actions historiques. Le philosophe John Rawls lui-même, cité dans l'analyse, reconnaissait que la désobéissance civile peut être justifiée lorsque des pratiques légalement sanctionnées produisent de graves injustices.

Il ne faut d'ailleurs pas de compétences techniques avancées pour participer à cette forme de résistance diffuse. Créer des sites web avec des informations fictives, publier des plaisanteries sur Reddit, nourrir les modèles avec leurs propres résultats ou modifier Wikipedia peuvent tout aussi bien empoisonner les données. La désobéissance numérique prend ainsi des formes qui vont du geste d'un seul artiste protégeant scrupuleusement chacune de ses œuvres jusqu'à des actions collectives coordonnées à grande échelle.

La course aux armements numériques

Mais comme dans tout conflit asymétrique où une partie dispose de ressources infiniment supérieures, la riposte ne s'est pas fait attendre. En 2025, des chercheurs des universités de Cambridge, de Darmstadt et du Texas à San Antonio ont présenté au symposium USENIX Security un outil baptisé LightShed, capable de déjouer les protections mises en place par Glaze et Nightshade.

LightShed peut détecter, rétro-concevoir et supprimer ces distorsions, neutralisant ainsi les poisons et rendant les images à nouveau exploitables pour l'entraînement de modèles d'IA génératifs. University of Cambridge Les résultats sont éloquents : lors d'évaluations expérimentales, LightShed a détecté avec 99,98 % de précision les images protégées par Nightshade et en a efficacement supprimé les protections.

Plus préoccupant encore, LightShed peut même transposer ce qu'il a appris d'un outil anti-IA, disons Nightshade, à d'autres outils comme Mist ou MetaCloak, sans les avoir jamais rencontrés au préalable. L'adaptabilité de l'outil lui confère une polyvalence redoutable. Ses créateurs tiennent toutefois à préciser qu'il ne s'agit pas d'une arme mise à la disposition de l'industrie, mais d'une alerte destinée à pousser la communauté à développer des défenses plus robustes. Comme l'explique Hanna Foerster, doctorante à l'Université de Cambridge et première auteure de la publication : « Vous ne pourrez jamais être certain que les entreprises ne disposent pas de méthodes pour neutraliser ces poisons sans jamais vous en informer. »

La publication de LightShed illustre un paradoxe inhérent à la recherche en sécurité offensive : exposer une vulnérabilité permet certes de la corriger, mais rend aussi la technique accessible à des acteurs malveillants ou simplement sans scrupules.


Un droit en retard sur la technique

Pendant que cette course aux armements algorithmiques se poursuit, le droit peine à rattraper son retard. Les procès se multiplient : d'ici 2024, la prolifération des modèles d'IA générative avait déjà engendré plus d'une trentaine de plaintes pour violation de droits d'auteur déposées par des ayants droit contre des développeurs d'IA. En juin 2025, Disney et NBCUniversal ont escaladé la guerre juridique en attaquant Midjourney, alléguant que l'entreprise avait utilisé des personnages protégés (notamment Elsa, les Minions, Dark Vador et Homer Simpson) pour entraîner son modèle.

Les dispositifs d'exclusion proposés par les grandes plateformes (formulaires opt-out, directives robots.txt) sont largement perçus comme insuffisants. Comme le résume l'illustratrice Eva Toorenent, utilisatrice de Glaze : ces politiques d'exclusion obligent les artistes à franchir des obstacles administratifs tout en laissant aux entreprises technologiques l'intégralité du pouvoir. La charge de la preuve, le coût des procédures et la disproportion des moyens entre une artiste freelance et un laboratoire de recherche milliardaire rendent le recours juridique largement illusoire pour la majorité des créateurs concernés.

Du côté de la régulation, les initiatives législatives restent embryonnaires. Le Generative AI Copyright Disclosure Act, proposé au Congrès américain en 2024, envisageait d'imposer aux développeurs de modèles d'IA de divulguer les jeux de données utilisés pour l'entraînement, une mesure minimale, mais qui n'a pas encore abouti.

Jusqu'où va la légitimité du sabotage ?

La question philosophique posée par le thème ne peut toutefois se résoudre dans la seule rhétorique des droits bafoués. L'empoisonnement des données soulève des risques systémiques non négligeables. Même si les modèles venaient à être compromis (leurs résultats devenant incohérents, trompeurs ou absurdes), les utilisateurs leur font excessivement confiance. L'empoisonnement pourrait alors contribuer aux mêmes nuisances qu'il cherche à combattre, en amplifiant l'inexactitude de systèmes sur lesquels les humains s'appuient de plus en plus.

La distinction entre empoisonnement ciblé visant à protéger des droits identifiables et empoisonnement diffus ou malveillant visant à semer la confusion dans des systèmes d'infrastructure critique est donc cruciale. Un artiste qui protège ses propres œuvres avec Nightshade n'est pas équivalent à un acteur hostile qui injecte méthodiquement de fausses informations médicales dans des corpus destinés à l'entraînement de systèmes de santé.

Des outils de plus en plus techniquement complexes et synchronisés pourraient se révéler bien plus destructeurs que des groupes de trolls mal coordonnés ou des expériences de recherche contrôlées. L'escalade vers des formes d'empoisonnement massif et non discriminé porterait en elle des risques systémiques dont les victimes finales seraient souvent les utilisateurs ordinaires, et non les entreprises visées.

En définitive, l'enjeu n'est peut-être pas tant de trancher si l'empoisonnement des données est moralement légitime dans l'absolu, mais de s'interroger sur ce que son émergence révèle : les artistes ne cherchent pas nécessairement à détruire l'IA, mais à dégrader suffisamment la qualité de ses résultats pour préserver la valeur de la création humaine. Même une détérioration temporaire permettrait de gagner du temps pour obtenir de meilleures protections légales et développer de nouveaux modèles économiques pour les créateurs. Une stratégie de résistance qui, paradoxalement, révèle autant les failles des modèles techniques que les lacunes béantes du droit à l'ère de l'IA générative.

Sources : MIT, Université de Cambridge, Trust-Lightshed

Et vous ?

La frontière entre désobéissance civile numérique et cyberattaque est-elle traçable en droit, ou s'agit-il inévitablement d'une appréciation politique et contextuelle ?

Si des outils comme LightShed permettent aux entreprises de neutraliser silencieusement les protections des artistes, sans jamais le divulguer, cela constitue-t-il à son tour une forme de fraude ou de violation des droits ?

L'empoisonnement des données peut-il réellement changer le rapport de force entre artistes indépendants et géants de la tech, ou ne fait-il que retarder une domination inévitable ?

La pratique de nourrir les modèles avec leurs propres sorties, souvent sans intention délibérée, annonce-t-elle un effondrement progressif de la qualité des IA à long terme ?

Faut-il encadrer réglementairement la recherche en sécurité offensive sur les systèmes d'IA, au risque de freiner le développement de contre-mesures légitimes ?

Voir aussi :

Les modèles d'IA tels que ChatGPT, Gemini et Claude peuvent développer des vulnérabilités de type « porte dérobée » lorsque des documents corrompus sont insérés dans leurs données d'entraînement

Il est facile d'injecter de nouvelles informations médicales erronées dans les LLM, il suffit de modifier 0,001 % des données d'entrée pour rendre l'IA moins précise
Vous avez lu gratuitement 2 820 articles depuis plus d'un an.
Soutenez le club developpez.com en souscrivant un abonnement pour que nous puissions continuer à vous proposer des publications.

Une erreur dans cette actualité ? Signalez-nous-la !

Avatar de tatayo
Expert éminent sénior https://www.developpez.com
Le 23/04/2026 à 5:24
Bonjour,
S'introduire illégalement dans un réseau informatique pour y corrompre des données est un délit.
Publier des âneries, bidouiller des images pour que les I. A. pensent qu'Elvis est vivant ou confondent une voiture et une cocotte minute n'a pour moi rien d'un délit.
Sinon il faudrait poursuivre tous ceux qui publient de fausses informations sur internet, quelque soit le média, puisque ça peut induire une I. A. en erreur.
Surtout quand on voit que les sociétés derrière piétinent allègrement tout ce qui ressemble de près ou de loin à du droit d'auteur ou de la propriété intellectuelle.

Tatayo.
7  0 
Avatar de Anselme45
Membre extrêmement actif https://www.developpez.com
Le 24/04/2026 à 11:03
Répondre à un acte délictueux par un acte délictueux n'est pas une solution...

Posons-nous plutôt la vraie question: Pourquoi est-ce que la justice ne sanctionne pas les délits des géants techno californiens?

Parfait exemple de la "paresse" de la justice des hommes: Il a fallu plus de 1 000 accidents (dont plusieurs mortels) dus aux dysfonctionnements de l'auto-pilote de Tesla pour que la justice enquête.

L'excuse? Tesla a caché ces accidents et ce n'est que suite à une fuite de données (certainement due à un gentil ancien employé de Tesla) que l'on a appris la réalité des choses... C'est étonnant, tous les médias du monde ont parlé d'accidents de Tesla ayant entraîné la mort de leur conducteur... Perso, je n'ai pas eu besoin d'une fuite de données pour le savoir...

Est-ce que les juges et autres procureurs n'ont pas lu les journaux ces 10 dernières années?
2  0 
Avatar de forthx
Membre éprouvé https://www.developpez.com
Le 23/04/2026 à 14:06
J'ai envie de dire bêtement :
si l'utilisation d'une donnée est autorisé et est prévu a cet effet, c'est mal de l'empoisonner (ca pourrai s'apparenter à du sabotage).
si l'utilisation d'une donnée n'est pas explicitement autorisé ca me parait injuste que la responsabilité d'un "empoisonnement" soit reporté sur le producteur de la donnée.
1  0 
Avatar de
https://www.developpez.com
Le 22/04/2026 à 19:55
Empoisonner volontairement les données d’une IA est effectivement un "crime", puisque l’intention consiste à altérer des données ou le fonctionnement d’un système informatisé. Ensuite, en fonction du but final recherché, de nombreuses autres charges peuvent s’y ajouter. Le droit actuel en matière de piratage informatique est généralement suffisant pour entamer des poursuites pénales ou civiles.

Un acte de résistance est le fait d’un mouvement ou d’une idéologie politique clairement établis. À ma connaissance, il n’existe pour l’heure aucun mouvement ou parti réactionnaire anti-IA.

P.S. : Les loups solitaires qui rédigent et publient des manifesto pour justifier un acte de folie ne sont pas des résistants. Au mieux, ils font office d’idiots utiles.
0  8