Getty Images poursuit le générateur d'art IA Stable Diffusion pour violation du droit d'auteur

L'accusant d'avoir utilisé 12 millions d'images pour former son IA « sans autorisation ni compensation »

Le 7 février 2023 à 08:39, par Stéphane le calme

56PARTAGES

Getty Images poursuit le générateur d'art IA Stable Diffusion pour violation du droit d'auteur,
accusant la société de s'être servie de 12 millions d'images pour former son modèle d'IA « sans autorisation … ni compensation »

Getty Images a déposé une plainte aux États-Unis contre Stability AI, les créateurs du générateur d'art IA open source Stable Diffusion, intensifiant sa bataille juridique contre l'entreprise. La banque d'images accuse Stability AI de « violation éhontée de la propriété intellectuelle de Getty Images à une échelle stupéfiante ». Elle affirme que Stability AI a copié plus de 12 millions d'images de sa base de données « sans autorisation ... ni compensation ... dans le cadre de ses efforts pour créer une entreprise concurrente », et que la startup a enfreint à la fois le droit d'auteur et la protection de la marque de commerce de l'entreprise.

Getty Images est bien connu pour sa vaste collection de millions d'images, y compris ses archives exclusives d'images historiques et sa plus large sélection d'images hébergées sur iStock. Vendredi, Getty a déposé une deuxième plainte contre Stability AI Inc pour empêcher l'utilisation et la duplication non autorisées de ses images de stock à l'aide de l'intelligence artificielle.

Selon le dernier procès intenté par la société devant un tribunal de district américain du Delaware, « Stability AI a copié plus de 12 millions de photographies de la collection de Getty Images, ainsi que les légendes et métadonnées associées, sans l'autorisation ni la compensation de Getty Images, dans le cadre de ses efforts pour bâtir une entreprise concurrente ».

Dans ce procès, Getty a allégué que Stability AI était allé jusqu'à supprimer les informations de gestion des droits d'auteur de Getty, falsifier ses propres informations de gestion des droits d'auteur et enfreindre les « marques célèbres » de Getty en dupliquant le filigrane de Getty sur certaines images. Reuters a rapporté que le deuxième procès de Getty contre Stability AI faisait suite au dépôt du mois dernier au Royaume-Uni. En plus de ces poursuites, Stability AI fait également face à un recours collectif d'artistes affirmant que la société a formé son modèle Stable Diffusion sur des milliards d'œuvres d'art protégées par le droit d'auteur sans indemniser les artistes ni demander la permission.

Le mois dernier, Getty a déclaré dans un communiqué que la société "croit que l'intelligence artificielle a le potentiel de stimuler les efforts créatifs", mais Stability AI a tenté de perturber potentiellement les activités d'imagerie de stock de la société dans le mauvais sens. Plutôt que de payer à Getty des licences pour former son modèle Stable Diffusion "d'une manière qui respecte les droits de propriété personnels et intellectuels", Getty a déclaré que "Stability AI n'a pas demandé une telle licence à Getty Images" et a apparemment "choisi d'ignorer les options de licence viables". et des protections juridiques de longue date dans la poursuite de leurs intérêts commerciaux autonomes ».

Stable Diffusion, qu'est-ce que c'est ?

Stable Diffusion est un produit logiciel d'intelligence artificielle (IA), lancé en août 2022 par une société appelée Stability AI. Selon Matthew Butterick, Stable Diffusion contient des copies non autorisées de millions, voire de milliards, d'images protégées par le droit d'auteur. Ces copies ont été faites à l'insu ou sans le consentement des artistes.

Même en supposant des dommages nominaux de 1 $ par image, la valeur de ce détournement serait d'environ 5 milliards de dollars (à titre de comparaison, le plus grand vol d'art jamais réalisé a été le vol en 1990 de 13 œuvres d'art du musée Isabella Stewart Gardner, d'une valeur actuelle estimée à 500 millions de dollars.)

Stable Diffusion appartient à une catégorie de systèmes d'IA appelée IA générative. Ces systèmes sont entraînés sur un certain type de travail créatif – par exemple du texte, du code logiciel ou des images – puis remixent ces travaux pour dériver (ou « générer ») d'autres travaux du même type.

Après avoir copié les cinq milliards d'images (sans le consentement des artistes originaux) Stable Diffusion s'appuie sur un processus mathématique appelé diffusion pour stocker des copies compressées de ces images d'entraînement, qui à leur tour sont recombinées pour dériver d'autres images. C'est, en bref, un outil de collage du 21^e siècle.

Ces images résultantes peuvent ou non ressembler extérieurement aux images d'entraînement. Néanmoins, elles sont dérivées de copies des images de formation et leur font concurrence sur le marché. Au minimum, la capacité de Stable Diffusion à inonder le marché avec un nombre pratiquement illimité d'images contrefaisantes infligera des dommages permanents au marché de l'art et des artistes.

Même le PDG de Stability AI, Emad Mostaque, a prévu que « les [futurs] modèles [IA] seront entièrement sous licence ». Mais Stable Diffusion ne l'est pas. Pour Matthew, c'est un parasite qui, s'il est autorisé à proliférer, causera un préjudice irréparable aux artistes, aujourd'hui et à l'avenir.

Exposé des motifs

Envoyé par Getty Images

Getty Images sert des clients créatifs, commerciaux et médiatiques dans plus de 200 pays à travers le monde, et ses images aident ses clients à produire des œuvres qui apparaissent chaque jour dans les journaux, magazines, campagnes publicitaires, films, programmes télévisés, livres, sites internet et autres médias les plus influents au monde. Dans des circonstances appropriées, et avec des garanties pour les droits et les intérêts de ses photographes et contributeurs et des sujets des images de sa collection, Getty Images autorise également l'utilisation de ses actifs visuels et des métadonnées associées en relation avec le développement de l'intelligence artificielle et des outils d'apprentissage automatique. Getty Images a concédé sous licence des millions d'actifs numériques appropriés à des innovateurs technologiques de premier plan à diverses fins liées à l'intelligence artificielle et à l'apprentissage automatique.

Les ressources visuelles de Getty Images sont hautement souhaitables pour une utilisation dans le cadre de l'intelligence artificielle et de l'apprentissage automatique en raison de leur haute qualité et parce qu'elles sont accompagnées de légendes détaillées spécifiques au contenu et de métadonnées riches.

Sur la base d'informations et de convictions, Stability AI a été fondée en 2020 par Emad Mostaque, un ancien dirigeant de fonds spéculatifs, en tant qu'entreprise à but lucratif. Selon des articles de presse récents, Stability AI a récemment levé plus de 100 millions de dollars auprès d'investisseurs en capital-risque et est
déjà évalué à 1 milliard de dollars. Sur le dos de la propriété intellectuelle détenue par Getty Images et d'autres détenteurs de droits d'auteur, Stability AI a créé un modèle de génération d'images appelé Stable Diffusion qui utilise l'intelligence artificielle pour fournir des images synthétisées par ordinateur en réponse à des invites textuelles. En plus d'offrir des versions open source de Stable Diffusion, Stability AI propose une interface utilisateur génératrice de revenus appelée DreamStudio qui est alimentée par son modèle Stable Diffusion. DreamStudio permet aux utilisateurs d'obtenir des images du modèle Stable Diffusion sur leurs propres ordinateurs personnels sans avoir besoin d'installation de logiciel ou de connaissances en codage, et Stability AI facture des frais pour ce service.

Plutôt que de tenter de négocier une licence avec Getty Images pour l'utilisation de son contenu, et même si les conditions d'utilisation des sites Web de Getty Images interdisent expressément la reproduction non autorisée de contenu à des fins commerciales telles que celles entreprises par Stability AI, Stability AI a copié au moins 12 millions d'images protégées par le droit d'auteur des sites Web de Getty Images, ainsi que le texte et les métadonnées associés, afin de former son modèle Stable Diffusion.

Stability AI est désormais en concurrence directe avec Getty Images en commercialisant Stable Diffusion et son interface DreamStudio auprès de ceux qui recherchent des images créatives, et sa violation du contenu de Getty Images à grande échelle a contribué à son succès à ce jour.

Sur la base d'informations et de convictions, Stability AI était bien consciente que le contenu qu'elle glanait sans l'autorisation des sites Web de Getty Images était protégé par le droit d'auteur.

Souvent, la sortie générée par Stable Diffusion contient une version modifiée d'un filigrane Getty Images, créant une confusion quant à la source des images et impliquant à tort une association avec Getty Images. Alors que certains des résultats générés par l'utilisation de Stable Diffusion sont esthétiquement agréables, d'autres sont de bien moindre qualité et vont parfois du bizarre au grotesque. L'incorporation par Stability AI des marques de Getty Images dans des images de mauvaise qualité, peu attrayantes ou offensantes dilue ces marques en violation supplémentaire des lois fédérales et étatiques sur les marques.

Jusqu'à présent, on ne sait toujours pas quel statut juridique les titulaires de droits d'image, qu'il s'agisse de Getty ou d'un artiste individuel, ont sur les entreprises qui récupèrent librement des images sur des sites Web pour former des systèmes d'IA comme Stable Diffusion sans consentement. Si le tribunal se range du côté de Getty, cela pourrait répondre à certaines des questions juridiques que de nombreux artistes se posent depuis le début de la controverse. Notamment, Stability AI a quelque peu sympathisé avec les artistes qui protestaient contre la technologie, annonçant le mois dernier un plan pour permettre aux artistes de se retirer des efforts de formation à l'image.

Getty est dans une position légèrement différente de celle des artistes, affirmant dans sa plainte la plus récente qu'elle est ciblée non seulement en raison de la qualité supérieure des images qu'elle héberge, mais également en raison de toutes les descriptions détaillées et métadonnées que Getty collecte. Une entreprise comme Stability AI peut utiliser ces données pour mieux répondre aux invites des utilisateurs, en utilisant essentiellement toutes les contributions de Getty pour concurrencer injustement le fournisseur d'images, selon l'entreprise.

Getty a demandé un procès devant jury « pour mettre fin à la conduite manifestement enfreinte de Stability AI et obtenir réparation pour le mépris impitoyable de Stability AI pour ses droits de propriété intellectuelle ». La société demande des dommages-intérêts, demandant au tribunal d'obliger « une comptabilité entière et complète à Getty Images sur les bénéfices, les gains, les avantages de Stability AI et la valeur des opportunités commerciales tirées de ses actes de contrefaçon ».

Qu'en pensent les experts ?

Les experts juridiques affirment que le cas de Getty Images est plus solide que le procès mené par l'artiste, mais avertissent que sur un territoire juridique aussi inconnu, il est impossible de prédire un résultat.

Andres Guadamaz, un universitaire britannique spécialisé dans l'IA et le droit d'auteur, a déclaré sur Twitter que la plainte de Getty était « très forte » : « La plainte est techniquement plus précise que le recours collectif », a estimé Guadamaz. « L'affaire reposera probablement sur la plainte pour violation [du droit d'auteur], et les défendeurs sont susceptibles de faire valoir une utilisation équitable. Cela pourrait aller dans les deux sens ».

Aaron Moss, avocat spécialisé dans le droit d'auteur chez Greenberg Glusker et éditeur du blog Copyright Lately, a tweeté : « La nouvelle plainte de Getty est bien meilleure que le recours collectif excessif dont j'ai parlé le mois dernier. L'accent est mis là où il devrait être*: l'ingestion d'images protégées par le droit d'auteur pour entraîner les données. Ce sera une bataille d'utilisation équitable fascinante ».

Moss, qui a été le premier à publier la plainte complète sur son blog, a noté que le recours collectif potentiel « était beaucoup plus axé sur les dommages professionnels causés aux artistes en activité par la prolifération des outils d'IA », tandis que Getty se concentre « sur le fait qu'il n'a pas été payé pour l'utilisation de ses images. Notamment, Getty a concédé sous licence ses images et ses métadonnées à d'autres générateurs d'art IA, soulignant le fait que Stability AI a délibérément fait du scrapping de ses images sans autorisation ».

Les arguments de violation du droit d'auteur dans le procès reposeront sur l'interprétation de la doctrine américaine de l'utilisation équitable, qui protège l'utilisation sans licence d'œuvres protégées par le droit d'auteur dans certains scénarios. Le concept « d'utilisation transformatrice » est également susceptible d'être un facteur important. La sortie de Stable Diffusion est-elle suffisamment différente de ses données d'apprentissage*? Des recherches récentes ont montré que le logiciel mémorise certaines de ses images d'entraînement et peut les reproduire presque exactement, bien que cela ne se produise que dans un très petit nombre de cas.

Un autre argument avancé par Getty Images concerne sa marque. Stable Diffusion est bien connu pour avoir recréé le filigrane de la société dans certaines de ses images, et Getty affirme que l'apparition de ce filigrane sur les « images bizarres ou grotesques » du modèle dilue la qualité des marques Getty Images en les floutant ou en les ternissant.

L'affaire sera cependant lente à avancer, a averti Moss. Il note que la plainte a été déposé devant le tribunal de district du Delaware et que le rôle du tribunal est « assez étayé ».

« Je traite actuellement une affaire là-bas, et on m'a dit que les juges mettent régulièrement des mois (parfois jusqu'à 6 à 9 mois) pour décider des requêtes de rejet après leur soumission », a déclaré Moss. « Il faudra probablement plusieurs années pour que l'affaire Getty Images passe par des requêtes de découverte et de jugement sommaire avant le procès ».

Il note que ces cas d'utilisation équitable nécessitent également la contribution des juges et des jurys. « Le jury tranche toutes les questions factuelles contestées, mais les questions juridiques ultimes sont censées être tranchées par un juge », explique Moss.

Sources : plainte, communiqué Getty Images, Andres Guadamaz, Aaron Moss

Vous avez lu gratuitement 758 articles depuis plus d'un an.
Soutenez le club developpez.com en souscrivant un abonnement pour que nous puissions continuer à vous proposer des publications.

Une erreur dans cette actualité ? Signalez-nous-la !

Votre nom : Votre e-mail :

Décrivez l'erreur que vous souhaitez porter à notre connaissance :