Getty Images est bien connu pour sa vaste collection de millions d'images, y compris ses archives exclusives d'images historiques et sa plus large sélection d'images hébergées sur iStock. Vendredi, Getty a déposé une deuxième plainte contre Stability AI Inc pour empêcher l'utilisation et la duplication non autorisées de ses images de stock à l'aide de l'intelligence artificielle.
Selon le dernier procès intenté par la société devant un tribunal de district américain du Delaware, « Stability AI a copié plus de 12 millions de photographies de la collection de Getty Images, ainsi que les légendes et métadonnées associées, sans l'autorisation ni la compensation de Getty Images, dans le cadre de ses efforts pour bâtir une entreprise concurrente ».
Dans ce procès, Getty a allégué que Stability AI était allé jusqu'à supprimer les informations de gestion des droits d'auteur de Getty, falsifier ses propres informations de gestion des droits d'auteur et enfreindre les « marques célèbres » de Getty en dupliquant le filigrane de Getty sur certaines images. Reuters a rapporté que le deuxième procès de Getty contre Stability AI faisait suite au dépôt du mois dernier au Royaume-Uni. En plus de ces poursuites, Stability AI fait également face à un recours collectif d'artistes affirmant que la société a formé son modèle Stable Diffusion sur des milliards d'œuvres d'art protégées par le droit d'auteur sans indemniser les artistes ni demander la permission.
Le mois dernier, Getty a déclaré dans un communiqué que la société "croit que l'intelligence artificielle a le potentiel de stimuler les efforts créatifs", mais Stability AI a tenté de perturber potentiellement les activités d'imagerie de stock de la société dans le mauvais sens. Plutôt que de payer à Getty des licences pour former son modèle Stable Diffusion "d'une manière qui respecte les droits de propriété personnels et intellectuels", Getty a déclaré que "Stability AI n'a pas demandé une telle licence à Getty Images" et a apparemment "choisi d'ignorer les options de licence viables". et des protections juridiques de longue date dans la poursuite de leurs intérêts commerciaux autonomes ».
Stable Diffusion, qu'est-ce que c'est ?
Stable Diffusion est un produit logiciel d'intelligence artificielle (IA), lancé en août 2022 par une société appelée Stability AI. Selon Matthew Butterick, Stable Diffusion contient des copies non autorisées de millions, voire de milliards, d'images protégées par le droit d'auteur. Ces copies ont été faites à l'insu ou sans le consentement des artistes.
Même en supposant des dommages nominaux de 1 $ par image, la valeur de ce détournement serait d'environ 5 milliards de dollars (à titre de comparaison, le plus grand vol d'art jamais réalisé a été le vol en 1990 de 13 œuvres d'art du musée Isabella Stewart Gardner, d'une valeur actuelle estimée à 500 millions de dollars.)
Stable Diffusion appartient à une catégorie de systèmes d'IA appelée IA générative. Ces systèmes sont entraînés sur un certain type de travail créatif – par exemple du texte, du code logiciel ou des images – puis remixent ces travaux pour dériver (ou « générer ») d'autres travaux du même type.
Après avoir copié les cinq milliards d'images (sans le consentement des artistes originaux) Stable Diffusion s'appuie sur un processus mathématique appelé diffusion pour stocker des copies compressées de ces images d'entraînement, qui à leur tour sont recombinées pour dériver d'autres images. C'est, en bref, un outil de collage du 21e siècle.
Ces images résultantes peuvent ou non ressembler extérieurement aux images d'entraînement. Néanmoins, elles sont dérivées de copies des images de formation et leur font concurrence sur le marché. Au minimum, la capacité de Stable Diffusion à inonder le marché avec un nombre pratiquement illimité d'images contrefaisantes infligera des dommages permanents au marché de l'art et des artistes.
Même le PDG de Stability AI, Emad Mostaque, a prévu que « les [futurs] modèles [IA] seront entièrement sous licence ». Mais Stable Diffusion ne l'est pas. Pour Matthew, c'est un parasite qui, s'il est autorisé à proliférer, causera un préjudice irréparable aux artistes, aujourd'hui et à l'avenir.
Exposé des motifs
Envoyé par Getty Images
Getty est dans une position légèrement différente de celle des artistes, affirmant dans sa plainte la plus récente qu'elle est ciblée non seulement en raison de la qualité supérieure des images qu'elle héberge, mais également en raison de toutes les descriptions détaillées et métadonnées que Getty collecte. Une entreprise comme Stability AI peut utiliser ces données pour mieux répondre aux invites des utilisateurs, en utilisant essentiellement toutes les contributions de Getty pour concurrencer injustement le fournisseur d'images, selon l'entreprise.
Getty a demandé un procès devant jury « pour mettre fin à la conduite manifestement enfreinte de Stability AI et obtenir réparation pour le mépris impitoyable de Stability AI pour ses droits de propriété intellectuelle ». La société demande des dommages-intérêts, demandant au tribunal d'obliger « une comptabilité entière et complète à Getty Images sur les bénéfices, les gains, les avantages de Stability AI et la valeur des opportunités commerciales tirées de ses actes de contrefaçon ».
Qu'en pensent les experts ?
Les experts juridiques affirment que le cas de Getty Images est plus solide que le procès mené par l'artiste, mais avertissent que sur un territoire juridique aussi inconnu, il est impossible de prédire un résultat.
Andres Guadamaz, un universitaire britannique spécialisé dans l'IA et le droit d'auteur, a déclaré sur Twitter que la plainte de Getty était « très forte » : « La plainte est techniquement plus précise que le recours collectif », a estimé Guadamaz. « L'affaire reposera probablement sur la plainte pour violation [du droit d'auteur], et les défendeurs sont susceptibles de faire valoir une utilisation équitable. Cela pourrait aller dans les deux sens ».
Aaron Moss, avocat spécialisé dans le droit d'auteur chez Greenberg Glusker et éditeur du blog Copyright Lately, a tweeté : « La nouvelle plainte de Getty est bien meilleure que le recours collectif excessif dont j'ai parlé le mois dernier. L'accent est mis là où il devrait être*: l'ingestion d'images protégées par le droit d'auteur pour entraîner les données. Ce sera une bataille d'utilisation équitable fascinante ».
Moss, qui a été le premier à publier la plainte complète sur son blog, a noté que le recours collectif potentiel « était beaucoup plus axé sur les dommages professionnels causés aux artistes en activité par la prolifération des outils d'IA », tandis que Getty se concentre « sur le fait qu'il n'a pas été payé pour l'utilisation de ses images. Notamment, Getty a concédé sous licence ses images et ses métadonnées à d'autres générateurs d'art IA, soulignant le fait que Stability AI a délibérément fait du scrapping de ses images sans autorisation ».
Les arguments de violation du droit d'auteur dans le procès reposeront sur l'interprétation de la doctrine américaine de l'utilisation équitable, qui protège l'utilisation sans licence d'œuvres protégées par le droit d'auteur dans certains scénarios. Le concept « d'utilisation transformatrice » est également susceptible d'être un facteur important. La sortie de Stable Diffusion est-elle suffisamment différente de ses données d'apprentissage*? Des recherches récentes ont montré que le logiciel mémorise certaines de ses images d'entraînement et peut les reproduire presque exactement, bien que cela ne se produise que dans un très petit nombre de cas.
Un autre argument avancé par Getty Images concerne sa marque. Stable Diffusion est bien connu pour avoir recréé le filigrane de la société dans certaines de ses images, et Getty affirme que l'apparition de ce filigrane sur les « images bizarres ou grotesques » du modèle dilue la qualité des marques Getty Images en les floutant ou en les ternissant.
L'affaire sera cependant lente à avancer, a averti Moss. Il note que la plainte a été déposé devant le tribunal de district du Delaware et que le rôle du tribunal est « assez étayé ».
« Je traite actuellement une affaire là-bas, et on m'a dit que les juges mettent régulièrement des mois (parfois jusqu'à 6 à 9 mois) pour décider des requêtes de rejet après leur soumission », a déclaré Moss. « Il faudra probablement plusieurs années pour que l'affaire Getty Images passe par des requêtes de découverte et de jugement sommaire avant le procès ».
Il note que ces cas d'utilisation équitable nécessitent également la contribution des juges et des jurys. « Le jury tranche toutes les questions factuelles contestées, mais les questions juridiques ultimes sont censées être tranchées par un juge », explique Moss.
Sources : plainte, communiqué Getty Images, Andres Guadamaz, Aaron Moss