OpenAI conteste les affirmations des auteurs selon lesquelles chaque réponse de ChatGPT est une œuvre dérivée,

L'entreprise affirme que ces plaintes sont irrecevables et demande leur rejet

Le 31 août 2023 à 14:37, par Mathis Lucas

380PARTAGES

OpenAI conteste les affirmations des auteurs selon lesquelles chaque réponse de ChatGPT est une œuvre dérivée
l'entreprise affirme que ces plaintes sont irrecevables et demande leur rejet

OpenAI a demandé cette semaine à un tribunal fédéral de Californie de rejeter les plaintes pour violation du droit d'auteur qui le visent depuis peu. Plusieurs auteurs poursuivent la startup d'IA pour avoir utilisé des copies pirates de leurs livres afin d'entraîner ses modèles de langage, dont le plus célèbre est ChatGPT. Les auteurs affirment que cette utilisation non autorisée est en violation de plusieurs lois fédérales des États-Unis, dont celles sur le droit d'auteur et le DMCA (Digital Millennium Copyright Act). Mais OpenAI conteste ces allégations et a déposé des motions de rejet dans lesquelles il demande au tribunal de Californie de rejeter toutes les plaintes sauf une.

OpenAI affirme que les plaintes pour violation du droit d'auteur sont irrecevables

OpenAI, qui bénéficie du soutien de Microsoft, s'est attaqué lundi à ce qu'il a appelé des "revendications accessoires" dans les poursuites, déclarant au tribunal fédéral de Californie que le texte généré par ChatGPT ne violait pas les droits des auteurs sur les livres. En effet, le laboratoire d'IA de San Francisco fait face à un nombre très important de plaintes intentées par des milliers d'auteurs pour violation du droit d'auteur et pour d'autres formes de violations. Les personnalités les plus connues parmi les plaignants sont la comédienne Sarah Silverman, l'écrivain et éditeur Paul Tremblay, la romancière Mona Awad et l'écrivain de science-fiction Richard Kadrey.

L'entreprise a déposé lundi des requêtes en irrecevabilité dans le cadre de plusieurs actions en justice de ce type. Dans les documents déposés auprès du tribunal, OpenAI a demandé le rejet de cinq des six chefs d'accusation déposés dans le cadre des poursuites. OpenAI a défendu la nature transformative de sa technologie, soulignant la nécessité de trouver un équilibre entre la protection des droits d'auteur et le progrès technologique. L'entreprise a également déclaré qu'elle prévoyait de contester le dernier chef d'accusation de violation directe du droit d'auteur devant le tribunal en tant que question de droit. Elle n'a toutefois pas donné un calendrier.

« Les autres plaintes des auteurs - qui portent sur la violation du droit d'auteur par personne interposée, la violation du Digital Millennium Copyright Act (DMCA), la concurrence déloyale, la négligence et l'enrichissement sans cause - doivent être supprimées des poursuites afin que ces affaires n'aillent pas jusqu'au stade de la découverte et au-delà avec des théories de responsabilité juridiquement infirmes », a fait valoir OpenAI. Il a souligné la valeur et le potentiel de l'IA - en particulier de son grand modèle de langage (LLM) ChatGPT - dans l'amélioration de la productivité, l'aide au codage informatique et la simplification des tâches quotidiennes.

Les arguments avancés par OpenAI devant le tribunal ont été vivement critiqués par la communauté. Les critiques ont accusé la startup d'IA de chercher à redéfinir le droit d'auteur afin de profiter illégalement des œuvres des auteurs. « Vous pouvez commencer à voir l'histoire qu'ils vont raconter ici, à savoir que le droit d'auteur a des limites. Il ne s'étend pas aux faits et aux idées. Même si une œuvre est protégée par le droit d'auteur et qu'un LLM la traite ou en produise un résumé, il ne s'agit pas d'une œuvre dérivée à proprement parler », a déclaré Gregory Leighton, spécialiste du droit de la vie privée au cabinet d'avocats Polsinelli.

L'entreprise a comparé l'impact de ChatGPT à une révolution intellectuelle importante, établissant un parallèle avec l'invention de la presse à imprimer. OpenAI estime que les auteurs se font une fausse idée de la portée du droit d'auteur, en ne tenant pas compte des limitations et des exceptions (y compris l'utilisation équitable) qui laissent de la place aux innovations telles que les LLM. Selon OpenAI, même si les livres ne représentaient qu'une "infime partie" de l'ensemble de données massives de ChatGPT, "l'utilisation de matériel protégé par le droit d'auteur par des innovateurs de manière transformatrice ne viole pas le droit d'auteur".

Contrairement aux plagiaires qui cherchent à tirer directement profit de la distribution de matériel protégé par le droit d'auteur, OpenAI a fait valoir que son objectif était d'apprendre à ses modèles à dériver les règles qui sous-tendent le langage humain pour faire des choses comme : aider les gens à gagner du temps au travail, faciliter la vie quotidienne ou simplement se divertir en tapant des invites dans ChatGPT. Dans sa demande au tribunal, OpenAI va plus loin en expliquant que l'objectif de la loi sur le droit d'auteur est de promouvoir le progrès de la science et des arts utiles en protégeant la manière dont les auteurs expriment leurs idées.

OpenAI affirme que les plaignants s'appuient sur des preuves contradictoires

Selon OpenAI, la loi sur le droit d'auteur ne vise pas à protéger l'idée sous-jacente d'une œuvre, les faits incorporés dans le message articulé de l'auteur ou d'autres éléments constitutifs de la création, qui sont sans doute les éléments des œuvres des auteurs qui seraient utiles au modèle d'apprentissage de ChatGPT. Citant un cas notable de droit d'auteur impliquant Google Books, OpenAI a déclaré : « si un auteur peut enregistrer un droit d'auteur sur son livre, les données statistiques relatives à la fréquence des mots, aux schémas syntaxiques et aux marqueurs thématiques de ce livre sont hors de portée de la protection du droit d'auteur ».

« En vertu de la jurisprudence qui en découle, ne constitue pas une contrefaçon le fait de créer des copies en gros [d'une œuvre] en tant qu'étape préliminaire pour développer un nouveau produit non contrefait, même si le nouveau produit est en concurrence avec l'original », a ajouté l'OpenAI. En fin de compte, OpenAI espère convaincre le tribunal que l'allégation de violation du droit d'auteur par le fait d'autrui formulée par les auteurs - qui prétendent que chaque réponse de ChatGPT représente une œuvre dérivée, "qu'il y ait ou non des similitudes entre le produit et les œuvres de formation" - est une "conclusion juridique erronée".

OpenAI soutient que les plaignants n'ont pas suffisamment de preuves pour affirmer que les LLM produisent des œuvres dérivées et que si ces normes sont appliquées à plus grande échelle, les photographes pourraient poursuivre les peintres qui font référence à leur matériel. « Les preuves apportées par les plaignants concernant les informations de gestion des droits d'auteur étaient contradictoires et ne montraient pas comment elles avaient été volontairement supprimées », a déclaré l'entreprise. Selon OpenAI, il n'y a pas non plus de preuve qui appuie l'affirmation selon laquelle il aurait conservé des bénéfices ou des avantages tirés du matériel enfreint.

Selon les auteurs, toute sortie de ChatGPT qui copie leurs œuvres, mais exclut les informations de gestion des droits d'auteur (CMI) telles que les noms des auteurs ou les années de publication viole le DMCA. Les auteurs ont accusé OpenAI d'avoir intentionnellement supprimé les CMI pour "profiter injustement du développement d'un produit commercial basé sur des reproductions non attribuées de ces écrits et idées volés et s'en attribuer le mérite". Mais selon OpenAI, les plaintes des auteurs sont "cousues de fil blanc" et totalement dépourvues d'explications sur la manière dont OpenAI pourrait supprimer les informations de gestion des droits d'auteur.

OpenAI a affirmé qu'il n'y a aucune preuve que la société a intentionnellement supprimé les CMI, mais également que les plaintes des auteurs allèguent un certain nombre de faits qui contrediraient cette théorie - y compris des allégations selon lesquelles les livres des plaignants ont été copiés par OpenAI dans leur intégralité. La société a ajouté que si les CMI ont été supprimés des données de formation, il s'agissait probablement d'un effet secondaire involontaire d'un processus technologique - comme lorsqu'un moteur de recherche n'est pas responsable d'avoir récupéré des images sur Internet sans avoir également récupéré les CMI associés.

OpenAI affirme que ce type de retrait accidentel des CMI exclut la responsabilité et ne soutient pas les allégations selon lesquelles l'entreprise a agi pour déguiser des actes répréhensibles ou dissimuler des infractions. Enfin, OpenAI estime que les réclamations de négligence et d'enrichissement sans cause fondées sur la législation de l'État sont préemptées par la loi fédérale sur le droit d'auteur. Par conséquent, elles devraient être annulées.

OpenAI est accusé de vouloir réduire les protections de la loi sur droit d'auteur

Selon les critiques, si OpenAI obtient satisfaction, ce sera la mort du droit d'auteur en tant que concept. Ils estiment qu'OpenAI joue à un jeu dangereux qui pourrait nuire à ses propres partenaires. « C'est vrai sur le fond, mais il s'agit d'un tour de passe-passe intéressant. On ne devrait pas parler d'usage loyal dans une motion de rejet, parce que l'usage loyal est une défense affirmative. C'est en fait quelque chose que le défendeur doit plaider et prouver de manière affirmative. Il s'agissait probablement toujours de revendications accessoires et complémentaires, alors que le plat de résistance est la violation du droit d'auteur », a déclaré Leighton.

Les requêtes en irrecevabilité d'OpenAI sont fondées sur la nature transformative de ChatGPT, les principes d'utilisation équitable et les lacunes juridiques perçues dans les demandes annexes des plaignants. Les motions ont donné un aperçu de la défense globale des opérations en cours d'OpenAI alors que le laboratoire d'IA navigue à l'intersection complexe de la loi sur le droit d'auteur et de la réalisation de progrès dans le domaine de l'IA. Si OpenAI réussit à faire rejeter la majorité des actions en justice intentées par les auteurs, il ne restera plus à la Cour qu'à décider si le modèle de formation d'OpenAI viole directement la loi sur le droit d'auteur.

Selon les experts, cela pourrait signifier que les données d'entraînement de ChatGPT violent la loi soit en reproduisant et en distribuant les œuvres originales, soit en préparant des œuvres dérivées sans autorisation ou sans modifications suffisantes. « Il est toutefois peu probable que les auteurs abandonnent ce combat aussi facilement. Pour eux, l'IA générative est une énorme escroquerie qui ne contribue pas à faire progresser l'intelligence humaine, mais représente plutôt une copie de l'intelligence humaine qui a été reconditionnée et séparée de ses créateurs », a écrit le cabinet d'avocats Joseph Saveri sur un site Web résumant leurs plaintes.

Bien que Leighton estime que cette requête en irrecevabilité n'aura peut-être pas d'effets immédiats considérables, les enjeux de l'affaire dans son ensemble restent importants. En déterminant dans quelle mesure de grands modèles de langage peuvent être formés sur des œuvres protégées par le droit d'auteur sans enfreindre le droit d'auteur, l'issue des procès pourrait avoir des implications majeures pour les cas d'utilisation de l'IA, en particulier s'il est établi que l'ingestion d'œuvres protégées par le droit d'auteur enfreint toujours le droit d'auteur. « Nous avons un premier aperçu de ce qui va se passer », a déclaré Leighton.

« Ils présentent ces éléments au juge, non pas parce que cela a vraiment quelque chose à voir avec la motion de rejet elle-même et ce qu'ils essaient d'accomplir sur le plan procédural, mais c'est l'introduction thématique à la partie [d'OpenAI] de l'affaire ici », a-t-il ajouté. Au fur et à mesure que les procès se déroulent, ce conflit juridique définira probablement l'avenir de la législation sur le droit d'auteur et du progrès technologique.

Sources : OpenAI (1, 2), plaintes visant les LLM

Et vous ?

Quel est votre avis sur le sujet ?

Que pensez-vous des arguments présentés par OpenAI pour demander le rejet des plaintes pour violation du droit d'auteur ?

Selon vous, les arguments de l'entreprise sont-ils recevables ? Pourquoi ?

Que pensez-vous des allégations selon lesquelles OpenAI cherche à réduire la portée des protections offertes par la loi sur le droit d'auteur ?

Voir aussi

OpenAI tente désormais de cacher que ChatGPT a été formé sur des livres protégés par le droit d'auteur comme la série Harry Poter de J.K Rowling, selon une étude

Des auteurs de livres poursuivent OpenAI en justice, affirmant que la société a abusé de leurs travaux pour former ChatGPT. Selon eux, les livres sont un « ingrédient clé » du chabot IA

OpenAI et Meta accusés d'avoir utilisé les œuvres de Sarah Silverman et de deux auteurs sans leur consentement comme données d'entraînements de leurs IA. Les plaintes de ce type se multiplient

GitHub, Microsoft, OpenAI ne parviennent pas à se sortir du procès Copilot, le juge a refusé de rejeter deux plaintes dans l'affaire et a renvoyé la plupart des autres allégations

Vous avez lu gratuitement 15 445 articles depuis plus d'un an.
Soutenez le club developpez.com en souscrivant un abonnement pour que nous puissions continuer à vous proposer des publications.

Une erreur dans cette actualité ? Signalez-nous-la !

Votre nom : Votre e-mail :

Décrivez l'erreur que vous souhaitez porter à notre connaissance :