11 auteurs dont des lauréats du prix Pulitzer~? se sont joints à une action en justice qui accuse OpenAI et Microsoft de violer leurs droits d'auteur pour entraîner ChatGPT

Le 2023-12-21 05:41:03, par Jade Emy, Communiqués de presse

Un groupe de 11 auteurs d'ouvrages non-romanesques s'est joint à une action en justice devant le tribunal fédéral de Manhattan qui accuse OpenAI et Microsoft d'utiliser abusivement les livres que les auteurs ont écrits pour entraîner les modèles qui sous-tendent le populaire chatbot ChatGPT d'OpenAI et d'autres logiciels basés sur l'intelligence artificielle.

Les auteurs, dont Taylor Branch, Stacy Schiff et Kai Bird, lauréats du prix Pulitzer et coauteurs de la biographie de J. Robert Oppenheimer "American Prometheus", adaptée cette année dans le film à succès "Oppenheimer", ont déclaré au tribunal que les entreprises avaient violé leurs droits d'auteur en utilisant leurs œuvres pour entraîner les modèles de langage à grande échelle GPT d'OpenAI.

"Les défendeurs engrangent des milliards grâce à l'utilisation non autorisée de livres de non-fiction, et les auteurs de ces livres méritent une compensation et un traitement équitables pour cela", a déclaré l'avocat des écrivains, Rohit Nath.

Julian Sancton, écrivain et rédacteur en chef du Hollywood Reporter, a déposé la première proposition de recours collectif le mois dernier. Il s'agit de l'une des nombreuses actions intentées par des groupes de détenteurs de droits d'auteur, dont les auteurs John Grisham, George R.R. Martin et Jonathan Franzen, contre OpenAI et d'autres entreprises technologiques pour utilisation abusive présumée de leurs œuvres dans l'apprentissage de l'IA. Les entreprises ont nié ces allégations.

Le procès de Sancton est le premier procès d'auteur contre OpenAI à citer également Microsoft comme défendeur. Le géant de la technologie a investi des milliards de dollars dans la startup d'intelligence artificielle et a intégré les systèmes d'OpenAI dans ses produits.

La plainte modifiée indique qu'OpenAI a "récupéré" les œuvres des auteurs ainsi que des quantités d'autres documents protégés par le droit d'auteur sur l'internet, sans autorisation, afin d'enseigner à ses modèles GPT comment répondre à des messages textuels humains. L'action en justice indique également que Microsoft a été "profondément impliqué" dans la formation et le développement des modèles et qu'il est également responsable de la violation des droits d'auteur.

Les auteurs ont demandé au tribunal de leur accorder un montant non précisé de dommages et intérêts et d'ordonner aux entreprises de cesser de violer leurs droits d'auteur.

Et vous ?

Quel est votre avis sur le sujet ?

Voir aussi :

George R.R, romancier de "Game of Thrones", John Grisham et d'autres grands auteurs américains poursuivent OpenAI pour des questions de droits d'auteur

Des auteurs de livres poursuivent OpenAI en justice, affirmant que la société a abusé de leurs travaux pour former ChatGPT. Selon eux, les livres sont un « ingrédient clé » du chabot IA

OpenAI tente désormais de cacher que ChatGPT a été formé sur des livres protégés par le droit d'auteur comme la série Harry Poter de J.K Rowling, selon une étude

Discussion forum

97 commentaires

OrthodoxWindows
Membre émérite

Tant que GPT-4 ne bloque pas les publicités lors de son visionnage, pour Youtube ça ne devrait pas poser de problèmes.

le 08/04/2024 à 10:48
Leruas
Membre éclairé

Heureusement qu'ils n'ont pas entrainé GPT-4 sur des vidéos TikTok

le 08/04/2024 à 21:24
totozor
Membre expert

Envoyé par Stéphane le calme

Êtes-vous surpris de voir les IA génératives s'appuyer sur des œuvres protégées même lorsqu'elles ne sont pas mentionnées en entrée ?

Non, si la demande réclame une chose qui n'est flaggée que sur une œuvre, elle risque fort de ressortir telle quelle ou presque.

Cela constitue-t-il, selon vous, une violation du droit d'auteur ? Dans quelle mesure ?
Que pensez-vous du raisonnement de Gary Marcus qui pense que le problème va toujours exister tant qu'il n'y a pas une modification de l'architecture pour permettre d'identifier les sources ?
Que pensez-vous de l'argumentation de Zack qui indique que le cas soulevé par le New-York Times ne relève pas du droit d'auteur ?

Je suis loin d'être un spécialiste du droit d'auteur donc il est compliqué de se prononcer mais j'ai retenu une chose de mes cours de droits : (en France) concernant les marques et logos, la "copie" n'est pas évaluée sur les différences mais sur la ressemblance.
Zack parle du processus de copie, ce qui me semble hors de propos, si tu retranscrits un texte numérisé en le même texte numérisé ça me semble être simplement du viol de propriété intellectuelle.
Je verrais plus une question sur l'exploitation commerciale, j'ai le droit d'imprimer mon propre Tshirt avec la couverture de Nevermind de Nirvana mais je n'ai pas le droit de le vendre.

le 02/01/2024 à 7:54
Jules34
Membre chevronné

Personne se dit qu'en s'entrainant sur youtube un modele d'IA à plus de chambre de finir par ressembler au cousin dégénéré du moyen-âge qu'à un Leonard de Vinci 3.0 ?

L'IA entrainé à Pewdiepie c'est le début la fin des temps.

le 08/04/2024 à 11:44
maxtal
Membre actif

si ils viraient leurs brides idéologiques ça irait peut être déjà un peu plus loin

le 10/04/2024 à 15:11
ManPaq
Membre averti

C'est le même problème qui a conduit Google à payer une amende de 500M$ en 21:

La directive européenne de 2019 impose aux plates-formes et aux GAFA (tel YouTube) de conclure avec les ayants droit des accords pour les rémunérer lorsqu’un utilisateur ou les algorithmes du système postent une œuvre (un texte, une chanson, un film…) sur lesquels ces ayants-droit ont des droits. Si la plate-forme ou le géant du net ne concluent pas un accord juste, ils encourent des poursuites pour non-respect de ces droits voisins du fait de la publication d’œuvres protégées sur leur réseau. Les plates-formes en ligne doivent en outre rémunérer les éditeurs de presse dont elles republient les contenus.Contenu soumis à la licence CC-BY-SA 4.0. Source : Article Droits voisins du droit d'auteur en France de Wikipédia en français :auteurs.

le 23/01/2024 à 5:25
irrmichael
Membre du Club

c'est un peu gros non?

le 28/02/2024 à 22:54
Matthieu Vergne
Expert éminent

Plus c'est gros, plus ça passe. C'est un principe de base. {^_^}

le 29/02/2024 à 2:24
TJ1985
Membre chevronné

Envoyé par impopia

Évidemment que, lorsque l'"IA" s'inspire de tout contenu digital présent sur Internet ou ailleurs, il ne peut pas y avoir lieu de "générer" qqch si ce n'est pas de copier des morceaux qu'elle a appris et de les mettre ensemble. Vous ne verrez jamais quelque chose de vraiment nouveau, il y aura toujours des morceaux copiés mis ensemble.

Dans quelle mesure sommes-nous vraiment libres de nos créations, qu'est-ce qui nous distingue fondamentalement de ces systèmes, hormis le volume d'apprentissage ?
Sûr ce point, il faut reprendre les chiffres de Yann LeCun. Un gosse de quatre ans ridiculise en masse d'information acquise n'importe quel "grand modèle" d'aujourd'hui. Et il continue à apprendre à chaque instant, lui...

le 13/04/2024 à 8:38
impopia
Membre régulier

Évidemment que, lorsque l'"IA" s'inspire de tout contenu digital présent sur Internet ou ailleurs, il ne peut pas y avoir lieu de "générer" qqch si ce n'est pas de copier des morceaux qu'elle a appris et de les mettre ensemble. Vous ne verrez jamais quelque chose de vraiment nouveau, il y aura toujours des morceaux copiés mis ensemble. Donc techniquement c'est une géante "violation des droits d'auteur", même s'il peut s'agir de contenu "libre" qui est utilisé. S'il n'y avait pas ce contenu libre et que tout était protégé par des droit d'auteur, pourrait-on parler d'IA du point de vue légal ?...

le 13/04/2024 à 8:19

Poster une réponse