IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)

Vous êtes nouveau sur Developpez.com ? Créez votre compte ou connectez-vous afin de pouvoir participer !

Vous devez avoir un compte Developpez.com et être connecté pour pouvoir participer aux discussions.

Vous n'avez pas encore de compte Developpez.com ? Créez-en un en quelques instants, c'est entièrement gratuit !

Si vous disposez déjà d'un compte et qu'il est bien activé, connectez-vous à l'aide du formulaire ci-dessous.

Identifiez-vous
Identifiant
Mot de passe
Mot de passe oublié ?
Créer un compte

L'inscription est gratuite et ne vous prendra que quelques instants !

Je m'inscris !

OpenAI voit une partie de la plainte de Sarah Silverman rejetée dans une décision mitigée, incluant le rejet de violations du DMCA
Et de chefs d'accusation pour enrichissement sans cause

Le , par Bruno

6PARTAGES

3  0 
Dans une décision judiciaire mitigée, un tribunal californien a partiellement rejeté la plainte pour violation du droit d'auteur déposée contre OpenAI par un groupe d'auteurs, dont la comédienne Sarah Silverman. La juge Araceli Martínez-Olguín a rejeté plusieurs chefs d'accusation, y compris la violation par personne interposée, les violations du Digital Millennium Copyright Act (DMCA), la négligence et l'enrichissement sans cause. Cependant, la plainte principale, accusant OpenAI de violation directe des droits d'auteur avec son logiciel ChatGPT, a été maintenue.

La juge a exprimé son scepticisme face à certaines allégations des auteurs, soulignant le manque de preuves de préjudice économique. Les plaignants ont jusqu'au 13 mars pour apporter des modifications à leur plainte. Bien qu'OpenAI ait obtenu quelques concessions, la plainte centrale demeure, mettant en cause la prétendue utilisation illégale des œuvres des auteurs pour entraîner ChatGPT. Cette affaire s'inscrit dans le contexte de poursuites similaires à l'encontre d'OpenAI, impliquant d'autres auteurs notables comme George R.R. Martin et John Grisham.


Sarah Silverman, Christopher Golden, et Richard Kadrey, comédienne et auteurs respectivement, intentent des poursuites judiciaires contre OpenAI et Meta devant un tribunal de district américain, accusant les entreprises de violation du droit d'auteur. Selon les plaintes déposées à San Francisco, les deux sociétés auraient acquis illégalement les œuvres des plaignants à partir de sites de "bibliothèques fantômes" proposant des livres numérisés sans respecter les droits d'auteur. Les auteurs soutiennent que leurs œuvres ont été utilisées comme matériau d'entraînement pour les modèles d'IA sans leur consentement ni rémunération.

Les plaignants fournissent comme preuve la capacité des modèles d'IA à résumer leurs livres sur demande. Par exemple, ChatGPT peut résumer "The Bedwetter" de Sarah Silverman, publié en 2010, tandis que LLaMA peut faire de même pour les livres "Ararat" de Christopher Golden et "Sandman Slim" de Richard Kadrey, tous deux des romans fantastiques.

La plainte contre Meta soutient que les livres des auteurs étaient inclus dans les ensembles de données utilisés pour former les modèles LLaMA, une série de modèles d'IA open source introduits par la société. Les plaignants allèguent que les ensembles de données ont des origines illicites, citant un document de Meta détaillant LLaMA, qui mentionne l'utilisation de ThePile, un ensemble de données assemblé par EleutherAI, et identifié comme provenant d'une copie du contenu de la Bibliotik, un "traceur privé". Les "bibliothèques fantômes" mentionnées dans la plainte sont qualifiées d'"incontestablement illégales".

Les deux plaintes font valoir que les auteurs n'ont pas donné leur consentement à l'utilisation de leurs livres protégés par le droit d'auteur comme matériel d'entraînement. Elles comprennent chacune six chefs d'accusation, incluant diverses violations du droit d'auteur, de la négligence, de l'enrichissement sans cause et de la concurrence déloyale. Les auteurs demandent des dommages-intérêts légaux, la restitution des bénéfices, entre autres réparations.

OpenAI a tenté de négocier des accords de licence avec les éditeurs de presse dans le but d'utiliser leurs articles pour entraîner ses modèles d'IA, cherchant ainsi à éviter les multiples poursuites judiciaires pour violation du droit d'auteur auxquelles elle est confrontée. Cependant, les propositions faites par OpenAI ont été considérées comme peu généreuses. La société aurait offert aux médias aussi peu qu'un million de dollars par an pour obtenir un accès légal à leurs contenus. Bien que certaines sources suggèrent que ces offres pouvaient atteindre jusqu'à cinq millions de dollars annuels, les éditeurs ont manifesté leur réticence, craignant que ces licences ne soient trop avantageuses pour OpenAI. Il est important de noter que les revenus annuels d'OpenAI ont dépassé 1,6 milliard de dollars en 2023.

« Nous sommes au milieu de nombreuses négociations et discussions avec de nombreux éditeurs. Ils sont actifs. Ils sont très positifs. Elles progressent bien. Vous avez vu des accords annoncés, et il y en aura d'autres à l'avenir », a déclaré Tom Rubin, responsable de la propriété intellectuelle et du contenu chez OpenAI. Toutefois, les rapports sur le sujet font état d'une hésitation de la part des éditeurs.

OpenAI a récemment demandé à un tribunal fédéral de Californie de rejeter les récentes plaintes pour violation du droit d'auteur portées contre la société. Plusieurs auteurs, dont Sarah Silverman, accusent la startup d'IA d'avoir utilisé des copies non autorisées de leurs livres pour entraîner ses modèles de langage, tels que ChatGPT. Les plaignants allèguent une violation des lois fédérales américaines sur le droit d'auteur et le Digital Millennium Copyright Act (DMCA). Cependant, OpenAI a déposé des motions de rejet demandant au tribunal de Californie de rejeter toutes les plaintes, à l'exception d'une.

La société, soutenue par Microsoft, a qualifié les revendications dans les poursuites de « revendications accessoires », affirmant que le texte généré par ChatGPT ne violait pas les droits d'auteur des auteurs sur leurs livres. OpenAI est confrontée à un nombre important de plaintes de milliers d'auteurs, parmi lesquels figurent des personnalités notables telles que Sarah Silverman, Paul Tremblay, Mona Awad et Richard Kadrey.

Dans ses requêtes en irrecevabilité déposées lundi, OpenAI a demandé le rejet de cinq des six chefs d'accusation formulés dans les poursuites. La société a défendu la nature transformative de sa technologie, soulignant la nécessité d'équilibrer la protection des droits d'auteur et le progrès technologique. OpenAI a l'intention de contester le dernier chef d'accusation, la violation directe du droit d'auteur, devant le tribunal en tant que question de droit, bien qu'aucun calendrier n'ait été fourni.

La communauté a vivement critiqué les arguments avancés par OpenAI devant le tribunal, accusant la société de tenter de redéfinir le droit d'auteur pour exploiter illégalement les œuvres des auteurs. La société a comparé l'impact de ChatGPT à une révolution intellectuelle, évoquant l'invention de la presse à imprimer. OpenAI estime que les auteurs sous-estiment la portée du droit d'auteur en ne tenant pas compte des limitations et exceptions qui permettent des innovations telles que les modèles de langage.

OpenAI a soutenu que l'utilisation de matériel protégé par le droit d'auteur par des innovateurs, même si les livres ne constituaient qu'une petite partie des données massives de ChatGPT, ne violait pas le droit d'auteur. La société a affirmé que son objectif était d'apprendre à ses modèles à dériver les règles du langage humain pour des applications bénéfiques telles que l'amélioration de la productivité, l'aide au codage informatique et la simplification des tâches quotidiennes. La demande d'OpenAI au tribunal souligne que la loi sur le droit d'auteur vise à promouvoir le progrès scientifique et artistique en protégeant la manière dont les auteurs expriment leurs idées.

OpenAI a également contesté les preuves présentées par les plaignants, en affirmant que la loi sur le droit d'auteur ne protège pas l'idée sous-jacente d'une œuvre, les faits incorporés dans le message de l'auteur ou d'autres éléments constitutifs de la création. La société a cité un cas impliquant Google Books pour étayer son argument selon lequel des données statistiques, telles que la fréquence des mots et les schémas syntaxiques, échappent à la protection du droit d'auteur, même si l'auteur détient des droits sur le livre lui-même.

La décision judiciaire contre OpenAI soulève des inquiétudes

La décision du juge fédéral de rejeter une partie, mais pas la totalité, des plaintes déposées dans le cadre de l'action en justice fait écho à une décision rendue dans le cadre d'un autre procès intenté par certains des mêmes auteurs plaignants (dont Mme Silverman) contre Meta au sujet de la manière dont cette société forme ses modèles linguistiques d'intelligence artificielle.

La principale demande rejetée par le juge était l'allégation de violation du droit d'auteur pour le compte d'autrui, qui soutenait essentiellement que chaque réponse générée par ChatGPT devait être considérée comme une contrefaçon parce que le modèle de langage aurait été formé à partir d'éléments protégés par le droit d'auteur et ne faisant pas l'objet d'une licence. Le juge a qualifié cette allégation d'« insuffisante », déclarant que les plaignants « n'expliquent pas ce que les résultats impliquent ou n'allèguent pas qu'un résultat particulier est substantiellement similaire - ou similaire du tout - à leurs livres ».

En outre, le juge a déclaré qu'il n'y avait aucune preuve à l'appui de l'allégation des auteurs selon laquelle OpenAI avait violé le Digital Millennium Copyright Act en supprimant les informations pertinentes sur les droits d'auteur du matériel sur lequel elle formait son modèle afin de dissimuler sa prétendue violation des droits d'auteur. Les plaintes pour négligence et enrichissement sans cause ont également été rejetées.

L'action en justice a cependant encore du mordant. Le juge a refusé de rejeter une plainte pour concurrence déloyale fondée sur l'allégation principale selon laquelle OpenAI a utilisé des œuvres protégées par le droit d'auteur pour entraîner ses modèles de langage à des fins commerciales. La décision judiciaire soulève des préoccupations significatives quant à la protection des droits d'auteur dans le contexte de l'intelligence artificielle. Il suscite des inquiétudes quant à la capacité des tribunaux à traiter efficacement les aspects complexes des litiges liés à l'IA.

Les conséquences néfastes d'une telle décision sur la protection des droits d'auteur sont significatives. Elle pourrait établir un précédent selon lequel les entreprises de l'IA pourraient potentiellement contourner les obligations de rémunération et d'autorisation préalable des créateurs, fragilisant ainsi le principe fondamental du droit d'auteur. En permettant aux entreprises d'IA d'utiliser des œuvres sans le consentement explicite des auteurs, cela pourrait compromettre la juste rémunération des créateurs pour leur travail intellectuel.


Par ailleurs, la décision risque d'avoir des répercussions sur la créativité artistique en décourageant les auteurs d'exprimer librement leurs idées et de partager leur travail, sachant que les entreprises d'IA pourraient potentiellement exploiter leurs œuvres sans une protection adéquate.

Il est crucial que les tribunaux traitent ces affaires avec une compréhension approfondie des enjeux liés à l'IA et au droit d'auteur, afin de garantir une protection adéquate des droits des auteurs dans un paysage technologique en constante évolution. Une jurisprudence claire et équilibrée est nécessaire pour maintenir un juste équilibre entre l'innovation technologique et la protection des droits créatifs.

Source : California court

Et vous ?

Quel est votre avis sur le sujet ?

Comment la décision du tribunal de rejeter certaines parties de la plainte de Sarah Silverman contre OpenAI pourrait-elle influencer la manière dont les litiges liés au droit d'auteur sont traités dans le contexte de l'intelligence artificielle ?

Quelles implications cette décision mitigée pourrait-elle avoir sur la capacité des créateurs de protéger efficacement leurs œuvres contre une utilisation non autorisée par des entreprises d'IA ?

Voir aussi :

OpenAI tente désormais de cacher que ChatGPT a été formé sur des livres protégés par le droit d'auteur, comme la série Harry Poter de J.K Rowling, selon une étude

OpenAI conteste les affirmations des auteurs selon lesquelles chaque réponse de ChatGPT est une œuvre dérivée, l'entreprise affirme que ces plaintes sont irrecevables et demande leur rejet

OpenAI proposerait aux éditeurs des offres aussi "dérisoires" qu'un million de dollars par an afin d'utiliser leurs articles pour entraîner ses modèles d'IA, selon un rapport

Une erreur dans cette actualité ? Signalez-nous-la !

Avatar de OrthodoxWindows
Membre émérite https://www.developpez.com
Le 08/04/2024 à 10:48
Tant que GPT-4 ne bloque pas les publicités lors de son visionnage, pour Youtube ça ne devrait pas poser de problèmes.

8  0 
Avatar de Leruas
Membre éclairé https://www.developpez.com
Le 08/04/2024 à 21:24
Heureusement qu'ils n'ont pas entrainé GPT-4 sur des vidéos TikTok
3  0 
Avatar de Jules34
Membre expérimenté https://www.developpez.com
Le 08/04/2024 à 11:44
Personne se dit qu'en s'entrainant sur youtube un modele d'IA à plus de chambre de finir par ressembler au cousin dégénéré du moyen-âge qu'à un Leonard de Vinci 3.0 ?

L'IA entrainé à Pewdiepie c'est le début la fin des temps.
3  2 
Avatar de maxtal
Membre actif https://www.developpez.com
Le 10/04/2024 à 15:11
si ils viraient leurs brides idéologiques ça irait peut être déjà un peu plus loin
1  0 
Avatar de irrmichael
Membre du Club https://www.developpez.com
Le 28/02/2024 à 22:54
c'est un peu gros non?
0  0 
Avatar de Matthieu Vergne
Expert éminent https://www.developpez.com
Le 29/02/2024 à 2:24
Plus c'est gros, plus ça passe. C'est un principe de base. {^_^}
0  0 
Avatar de TJ1985
Membre chevronné https://www.developpez.com
Le 13/04/2024 à 8:38
Citation Envoyé par impopia Voir le message
Évidemment que, lorsque l'"IA" s'inspire de tout contenu digital présent sur Internet ou ailleurs, il ne peut pas y avoir lieu de "générer" qqch si ce n'est pas de copier des morceaux qu'elle a appris et de les mettre ensemble. Vous ne verrez jamais quelque chose de vraiment nouveau, il y aura toujours des morceaux copiés mis ensemble.
Dans quelle mesure sommes-nous vraiment libres de nos créations, qu'est-ce qui nous distingue fondamentalement de ces systèmes, hormis le volume d'apprentissage ?
Sûr ce point, il faut reprendre les chiffres de Yann LeCun. Un gosse de quatre ans ridiculise en masse d'information acquise n'importe quel "grand modèle" d'aujourd'hui. Et il continue à apprendre à chaque instant, lui...
0  0 
Avatar de impopia
Membre régulier https://www.developpez.com
Le 13/04/2024 à 8:19
Évidemment que, lorsque l'"IA" s'inspire de tout contenu digital présent sur Internet ou ailleurs, il ne peut pas y avoir lieu de "générer" qqch si ce n'est pas de copier des morceaux qu'elle a appris et de les mettre ensemble. Vous ne verrez jamais quelque chose de vraiment nouveau, il y aura toujours des morceaux copiés mis ensemble. Donc techniquement c'est une géante "violation des droits d'auteur", même s'il peut s'agir de contenu "libre" qui est utilisé. S'il n'y avait pas ce contenu libre et que tout était protégé par des droit d'auteur, pourrait-on parler d'IA du point de vue légal ?...
0  1