IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)

Vous êtes nouveau sur Developpez.com ? Créez votre compte ou connectez-vous afin de pouvoir participer !

Vous devez avoir un compte Developpez.com et être connecté pour pouvoir participer aux discussions.

Vous n'avez pas encore de compte Developpez.com ? Créez-en un en quelques instants, c'est entièrement gratuit !

Si vous disposez déjà d'un compte et qu'il est bien activé, connectez-vous à l'aide du formulaire ci-dessous.

Identifiez-vous
Identifiant
Mot de passe
Mot de passe oublié ?
Créer un compte

L'inscription est gratuite et ne vous prendra que quelques instants !

Je m'inscris !

Des milliers d'auteurs s'opposent à l'exploitation de leur travail sans permission ni rémunération par l'IA générative
Certains ont déjà intenté des actions en justice contre OpenAI

Le , par Stéphane le calme

11PARTAGES

5  0 
Des milliers d’auteurs, dont Nora Roberts, Viet Thanh Nguyen, Michael Chabon et Margaret Atwood, ont signé une lettre demandant aux entreprises d’intelligence artificielle comme OpenAI et Meta de cesser d’utiliser leur travail sans autorisation ni rémunération. C’est la dernière d’une série de contre-offensives que le monde littéraire a lancées ces dernières semaines contre l’IA. Mais protéger les écrivains des impacts négatifs de ces technologies n’est pas une proposition facile.

Selon un rapport de The Authors Guild, le revenu médian d'un écrivain à temps plein l'année dernière aux États-Unis était de 23 000 $. Et les revenus des écrivains ont baissé de 42 % entre 2009 et 2019.

L'avènement d'applications d'IA génératives basées sur du texte comme GPT-4 et Bard, qui fouillent le Web à la recherche de contenu d'auteurs sans autorisation ni compensation, puis l'utilisent pour produire de nouveaux contenus en réponse aux invites des utilisateurs, donne aux écrivains de tout le pays plus de raison de s'inquiéter.

« Il n'y a pas de besoin urgent pour l'IA d'écrire un roman », a déclaré Alexander Chee, l'auteur à succès de romans comme Edimbourg et La Reine de la nuit. « Les seules personnes qui pourraient en avoir besoin sont les personnes qui s'opposent à payer les écrivains ce qu'ils valent ».

Chee fait partie des près de 8 000 auteurs qui viennent de signer une lettre adressée aux dirigeants de six sociétés d'IA, dont OpenAI, Alphabet et Meta.

« Elle [la lettre] dit qu'il n'est pas juste d'utiliser nos trucs dans votre IA sans autorisation ni paiement », a déclaré Mary Rasenberger, PDG de The Author's Guild. L'organisation de défense des écrivains à but non lucratif a créé la lettre et l'a envoyée aux sociétés d'IA lundi. « Alors, s'il vous plaît, commencez à nous indemniser et à nous parler ».

Rasenberger a déclaré que la guilde essaie d'amener ces entreprises à trouver un arrangement à l'amiable sans avoir à les poursuivre.

« Les procès représentent une énorme somme d'argent », a déclaré Rasenberger. « Ils prennent vraiment beaucoup de temps ».


Mais certaines personnalités littéraires sont prêtes à combattre les entreprises technologiques devant les tribunaux

La comédienne et auteure Sarah Silverman, ainsi que les auteurs Christopher Golden et Richard Kadrey, poursuivent OpenAI et Meta chacun devant un tribunal de district américain pour double plainte pour violation du droit d'auteur.

Selon les plaintes déposées devant le tribunal fédéral de San Francisco, Meta et OpenAI ont obtenu les œuvres des plaignants à partir de sites illégaux de « bibliothèques fantômes », qui proposent des livres numérisés sans respecter les droits d’auteur. Les plaignants affirment que leurs œuvres ont été utilisées comme matériel d’entraînement pour les modèles d’IA, sans qu’ils n’en aient été informés ni rémunérés.

Les plaignants citent comme preuve le fait que les modèles d’IA sont capables de résumer leurs livres lorsqu’ils sont sollicités. Par exemple, ChatGPT peut fournir un résumé du livre The Bedwetter de Sarah Silverman, publié en 2010, qui raconte son enfance marquée par l’énurésie. De même, LLaMA peut résumer les livres Ararat de Christopher Golden et Sandman Slim de Richard Kadrey, qui sont des romans fantastiques.

Quant à la plainte séparée contre Meta, il allègue que les livres des auteurs étaient accessibles dans les ensembles de données que Meta a utilisés pour former ses modèles LLaMA, un quatuor de modèles d'IA open source que la société a introduit en février.

De même, OpenAI fait l’objet d’une plainte en nom collectif déposée par deux autres auteurs américains, Paul Tremblay et Mona Awad, qui affirment que la société a utilisé leurs œuvres sans autorisation pour entraîner son système d’intelligence artificielle générative ChatGPT.


Une étape nécessaire

Gina Maccoby est agent littéraire à New York. Elle dit que les actions en justice sont une étape nécessaire pour que les écrivains soient équitablement secoués.

« Cela doit arriver », a déclaré Maccoby. « C'est la seule façon pour que ces choses soient réglées ».

Maccoby a déclaré que les agents, y compris elle-même, commençaient à parler aux éditeurs de l'inclusion d'un langage dans les contrats des écrivains qui interdit les utilisations non autorisées de l'IA comme un autre moyen de protéger leurs moyens de subsistance et ceux de leurs clients. (Selon une récente enquête de la Guilde des auteurs sur l'IA, alors que 90 % des écrivains qui ont répondu ont déclaré « qu'ils devraient être rémunérés pour l'utilisation de leur travail dans la formation à l'IA », 67 % ont déclaré qu'ils « n'étaient pas sûrs de savoir si leurs contrats d'édition ou les conditions d'utilisation de la plate-forme incluent des autorisations ou l'octroi de droits pour utiliser leur travail à des fins liées à l'IA ».)

« Ce que j'entends de mes collègues, c'est que la plupart des éditeurs sont disposés à restreindre certains types d'utilisation de l'IA », a déclaré Maccoby, ajoutant qu'elle n'avait pas encore ajouté de telles clauses aux contrats de ses propres écrivains. La Guilde des auteurs a mis à jour son contrat type en mars pour inclure un langage traitant de l'utilisation de l'IA.

Maccoby a déclaré que même si les contrats des auteurs interdisent explicitement aux sociétés d'IA de faire du scrapping et de tirer profit des œuvres littéraires, les règles sont difficiles à appliquer : « Comment sait-on même si un livre se trouve dans un ensemble de données qui a été ingéré par un programme d'IA ? » se demande Maccoby.

En plus des lettres, des poursuites et du langage contractuel, le secteur de l'édition cherche en outre à protéger l'avenir des auteurs en plaidant pour une législation sur la manière dont l'IA générative peut et ne peut pas être utilisée.

Rasenberger de la Guilde des auteurs a déclaré que son organisation faisait activement pression pour de tels projets de loi. Entre-temps, de nombreuses audiences ont eu lieu récemment à divers niveaux de gouvernement sur des sujets liés à l'IA, comme l'audience de la semaine dernière du sous-comité judiciaire du Sénat sur l'IA et le droit d'auteur.

« En ce moment, on en parle beaucoup », a déclaré Rumman Chowdhury, un responsable de l'IA à l'Université de Harvard, qui a témoigné lors d'une de ces audiences en juin. « Mais nous ne voyons pas encore de législation ou de réglementation concrète sortir ».

Chowdhury a déclaré que la voie à suivre serait forcément compliquée.

« Certains seront litigieux, certains seront réglementés, et certains d'entre eux n'auront littéralement qu'à crier jusqu'à ce que nous soyons entendus », a-t-elle déclaré.


Lettre ouverte adressée aux leaders de l'intelligence artificielle générative

Nous, soussignés, attirons votre attention sur l'injustice inhérente à l'exploitation de nos œuvres dans le cadre de vos systèmes d'IA sans notre consentement, crédit ou compensation.

Les technologies d'IA génératives construites sur de grands modèles de langage doivent leur existence à nos écrits. Ces technologies imitent et régurgitent notre langage, nos histoires, notre style et nos idées. Des millions de livres, d'articles, d'essais et de poésie protégés par le droit d'auteur fournissent la «nourriture» des systèmes d'IA, des repas sans fin pour lesquels il n'y a pas eu de facture. Vous dépensez des milliards de dollars pour développer la technologie de l'IA. Il n'est que juste que vous nous rémunériez pour l'utilisation de nos écrits, sans lesquels l'IA serait banale et extrêmement limitée.

Nous comprenons que de nombreux livres utilisés pour développer des systèmes d'IA proviennent de sites Web de piratage notoires. Non seulement la récente décision de la Cour suprême dans l'affaire Warhol c. Goldsmith indique clairement que la forte commercialité de votre utilisation va à l'encontre de l'utilisation équitable, mais aucun tribunal n'excuserait la copie d'œuvres d'origine illégale comme une utilisation équitable. En raison de l'intégration de nos écrits dans vos systèmes, l'IA générative menace de nuire à notre profession en inondant le marché de livres médiocres écrits à la machine, d'histoires et de journalisme basés sur notre travail. Au cours de la dernière décennie, les auteurs ont connu une baisse de quarante pour cent de leurs revenus, et le revenu médian actuel des écrivains à temps plein en 2022 n'était que de 23 000 $. L'introduction de l'IA menace de faire pencher la balance et de rendre encore plus difficile, voire impossible, pour les écrivains, en particulier les jeunes écrivains et les voix des communautés sous-représentées, de gagner leur vie de leur profession.

Nous vous demandons, vous, dirigeants de l'IA, d'atténuer les dommages causés à notre profession en prenant les mesures suivantes :
  1. Obtenez l'autorisation d'utiliser notre matériel protégé par le droit d'auteur dans vos programmes d'IA générative.
  2. Rémunérez équitablement les auteurs pour l'utilisation passée et actuelle de nos travaux dans vos programmes d'IA générative.
  3. Rémunérez équitablement les écrivains pour l'utilisation de nos œuvres dans la sortie de l'IA, que les sorties enfreignent ou non la loi en vigueur.

Nous espérons que vous apprécierez la gravité de nos préoccupations et que vous travaillerez avec nous pour assurer, dans les années à venir, un écosystème sain pour les auteurs et les journalistes.

Sincèrement,

La Guilde des auteurs et les écrivains soussignés

Source : lettre ouverte

Et vous ?

Que pensez-vous de l’utilisation de l’IA pour générer du contenu à partir du travail des auteurs sans leur consentement ni leur rétribution ?
Pensez-vous que les écrivains devraient avoir le droit de contrôler la façon dont leur travail est utilisé par les entreprises d’IA ?
Quels sont les avantages et les inconvénients de l’IA générative pour la création littéraire ?
Avez-vous déjà utilisé ou essayé une application d’IA générative basée sur le texte ? Si oui, quelle a été votre expérience ?
Quels sont les défis et les opportunités que l’IA représente pour l’avenir de l’écriture et de la lecture ?

Une erreur dans cette actualité ? Signalez-nous-la !

Avatar de onilink_
Membre émérite https://www.developpez.com
Le 07/10/2023 à 20:08
Citation Envoyé par archqt Voir le message
Pas évident, moi je lis des livres, imaginons des milliers. Ensuite j'écris un livre qui tient compte de mes lectures. Quelle différence avec l'entraînement de l'IA au final ?
Ensuite je comprends parfaitement les remarques de ceux dont les œuvres sont "pompées"
Absolument tout... ?

Comparer un LLM, un algorithme qui à la fâcheuse tendance à mémoriser ses entrées, mais qui ne connaît rien d'autre du monde que ces données la, avec un humain qui compresse et mémorise mal mais aussi de façon ultra subjective ses lectures tout en les mélangeant à son vécu... sérieusement?

Cela me semble très dangereux d'essayer de faire le lien entre les deux.

De plus il ne te faut pas une fraction de seconde pour pondre un livre. Et si tu fais du plagiat tu te prendras un procès.

OpenAI demandent à ce que leurs magouilles deviennent juridiquement légales. Cela n'apportera rien de bon pour personne, sauf pour eux.
9  1 
Avatar de OrthodoxWindows
Membre émérite https://www.developpez.com
Le 08/04/2024 à 10:48
Tant que GPT-4 ne bloque pas les publicités lors de son visionnage, pour Youtube ça ne devrait pas poser de problèmes.

8  0 
Avatar de totozor
Membre expert https://www.developpez.com
Le 23/08/2023 à 7:42
Quelle est votre opinion sur l’utilisation du contenu protégé par le droit d’auteur comme données d’entraînement pour les modèles d’IA ?
Je suis assez partagé, autant je peux comprendre qu'un auteur ne veut pas qu'on puisse contourner l'achat de son livre avec une IA.
Autant les auteurs doivent aussi admettre que leurs oeuvres sont publiques et il n'y a rien de choquant qu'une IA puisse faire un résumé de celles ci. Tout comme il n'est pas choquant qu'une IA résume la pensée d'un philosophe.
Pensez-vous que les entreprises d’IA devraient payer les auteurs dont les œuvres sont utilisées comme données d’entraînement ?
Ca les rendrait instantanément non viables, ça rendrait les IA existantes complètement protégées d'éventuel nouveau concurent.
Avez-vous déjà utilisé ou interagi avec un modèle d’IA qui a généré du contenu protégé par le droit d’auteur ? Si oui, comment avez-vous réagi ?
Probablement pas mais beaucoup de monde semble impressionné par les réponses à "écrit moi un texte à la façon de ..." donc c'est monnaie courante.

Citation Envoyé par Stéphane le calme Voir le message
ChatGPT tente désormais d’éviter de répondre aux sollicitations des utilisateurs avec des formulations exactes provenant d’œuvres protégées par le droit d’auteur, selon un article technique publié par un groupe de chercheurs en IA travaillant pour le pôle recherche de ByteDance.
C'est interressant parce que si l'article dit vrai ça veut dire que ChatGPT sait identifier les textes soumis au droit d'auteur et donc ne pourra pas se défendre en disant qu'ils ont traité une tonne de données aveuglément et qu'ils sont donc incapable d'identifier les données libres de droit des autres.
4  0 
Avatar de _toma_
Membre averti https://www.developpez.com
Le 08/10/2023 à 18:28
La question du comité : "Comment justifiez-vous de la légalité de votre collecte de données ?"
La réponse d'openAI : "Nous vous assurons que cette collecte de données est loyale."

Et la suite de leur réponse :
L'incertitude juridique sur les implications en matière de droit d'auteur de l'entraînement des systèmes d'IA impose des coûts substantiels aux développeurs d'IA et devrait donc être résolue de manière autoritaire.
Non mais vous êtes sérieux les gars ? Vous voulez bien faire de la thune mais vous voulez pas en dépenser donc il faudrait prendre une décision autoritaire (qui fasse abstraction de la loi ?) qui aille dans votre sens. C'est vraiment ça la réponse ? Ça me semble tellement hallucinant que je me demande si je comprends bien la phrase.
4  1 
Avatar de Leruas
Membre éclairé https://www.developpez.com
Le 08/04/2024 à 21:24
Heureusement qu'ils n'ont pas entrainé GPT-4 sur des vidéos TikTok
3  0 
Avatar de Fagus
Membre expert https://www.developpez.com
Le 23/08/2023 à 13:11
Citation Envoyé par totozor
autant je peux comprendre qu'un auteur ne veut pas qu'on puisse contourner l'achat de son livre avec une IA.
Autant les auteurs doivent aussi admettre que leurs oeuvres sont publiques et il n'y a rien de choquant qu'une IA puisse faire un résumé de celles ci. Tout comme il n'est pas choquant qu'une IA résume la pensée d'un philosophe.
Je suis d'accord, mais je vois deux problème légaux :
  1. que la société n'ait pas payé les documents d'entraînement . Si un particulier veut accéder à un contenu sous droit d'auteur, il n'a pas le droit de le télécharger sur un torrent. Je ne vois pas pourquoi une puissante société aurait le droit de le faire en toute impunité. Surtout que pour de nombreux contenu, une licence commerciale n'est pas la même qu'une licence d'utilisation pour un utilisateur. C'est comme si pour le prix d'un livre harry potter, j'avais le droit de faire un usage commercial du contenu...
  2. que le modèle puisse reconstituer l'oeuvre si on lui demande (pour cela il semble qu'ils prennent des mesures techniques).
2  0 
Avatar de onilink_
Membre émérite https://www.developpez.com
Le 01/09/2023 à 13:24
Il n'y a rien d'étonnant, rien ne va de toute façon avec OpenAI, à commencer par leur nom.

Ils parlent de progrès et de développement scientifique mais ChatGPT n'est qu'une interface pimpée sur une techno qui existe déjà depuis au moins 3 ans. Il n'y a aucun apport scientifique de leur coté. Il n'ont même pas inventé les transformers sur quoi sont basé les LLM qu'ils utilisent (je crois que c'est Google qui en est à l'origine).

Leur "seul" apport c'est de dépenser des sommes considérables pour entraîner des modèles gigantesques relativement "cons" mais ont des performances qui dépendent de leur taille.

Tout le reste n'est que stratégie marketing et médiatique.
Habituer les utilisateurs à un service gratuit d'une techno qui parait révolutionnaire et qui est plutôt coûteuse de leur coté (ceux qui ont utilisé GPT3 avant que ChatGPT ne sorte savent qu'il y a un prix fixé au token) puis diminuer la qualité du service gratuit pour forcer à prendre un abonnement et essayer de rendre ça lucratif de leur coté.
2  0 
Avatar de JRM73
Futur Membre du Club https://www.developpez.com
Le 10/10/2023 à 14:35
@archqt

certes, mais toi, comme tu es un gars bien, tu les payes tes livres.

2  0 
Avatar de kain_tn
Expert éminent https://www.developpez.com
Le 10/10/2023 à 22:27
Citation Envoyé par _toma_ Voir le message
La question du comité : "Comment justifiez-vous de la légalité de votre collecte de données ?"
La réponse d'openAI : "Nous vous assurons que cette collecte de données est loyale."

Et la suite de leur réponse :

Non mais vous êtes sérieux les gars ? Vous voulez bien faire de la thune mais vous voulez pas en dépenser donc il faudrait prendre une décision autoritaire (qui fasse abstraction de la loi ?) qui aille dans votre sens. C'est vraiment ça la réponse ? Ça me semble tellement hallucinant que je me demande si je comprends bien la phrase.
On ne devient pas milliardaire en dépensant de l'argent mais en demandant à ses petits copains de faire passer des lois, donner des contrats, etc. Sam Altman n'échappe pas à la règle.
2  0 
Avatar de onilink_
Membre émérite https://www.developpez.com
Le 23/08/2023 à 13:55
Je ne vois pas pourquoi il faudrait créer une exception.

Si j’apprends par cœur un livre Harry Potter et que je le re écris sur internet, j’enfreins le droit d'auteur.
Pourquoi cela devrait être différent venant d'une IA?

Si empêcher l'utilisation de texte soumis au droit d'auteur diminuerait la qualité des modèles ça montre d'autant plus l'importance:
- de continuer de protéger ces textes, je ne vois pas pourquoi on ferait des exceptions pour ces modèles que seules des multinationales peuvent se payer et entraîner et qui en plus ne sont pas ouverts. Cela montre d'autant plus la valeur de ces textes puisqu'ils ne peuvent pas s'en passer
- qu'il faudrait changer de paradigme et arrêter de faire des modèles qui ingurgitent et apprennent par cœur les données d’entraînement

C'est un aveux que ces modèles sont des machines à pomper les données malgré ce qu'ils essayent de nous vendre.
Avec les fameuses analogies de la façon dont l'humain apprends... alors que cela n'a rien, mais alors rien à voir.

Forcer les modèles d'arrêter à régurgiter les données d’entraînement serait sûrement le moyen légal le plus efficace pour régler pas mal de problèmes éthiques causés par l'IA, comme:
- le plagia des modèles génératifs, que ce soit du style ou carrément des images de certaines artistes, ou comme ici de livres ou autres textes protégés
- l'apprentissage par cœur de données privées, car contrairement a ce que l'on nous vend les données d’entraînement ne sont pas obtenues que par des sources publiques. Cela crée des problèmes de sécurité assez gros comme on peut l'imaginer
- le fait qu'on ne sait pas si une sortie peut être utilisée légalement (ex: la licence d'un code source généré qui aurait pompé des bouts soumis à la GNU GPL )

Science4All a fait pas mal de vidéos très intéressantes sur le sujet, qui est évidemment bien plus complexe que ce qu'il laisse paraitre au premier abord.

Bonus: https://thenib.com/im-a-luddite/
1  0