IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)

Vous êtes nouveau sur Developpez.com ? Créez votre compte ou connectez-vous afin de pouvoir participer !

Vous devez avoir un compte Developpez.com et être connecté pour pouvoir participer aux discussions.

Vous n'avez pas encore de compte Developpez.com ? Créez-en un en quelques instants, c'est entièrement gratuit !

Si vous disposez déjà d'un compte et qu'il est bien activé, connectez-vous à l'aide du formulaire ci-dessous.

Identifiez-vous
Identifiant
Mot de passe
Mot de passe oublié ?
Créer un compte

L'inscription est gratuite et ne vous prendra que quelques instants !

Je m'inscris !

Amazon fait marche arrière face aux « livres poubelles » écrits par l'IA après la colère du public
L'entreprise supprime plusieurs livres de ce type répertoriés sous le nom d'un véritable auteur

Le , par Stéphane le calme

11PARTAGES

6  0 
Amazon, la grande enseigne du commerce électronique, a retiré plusieurs livres soupçonnés d’avoir été écrits par une intelligence artificielle et attribués à un véritable auteur. Cette décision fait suite à la plainte de la professeure Jane Friedman, qui a dénoncé sur Twitter la présence de livres qu’elle n’avait pas écrits sous son nom. Elle a reçu le soutien de la Guilde des auteurs, une organisation qui défend les droits des écrivains.

Jane Friedman, journaliste, auteure et professeure, a récemment découvert sur Amazon et Goodreads une demi-douzaine de « livres poubelles » portant son nom, probablement remplis de contenu généré par l’intelligence artificielle. Elle s'est inquiétée de l'impact que ces livres contrefaits peuvent avoir sur sa réputation. Ces livres portaient les titres Your Guide to Writing a Bestseller eBook on Amazon, Publishing Power : Navigating Amazon’s Kindle Direct Publishing et Promote to Prosper : Strategies to Skyrocket Your eBook Sales on Amazon. Ces livres utilisaient son nom et sa réputation pour attirer les acheteurs potentiels.

Friedman a contacté Amazon pour demander le retrait de ces livres, mais elle s’est heurtée à un refus initial. Amazon lui a dit qu’elle devait prouver qu’elle possédait la marque déposée sur son propre nom, ce qu’elle n’a pas pu faire. Amazon a donc décidé de laisser les livres en vente.

Friedman n’a pas baissé les bras et a exposé son cas sur Twitter, où elle a reçu le soutien de nombreux autres auteurs et de la Guilde des auteurs. Cette dernière s’est proposée d’intervenir en sa faveur auprès d’Amazon.

Citation Envoyé par Guilde des auteurs
Jane Friedman, en tant que membre de la Guilde des auteurs, nous pouvons plaider en votre nom et contacter immédiatement la haute direction pour leur faire savoir que ces travaux sont une tentative de compromission de votre marque et doivent être supprimés en tant qu'infractions à la loi Lanham.

D'autres auteurs répondant au tweet de Friedman ont déclaré que la même chose leur était arrivée, et dans certains cas, l'éditeur des livres frauduleux a fait plus que simplement utiliser leurs noms.

« Désolé que vous ayez eu affaire à ça », a écrit l'auteur et poète Hattie Jean Hayes. « J'ai quelqu'un qui utilise mon nom pour publier de l'érotisme sur Amazon [Kindle Direct Publishing] depuis ces trois dernières années. C'est assez clairement une attaque ciblée puisqu'ils ont utilisé les noms des membres (mineurs !) de ma famille dans les histoires », a déclaré Hayes. « Amazon/Kindle m'a donné exactement la même réponse ».

Une autre auteure, Sarah Rose, a tweeté : « Les gens n'arrêtent pas de me dire qu'ils ont acheté mon dernier livre - qui porte mon nom, mais je n'ai pas écrit - un escroc utilisant l'algorithme "trouver plus par cet auteur". Mon éditeur n'a pas pu faire que ça s'arrête et j'ai en quelque sorte abandonné ».

Amazon cède face à la pression

Face à la pression publique, Amazon a finalement changé de cap et a commencé à retirer les livres frauduleux de son site web.

« Nous avons des directives claires sur le contenu qui peut être mis en vente et nous enquêtons rapidement sur tout livre lorsque nous recevons une alerte », a déclaré Ashley Vanicek, porte-parole d’Amazon. « Nous accueillons les commentaires des auteurs et nous travaillons directement avec eux pour résoudre tout problème qu’ils soulèvent et lorsque nous avons commis une erreur, nous la corrigeons ».

Friedman a confirmé sur Twitter que les livres avaient été retirés d’Amazon. Elle s’est toutefois inquiétée du sort des autres auteurs qui n’ont pas la même audience qu’elle et qui ne peuvent pas faire autant de bruit.

La Guilde des auteurs a déclaré que ses membres pouvaient demander l'aide de l'organisation pour contacter la haute direction d'Amazon au sujet d'œuvres frauduleuses.

« Nous avons travaillé avec Amazon sur ce problème dans le passé, et nous poursuivrons nos conversations avec eux sur l'avancement de leurs efforts pour suivre le rythme de la technologie », a déclaré la Guilde des auteurs dans un communiqué. « En attendant, nous encourageons tout le monde à signaler ces livres qui tentent de tirer profit de votre marque via le portail de réclamation d'Amazon ».

Alors que les industries de la technologie et du divertissement continuent de lutter contre l'IA générative, la Guilde des auteurs affirme que la première étape de l'application de garde-fous consiste à exiger le consentement de l'auteur et une compensation pour l'utilisation de son travail.

En juillet, 10 000 membres de la Guilde des auteurs ont cosigné une lettre rédigée par l'organisation appelant les leaders de l'industrie de l'IA, dont OpenAI, Alphabet, Meta, Stability AI, IBM et Microsoft, à obtenir le consentement des auteurs, à les créditer et à les rémunérer équitablement.

« Il peut parfois être difficile de résoudre des problèmes comme celui-ci via les canaux habituels d'Amazon s'il ne s'agit pas d'une violation flagrante du droit d'auteur (lorsqu'il existe des procédures de retrait en vertu du DMCA), en particulier si la base juridique n'est pas clairement articulée », a déclaré un porte-parole de la Guilde des auteurs. « Amazon doit permettre aux auteurs de résoudre plus facilement les problèmes ».

Les conséquences des « livres poubelles » écrits par l’IA

Les « livres poubelles » écrits par l’IA ont des conséquences négatives à plusieurs niveaux :
  • sur le plan économique, ils nuisent aux revenus et à la réputation des vrais auteurs, qui doivent faire face à une concurrence déloyale et à une confusion des lecteurs. Ils peuvent aussi entraîner des pertes financières pour les lecteurs, qui se font escroquer en achetant des livres de mauvaise qualité ou sans valeur ajoutée ;
  • sur le plan juridique, ils posent des problèmes de droit d’auteur, de propriété intellectuelle et de responsabilité. Il n’est pas toujours facile de déterminer qui est l’auteur réel d’un livre écrit par l’IA, qui détient les droits sur le contenu et qui est responsable en cas de litige ou de dommage. Les lois actuelles ne sont pas adaptées à ce genre de situation et nécessitent une mise à jour ;
  • sur le plan culturel, les « livres poubelles » écrits par l’IA appauvrissent la diversité et la qualité du paysage littéraire. Ils peuvent aussi véhiculer des informations erronées, biaisées ou manipulatrices, qui influencent négativement l’opinion et la connaissance des lecteurs.

Conclusion

Ce n’est pas la première fois qu’Amazon est confronté au problème des « livres poubelles » écrits par l’IA. En 2021, la presse américaine avait révélé l’existence d’une entreprise nommée KDP Rocket, qui proposait de créer des livres électroniques personnalisés à partir de modèles générés par l’IA. Ces livres étaient ensuite publiés sur la plateforme Kindle Direct Publishing d’Amazon, sans mentionner qu’ils étaient le produit d’une machine.

L’utilisation de l’IA pour créer du contenu pose des questions éthiques et juridiques, notamment sur le respect du droit d’auteur, la qualité de l’information et la responsabilité des plateformes. Amazon devra sans doute renforcer ses mesures de contrôle pour éviter que son catalogue ne soit envahi par des « livres poubelles » qui nuisent aux véritables auteurs.

Indépendamment de ce que contiennent ces « livres poubelles », la grande question est de savoir comment Amazon, un site majeur qui atteint des centaines de millions de clients, prévoit de protéger à la fois les auteurs et les clients contre la fraude et la mauvaise attribution.

Ces cas soulèvent des questions sur la vérification des auteurs et la responsabilité des plateformes en ligne face à la prolifération des contenus générés par l’IA. Comment les lecteurs peuvent-ils distinguer les vrais auteurs des imposteurs ? Comment les auteurs peuvent-ils protéger leur identité et leur propriété intellectuelle ? Comment les plateformes peuvent-elles empêcher ou détecter les publications frauduleuses ? Ce sont autant de défis auxquels le monde du livre devra faire face à l’ère de l’IA.

Sources : Guilde des auteurs, Amazon

Et vous ?

Quelle est votre opinion sur les “livres poubelles” écrits par l’IA ? Les considérez-vous comme de la littérature ou comme de la fraude ?
Avez-vous déjà acheté ou lu un “livre poubelle” écrit par l’IA ? Si oui, comment avez-vous découvert qu’il s’agissait d’un faux livre ? Sinon, comment faites-vous pour les éviter ?
Que pensez-vous de la réaction d’Amazon face au problème des “livres poubelles” écrits par l’IA ? Trouvez-vous qu’elle a été suffisante et rapide ? Que devrait faire Amazon pour mieux protéger les auteurs et les lecteurs ?
Quelles sont les conséquences des “livres poubelles” écrits par l’IA sur le monde littéraire ? Pensez-vous qu’ils nuisent à la qualité, à la diversité et à la crédibilité de la littérature ? Ou pensez-vous qu’ils stimulent la créativité, la concurrence et l’innovation ?
Comment voyez-vous l’avenir de la création littéraire avec l’intelligence artificielle ? Pensez-vous que l’IA peut être un outil utile et positif pour les auteurs ? Ou pensez-vous qu’elle représente une menace pour leur métier et leur identité ?

Une erreur dans cette actualité ? Signalez-nous-la !

Avatar de onilink_
Membre émérite https://www.developpez.com
Le 07/10/2023 à 20:08
Citation Envoyé par archqt Voir le message
Pas évident, moi je lis des livres, imaginons des milliers. Ensuite j'écris un livre qui tient compte de mes lectures. Quelle différence avec l'entraînement de l'IA au final ?
Ensuite je comprends parfaitement les remarques de ceux dont les œuvres sont "pompées"
Absolument tout... ?

Comparer un LLM, un algorithme qui à la fâcheuse tendance à mémoriser ses entrées, mais qui ne connaît rien d'autre du monde que ces données la, avec un humain qui compresse et mémorise mal mais aussi de façon ultra subjective ses lectures tout en les mélangeant à son vécu... sérieusement?

Cela me semble très dangereux d'essayer de faire le lien entre les deux.

De plus il ne te faut pas une fraction de seconde pour pondre un livre. Et si tu fais du plagiat tu te prendras un procès.

OpenAI demandent à ce que leurs magouilles deviennent juridiquement légales. Cela n'apportera rien de bon pour personne, sauf pour eux.
9  1 
Avatar de OrthodoxWindows
Membre émérite https://www.developpez.com
Le 08/04/2024 à 10:48
Tant que GPT-4 ne bloque pas les publicités lors de son visionnage, pour Youtube ça ne devrait pas poser de problèmes.

8  0 
Avatar de totozor
Membre expert https://www.developpez.com
Le 23/08/2023 à 7:42
Quelle est votre opinion sur l’utilisation du contenu protégé par le droit d’auteur comme données d’entraînement pour les modèles d’IA ?
Je suis assez partagé, autant je peux comprendre qu'un auteur ne veut pas qu'on puisse contourner l'achat de son livre avec une IA.
Autant les auteurs doivent aussi admettre que leurs oeuvres sont publiques et il n'y a rien de choquant qu'une IA puisse faire un résumé de celles ci. Tout comme il n'est pas choquant qu'une IA résume la pensée d'un philosophe.
Pensez-vous que les entreprises d’IA devraient payer les auteurs dont les œuvres sont utilisées comme données d’entraînement ?
Ca les rendrait instantanément non viables, ça rendrait les IA existantes complètement protégées d'éventuel nouveau concurent.
Avez-vous déjà utilisé ou interagi avec un modèle d’IA qui a généré du contenu protégé par le droit d’auteur ? Si oui, comment avez-vous réagi ?
Probablement pas mais beaucoup de monde semble impressionné par les réponses à "écrit moi un texte à la façon de ..." donc c'est monnaie courante.

Citation Envoyé par Stéphane le calme Voir le message
ChatGPT tente désormais d’éviter de répondre aux sollicitations des utilisateurs avec des formulations exactes provenant d’œuvres protégées par le droit d’auteur, selon un article technique publié par un groupe de chercheurs en IA travaillant pour le pôle recherche de ByteDance.
C'est interressant parce que si l'article dit vrai ça veut dire que ChatGPT sait identifier les textes soumis au droit d'auteur et donc ne pourra pas se défendre en disant qu'ils ont traité une tonne de données aveuglément et qu'ils sont donc incapable d'identifier les données libres de droit des autres.
4  0 
Avatar de _toma_
Membre averti https://www.developpez.com
Le 08/10/2023 à 18:28
La question du comité : "Comment justifiez-vous de la légalité de votre collecte de données ?"
La réponse d'openAI : "Nous vous assurons que cette collecte de données est loyale."

Et la suite de leur réponse :
L'incertitude juridique sur les implications en matière de droit d'auteur de l'entraînement des systèmes d'IA impose des coûts substantiels aux développeurs d'IA et devrait donc être résolue de manière autoritaire.
Non mais vous êtes sérieux les gars ? Vous voulez bien faire de la thune mais vous voulez pas en dépenser donc il faudrait prendre une décision autoritaire (qui fasse abstraction de la loi ?) qui aille dans votre sens. C'est vraiment ça la réponse ? Ça me semble tellement hallucinant que je me demande si je comprends bien la phrase.
4  1 
Avatar de Leruas
Membre éclairé https://www.developpez.com
Le 08/04/2024 à 21:24
Heureusement qu'ils n'ont pas entrainé GPT-4 sur des vidéos TikTok
3  0 
Avatar de Fagus
Membre expert https://www.developpez.com
Le 23/08/2023 à 13:11
Citation Envoyé par totozor
autant je peux comprendre qu'un auteur ne veut pas qu'on puisse contourner l'achat de son livre avec une IA.
Autant les auteurs doivent aussi admettre que leurs oeuvres sont publiques et il n'y a rien de choquant qu'une IA puisse faire un résumé de celles ci. Tout comme il n'est pas choquant qu'une IA résume la pensée d'un philosophe.
Je suis d'accord, mais je vois deux problème légaux :
  1. que la société n'ait pas payé les documents d'entraînement . Si un particulier veut accéder à un contenu sous droit d'auteur, il n'a pas le droit de le télécharger sur un torrent. Je ne vois pas pourquoi une puissante société aurait le droit de le faire en toute impunité. Surtout que pour de nombreux contenu, une licence commerciale n'est pas la même qu'une licence d'utilisation pour un utilisateur. C'est comme si pour le prix d'un livre harry potter, j'avais le droit de faire un usage commercial du contenu...
  2. que le modèle puisse reconstituer l'oeuvre si on lui demande (pour cela il semble qu'ils prennent des mesures techniques).
2  0 
Avatar de onilink_
Membre émérite https://www.developpez.com
Le 01/09/2023 à 13:24
Il n'y a rien d'étonnant, rien ne va de toute façon avec OpenAI, à commencer par leur nom.

Ils parlent de progrès et de développement scientifique mais ChatGPT n'est qu'une interface pimpée sur une techno qui existe déjà depuis au moins 3 ans. Il n'y a aucun apport scientifique de leur coté. Il n'ont même pas inventé les transformers sur quoi sont basé les LLM qu'ils utilisent (je crois que c'est Google qui en est à l'origine).

Leur "seul" apport c'est de dépenser des sommes considérables pour entraîner des modèles gigantesques relativement "cons" mais ont des performances qui dépendent de leur taille.

Tout le reste n'est que stratégie marketing et médiatique.
Habituer les utilisateurs à un service gratuit d'une techno qui parait révolutionnaire et qui est plutôt coûteuse de leur coté (ceux qui ont utilisé GPT3 avant que ChatGPT ne sorte savent qu'il y a un prix fixé au token) puis diminuer la qualité du service gratuit pour forcer à prendre un abonnement et essayer de rendre ça lucratif de leur coté.
2  0 
Avatar de JRM73
Futur Membre du Club https://www.developpez.com
Le 10/10/2023 à 14:35
@archqt

certes, mais toi, comme tu es un gars bien, tu les payes tes livres.

2  0 
Avatar de kain_tn
Expert éminent https://www.developpez.com
Le 10/10/2023 à 22:27
Citation Envoyé par _toma_ Voir le message
La question du comité : "Comment justifiez-vous de la légalité de votre collecte de données ?"
La réponse d'openAI : "Nous vous assurons que cette collecte de données est loyale."

Et la suite de leur réponse :

Non mais vous êtes sérieux les gars ? Vous voulez bien faire de la thune mais vous voulez pas en dépenser donc il faudrait prendre une décision autoritaire (qui fasse abstraction de la loi ?) qui aille dans votre sens. C'est vraiment ça la réponse ? Ça me semble tellement hallucinant que je me demande si je comprends bien la phrase.
On ne devient pas milliardaire en dépensant de l'argent mais en demandant à ses petits copains de faire passer des lois, donner des contrats, etc. Sam Altman n'échappe pas à la règle.
2  0 
Avatar de onilink_
Membre émérite https://www.developpez.com
Le 23/08/2023 à 13:55
Je ne vois pas pourquoi il faudrait créer une exception.

Si j’apprends par cœur un livre Harry Potter et que je le re écris sur internet, j’enfreins le droit d'auteur.
Pourquoi cela devrait être différent venant d'une IA?

Si empêcher l'utilisation de texte soumis au droit d'auteur diminuerait la qualité des modèles ça montre d'autant plus l'importance:
- de continuer de protéger ces textes, je ne vois pas pourquoi on ferait des exceptions pour ces modèles que seules des multinationales peuvent se payer et entraîner et qui en plus ne sont pas ouverts. Cela montre d'autant plus la valeur de ces textes puisqu'ils ne peuvent pas s'en passer
- qu'il faudrait changer de paradigme et arrêter de faire des modèles qui ingurgitent et apprennent par cœur les données d’entraînement

C'est un aveux que ces modèles sont des machines à pomper les données malgré ce qu'ils essayent de nous vendre.
Avec les fameuses analogies de la façon dont l'humain apprends... alors que cela n'a rien, mais alors rien à voir.

Forcer les modèles d'arrêter à régurgiter les données d’entraînement serait sûrement le moyen légal le plus efficace pour régler pas mal de problèmes éthiques causés par l'IA, comme:
- le plagia des modèles génératifs, que ce soit du style ou carrément des images de certaines artistes, ou comme ici de livres ou autres textes protégés
- l'apprentissage par cœur de données privées, car contrairement a ce que l'on nous vend les données d’entraînement ne sont pas obtenues que par des sources publiques. Cela crée des problèmes de sécurité assez gros comme on peut l'imaginer
- le fait qu'on ne sait pas si une sortie peut être utilisée légalement (ex: la licence d'un code source généré qui aurait pompé des bouts soumis à la GNU GPL )

Science4All a fait pas mal de vidéos très intéressantes sur le sujet, qui est évidemment bien plus complexe que ce qu'il laisse paraitre au premier abord.

Bonus: https://thenib.com/im-a-luddite/
1  0