Les algorithmes d’IA ont besoin de données pour s’entraîner et apprendre. Cependant, l’accès non autorisé aux données peut entraîner des problèmes. Certaines entreprises d’IA, comme Anthropic, ont été accusées de solliciter les serveurs de sites web sans autorisation, ce qui peut entraîner une surcharge des ressources et des temps d’arrêt.
L'une de leur victime n'est autre qu'iFixit. Le PDG de la structure, Kyle Wiens, a interpellé la société d’IA Anthropic avec agacement. Il ne s'agit pas seulement du fait qu'une société d'IA semble engorger les ressources du serveur, mais aussi du fait qu'il lui a été expressément interdit d'utiliser le contenu sur ses serveurs. Comme le souligne M. Wiens, il suffit d'accéder aux conditions d'utilisation pour s'en rendre compte : "N'utilisez pas le contenu." Cela a conduit certains à se demander si les entreprises d'IA ne préfèrent pas demander pardon plutôt que demander la permission, et ne prennent donc pas la peine de vérifier les conditions d'utilisation en premier lieu.
Dans ce contexte, un groupe d'auteurs a intenté un procès à la société d'IA Anthropic, affirmant qu'elle a commis un "vol à grande échelle" en entraînant son chatbot sur des copies pirates de livres protégés par le droit d'auteur.
Anthropic poursuivi pour avoir entraîné son chatbot sur des copies pirates de livres protégés par le droit d'auteur
Basée à San Francisco et fondée par d'anciens patrons d'OpenAI, Anthropic a fait de la version digne de confiance de l'IA un élément central de ses efforts de marketing autour de son chatbot, Claude, promettant de fournir des "systèmes d'IA fiables, interprétables et orientables". L'entreprise a même appelé de ses vœux des propositions d'IA axées sur la sécurité.
Cette image a été quelque peu ébranlée par la plainte déposée le 19 août dernier devant un tribunal fédéral de San Francisco, alléguant qu'Anthropic a enseigné son produit d'IA en utilisant des bibliothèques d'œuvres piratées. Des plaintes similaires ont été déposées contre ChatGPT d'OpenAI et contre Anthropic lui-même par des éditeurs de musique. "Il n'est pas exagéré de dire que le modèle d'Anthropic cherche à tirer profit de l'exploitation de l'expression humaine et de l'ingéniosité qui se cachent derrière chacune de ces œuvres", affirme la plainte.
Les auteurs qui intentent ce procès sont Andrea Bartz, Charles Graeber et Kirk Wallace Johnson, qui cherchent à représenter une classe d'auteurs de fiction et de non-fiction partageant les mêmes idées. Les plaignants affirment que l'entreprise technologique a construit ses modèles d'IA en utilisant du travail humain. Cela permet d'entraîner des chatbots d'IA comme Claude à produire du texte, sans le consentement des créateurs originaux et sans leur offrir la moindre compensation. Bien que cette affaire porte sur l'écrit, Anthropic fait actuellement l'objet de plaintes similaires de la part d'éditeurs de musique, qui affirment que l'IA générative tire profit de l'utilisation abusive d'œuvres créatives.
Anthropic et d'autres entreprises technologiques se sont défendues en faisant valoir que la formation de modèles d'IA relevait de la doctrine de l'usage loyal de la loi américaine sur le droit d'auteur. Cette doctrine couvre généralement l'enseignement, la recherche ou la transformation d'œuvres protégées par le droit d'auteur en quelque chose de nouveau.
Toutefois, le procès intenté à Anthropic affirme que les systèmes d'IA n'apprennent pas de la même manière que les humains : "Les humains qui apprennent à partir de livres en achètent des copies légales ou les empruntent à des bibliothèques qui les achètent, offrant ainsi au moins une certaine compensation aux auteurs et aux créateurs."
Source : Tribunal fédéral de San Francisco
Et vous ?
Pensez-vous que cette plainte est crédible ou pertinente ?
Quel est votre avis sur le sujet ?
Voir aussi :
Apple et d'autres ont formé leurs modèles d'IA sur un ensemble de données compilé à partir des transcriptions de 173 536 vidéos réparties sur plus de 48 000 chaînes YouTube, sans le consentement des créateurs
De nombreux sites restreignent l'utilisation de leurs données pour empêcher la formation de l'IA, selon une étude. La «crise émergente du consentement» pourrait constituer une menace pour les entreprises d'IA
« Il est impossible de créer des outils comme ChatGPT sans contenus sous copyright », selon OpenAI, qui suscite des réactions dont celles de fermer le service ou de l'amener à rémunérer les auteurs