La société Anthropic, spécialisée dans l'intelligence artificielle générative (GenAI), a fait valoir devant un tribunal américain que l'utilisation de contenus protégés par le droit d'auteur dans les données d'apprentissage des grands modèles de langage (LLM) relevait d'un « usage loyal » et que « les outils d'IA à usage général d'aujourd'hui ne pourraient tout simplement pas exister » si les sociétés d'IA devaient payer des licences pour ces contenus. En vertu de la législation américaine, le « fair use » permet l'utilisation limitée de matériel protégé par des droits d'auteur sans autorisation, à des fins telles que la critique, le reportage, l'enseignement et la recherche.
Les outils de génération automatique de contenu, basés sur l’intelligence artificielle, sont de plus en plus utilisés dans divers domaines, tels que le journalisme, le marketing, le design ou la musique. Ces outils, appelés GenAI tools, permettent de créer des textes, des images, des vidéos, des sons ou des modèles 3D à partir de données existantes ou de requêtes en langage naturel. Ils reposent sur des algorithmes complexes et des réseaux neuronaux capables d’apprendre des patterns et de produire des outputs qui imitent la créativité humaine.
Toutefois, ces outils soulèvent des questions juridiques et éthiques, notamment en matière de droit d’auteur. En effet, les GenAI tools utilisent souvent des œuvres protégées par le droit d’auteur comme source d’inspiration ou de formation, sans rémunérer ni demander l’autorisation des auteurs originaux. Certains estiment que cela constitue une violation du droit d’auteur et que les GenAI tools devraient payer des royalties ou des licences pour utiliser les œuvres existantes. D’autres, au contraire, considèrent que les GenAI tools ne font que réutiliser les œuvres existantes de manière transformative et originale, et qu’ils devraient bénéficier d’une exception au droit d’auteur, au nom de la liberté d’expression ou de l’innovation.
Anthropic poursuivit pour violation du copyright...
En octobre 2023, une série d'éditeurs de musique, dont Concord, Universal Music Group et ABKCO, ont intenté une action en justice contre la société d'IA générative Anthropic, soutenue par Amazon et Google, réclamant des millions de dollars de dommages et intérêts pour la prétendue « violation systématique et généralisée de leurs paroles de chansons protégées par le droit d'auteur ».
La plainte, déposée auprès d'un tribunal de district du Tennessee, allègue qu'Anthropic, en construisant et en exploitant ses modèles d'IA, « copie et diffuse illégalement de vastes quantités d'œuvres protégées par le droit d'auteur, y compris les paroles d'une myriade de compositions musicales appartenant à des éditeurs ou contrôlées par eux ». Elle ajoute que si la technologie de l'IA peut être complexe et à la pointe du progrès, les questions juridiques liées à l'utilisation d'œuvres protégées par le droit d'auteur sont « simples et connues de longue date ».
« Le défendeur ne peut pas reproduire, distribuer et afficher les œuvres protégées par le droit d'auteur de quelqu'un d'autre pour créer sa propre entreprise, à moins d'obtenir l'autorisation du titulaire des droits », est-il indiqué dans la plainte. Ce principe ne disparaît pas simplement parce qu'une société orne sa contrefaçon des mots "AI".
La plainte affirme en outre que l'incapacité d'Anthropic à obtenir des autorisations de droits d'auteur « prive les éditeurs et leurs auteurs-compositeurs du contrôle de leurs œuvres protégées par le droit d'auteur et des bénéfices durement gagnés de leurs efforts créatifs ».
...estime qu'il n'est pas viable d'obtenir des accords de licence
Pour remédier à ce problème, les éditeurs de musique demandent au tribunal d'obliger Anthropic à verser des dommages et intérêts, de rendre compte de ses données et méthodes de formation et de détruire toutes les « copies contrefaites » des œuvres en possession de la société.
Cependant, dans une soumission au Bureau américain des droits d'auteur le 30 octobre (qui était complètement séparée de l'affaire), Anthropic a déclaré que l'entraînement de son modèle d'IA Claude « se qualifie comme une utilisation essentiellement licite des matériaux », arguant que, « dans la mesure où des œuvres protégées par le droit d'auteur sont utilisées dans les données d'entraînement, c'est pour l'analyse (des relations statistiques entre les mots et les concepts) qui n'est pas liée à un quelconque objectif expressif de l'œuvre ».
Elle a ajouté : « L'utilisation d'œuvres pour former Claude est équitable car elle n'empêche pas la vente des œuvres originales et, même si elle est commerciale, elle est suffisamment transformatrice ».
En ce qui concerne l'éventualité d'un régime de licence pour l'ingestion par LLM de contenus protégés...
La fin de cet article est réservée aux abonnés. Soutenez le Club Developpez.com en prenant un abonnement pour que nous puissions continuer à vous proposer des publications.