À mesure que l'IA devient de plus en plus sophistiquée et s'intègre à notre vie quotidienne, des questions difficiles se posent quant à la responsabilité juridique de ses actions. Les outils d'IA générative, capables de produire de nouveaux textes, images, musiques et autres à partir d'un échantillon de données, en sont un bon exemple. Lorsque ces créations empruntent des éléments protégés par le droit d'auteur, qui doit en subir les conséquences : l'utilisateur qui fournit l'invite ou le développeur de l'outil d'IA ? Eh bien, les géants de la Tech ont un avis tout tranché sur la question : il consiste à privatiser les profits et à socialiser la violation des droits d'auteur.
Selon les entreprises du secteur de l'IA, les programmes d'IA sont exactement comme les appareils d'enregistrement audio ou vidéo, les photocopieurs ou les caméras, qui peuvent tous être utilisés pour enfreindre les droits d'auteur. Les fabricants de ces appareils ne sont pas responsables des cas de violation du droit d'auteur, alors pourquoi les entreprises d'IA devraient-elles l'être ? C'est du moins ce qui ressort de leur raisonnement. Par exemple, lorsque vous reproduisez entièrement un livre à l'aide d'une photocopieuse, ce n'est pas le fabricant de l'appareil qui risque des poursuites, mais bien sûr vous, sauf si vous avez une autorisation légale.
Les sociétés d'IA souhaitent que les choses se passent de la même façon avec les programmes d'IA qu'ils fournissent. Le Bureau américain du droit d'auteur réfléchit à de nouvelles réglementations concernant l'IA générative et a publié en août une demande de commentaires sur l'IA et le droit d'auteur. Les réponses à cette demande sont publiques. La démarche révèle que les entreprises du secteur de l'IA du monde ont beaucoup à dire à ce sujet. L'article présente ci-dessous les arguments de Meta, Google, Microsoft, Adobe, Hugging Face, StabilityAI et Anthropic, ainsi qu'une réponse d'Apple sur le droit d'auteur concernant le code généré par l'IA.
D'après les plaintes, la plupart des entreprises d'IA ont utilisé sans autorisation du matériel protégé par des droits d'auteur ou des marques déposées pour former leur logiciel, et OpenAI est poursuivi en justice par plus d'une douzaine d'auteurs majeurs qui l'accusent d'avoir violé leurs droits d'auteur. Et bien que ces entreprises aient déclaré que les consommateurs devraient être responsables des résultats de leurs systèmes, nombre d'entre elles, dont Google, OpenAI, Microsoft et Amazon, proposent de couvrir les frais de justice de leurs clients dans le cadre de procès pour violation des droits d'auteur. Ce qui brouille encore plus les pistes.
Mais, en fin de compte, les entreprises affirment que la loi actuelle sur le droit d'auteur est de leur côté et qu'il n'est pas nécessaire que le Bureau du droit d'auteur la modifie, du moins pas maintenant. Elles notent que si le bureau s'en prend aux développeurs et modifie la loi sur le droit d'auteur, cela pourrait entraver la technologie naissante. Dans sa lettre, OpenAI a déclaré qu'elle demande instamment au Bureau du droit d'auteur de faire preuve de prudence en appelant à de nouvelles solutions législatives qui pourraient s'avérer, a posteriori, prématurées ou malavisées, alors que la technologie évolue rapidement. Voici ce que disent les commentaires :
Microsoft
« Les utilisateurs doivent prendre la responsabilité d'utiliser les outils de manière responsable et conformément à leur conception. Pour répondre aux préoccupations des titulaires de droits, les développeurs d'IA ont pris des mesures pour atténuer le risque d'utilisation abusive des logiciels d'IA à des fins de violation des droits d'auteur. Microsoft intègre un grand nombre de mesures et de garanties de ce type pour limiter les utilisations potentiellement préjudiciables de ses outils d'IA. Ces mesures comprennent des contrôles qui ajoutent des instructions supplémentaires à l'invite de l'utilisateur afin de limiter les résultats nuisibles ou illicites », note Microsoft.
Cependant, il convient de noter que les "mesures de protection" que Microsoft est censé avoir mises en place n'ont guère permis d'empêcher les violations massives de marques et de droits d'auteur. En fait, The Walt Disney Company a récemment demandé au géant de la technologie d'empêcher les utilisateurs de porter atteinte à ses marques. En ce qui concerne la modification de la législation sur le droit d'auteur, Microsoft a déclaré qu'elle pourrait nuire aux petits développeurs d'IA. « L'obligation d'obtenir le consentement pour utiliser des œuvres accessibles à des fins de formation freinerait l'innovation dans le domaine de l'IA », a écrit l'entreprise.
« Il n'est pas possible d'obtenir l'échelle de données nécessaires pour développer des modèles d'IA responsables. De tels régimes de licence entraveront l'innovation des jeunes entreprises et des nouveaux venus qui ne disposent pas des ressources nécessaires pour obtenir des licences, laissant le développement de l'IA à un petit groupe d'entreprises disposant des ressources nécessaires pour gérer des programmes de licence à grande échelle ou à des développeurs dans des pays qui ont décidé que l'utilisation d'œuvres protégées par le droit d'auteur pour former des modèles IA ne constituait pas une violation des droits d'auteur ».
« La possibilité qu'un système d'IA génératif puisse, grâce à une "prompt engineering", être amené à reproduire un contenu à partir de ses données d'apprentissage soulève des questions quant à la limite appropriée entre la contrefaçon directe et la contrefaçon secondaire. Lorsqu'un système d'IA est incité par un utilisateur à produire un résultat de contrefaçon, toute responsabilité qui en découle devrait être attribuée à l'utilisateur en tant que partie dont le comportement volontaire a causé la contrefaçon de manière immédiate », a déclaré la firme de Mountain View. Selon elle, par le passé, de telles règles auraient empêché plusieurs innovations.
« Une règle qui tiendrait les développeurs d'IA directement (et strictement) responsables de tout résultat contrefaisant créé par les utilisateurs imposerait une responsabilité écrasante aux développeurs d'IA, même s'ils ont pris des mesures raisonnables pour empêcher les activités de contrefaçon des utilisateurs. Si cette norme avait été appliquée dans le passé, nous n'aurions pas d'accès légal aux photocopieuses, aux appareils d'enregistrement audio et vidéo personnels ou aux ordinateurs personnels, qui peuvent tous être utilisés à des fins de contrefaçon ainsi qu'à des fins très bénéfiques », affirme Google. L'entreprise ajoute :
« Si la formation pouvait être réalisée sans création de copies, il n'y aurait pas de questions de droit d'auteur dans ce cas. En effet, cet acte de "récolte de connaissances", pour reprendre la métaphore de Harper & Row utilisée par la Cour, comme l'acte de lire un livre et d'apprendre les faits et les idées qu'il contient, non seulement ne constituerait pas une contrefaçon, mais contribuerait à l'objectif même de la loi sur le droit d'auteur. Le simple fait que, d'un point de vue technologique, des copies doivent être faites pour extraire ces idées et ces faits des œuvres protégées par le droit d'auteur ne devrait pas modifier ce résultat ».
OpenAI
« Dans l'évaluation des réclamations pour infraction concernant les résultats, l'analyse commence par l'utilisateur. Après tout, il n'y a pas de résultat sans une demande de l'utilisateur, et la nature du résultat est directement influencée par ce qui a été demandé », indique la startup d'IA. Microsoft et OpenAI sont étroitement liés par un partenariat, la firme de Redmond ayant investi plusieurs milliards de dollars dans le laboratoire d'IA de San Francisco. Cela suggère que les deux entreprises partagent le même point de vue sur la question. OpenAI est beaucoup plus intéressé par une réglementation portant sur le développement de l'IA à l'échelle de l'industrie.
Meta
« Imposer un régime de licence inédit maintenant, bien après les faits, provoquera le chaos, car les développeurs chercheront à identifier des millions et des millions de détenteurs de droits, pour un bénéfice très faible, étant donné que toute redevance équitable due serait incroyablement faible à la lumière de l'insignifiance de n'importe quelle œuvre parmi un ensemble d'entraînement Al », affirme Meta. En clair, Mark Zuckerberg et les siens pensent que la modification de la loi sur le droit d'auteur risque de créer de nouveaux problèmes et que les détenteurs de droits d'auteur ne recevraient de toute façon pas beaucoup d'argent.
Anthropic
« Une politique saine a toujours reconnu la nécessité d'imposer des limites appropriées au droit d'auteur afin de soutenir la créativité, l'innovation et d'autres valeurs, et nous pensons que le droit existant et la collaboration continue entre toutes les parties prenantes peuvent harmoniser les divers intérêts en jeu, libérer les avantages de l'IA tout en répondant aux inquiétudes », note Anthropic. Il estime que la loi actuelle est bonne et il n'y a aucune raison de la changer. En outre, la société a déclaré que la copie n'est qu'une étape intermédiaire qui permet d'extraire des éléments non protégeables et de les utiliser pour aboutir à de nouveaux résultats.
« Comme nous l'avons vu plus haut, pour Claude, le processus de formation fait des copies d'informations dans le but d'effectuer une analyse statistique des données. La copie n'est qu'une étape intermédiaire, qui permet d'extraire des éléments non protégeables de l'ensemble du corpus d'œuvres, afin de créer de nouveaux résultats. De cette manière, l'utilisation de l'œuvre originale protégée par le droit d'auteur est non expressive, c'est-à-dire qu'il ne s'agit pas de réutiliser l'expression protégée par le droit d'auteur pour la communiquer aux utilisateurs », explique Anthropic dans son commentaire adressé au Bureau américain du droit d'auteur.
Adobe
« Dans l'affaire Sega v. Accolade, le neuvième circuit a jugé que la copie intermédiaire du logiciel de Sega constituait un usage loyal. Le défendeur a effectué des copies pendant qu'il procédait à une rétro-ingénierie pour découvrir les exigences fonctionnelles - informations non protégées - permettant de rendre les jeux compatibles avec la console de jeu de Sega. Cette copie intermédiaire a également bénéficié au public : elle a entraîné une augmentation du nombre de jeux vidéo conçus de manière indépendante (qui contiennent un mélange d'aspects fonctionnels et créatifs) disponibles pour la console de Sega », écrit l'entreprise.
D'après elle, cette croissance de l'expression créative était précisément ce que la loi sur le droit d'auteur était censée promouvoir. Des plaintes ont signalé au début de l'année qu'Adobe utilise les photos des clients pour entraîner son IA. Un client a découvert qu'Adobe l'avait inscrit (ainsi que d'autres clients) à un programme d'analyse de contenu à travers lequel l'éditeur de logiciels graphiques peut analyser votre contenu hébergé sur son cloud à l'aide de techniques telles que l'apprentissage automatique (par exemple, pour la reconnaissance des formes) afin de développer et d'améliorer ses produits et services basés sur l'IA.
Hugging Face
« L'utilisation d'une œuvre donnée dans le cadre d'une formation poursuit un objectif largement bénéfique : la création d'un modèle Al distinctif et productif. Plutôt que de remplacer l'expression communicative spécifique de l'œuvre initiale, le modèle est capable de créer une grande variété de sorties différentes sans aucun rapport avec l'expression sous-jacente protégée par le droit d'auteur. Pour ces raisons et d'autres encore, les modèles génératifs sont généralement considérés comme une utilisation équitable lorsqu'ils s'entraînent sur un grand nombre d'œuvres protégées par le droit d'auteur », explique Hugging Face dans son commentaire.
StabilityAI
« Plusieurs juridictions, dont Singapour, le Japon, l'UE et la République de Corée ont réformé leurs lois sur le droit d'auteur afin de créer des zones de sécurité pour la formation à l'IA qui produisent des effets similaires à ceux de l'utilisation équitable. Au Royaume-Uni, le conseiller scientifique en chef du gouvernement a recommandé que : si l'objectif du gouvernement est de promouvoir une industrie innovante de l'IA au Royaume-Uni, il devrait permettre l'extraction de données, de textes et d'images disponibles (l'input) et utiliser les protections existantes du droit d'auteur et de la loi sur la propriété intellectuelle sur l'output de l'IA », note l'entreprise.
Apple
« Dans les cas où un développeur humain contrôle les éléments expressifs de la sortie et les décisions de modifier, d'ajouter, d'améliorer ou même de rejeter le code suggéré, le code final qui résulte des interactions du développeur avec les outils sera suffisamment humain pour être protégé par le droit d'auteur », explique Apple.
Motion Picture Association
Selon les analystes, il peut être surprenant de constater que les principaux studios de cinéma commencent à se ranger du côté des géants de la Tech, même s'ils abordent la question sous un angle différent. Dans sa soumission au Bureau du droit d'auteur, la Motion Picture Association (MPA) a établi une distinction entre l'IA générative et l'utilisation de l'IA dans l'industrie cinématographique, dans laquelle "l'IA est un outil qui soutient, mais ne remplace pas, la création humaine des œuvres des membres". L'association s'est également prononcée contre la mise à jour de la législation actuelle sur le droit d'auteur, en déclarant notamment :
« La MPA estime actuellement que la loi existante sur le droit d'auteur devrait être en mesure de répondre à ces questions. Un titulaire de droits d'auteur qui établit une violation devrait pouvoir se prévaloir des recours existants prévus aux articles 502 à 505, y compris les dommages-intérêts et les mesures d'injonction. À l'heure actuelle, il n'y a aucune raison de penser que les titulaires de droits d'auteur et les entreprises engagées dans la formation de modèles et de systèmes d'IA générative ne peuvent pas conclure des accords de licence volontaires, de sorte qu'une intervention des pouvoirs publics pourrait être nécessaire ».
Source : le Bureau américain du droit d'auteur
Et vous ?
Que pensez-vous des différents avis exprimés ci-dessus par les entreprises d'IA ?
À votre avis, les utilisateurs sont-ils responsables des violations de droits d'auteurs liées à l'IA ?
Que pensez-vous du choix de Google de comparer les programmes d'IA aux appareils comme les photocopieuses ?
Que pensez-vous du refus des entreprises d'IA de rémunérer les détenteurs de droits d'auteur sur les données d'entraînement de l'IA ?
Que pensez-vous de l'approche des entreprises du secteur de l'IA sur le droit d'auteur ? Tentent-elles de le contourner ou d'exploiter ses limites ?
Voir aussi
Adobe utilise-t-il vos photos pour entraîner son IA ? Adobe pourrait analyser votre contenu à l'aide de techniques telles que l'apprentissage automatique, selon la Fondation Krita
Microsoft s'engage à payer les frais de justice si des clients sont poursuivis pour avoir utilisé son IA Copilot, sans s'inquiéter des plaintes pour violation de copyright
OpenAI et Meta accusés d'avoir utilisé les œuvres de Sarah Silverman et de deux auteurs sans leur consentement, comme données d'entraînements de leurs IA. Les plaintes de ce type se multiplient