Microsoft a déposé une requête visant à rejeter des éléments clés d’une plainte déposée par le New York Times contre l’entreprise et OpenAI, les accusant de violation du droit d’auteur. Pour rappel, le Times a poursuivi les deux sociétés pour avoir utilisé ses articles publiés pour former leurs modèles de langage GPT (large language models, LLM) sans autorisation ni compensation. Dans sa requête, Microsoft accuse le Times de propager une « futurologie apocalyptique » en affirmant que les technologies d’intelligence artificielle (IA) représentent une menace pour le journalisme indépendant. Cette démarche fait suite au dépôt d’OpenAI fin février, qui cherchait également à rejeter certains éléments clés de l’affaire.
Microsoft a déposé lundi une requête auprès d'un tribunal fédéral visant à rejeter certaines parties d'un procès intenté par la New York Times Company.
Le 27 décembre, le Times a intenté un procès à Microsoft et à son partenaire OpenAI, accusant les deux sociétés de violer ses droits d'auteur en utilisant ses articles pour former des technologies d'intelligence artificielle telles que le chatbot IA ChatGPT. Les chatbots concurrencent l'organe d'information en tant que source d'information fiable, selon la plainte.
La plainte du New York Times citait plusieurs exemples où les chatbots d’OpenAI et de Microsoft donnaient aux utilisateurs des extraits quasi textuels de ses articles lorsqu’ils étaient sollicités. Elle accusait OpenAI et Microsoft de vouloir « profiter gratuitement de l’énorme investissement du Times dans le journalisme » et de créer un substitut au journal.
L'éditeur estime que les utilisateurs de la technologie d'OpenAI - que Microsoft applique à l'ensemble de son empire logiciel et cloud - pourraient effectivement contourner le paywall du journal et lire des articles gratuitement en demandant au chatbot de générer des morceaux de texte qu'il a couvert, privant ainsi l'entreprise de l'argent de ses abonnements.
Dans sa requête, déposée auprès du tribunal de district des États-Unis pour le district sud de New York, Microsoft a fait valoir que les grands modèles de langage, ou L.L.M. - les technologies qui alimentent les chatbots - ne supplantaient pas le marché des articles d'actualité et des autres documents sur lesquels ils ont été formés.
La requête de Microsoft était similaire à celle déposée par OpenAI la semaine dernière
Dans une motion demandant le rejet de l'affaire, OpenAI a estimé que les preuves fournies par le journal « semblent avoir été des efforts prolongés et étendus pour pirater les modèles d'OpenAI », et a nié que ChatGPT puisse détourner les gens des paywall, ajoutant que les gens n'utilisent pas le chatbot pour lire des articles publiés de toute façon.
OpenAI a allégué que « 100 exemples dans lesquels une version du modèle GPT-4 d'OpenAI a soi-disant généré plusieurs paragraphes du contenu du Times en réponse à des invites de l'utilisateur » ne reflètent pas la façon dont les gens normaux utilisent ChatGPT.
Au contraire, il aurait fallu au Times « des dizaines de milliers de tentatives pour générer » ces supposés « résultats hautement anormaux » en « ciblant et en exploitant un bogue » qu'OpenAI affirme s'être maintenant « engagée à corriger ».
Selon OpenAI, cette activité équivaut à des « attaques fabriquées » par un « tueur à gages », qui aurait piraté les modèles OpenAI jusqu'à ce qu'ils hallucinent du faux contenu du NYT ou régurgitent des données d'entraînement pour reproduire les articles du NYT. Le NYT aurait payé pour ces « attaques » afin de recueillir des preuves à l'appui des affirmations du Times selon lesquelles les produits d'OpenAI mettent en péril son journalisme en régurgitant prétendument des reportages et en volant l'audience du Times.
OpenAI n’a pas nommé la personne qu’elle qualifie de « tueur à gages » et n’a pas accusé le journal d’enfreindre les lois anti-piratage.
Tout comme OpenAI avant elle, Microsoft accuse le Times d’avoir créé des « instructions irréalistes » pour inciter les outils basés sur GPT à générer des réponses correspondant à son contenu.
L’entreprise compare également la plainte du Times aux efforts des studios hollywoodiens pour « stopper une nouvelle technologie révolutionnaire » : le magnétoscope (VCR). Plus précisément, Microsoft a comparé les L.L.M. aux enregistreurs à vidéocassette, arguant que les deux sont autorisés par la loi. « Malgré les affirmations du Times, la loi sur le droit d'auteur n'est pas plus un obstacle pour le L.L.M. qu'elle ne l'était pour le magnétoscope (ou le piano mécanique, la photocopieuse, l'ordinateur personnel, l'internet ou le moteur de recherche) », peut-on lire dans la motion.
À la fin des années 1970, les studios de cinéma ont poursuivi Sony pour son magnétoscope Betamax, arguant qu'il permettrait aux gens de copier illégalement des films et des émissions de télévision. Mais les tribunaux ont finalement estimé que la réalisation de ces copies à des fins de visionnage personnel constituait un usage loyal au regard de la loi.
En effet, au lieu de nuire à Hollywood, le VCR a contribué à l’essor de l’industrie du divertissement en ouvrant de nouvelles sources de revenus. Le fabricant de Windows estime alors que les LLM constituent une avancée majeure en matière d’intelligence artificielle, et Microsoft a collaboré avec OpenAI pour « mettre leur extraordinaire puissance à la portée du public », car elle « croit fermement en leur capacité à améliorer la vie et le travail des gens ».
Microsoft a déclaré que trois parties du procès devraient être rejetées en partie parce que le Times n'a pas démontré de préjudice réel
L’entreprise demande au tribunal de rejeter trois chefs d’accusation, dont celui affirmant qu’elle est responsable de la violation du droit d’auteur par les utilisateurs finaux via l’utilisation d’outils basés sur GPT, ainsi que celui alléguant une violation du Digital Millennium Copyright Act. Microsoft souhaite également que le tribunal rejette l’élément de l’affaire dans lequel le Times l’accuse d’avoir détourné des actualités urgentes et des recommandations d’achats pour les consommateurs. À titre d’exemple, le Times a soutenu dans sa plainte qu’il perdra des revenus si les utilisateurs demandent à ChatGPT de rechercher des articles sur Wirecutter, propriété du journal, car les acheteurs potentiels ne cliqueront plus sur ses liens de recommandation. Cependant, Microsoft considère que cela relève de la « spéculation sur ce que le Times craint apparemment qu’il se produise », et le journal n’a fourni aucun exemple concret dans sa plainte.
« Microsoft ne conteste pas avoir travaillé avec OpenAI pour copier des millions d’œuvres du Times sans autorisation afin de construire ses outils », a déclaré Ian Crosby, avocat principal du Times. « Au lieu de cela, elle compare étrangement les LLM au VCR, même si les fabricants de VCR n’ont jamais prétendu qu’il était nécessaire de se livrer à une violation massive du droit d’auteur pour construire leurs produits. »
Conclusion
Comme d'autres entreprises d'I.A., Microsoft et OpenAI ont construit leur technologie en l'alimentant avec d'énormes quantités de données numériques, dont certaines sont probablement protégées par des droits d'auteur. Les entreprises d'I.A. ont affirmé qu'elles pouvaient légalement utiliser ces données pour former leurs systèmes sans avoir à les payer, parce qu'elles sont publiques et qu'elles ne les reproduisent pas dans leur intégralité.
Le Times est le premier grand média américain à poursuivre Microsoft et OpenAI pour des questions de droits d'auteur liés à ses œuvres écrites. Des écrivains, des codeurs informatiques et d'autres groupes ont également intenté des actions en justice pour violation des droits d'auteur contre des entreprises qui développent des technologies d'IA générative, c'est-à-dire des technologies qui génèrent du texte, des images et d'autres médias.
OpenAI et Microsoft font face à d'autres poursuites judiciaires liées au contenu utilisé pour former leurs LLM. Des écrivains de non-fiction et des auteurs de fiction, dont Michael Chabon, George R.R. Martin, John Grisham et Jodi Picoult, ont accusé les entreprises d'avoir volé leur travail pour entraîner l'IA. Plus récemment, The Intercept, Raw Story et AlterNet ont intenté des actions en justice distinctes contre l'entreprise, car ChatGPT reproduirait leur contenu « mot pour mot ou presque » tout en supprimant les attributions appropriées.
Source : motion de Microsoft
Et vous ?
Quelle est votre opinion sur l’utilisation d’articles de presse pour former des modèles de langage comme GPT ? Pensez-vous que les entreprises devraient obtenir une autorisation explicite avant d’utiliser du contenu protégé par le droit d’auteur ?
Les technologies d’intelligence artificielle (IA) menacent-elles réellement le journalisme indépendant ? Ou bien est-ce une exagération ? Quels sont les avantages et les inconvénients de l’utilisation de l’IA dans le domaine du journalisme ?
Le Times a-t-il raison de poursuivre Microsoft et OpenAI ? Quelles sont les implications plus larges de cette affaire pour l’avenir de l’IA et du droit d’auteur ?
Pensez-vous que les LLM (large language models) devraient être soumis à des règles plus strictes en matière d’utilisation de contenu protégé par le droit d’auteur ? Si oui, quelles mesures devraient être prises ?
Quelles sont les responsabilités des entreprises technologiques lorsqu’il s’agit d’utiliser des œuvres protégées par le droit d’auteur pour former des modèles d’IA ?
Microsoft accuse le New York Times de propager une « futurologie apocalyptique » dans le cadre du procès OpenAI
Et demande de rejeter des éléments clés du procès intenté pour violation du copyright
Microsoft accuse le New York Times de propager une « futurologie apocalyptique » dans le cadre du procès OpenAI
Et demande de rejeter des éléments clés du procès intenté pour violation du copyright
Le , par Stéphane le calme
Une erreur dans cette actualité ? Signalez-nous-la !