
OpenAI a admis qu'il s'appuie sur des œuvres protégées par le droit d'auteur
Ces dernières années, les capacités des chatbots d'IA, comme ChatGPT d'OpenAI, se sont considérablement améliorées ; ils s'appuient sur de grands modèles de langage (LLM) pour produire du contenu pour les utilisateurs. Mais le processus de formation est largement controversé, certains éditeurs accusant OpenAI d'utiliser des œuvres protégées par le droit d'auteur sans autorisation, et un certain nombre d'affaires juridiques sont en cours.
Défendant ses pratiques commerciales dans un procès, OpenAI a déclaré : « les modèles apprennent, comme nous le faisons tous, de ce qui a été fait auparavant. La défense de l'usage équitable existe précisément pour cette raison : encourager et permettre le développement de nouvelles idées qui s'appuient sur des idées antérieures ». Cette défense d'OpenAI est conforme aux précédentes déclarations de l'entreprise sur la formation de ses modèles.
En janvier 2024, OpenAI affirmait : « étant donné que le droit d'auteur couvre aujourd'hui pratiquement toutes les formes d'expression humaine, il serait impossible d’entraîner les meilleurs modèles d'IA d'aujourd'hui sans utiliser des documents protégés par le droit d'auteur ». OpenAI reconnaît donc ouvertement qu'il utilise des contenus protégés par le droit d'auteur pour créer ses modèles d'IA. L'entreprise n'a toutefois pas encore été condamnée.
Plusieurs éditeurs de presse ont poursuivi Microsoft et OpenAI pour violation du droit d'auteur. Parmi les poursuivants, on peut noter les éditeurs de presse de Californie, du Colorado, de l'Illinois, de Floride, du Minnesota et de New York. Certains procès sont en cours, mais le 7 novembre 2024, le juge de district américain Colleen McMahon, à New York, a rejeté une poursuite contre OpenAI qui avait été intentée par les médias Raw Story et AlterNet.
Selon les experts, la porte de sortie de la situation semble résider dans la conclusion d’accords de licence avec les éditeurs de presse. L'Associated Press et OpenAI ont conclu un accord de licence permettant à OpenAI d'accéder à une partie des archives textuelles du média. Mais ces accords sont controversés.
OpenAI réclame un accès illimité aux œuvres protégées par le droit d'auteur
Les détenteurs de droits d'auteur et les entreprises d'IA s'affrontent actuellement dans une multitude de procès. La situation est la suivante : les détenteurs de droits d'auteur allèguent que les entreprises d'IA entraînent illégalement leurs modèles sur des œuvres protégées, mais les entreprises d'IA rejettent en bloc ces allégations et affirment que « l'utilisation des œuvres protégées par le droit d'auteur pour l'entraînement de l'IA relève de l'usage loyal ».
Pour l'heure, une décision favorise les détenteurs de droits. Dans une affaire, un juge a statué que l'entraînement de l'IA sur des œuvres protégées n'est pas un usage loyal, car les résultats de l'IA menacent clairement de remplacer Westlaw, la société de recherche juridique de Thomson-Reuters, sur le marché.
OpenAI veut éviter une issue similaire dans les nombreux procès dans lesquels il est impliqué. La startup affirme que l'IA transforme les œuvres protégées par le droit d'auteur sur lesquelles elle s'entraîne et allègue que les réponses générées par l'IA ne sont pas des substituts aux œuvres originales :

Dans le cas contraire, OpenAI affirme que cela aurait de graves conséquences sur les États-Unis. « La République populaire de Chine continuera probablement à accéder à des données protégées par le droit d'auteur auxquelles les entreprises américaines ne peuvent pas accéder, ce qui est censé donner une longueur d'avance à la Chine tout en gagnant peu en termes de protections pour les créateurs de la propriété intellectuelle d'origine », a fait valoir OpenAI.
OpenAI appelle à mettre de côté les considérations liées aux droits d'auteur
Selon OpenAI, le gouvernement fédéral peut à la fois garantir la liberté des Américains d'apprendre à partir de l'IA et éviter de perdre l'avance des États-Unis en matière d'IA au profit de la Chine en préservant la capacité des modèles d'IA américains à apprendre à partir de matériel protégé par le droit d'auteur. Mais OpenAI est accusé de vouloir redéfinir la notion de droit d'auteur à son profit, sans tenir compte des impacts sur les détenteurs de droit d'auteur.
Dans ses recommandations politiques, OpenAI a clairement indiqué qu'il pense que l'acheminement d'un maximum de données vers les entreprises d'IA, sans tenir compte des préoccupations des détenteurs de droits, est la seule voie vers le leadership mondial des États-Unis en matière d'IA.

« Dans l'ensemble, ce paquet de lois pourrait imposer des exigences de conformité lourdes susceptibles d'entraver notre compétitivité économique et de nuire à notre sécurité nationale, car elles seront probablement plus difficiles à appliquer contre les entreprises chinoises », a déclaré l'OpenAI.
Selon OpenAI, « si les modèles d'IA chinois deviennent plus avancés et plus largement utilisés par les Américains, la Chine pourrait manipuler les modèles ou ignorer les préjudices causés aux utilisateurs américains par des activités illicites et nuisibles telles que la fraude d'identité et le vol de propriété intellectuelle ». Au début de l'année, OpenAI a accusé la startup chinoise DeepSeek d'utiliser indûment les données d'OpenAI à des fins d'entraînement.
OpenAI réclame des protections contre les lois internationales en matière d'IA
Dans ses recommandations, OpenAI a déclaré que le développement de l'IA est une question de sécurité nationale. Afin d'éviter les risques pour la sécurité nationale, OpenAI a exhorté Donald Trump à promulguer une loi fédérale qui prenne le pas sur les lois des États qui tentent de réglementer les menaces de l'IA pour des choses comme la vie privée des consommateurs ou l'intégrité des élections, comme les deepfakes ou la reconnaissance faciale.
Selon OpenAI, cette loi fédérale devrait mettre en place un « partenariat volontaire entre le gouvernement fédéral et le secteur privé », où les entreprises d'IA échangent leurs connaissances de l'industrie et l'accès aux modèles contre un « soulagement » fédéral et des «...
La fin de cet article est réservée aux abonnés. Soutenez le Club Developpez.com en prenant un abonnement pour que nous puissions continuer à vous proposer des publications.