IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)

Vous êtes nouveau sur Developpez.com ? Créez votre compte ou connectez-vous afin de pouvoir participer !

Vous devez avoir un compte Developpez.com et être connecté pour pouvoir participer aux discussions.

Vous n'avez pas encore de compte Developpez.com ? Créez-en un en quelques instants, c'est entièrement gratuit !

Si vous disposez déjà d'un compte et qu'il est bien activé, connectez-vous à l'aide du formulaire ci-dessous.

Identifiez-vous
Identifiant
Mot de passe
Mot de passe oublié ?
Créer un compte

L'inscription est gratuite et ne vous prendra que quelques instants !

Je m'inscris !

GitHub, Microsoft, OpenAI ne parviennent pas à se sortir du procès Copilot,
Le juge a refusé de rejeter deux plaintes dans l'affaire et a renvoyé la plupart des autres allégations

Le , par Bruno

11PARTAGES

9  0 
GitHub, Microsoft et OpenAI sont poursuivis en justice pour avoir utilisé du code source public provenant de GitHub pour créer le modèle d’apprentissage automatique Codex d’OpenAI et l’assistant de programmation Copilot de GitHub. Les développeurs de logiciels affirment que Codex et Copilot ont été créés à partir de leur code, et le reproduisent parfois, sans leur permission explicite ou sans respecter les conditions sous lesquelles ils ont accordé leur licence.

Le juge Jon Tigar a refusé de rejeter deux accusations dans l’affaire et a renvoyé la plupart des autres allégations pour révision. Il s’agit d’une violation des conditions de licence des logiciels et d’une violation de la loi sur le droit d’auteur numérique (DMCA) pour avoir reproduit du code protégé par le droit d’auteur sans les informations requises sur la gestion des droits d’auteur.


Le procès devrait donc se poursuivre sur la base de ces allégations. Le juge a également rejeté - avec possibilité de modifier - les accusations des plaignants pour avoir violé d’autres aspects du DMCA, interféré avec les contrats, commis une fraude, une fausse désignation d’origine, un enrichissement sans cause, une concurrence déloyale, violé la politique de confidentialité et les conditions d’utilisation de GitHub, violé la loi californienne sur la protection de la vie privée des consommateurs et fait preuve de négligence.

Il a estimé que ces accusations manquaient de détails requis par la loi pour être recevables, mais qu’elles étaient suffisamment plausibles pour envisager une plainte modifiée qui fournirait plus de clarté sur le préjudice supposé causé par Copilot et Codex.

OpenAI accuse GitHub et Microsoft d’avoir violé ses droits d’auteur et sa marque déposée en utilisant son modèle GPT-3 sans autorisation pour alimenter GitHub Copilot. GitHub et Microsoft demandent au tribunal de rejeter la plainte d’OpenAI, en invoquant plusieurs arguments juridiques, tels que le fait que le code généré par GitHub Copilot n’est pas une copie du code d’OpenAI, que l’utilisation de GPT-3 relève du fair use, et que la marque déposée d’OpenAI n’est pas distinctive.

L’ordonnance du tribunal a examiné les arguments des deux parties et décide de rejeter partiellement et de maintenir partiellement la plainte d’OpenAI. Le tribunal conclut qu’il existe une inférence raisonnable que GitHub a intentionnellement conçu GitHub Copilot pour utiliser GPT-3, ce qui pourrait constituer une violation directe ou contributive des droits d’auteur d’OpenAI. Le tribunal rejette cependant les allégations d’OpenAI selon lesquelles GitHub Copilot viole sa marque déposée, en estimant qu’OpenAI n’a pas démontré que sa marque déposée est protégeable ou que GitHub Copilot crée une confusion chez les consommateurs. Le tribunal accorde à OpenAI la possibilité de modifier sa plainte pour remédier aux défauts identifiés.

L'ordonnance rendue jeudi par le juge de district Jon Tigar en Californie du Nord peut être considérée comme un bref répit pour GitHub, sa société mère Microsoft et son partenaire OpenAI, dont le chiffre d'affaires atteint plusieurs milliards de dollars. Mais il laisse intacts les aspects les plus importants de l'affaire tout en permettant à d'autres revendications d'être mieux étayées dans une plainte révisée.

Déposée en novembre, la plainte initiale alléguait que GitHub, Microsoft et OpenAI avaient violé le droit d'auteur, le droit des contrats, le droit à la vie privée et le droit des affaires, entre autres, en utilisant le code source public extrait de GitHub pour créer le modèle d'apprentissage automatique Codex d'OpenAI et l'assistant de programmation Copilot de GitHub.

Les développeurs de logiciels se sont insurgés du fait que Codex et Copilot ont été créés à partir de leur code, et qu'ils le reproduisent parfois, sans autorisation explicite et sans se soucier des conditions de licence de leur travail. Certains d'entre eux ont d'ailleurs intenté des procès à ce sujet.

Le juge a par ailleurs rejeté l'argument de la défense selon lequel les plaignants ne devraient pas être autorisés à poursuivre leur action sous pseudonyme en raison des menaces de mort envoyées à l'avocat des plaignants.

GitHub et Microsoft suggèrent que la crainte des plaignants est déraisonnable parce que « les types de messages méchants dont il est question ici sont un fait de la vie moderne à l'ère des "trolls" sur Internet », a écrit le juge dans son ordonnance. GitHub et Microsoft n'expliquent pas pourquoi la montée des trolls sur Internet rend les craintes des plaignants déraisonnables.

Sources : The order issued by US District Judge Jon Tigar, The initial complaint

Et vous ?

Les arguments des défendeurs pour justifier l’utilisation du code public pour créer Codex et Copilot sont-ils compréhensibles ?

Quelles sont les conséquences potentielles de cette affaire pour les développeurs de logiciels qui utilisent des licences open source ?

Quels peuvent être les risques juridiques et éthiques de la génération automatique de code à partir d’exemples existants ?

Quelles sont les alternatives possibles à Copilot et Codex pour aider les développeurs à écrire du code plus facilement et plus rapidement ?

Voir aussi :

Un développeur poursuit Microsoft, GitHub et OpenAI pour une technologie d'IA qui génère du code semblant identique aux programmes existants. Copilot s'appuie sur du code publié sur GitHub

Une avocate spécialisée dans l'open source donne son point de vue sur la plainte contre GitHub Copilot, l'assistant de programmation basé sur l'IA

Un développeur porte plainte contre GitHub Copilot, le décrivant comme un produit d'IA qui «*s'appuie sur un piratage de logiciels open source sans précédent ». Il vise le statut de recours collectif

OpenAI a fait appel à des travailleurs kényans payés moins de 2 dollars par heure pour rendre ChatGPT moins toxique, les experts jugent ce tarif faible en raison des "tâches ingrates" des employés

Windows 12 : Microsoft se prépare à une intégration plus profonde de l'IA dans son système d'exploitation. Cette version pourrait être disponible l'année prochaine, en 2024

Une erreur dans cette actualité ? Signalez-nous-la !

Avatar de OrthodoxWindows
Membre expert https://www.developpez.com
Le 08/04/2024 à 10:48
Tant que GPT-4 ne bloque pas les publicités lors de son visionnage, pour Youtube ça ne devrait pas poser de problèmes.

9  0 
Avatar de onilink_
Membre émérite https://www.developpez.com
Le 07/10/2023 à 20:08
Citation Envoyé par archqt Voir le message
Pas évident, moi je lis des livres, imaginons des milliers. Ensuite j'écris un livre qui tient compte de mes lectures. Quelle différence avec l'entraînement de l'IA au final ?
Ensuite je comprends parfaitement les remarques de ceux dont les œuvres sont "pompées"
Absolument tout... ?

Comparer un LLM, un algorithme qui à la fâcheuse tendance à mémoriser ses entrées, mais qui ne connaît rien d'autre du monde que ces données la, avec un humain qui compresse et mémorise mal mais aussi de façon ultra subjective ses lectures tout en les mélangeant à son vécu... sérieusement?

Cela me semble très dangereux d'essayer de faire le lien entre les deux.

De plus il ne te faut pas une fraction de seconde pour pondre un livre. Et si tu fais du plagiat tu te prendras un procès.

OpenAI demandent à ce que leurs magouilles deviennent juridiquement légales. Cela n'apportera rien de bon pour personne, sauf pour eux.
9  1 
Avatar de totozor
Expert confirmé https://www.developpez.com
Le 23/08/2023 à 7:42
Quelle est votre opinion sur l’utilisation du contenu protégé par le droit d’auteur comme données d’entraînement pour les modèles d’IA ?
Je suis assez partagé, autant je peux comprendre qu'un auteur ne veut pas qu'on puisse contourner l'achat de son livre avec une IA.
Autant les auteurs doivent aussi admettre que leurs oeuvres sont publiques et il n'y a rien de choquant qu'une IA puisse faire un résumé de celles ci. Tout comme il n'est pas choquant qu'une IA résume la pensée d'un philosophe.
Pensez-vous que les entreprises d’IA devraient payer les auteurs dont les œuvres sont utilisées comme données d’entraînement ?
Ca les rendrait instantanément non viables, ça rendrait les IA existantes complètement protégées d'éventuel nouveau concurent.
Avez-vous déjà utilisé ou interagi avec un modèle d’IA qui a généré du contenu protégé par le droit d’auteur ? Si oui, comment avez-vous réagi ?
Probablement pas mais beaucoup de monde semble impressionné par les réponses à "écrit moi un texte à la façon de ..." donc c'est monnaie courante.

Citation Envoyé par Stéphane le calme Voir le message
ChatGPT tente désormais d’éviter de répondre aux sollicitations des utilisateurs avec des formulations exactes provenant d’œuvres protégées par le droit d’auteur, selon un article technique publié par un groupe de chercheurs en IA travaillant pour le pôle recherche de ByteDance.
C'est interressant parce que si l'article dit vrai ça veut dire que ChatGPT sait identifier les textes soumis au droit d'auteur et donc ne pourra pas se défendre en disant qu'ils ont traité une tonne de données aveuglément et qu'ils sont donc incapable d'identifier les données libres de droit des autres.
4  0 
Avatar de Leruas
Membre éclairé https://www.developpez.com
Le 08/04/2024 à 21:24
Heureusement qu'ils n'ont pas entrainé GPT-4 sur des vidéos TikTok
4  0 
Avatar de _toma_
Membre éclairé https://www.developpez.com
Le 08/10/2023 à 18:28
La question du comité : "Comment justifiez-vous de la légalité de votre collecte de données ?"
La réponse d'openAI : "Nous vous assurons que cette collecte de données est loyale."

Et la suite de leur réponse :
L'incertitude juridique sur les implications en matière de droit d'auteur de l'entraînement des systèmes d'IA impose des coûts substantiels aux développeurs d'IA et devrait donc être résolue de manière autoritaire.
Non mais vous êtes sérieux les gars ? Vous voulez bien faire de la thune mais vous voulez pas en dépenser donc il faudrait prendre une décision autoritaire (qui fasse abstraction de la loi ?) qui aille dans votre sens. C'est vraiment ça la réponse ? Ça me semble tellement hallucinant que je me demande si je comprends bien la phrase.
4  1 
Avatar de Fagus
Membre expert https://www.developpez.com
Le 23/08/2023 à 13:11
Citation Envoyé par totozor
autant je peux comprendre qu'un auteur ne veut pas qu'on puisse contourner l'achat de son livre avec une IA.
Autant les auteurs doivent aussi admettre que leurs oeuvres sont publiques et il n'y a rien de choquant qu'une IA puisse faire un résumé de celles ci. Tout comme il n'est pas choquant qu'une IA résume la pensée d'un philosophe.
Je suis d'accord, mais je vois deux problème légaux :
  1. que la société n'ait pas payé les documents d'entraînement . Si un particulier veut accéder à un contenu sous droit d'auteur, il n'a pas le droit de le télécharger sur un torrent. Je ne vois pas pourquoi une puissante société aurait le droit de le faire en toute impunité. Surtout que pour de nombreux contenu, une licence commerciale n'est pas la même qu'une licence d'utilisation pour un utilisateur. C'est comme si pour le prix d'un livre harry potter, j'avais le droit de faire un usage commercial du contenu...
  2. que le modèle puisse reconstituer l'oeuvre si on lui demande (pour cela il semble qu'ils prennent des mesures techniques).
2  0 
Avatar de onilink_
Membre émérite https://www.developpez.com
Le 01/09/2023 à 13:24
Il n'y a rien d'étonnant, rien ne va de toute façon avec OpenAI, à commencer par leur nom.

Ils parlent de progrès et de développement scientifique mais ChatGPT n'est qu'une interface pimpée sur une techno qui existe déjà depuis au moins 3 ans. Il n'y a aucun apport scientifique de leur coté. Il n'ont même pas inventé les transformers sur quoi sont basé les LLM qu'ils utilisent (je crois que c'est Google qui en est à l'origine).

Leur "seul" apport c'est de dépenser des sommes considérables pour entraîner des modèles gigantesques relativement "cons" mais ont des performances qui dépendent de leur taille.

Tout le reste n'est que stratégie marketing et médiatique.
Habituer les utilisateurs à un service gratuit d'une techno qui parait révolutionnaire et qui est plutôt coûteuse de leur coté (ceux qui ont utilisé GPT3 avant que ChatGPT ne sorte savent qu'il y a un prix fixé au token) puis diminuer la qualité du service gratuit pour forcer à prendre un abonnement et essayer de rendre ça lucratif de leur coté.
2  0 
Avatar de JRM73
Membre à l'essai https://www.developpez.com
Le 10/10/2023 à 14:35
@archqt

certes, mais toi, comme tu es un gars bien, tu les payes tes livres.

2  0 
Avatar de kain_tn
Expert éminent https://www.developpez.com
Le 10/10/2023 à 22:27
Citation Envoyé par _toma_ Voir le message
La question du comité : "Comment justifiez-vous de la légalité de votre collecte de données ?"
La réponse d'openAI : "Nous vous assurons que cette collecte de données est loyale."

Et la suite de leur réponse :

Non mais vous êtes sérieux les gars ? Vous voulez bien faire de la thune mais vous voulez pas en dépenser donc il faudrait prendre une décision autoritaire (qui fasse abstraction de la loi ?) qui aille dans votre sens. C'est vraiment ça la réponse ? Ça me semble tellement hallucinant que je me demande si je comprends bien la phrase.
On ne devient pas milliardaire en dépensant de l'argent mais en demandant à ses petits copains de faire passer des lois, donner des contrats, etc. Sam Altman n'échappe pas à la règle.
2  0 
Avatar de SimonKenoby
Membre confirmé https://www.developpez.com
Le 05/07/2023 à 17:23
Ben forcément, contrairement a ce qu'un certain Elon affirme, les livres ont beaucoup plus de valeur pour les modèles que des tweets, surtout ceux que l'on peut voir depuis qu'il a repris twitter.
1  0