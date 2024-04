GPT Store : problèmes de sécurité et prolifération des chatbots illégaux

Le GPT Store pourrait en rajouter aux problèmes juridiques d'OpenAI

Blichfeldt Andersen, directeur de publication chez l'éditeur de manuels scolaires Praxis, explique : « j'ai personnellement cherché des infractions et je les ai signalées. Elles ne cessent d'apparaître ». Andersen soupçonne que les coupables sont principalement des jeunes qui téléchargent du matériel provenant de manuels scolaires pour créer des robots personnalisés qu'ils partagent avec leurs camarades de classe, et qu'il n'a découvert qu'une infime partie des chatbots contrevenants dans le GPT Store. « La pointe de l'iceberg », a-t-il déclaré. Cela signifie que le problème est beaucoup plus complexe à résoudre qu'il n'y paraît.OpenAI a lancé le GPT Store comme une place de marché où les développeurs spécialisés dans l'IA peuvent partager et monétiser leurs propres chatbots personnalisés basés sur la technologie GPT. Le GPT Store est pour les modèles d'IA personnalisés ce que l’App Store d’Apple ou le Play Store de Google sont pour les applications mobiles iOS et Android. Cependant, le fait d'être sous l'égide d'OpenAI ne signifie pas forcément que ces GPT offriront les mêmes niveaux de sécurité et de confidentialité des données que le ChatGPT original. Selon les analystes, ils ne facilitent pas la tâche aux utilisateurs pour choisir des GPT sûrs.Les chatbots proposés dans le GPT Store d'OpenAI sont basés sur la même technologie que ChatGPT, mais sont créés par des développeurs tiers pour des tâches spécifiques. Pour personnaliser son GPT, un développeur peut télécharger des données supplémentaires qu'il peut exploiter pour compléter les connaissances intégrées dans la technologie d'OpenAI. Le processus qui permet de consulter ces données supplémentaires est appelé RAG (retrieval-augmented generation). D'après Andersen, les fichiers RAG des chatbots du GPT Store sont une mine d'informations protégées par le droit d'auteur et téléchargées sans autorisation.Selon plusieurs analyses, il est facile de trouver sur le GPT Store des chatbots dont les descriptions suggèrent qu'ils pourraient utiliser des contenus protégés par le droit d'auteur d'une manière ou d'une autre. Les rapports indiquent qu'il héberge de nombreux GPT de spam et d'usurpation d'identité, certains se faisant passer pour des célébrités. Par exemple, Wired dit avoir identifié un chatbot appelé "Westeros Writer" qui prétend écrire comme George R.R. Martin, le créateur de Game of Thrones. Un autre, Voice of Atwood, prétend imiter l'écrivaine Margaret Atwood. Un autre encore, Write Like Stephen, vise à imiter Stephen King.Le chatbot qui tente d'imiter Stephen King explique avoir accès à ses mémoires intitulées "On Writing" (Écriture). Ainsi, il a été en mesure de reproduire mot pour mot des passages du livre à la demande, en indiquant même la page d'où provenait le matériel. Il n'a pas été possible de contacter le développeur du chatbot, car il n'a pas fourni d'adresse mail, de numéro de téléphone, de profil social externe ou d'autres informations. L'utilisation sans autorisation du matériel protégé par le droit d'auteur est permise dans certains contextes, mais dans d'autres, les détenteurs de droits peuvent choisir d'intenter une action en justice.Kayla Wood, porte-parole d'OpenAI, affirme que l'entreprise répond aux demandes de retrait des GPT créés à partir de contenus protégés par des droits d'auteur, mais elle a refusé de répondre aux questions sur la fréquence à laquelle OpenAI traite ces demandes. Elle a ajouté que l'entreprise recherche de manière proactive les GPT problématiques. Wood a expliqué : « nous utilisons une combinaison de systèmes automatisés, d'examens humains et de rapports d'utilisateurs afin de trouver et évaluer les GPT qui violent potentiellement nos politiques, y compris l'utilisation de contenu de tiers sans les autorisations nécessaires ».Alors qu'OpenAI est déjà visé par de nombreuses actions en justice pour violation du droit, les GPT entraînés sur des matériels protégés par le droit d'auteur pourraient représenter un nouveau casse-tête juridique pour l'entreprise. Le laboratoire d'IA est confronté à un certain nombre de procès très médiatisés pour violation de droits d'auteur, dont un intenté par le New York Times et plusieurs intentés par plusieurs groupes d'auteurs, y compris de grands noms comme George R.R. Martin. Selon les experts, les litiges concernant le matériel protégé téléchargé sur le GPT Store pourraient avoir des répercussions plus immédiates.« Les GPT modifient la relation entre OpenAI et ses utilisateurs d'une manière importante pour le droit d'auteur », affirme James Grimmelmann, professeur de droit de l'Internet à l'université de Cornell. Lorsque des sites Web permettent aux utilisateurs de télécharger leur propre contenu (comme YouTube qui permet à des personnes ordinaires de publier des vidéos personnelles), elles sont soumises au "Digital Millennium Copyright Act" (DMCA), une partie de la loi américaine sur le droit d'auteur qui permet aux détenteurs de droits d'auteur de porter plainte si leur propriété intellectuelle est diffusée sans leur autorisation.Ainsi, si un Youtubeur publie une vidéo avec de la musique en arrière-plan qu'il n'a pas autorisée, les labels musicaux déposent parfois des plaintes et font retirer les matériels. Étant donné que le GPT Store permet aux développeurs de télécharger leur travail, elle est régie par ces règles. Conçu comme une loi antipiratage, le DMCA revêt aujourd'hui une importance capitale dans l'application du droit d'auteur, car elle offre aux détenteurs de droits d'auteur un moyen relativement rapide d'exiger que leurs œuvres soient retirées lorsque des personnes les mettent en ligne sans leur autorisation : les avis de retrait DMCA.Les conditions d'OpenAI pour le GPT Store interdisent explicitement l'utilisation de contenu provenant de tiers sans les autorisations nécessaires, mais à l'heure actuelle, il n'existe aucun moyen simple pour les personnes extérieures de vérifier si leur matériel protégé par le droit d'auteur a été téléchargé par les développeurs qui créent les GPT. Cela signifie que les détenteurs de droits d'auteur concernés doivent partir à la chasse. Andersen explique qu'il s'appuie sur des mots clés pour passer au peigne fin le GPT Store afin de repérer les chatbots de conversation susceptibles d'utiliser le contenu des manuels scolaires de Praxis.Il doit ensuite engager la conversation avec chaque chatbot qu'il trouve pour essayer de déterminer s'il a été formé sur les titres de Praxis. D'après lui, c'est un travail fastidieux, mais qui donne des résultats. Il rapporte avoir réussi à inciter plusieurs chatbots à reproduire des passages spécifiques des manuels édités par Praxis. « Il faut tromper le modèle pour qu'il se révèle », affirme-t-il. Après avoir trouvé les premiers exemples de livres de Praxis sur le GPT Store, Andersen a envoyé à OpenAI des avis de retrait DMCA. Mais la société n'a pas réagi jusqu'à ce qu'il demande l'aide du groupe Danish Rights Alliance (DRA).La DRA représente les intérêts des travailleurs créatifs au Danemark. Elle a adopté une approche rigoureuse pour protéger les droits d'auteur de ses membres à l'ère de l'IA. L'année dernière, elle a obtenu qu'une collection de plus de 196 000 livres utilisés pour la formation à l'IA générative soit temporairement mise hors ligne en déposant des avis de retrait DMCA. Andersen indique que Praxis envisage d'intenter une action en justice contre OpenAI si les conditions du GPT Store ne s'améliorent pas. (D'autres éditeurs et organisations pourraient suivre.)Il souhaiterait que l'entreprise et d'autres développeurs d'IA ajoutent des systèmes plus robustes qui recherchent les matériels protégés par le droit d'auteur dans les contenus RAG téléchargés, à l'instar du système Content ID mis en place pour protéger les contenus protégés par le droit d'auteur contre l'apparition sur YouTube. (Lorsqu'on a demandé à OpenAI s'il prévoit d'introduire un système similaire à Content ID, il n'a pas répondu directement, mais son porte-parole Kayla Wood a déclaré que l'entreprise contrôlait les GPT de manière proactive.)Quel est votre avis sur le sujet ?Que pensez-vous des nombreux problèmes rencontrés par le GPT Store d'OpenAI ?Comment les GPT créés à partir de matériels protégés par des droits d'auteurs pourraient impacter OpenAI ?