
GPT Store : problèmes de sécurité et prolifération des chatbots illégaux
Blichfeldt Andersen, directeur de publication chez l'éditeur de manuels scolaires Praxis, explique : « j'ai personnellement cherché des infractions et je les ai signalées. Elles ne cessent d'apparaître ». Andersen soupçonne que les coupables sont principalement des jeunes qui téléchargent du matériel provenant de manuels scolaires pour créer des robots personnalisés qu'ils partagent avec leurs camarades de classe, et qu'il n'a découvert qu'une infime partie des chatbots contrevenants dans le GPT Store. « La pointe de l'iceberg », a-t-il déclaré. Cela signifie que le problème est beaucoup plus complexe à résoudre qu'il n'y paraît.
OpenAI a lancé le GPT Store comme une place de marché où les développeurs spécialisés dans l'IA peuvent partager et monétiser leurs propres chatbots personnalisés basés sur la technologie GPT. Le GPT Store est pour les modèles d'IA personnalisés ce que l’App Store d’Apple ou le Play Store de Google sont pour les applications mobiles iOS et Android. Cependant, le fait d'être sous l'égide d'OpenAI ne signifie pas forcément que ces GPT offriront les mêmes niveaux de sécurité et de confidentialité des données que le ChatGPT original. Selon les analystes, ils ne facilitent pas la tâche aux utilisateurs pour choisir des GPT sûrs.
Les chatbots proposés dans le GPT Store d'OpenAI sont basés sur la même technologie que ChatGPT, mais sont créés par des développeurs tiers pour des tâches spécifiques. Pour personnaliser son GPT, un développeur peut télécharger des données supplémentaires qu'il peut exploiter pour compléter les connaissances intégrées dans la technologie d'OpenAI. Le processus qui permet de consulter ces données supplémentaires est appelé RAG (retrieval-augmented generation). D'après Andersen, les fichiers RAG des chatbots du GPT Store sont une mine d'informations protégées par le droit d'auteur et téléchargées sans autorisation.
Selon plusieurs analyses, il est facile de trouver sur le GPT Store des chatbots dont les descriptions suggèrent qu'ils pourraient utiliser des contenus protégés par le droit d'auteur d'une manière ou d'une autre. Les rapports indiquent qu'il héberge de nombreux GPT de spam et d'usurpation d'identité, certains se faisant passer pour des célébrités. Par exemple, Wired dit avoir identifié un chatbot appelé "Westeros Writer" qui prétend écrire comme George R.R. Martin, le créateur de Game of Thrones. Un autre, Voice of Atwood, prétend imiter l'écrivaine Margaret Atwood. Un autre encore, Write Like Stephen, vise à imiter Stephen King.
Le chatbot qui tente d'imiter Stephen King explique avoir accès à ses mémoires intitulées "On Writing" (Écriture). Ainsi, il a été en mesure de reproduire mot pour mot des passages du livre à la demande, en indiquant même la page d'où provenait le matériel. Il n'a pas été possible de contacter le développeur du chatbot, car il n'a pas fourni d'adresse mail, de numéro de téléphone, de profil social externe ou d'autres informations. L'utilisation sans autorisation du matériel protégé par le droit d'auteur est permise dans certains contextes, mais dans d'autres, les détenteurs de droits peuvent choisir d'intenter une action en justice.
Kayla Wood, porte-parole d'OpenAI, affirme que l'entreprise répond aux demandes de retrait des GPT créés à partir de contenus protégés par des droits d'auteur, mais elle a refusé de répondre aux questions sur la fréquence à laquelle OpenAI traite ces demandes. Elle a ajouté que l'entreprise recherche de manière proactive les GPT problématiques. Wood a expliqué : « nous utilisons une combinaison de systèmes automatisés, d'examens humains et de rapports d'utilisateurs afin de trouver et évaluer les GPT qui violent potentiellement nos politiques, y compris l'utilisation de contenu de tiers sans les autorisations nécessaires ».
Le GPT Store pourrait en rajouter aux problèmes juridiques d'OpenAI
Alors qu'OpenAI est déjà visé par de nombreuses actions en justice pour violation du droit, les GPT entraînés sur des matériels protégés par le droit d'auteur pourraient représenter un nouveau casse-tête juridique pour l'entreprise. Le laboratoire d'IA est confronté à un certain nombre de procès très médiatisés pour violation de droits d'auteur, dont un intenté par le New York Times et plusieurs intentés par plusieurs groupes d'auteurs, y compris de grands noms comme George R.R. Martin. Selon les experts, les litiges concernant le matériel protégé téléchargé sur le GPT Store pourraient avoir des répercussions plus immédiates.
« Les GPT modifient la relation entre OpenAI et ses utilisateurs d'une manière importante pour le droit d'auteur », affirme James Grimmelmann, professeur de droit de l'Internet à l'université de Cornell. Lorsque des sites Web permettent aux utilisateurs de télécharger leur propre contenu (comme YouTube qui permet à des personnes ordinaires de publier des vidéos personnelles), elles sont soumises au "Digital Millennium Copyright Act" (DMCA), une partie de la loi américaine sur le droit d'auteur qui permet aux détenteurs de droits d'auteur de porter plainte si leur propriété intellectuelle est diffusée sans leur autorisation.
Ainsi, si un Youtubeur publie une vidéo avec de la musique en arrière-plan qu'il n'a pas autorisée, les labels musicaux déposent parfois des plaintes et font retirer les matériels. Étant donné que le GPT Store permet aux développeurs de télécharger leur travail, elle est régie par ces règles. Conçu comme une loi antipiratage, le DMCA revêt aujourd'hui une importance capitale dans l'application du droit d'auteur, car elle offre aux détenteurs de droits d'auteur un moyen relativement rapide d'exiger que leurs œuvres soient retirées lorsque des personnes les mettent en ligne sans leur autorisation : les avis de retrait DMCA.
Les conditions d'OpenAI pour le GPT Store interdisent explicitement l'utilisation de contenu provenant de tiers sans les autorisations nécessaires, mais à l'heure actuelle, il n'existe aucun moyen simple pour les personnes extérieures de vérifier si leur matériel protégé par le droit d'auteur a été téléchargé par les développeurs qui créent les GPT. Cela signifie que les détenteurs de droits...
La fin de cet article est réservée aux abonnés. Soutenez le Club Developpez.com en prenant un abonnement pour que nous puissions continuer à vous proposer des publications.