ChatGPT est un bot conversationnel qui utilise un modèle de langage artificiel pour produire des réponses à partir de n’importe quelle entrée textuelle. Il peut converser sur différents sujets, générer du contenu créatif comme des poèmes, des histoires ou des chansons, et même imiter le style d’écriture de personnalités célèbres. ChatGPT est accessible au public via une interface web ou une API.
Les analystes ont qualifié le ChatGPT d'OpenAI d'application grand public à la croissance la plus rapide de l'histoire, et son succès précoce a déclenché une course aux armements parmi les entreprises de la Silicon Valley pour déployer des chatbots concurrents. Le directeur général de la société, Sam Altman, est devenu une figure influente dans le débat sur la réglementation de l'IA, témoignant à Capitol Hill, dînant avec des législateurs et rencontrant le président Biden et le vice-président Harris.
Mais maintenant, l'entreprise fait face à un nouveau défi : la FTC a fait parvenir à OpenAI une demande d’information de 20 pages, dans laquelle elle lui enjoint de fournir des documents relatifs au développement et à l’entraînement de ses modèles de langage, à la collecte et à la protection des données personnelles utilisées par la plateforme, à la vérification et à la correction des informations produites par ChatGPT, et aux risques potentiels pour les consommateurs, notamment en termes de préjudice réputationnel.
La FTC s’intéresse notamment aux cas « d'hallucinations », un terme qui désigne les situations où l’IA génère des informations fausses ou inventées. Par exemple, ChatGPT peut affirmer que le président des États-Unis est un extraterrestre, ou que le pape a été accusé de meurtre. Ces informations peuvent être nuisibles pour les personnes concernées, mais aussi pour les utilisateurs qui les prennent pour vraies.
Des réclamations à cet effet ont été faites le mois dernier dans le cadre d'un procès civil privé lorsqu'un animateur de radio de l'État de Géorgie a poursuivi OpenAI alléguant que ChatGPT l'avait diffamé et avait porté atteinte à sa réputation en associant faussement son nom à un problème criminel.
En avril, un maire australien a menacé d'intenter une action en diffamation contre OpenAI après que ChatGPT l'aurait prétendument accusé d'être impliqué dans un scandale de corruption étrangère. Les avocats de l'homme auraient donné à OpenAI 28 jours pour corriger son modèle d'IA. Depuis lors, il n'y a pas eu d'autre mot de litige.
La FTC veut également savoir comment OpenAI teste, ajuste et manipule ses algorithmes, notamment pour produire des réponses différentes ou pour répondre aux risques, et dans différentes langues. Elle demande aussi à OpenAI de lui fournir la liste des plaintes qu’elle a reçues du public, des procès auxquels elle est impliquée, et des détails sur la fuite de données qu’elle a révélée en mars 2023 et qui avait exposé temporairement les historiques de chat et les données de paiement des utilisateurs.
La lettre demande également de nombreux documents de l'entreprise, y compris des contrats avec des partenaires depuis 2017, et des communications internes sur le potentiel des modèles d'IA à "produire des déclarations inexactes sur les individus" et à "révéler des informations personnelles".
Quelles sont les conséquences possibles de l’enquête ?
L’enquête de la FTC est la première manifestation concrète d’une régulation gouvernementale de l’IA aux États-Unis, alors que les législateurs du Congrès peinent à se mettre à la page sur une industrie en pleine évolution et à élaborer une législation adaptée au secteur. Les efforts américains sont largement en retard par rapport à d’autres acteurs mondiaux. Par exemple, l’Union européenne est en passe de finaliser une législation pionnière qui interdit l’utilisation de l’IA pour la police prédictive et qui applique des restrictions aux scénarios d’utilisation à haut risque3.
L’enquête de la FTC pourrait aussi compliquer la relation entre OpenAI et les décideurs politiques, dont beaucoup ont été impressionnés par la technologie et le PDG de la start-up, Sam Altman. Elle pourrait aussi attirer davantage l’attention sur le rôle d’OpenAI dans le débat sur la menace que l’IA générative peut représenter pour l’emploi, la sécurité nationale et la démocratie.
OpenAI dispose d’un délai de 30 jours pour répondre aux demandes de l’agence. Si elle ne se conforme pas ou si elle fournit des informations incomplètes ou inexactes, elle s’expose à des sanctions civiles ou pénales.
Les réactions à l’enquête
L’enquête de la FTC a suscité des réactions contrastées dans le monde de l’IA. Certains ont salué l’initiative de l’agence, estimant qu’elle était nécessaire pour encadrer le développement et l’utilisation de l’IA générative, qui peut avoir des impacts sociaux et éthiques importants. D’autres ont critiqué l’enquête, la jugeant trop intrusive, disproportionnée ou mal ciblée.
Parmi les partisans de l’enquête, on trouve des experts en éthique de l’IA, des défenseurs des droits des consommateurs, et des concurrents d’OpenAI. Ils estiment que ChatGPT pose des risques réels pour les utilisateurs, qui peuvent être trompés, manipulés ou exposés par le bot. Ils appellent à plus de transparence et de responsabilité de la part d’OpenAI, qui selon eux profite d’un statut privilégié dans le secteur de l’IA sans rendre de comptes à la société.
Parmi les opposants à l’enquête, on trouve des partisans de l’innovation, des défenseurs de la liberté d’expression, et des alliés d’OpenAI. Ils estiment que ChatGPT est une avancée technologique majeure, qui offre des opportunités créatives et éducatives aux utilisateurs. Ils craignent que l’enquête de la FTC ne freine le progrès de l’IA, ne limite la diversité des voix et des idées, et ne nuise à la compétitivité des États-Unis face à d’autres puissances.
Par le billet de son PDG, OpenAI a déclaré qu’elle coopérerait avec la FTC et qu’elle respecterait les lois en vigueur. Elle a aussi affirmé qu’elle s’efforçait de rendre ChatGPT plus fiable, plus sûr et plus éthique. Elle a rappelé qu’elle avait mis en place des mécanismes de contrôle et de modération pour prévenir les abus et les erreurs du bot. Elle a enfin souligné qu’elle avait pour mission de créer une IA bénéfique pour l’humanité.
Il est très décevant de voir la demande de la FTC commencer par une fuite, ce qui n'aide pas à instaurer la confiance. Cela dit, il est extrêmement important pour nous que notre technologie soit sûre et pro-consommateur, et nous sommes convaincus que nous respectons la loi. Bien sûr, nous travaillerons avec la FTC.
Nous avons construit GPT-4 en s'appuyant sur des années de recherche sur la sécurité et avons passé plus de 6 mois après avoir terminé la formation initiale pour le rendre plus sûr et plus aligné avant de le publier. Nous protégeons la vie privée des utilisateurs et concevons nos systèmes pour en savoir plus sur le monde, et non sur les particuliers.
Nous sommes transparents sur les limites de notre technologie, en particulier lorsque nous ne parvenons pas à le faire. et notre structure de bénéfices plafonnés signifie que nous ne sommes pas incités à réaliser des rendements illimités.
Nous avons construit GPT-4 en s'appuyant sur des années de recherche sur la sécurité et avons passé plus de 6 mois après avoir terminé la formation initiale pour le rendre plus sûr et plus aligné avant de le publier. Nous protégeons la vie privée des utilisateurs et concevons nos systèmes pour en savoir plus sur le monde, et non sur les particuliers.
Nous sommes transparents sur les limites de notre technologie, en particulier lorsque nous ne parvenons pas à le faire. et notre structure de bénéfices plafonnés signifie que nous ne sommes pas incités à réaliser des rendements illimités.
Des procès qui se multiplientit is very disappointing to see the FTC's request start with a leak and does not help build trust.
— Sam Altman (@sama) July 13, 2023
that said, it’s super important to us that out technology is safe and pro-consumer, and we are confident we follow the law. of course we will work with the FTC.
Paul Tremblay et Mona Awad, affirment que la société a utilisé leurs œuvres sans autorisation pour entraîner son système d’intelligence artificielle générative ChatGPT. La plainte des auteurs affirme que les livres sont un « ingrédient clé » car ils offrent les « meilleurs exemples d’écriture longue de haute qualité ». La plainte estime qu’OpenAI a incorporé dans ses données d’entraînement plus de 300 000 livres, dont certains provenant de « bibliothèques fantômes » illégales qui proposent des livres protégés par le droit d’auteur sans autorisation.
Awad est connue pour ses romans comme « 13 Ways of Looking at a Fat Girl » et « Bunny ». Tremblay est l’auteur de romans comme « The Cabin at the End of the World », qui a été adapté dans le film de Night Shyamalan « Knock at the Cabin » sorti en février. Tremblay et Awad affirment que ChatGPT peut générer des résumés « très précis » de leurs livres, ce qui indique qu’ils figurent dans sa base de données.
Mais ils ne sont pas les seuls.
La comédienne et auteure Sarah Silverman, ainsi que les auteurs Christopher Golden et Richard Kadrey, poursuivent OpenAI et Meta chacun devant un tribunal de district américain pour double plainte pour violation du droit d'auteur.
Selon les plaintes déposées vendredi devant le tribunal fédéral de San Francisco, Meta et OpenAI ont obtenu les œuvres des plaignants à partir de sites illégaux de « bibliothèques fantômes », qui proposent des livres numérisés sans respecter les droits d’auteur. Les plaignants affirment que leurs œuvres ont été utilisées comme matériel d’entraînement pour les modèles d’IA, sans qu’ils n’en aient été informés ni rémunérés.
Les plaignants citent comme preuve le fait que les modèles d’IA sont capables de résumer leurs livres lorsqu’ils sont sollicités. Par exemple, ChatGPT peut fournir un résumé du livre The Bedwetter de Sarah Silverman, publié en 2010, qui raconte son enfance marquée par l’énurésie. De même, LLaMA peut résumer les livres Ararat de Christopher Golden et Sandman Slim de Richard Kadrey, qui sont des romans fantastiques.
Les auteurs disent qu'ils « n'ont pas consenti à l'utilisation de leurs livres protégés par le droit d'auteur comme matériel de formation » pour les modèles d'IA des entreprises. Leurs plaintes contiennent chacune six chefs d'accusation de divers types de violations du droit d'auteur, de négligence, d'enrichissement sans cause et de concurrence déloyale. Les auteurs demandent des dommages-intérêts légaux, la restitution des bénéfices, etc.
Les avocats Joseph Saveri et Matthew Butterick, qui représentent les trois auteurs, écrivent sur leur site Web LLMlitigation qu'ils ont entendu parler « d'écrivains, d'auteurs et d'éditeurs qui s'inquiètent de la capacité étonnante de [ChatGPT] à générer du texte similaire à celui trouvé dans les matériaux textuels protégés par les droits d'auteur, y compris des milliers de livres ».
Source : FTC
Et vous ?
Que pensez-vous de l’enquête de la FTC sur OpenAI et ChatGPT?
Avez-vous déjà utilisé ChatGPT ou un autre bot conversationnel basé sur l’IA? Quelle a été votre expérience?
Quels sont les avantages et les inconvénients de l’IA générative pour la société?
Quelles sont les mesures que vous aimeriez voir prises pour réguler l’IA et protéger les consommateurs?
Quels sont les domaines d’application de l’IA qui vous intéressent ou vous inquiètent le plus?