Microsoft et OpenAI ont été poursuivis mercredi par seize individus anonymes qui affirment que les produits d’intelligence artificielle des entreprises basés sur ChatGPT ont collecté et divulgué leurs informations personnelles sans notification ni consentement adéquats.La plainte, déposée devant un tribunal fédéral à San Francisco, en Californie, allègue que les deux entreprises ont ignoré les moyens légaux d’obtenir des données pour leurs modèles d’IA et ont choisi de les collecter sans les payer. « Malgré les protocoles établis pour l’achat et l’utilisation des informations personnelles, les défendeurs ont adopté une approche différente : le vol », dit la plainte. « Ils ont systématiquement extrait 300 milliards de mots d’Internet, ‘livres, articles, sites web et publications - y compris des informations personnelles obtenues sans consentement’. OpenAI l’a fait en secret, et sans s’enregistrer comme courtier en données comme il était tenu de le faire en vertu de la loi applicable. »
Par le biais de leurs produits d’IA, affirme-t-elle, les deux entreprises « collectent, stockent, suivent, partagent et divulguent » les informations personnelles de millions de personnes, y compris les détails des produits, les informations sur les comptes, les noms, les coordonnées, les identifiants de connexion, les courriels, les informations de paiement, les relevés de transactions, les données du navigateur, les médias sociaux, les journaux de discussion, les données d’utilisation, les analyses, les cookies, les recherches et autres activités en ligne.
Microsoft et OpenAI accusés d'avoir intégré des informations personnelles de millions de personnes dans leurs produits
La plainte soutient que Microsoft et OpenAI ont intégré dans leurs produits d’IA les informations personnelles de millions de personnes, reflétant des passe-temps, des croyances religieuses, des opinions politiques, des antécédents électoraux, l’appartenance à des groupes sociaux ou de soutien, des orientations sexuelles et des identités de genre, des historiques professionnels, des photos de famille, des amis et d’autres données découlant des interactions en ligne.
OpenAI a développé une famille de modèles génératifs de langage à grande échelle, qui comprend GPT-2, GPT-4 et ChatGPT ; Microsoft non seulement défend la technologie, mais l’a intégrée dans tous les coins de son empire, de Windows à Azure.
« En ce qui concerne les informations personnelles identifiables, les défendeurs ne parviennent pas à les filtrer suffisamment des modèles d’entraînement, mettant ainsi des millions de personnes en danger de voir ces informations divulguées sur demande ou autrement à des étrangers du monde entier », affirme la plainte, citant le rapport sur le sujet.
La plainte de 157 pages est lourde de citations médiatiques et académiques exprimant l’inquiétude au sujet des modèles d’IA et de l’éthique, mais légère sur les cas spécifiques de préjudice. Pour les 16 plaignants, la plainte indique qu’ils ont utilisé ChatGPT ainsi que d’autres services Internet comme Reddit et qu’ils s’attendaient à ce que leurs interactions numériques ne soient pas intégrées dans un modèle d’IA. Il reste à voir comment le contenu et les métadonnées créés par le plaignant ont été exploités et si ChatGPT ou d’autres modèles reproduiront ces données.
La plainte vise le statut de recours collectif
OpenAI a par le passé traité la reproduction d’informations personnelles en les filtrant. La plainte demande le statut de recours collectif et des dommages-intérêts de 3 milliards de dollars (bien que ce montant soit susceptible d’être réduit si l’affaire aboutit). Tout dommage réel serait déterminé si les demandeurs l'emportaient, sur la base des conclusions du tribunal.
La plainte allègue que Microsoft et OpenAI ont violé l'Electronic Privacy Communications Act américain en obtenant et en utilisant des informations privées, et en interceptant illégalement les communications entre les utilisateurs et les services tiers via des intégrations avec ChatGPT et des produits similaires.
La plainte soutient en outre que les accusés ont violé la loi sur la fraude et les abus informatiques en interceptant les données d'interaction grâce à des plugins.
Elle allègue également des violations d'autres lois, notamment les lois californiennes sur l'invasion de la vie privée (Invasion of Privacy Act) et la loi sur la concurrence déloyale, les lois de l'Illinois sur la confidentialité des informations biométriques (Biometric Information Privacy Act) et la loi sur la fraude à la consommation et les pratiques commerciales trompeuses, le droit des affaires de New York ainsi que de divers préjudices généraux (délits) comme la négligence et l'enrichissement sans cause.
La plainte
Ceci est un extrait de la plainte.
Le 19 octobre 2016, Stephen Hawking, professeur de physique théorique à l'Université de Cambridge, a prédit : « Le succès dans la création de l'IA pourrait être le plus grand...
La fin de cet article est réservée aux abonnés. Soutenez le Club Developpez.com en prenant un abonnement pour que nous puissions continuer à vous proposer des publications.