L’Union européenne prépare une législation qui obligerait les outils d’intelligence artificielle comme ChatGPT à divulguer le matériel protégé par le droit d’auteur utilisé dans la construction de leurs systèmes, selon un nouveau projet de loi qui serait le premier ensemble de règles complet de l’Occident régissant le déploiement de l’IA. Cette obligation permettrait aux éditeurs et aux créateurs de contenu de disposer d’une nouvelle arme pour demander une part des bénéfices lorsque leurs œuvres sont utilisées comme matériau source pour le contenu généré par l’IA par des outils comme ChatGPT.
Le problème a été l'une des questions commerciales les plus épineuses à émerger dans le contexte d'une frénésie d'outils alimentés par l'IA déployés ou testés par des entreprises comme Microsoft Corp. et le propriétaire de Google, Alphabet Inc.
ChatGPT est un outil d’IA qui peut générer du contenu créatif comme des poèmes, des histoires, des codes, des essais, des chansons, des parodies de célébrités et plus encore. Il utilise un modèle de langage neuronal entraîné sur des milliards de mots provenant d’Internet, y compris des œuvres protégées par le droit d’auteur.
Fin mars, le Garante per la protezione dei dati personali (en français Garant de la protection des données personnelles que nous allons abréger GPDP) a bloqué le site Web d'OpenAI hébergeant le modèle. Les autorités cherchent à savoir si le logiciel collecte illégalement des données sur les citoyens et si la technologie pourrait nuire aux mineurs de moins de 13 ans. L'Italie est ainsi devenue le premier pays à réglementer ChatGPT, et d'autres pays de l'UE pourraient lui emboîter le pas.
L'organisme de surveillance a déclaré que le 20 mars, l'application avait subi une violation de données impliquant des conversations d'utilisateurs et des informations de paiement. Il a déclaré qu'il n'y avait aucune base légale pour justifier « la collecte et le stockage massifs de données personnelles dans le but de 'former' les algorithmes sous-jacents au fonctionnement de la plateforme ». Il a également déclaré que puisqu'il n'y avait aucun moyen de vérifier l'âge des utilisateurs, l'application « expose les mineurs à des réponses absolument inadaptées par rapport à leur degré de développement et de sensibilisation ».
La décision n'a pas fait l'unanimité en Italie. Par exemple, Matteo Salvini, qui est le chef du parti de la Ligue (la coalition au pouvoir) a déclaré : « Je trouve disproportionnée la décision de la Commission de surveillance de la vie privée qui a forcé #ChatGPT à empêcher l'accès depuis l'Italie ». Salvini, qui est également ministre des Transports, a déclaré que la décision du régulateur était « hypocrite » et qu'il fallait faire preuve de bon sens, car « les questions de confidentialité concernent pratiquement tous les services en ligne ».
Quoi qu'il en soit, OpenAI, qui a désactivé ChatGPT pour les utilisateurs italiens à la suite de la demande de l'agence, a déclaré travailler activement à la réduction de l'utilisation des données personnelles dans la formation de ses systèmes d'IA comme ChatGPT. « Nous sommes impatients de travailler en étroite collaboration avec (l'agence italienne des données) et de l'informer sur la manière dont nos systèmes sont construits et utilisés », a déclaré l'entreprise.
Mais l'affaire a fait suffisamment de bruit pour que les homologues européens du gendarme italien des données s'y intéressent.
Alors que les parlementaires européens ne sont pas d'accord sur le contenu et la portée de la loi sur l'IA de l'UE, certains régulateurs constatent que les outils existants, tels que le règlement général sur la protection des données (RGPD) qui donne aux utilisateurs le contrôle de leurs informations personnelles, peuvent s'appliquer à la catégorie en plein essor des entreprises d'IA générative.
La décision de l'Italie de suspendre temporairement ChatGPT a incité d'autres pays européens à étudier si des mesures plus sévères sont nécessaires pour freiner les chatbots extrêmement populaires et s'il faut coordonner de telles actions. Le commissaire fédéral allemand à la protection des données et à la liberté d'information, Ulrich Kelber, a déclaré que le pays pourrait, en théorie, également suspendre temporairement ChatGPT s'il décidait de déterminer si la technologie violait le règlement général sur la protection des données (RGPD) de l'Union européenne.
Les régulateurs de la vie privée en France et en Irlande ont contacté leurs homologues en Italie pour en savoir plus sur le fondement de la suspension. L'Allemagne pourrait suivre les traces de l'Italie en bloquant ChatGPT pour des raisons de sécurité des données, a déclaré le commissaire allemand à la protection des données au journal Handelsblatt.
« Nous suivons le régulateur italien », a déclaré un porte-parole du commissaire irlandais à la protection des données. « Nous nous coordonnerons avec toutes les autorités de protection des données de l'UE en ce qui concerne cette question ».
Les régulateurs espagnols ont déclaré qu'ils n'avaient pas reçu de plainte officielle concernant ChatGPT et qu'ils pourraient lancer leur propre enquête à l'avenir si nécessaire. La Suède, cependant, n'aurait pas l'intention d'interdire le logiciel et n'a pas contacté le GDPD italien pour obtenir des conseils.
Certains experts juridiques pensent qu'une répression de ChatGPT pourrait signifier que d'autres chatbots IA comme Bard de Google ou Bing de Microsoft (qui s'appuie sur le même moteur que ChatGPT) pourraient également être examinés et réglementés.
« Contrairement à ChatGPT, Google est plus susceptible d'avoir déjà pris en compte [la confidentialité] en raison de son histoire en Europe et de la taille de l'organisation », a déclaré Dessislava Savova.
ChatGPT, donne-nous tes sources de formation
C'est dans ce contexte qu'est élaboré un projet de loi européen visant à garantir que l’IA soit utilisée de manière éthique et responsable, en respectant les droits fondamentaux et les valeurs européennes. Il prévoit également des sanctions pouvant aller jusqu’à 6% du chiffre d’affaires mondial pour les entreprises qui ne respectent pas les règles.
Les partisans du projet de loi affirment qu’il favorisera la confiance et l’innovation dans le domaine de l’IA, tout en protégeant les intérêts des créateurs de contenu. Les critiques soutiennent qu’il pourrait entraver le développement et l’utilisation de l’IA, en imposant des charges administratives et des risques juridiques excessifs.
Les négociateurs du Parlement européen prévoient d'insérer le nouveau langage, examiné par le Wall Street Journal, dans un projet de loi de l'UE en voie d'adoption, ajoutant des mesures visant à réglementer un certain nombre d'aspects de l'IA. Le projet de loi de l'UE est à l'avant-garde d'une poussée mondiale des régulateurs pour établir des règles pour le développement et l'utilisation de l'IA.
Bien que les ébauches du projet de loi et des amendements ne soient pas définitives, elles reflètent un accord à un stade avancé entre les membres. Les États membres ont pour objectif de négocier et d'adopter une version finale du projet de loi plus tard cette année.
L'Europe a été l'un des premiers à tenter de freiner les entreprises technologiques et de rédiger une réglementation pour faire face à l'évolution rapide du paysage technologique mondial. Les règles établies à Bruxelles ont souvent été adoptées dans le monde entier, parfois en établissant des précédents juridiques adoptés par d'autres nations. Les grandes entreprises technologiques ont souvent adapté leurs pratiques mondiales aux règles de l'UE afin de ne pas fonctionner trop différemment sur les grands marchés.
L'intérêt pour l'IA a explosé depuis la sortie l'automne dernier de ChatGPT, un outil ouvert développé par OpenAI et soutenu par Microsoft. Cela a déclenché une course aux armements avec Google et d'autres entreprises pour déployer ce qu'on appelle des outils d'IA génératifs, qui peuvent imiter la production créative humaine pour générer leur propre contenu.
En vertu des nouvelles dispositions ajoutées au projet de loi de l'UE sur l'IA, les développeurs de modèles d'IA génératifs devront publier un « résumé suffisamment détaillé » des éléments protégés par le droit d'auteur qu'ils ont ingérés dans le cadre de leur création, indique le projet. Les derniers modèles d'IA générative sont formés pour créer leur propre contenu, comme des textes marketing, des images photoréalistes ou des chansons pop, en ingérant des milliards de textes, d'images, de vidéos ou de clips musicaux existants.
La question de savoir comment gérer l'utilisation d'informations protégées par le droit d'auteur dans la construction de l'IA générative est controversée depuis que ChatGPT est devenu une sensation virale. La capacité des outils à synthétiser d'énormes corpus de travaux créatifs ou intellectuels, puis à créer des contrats juridiques, des textes marketing, des clips vidéo ou des codes informatiques ostensiblement originaux a conduit des écrivains, des artistes visuels et d'autres à se plaindre et à exiger une compensation.
Source : Wall Street Journal
Et vous ?
Que pensez-vous de l'idée derrière ce projet de loi ?
Quels sont les défis techniques et juridiques pour mettre en œuvre la divulgation des sources par les outils d’IA?
Quelles pourraient être les implications de divulguer les sources qui ont été utilisées pour former un outil d'IA ?
Quels sont les critères pour déterminer si une œuvre est protégée par le droit d’auteur ou non?
Quels sont les avantages et les inconvénients de l’utilisation du contenu généré par l’IA comme ChatGPT?
ChatGPT : un projet de loi de l'UE pourrait obliger les outils d'IA à révéler le matériel protégé par le droit d'auteur
Utilisé dans la construction de leurs systèmes
ChatGPT : un projet de loi de l'UE pourrait obliger les outils d'IA à révéler le matériel protégé par le droit d'auteur
Utilisé dans la construction de leurs systèmes
Le , par Stéphane le calme
Une erreur dans cette actualité ? Signalez-nous-la !