Le décret du président Joe Biden sur l'intelligence artificielle, par exemple, prévoit un nouvel ensemble de normes gouvernementales pour le filigrane des contenus générés par l'IA. Il s'agit d'un domaine prometteur, mais les technologies actuelles sont loin d'être une solution miracle pour se défendre contre les contrefaçons. Le 30 octobre, le président Joe Biden a signé un décret établissant des règles relatives à l'IA générative, avant toute législation émanant des législateurs. L’un des objectifs du décret est de garantir une utilisation responsable et efficace de la technologie par le gouvernement.
Le président Biden a publié un décret historique pour s'assurer que l'Amérique ouvre la voie en saisissant la promesse et en gérant les risques de l'intelligence artificielle. Ce décret établit de nouvelles normes en matière de sûreté et de sécurité de l'IA, protège la vie privée des Américains, fait progresser l'équité et les droits civils, défend les consommateurs et les travailleurs, promeut l'innovation et la concurrence.
L'implémentation audio de SynthID convertit l'onde audio en une visualisation bidimensionnelle du spectre des fréquences, une approche qualifiée de « différente de tout ce qui existe aujourd'hui » par DeepMind. Cette initiative de Google s'inscrit dans la lignée de la version bêta de SynthID pour les images sur Vertex AI de Google Cloud, offrant une solution de filigrane robuste malgré certaines limitations face aux manipulations extrêmes d'images.
Dans un post publié le 16 novembre, DeepMind indique que le filigrane ne devrait pas être détectable par l'oreille humaine et « ne compromet pas l'expérience d'écoute », et ajoute qu'il devrait rester détectable même si une piste audio est compressée, accélérée ou ralentie, ou si du bruit supplémentaire est ajouté. Aujourd'hui, en partenariat avec YouTube, nous annonçons Lyria de Google DeepMind, notre modèle d'IA de génération musicale le plus avancé à ce jour, ainsi que deux expériences d'IA conçues pour ouvrir un nouveau terrain de jeu à la créativité :
- Dream Track : une expérience dans YouTube Shorts conçue pour aider à approfondir les liens entre les artistes, les créateurs et les fans par le biais de la création musicale ;
- Les outils d'IA musicale : un ensemble d'outils conçu avec des artistes, des auteurs-compositeurs et des producteurs pour les aider à renforcer leurs processus créatifs.
Pour développer ces projets, des experts techniques de Google et un large éventail d'artistes et d'auteurs-compositeurs de renommée mondiale ont été réuni afin d'explorer la manière dont les technologies musicales génératives peuvent façonner de manière responsable l'avenir de la création musicale.
Présentation du modèle Lyria
La musique contient d'énormes quantités d'informations : chaque battement, chaque note et chaque harmonie vocale à chaque seconde. Lorsqu'ils génèrent de longues séquences sonores, les modèles d'intelligence artificielle ont du mal à maintenir la continuité musicale entre les phrases, les vers ou les longs passages. Comme la musique comprend souvent plusieurs voix et instruments en même temps, elle est beaucoup plus difficile à créer que la parole.
Construit par Google DeepMind, le modèle Lyria excelle à générer de la musique avec des instruments et des voix, à effectuer des tâches de transformation et de continuité, et à donner aux utilisateurs un contrôle plus nuancé du style et de la performance de la sortie. Lyria est testé dans le cadre d'une expérience appelée Dream Track, conçue pour tester de nouvelles façons pour les artistes de se connecter avec leurs fans et développée en collaboration avec YouTube.
« L'émergence de l'IA a fait entrer la musique dans une nouvelle ère créative. Alors qu'une myriade d'entreprises définissent leur approche de l'IA, nous voulons que la nôtre soit définie par le partenariat et la responsabilité. C'est pourquoi nous avons élaboré un ensemble de principes relatifs à l'IA musicale et un incubateur d'IA musicale, publiés au début de l'année, qui s'appuient sur une collaboration responsable.
« Depuis lors, nous avons exploré les possibilités de l'IA pour stimuler la créativité aux côtés des artistes, des auteurs-compositeurs, des producteurs et de nos partenaires, tout en identifiant les défis qu'elle pose. En testant et en apprenant, nous pouvons mieux comprendre comment améliorer les opportunités pour les artistes et l'industrie et approfondir l'engagement des fans, au bénéfice de l'ensemble de la communauté musicale », ont déclaré Lyor Cohen et Toni Reid, responsable mondial de la musique, youtube et vice-présidente, expériences émergentes et produits communautaires.
Dans le cadre de cette expérience, un nombre limité de créateurs pourront utiliser Dream Track pour produire une bande-son unique avec la voix générée par l'IA et le style musical d'artistes tels qu'Alec Benjamin, Charlie Puth, Charli XCX, Demi Lovato, John Legend, Sia, T-Pain, Troye Sivan et Papoose. Les utilisateurs de Dream Track peuvent entrer un sujet et choisir un artiste dans le carrousel pour générer une bande-son de 30 secondes pour leur court. Grâce au modèle Lyria, Dream Track génère simultanément les paroles, la bande-son et la voix générée par l'IA dans le style de l'artiste sélectionné.
L'approche de SynthID, qui convertit l'onde audio en une visualisation bidimensionnelle du spectre des fréquences, est décrite comme unique, ce qui souligne l'effort de Google pour développer des méthodes de filigranage qui vont au-delà des solutions conventionnelles. Cependant, il reste essentiel de surveiller la résistance du filigrane face à des manipulations extrêmes, bien que l'annonce mentionne sa stabilité face à des altérations telles que la compression, l'accélération et le ralentissement.
Les limites des solutions actuelles pour lutter contre les contrefaçons
Des chercheurs de l’université du Maryland ont examiné la fiabilité des filigranes actuels de l’IA et ont constaté qu’il est facile pour les mauvais acteurs d’ajouter ou de supprimer des filigranes. Les chercheurs ont pu facilement échapper aux méthodes actuelles de filigrane pendant les tests et ont trouvé qu’il était encore plus facile d’ajouter de faux emblèmes.
La protection contre les contrefaçons ne devrait pas compromettre la vie privée des utilisateurs, et il est crucial de s'assurer que ces filigranes ne sont pas utilisés à des fins de suivi ou de collecte d'informations sensibles. Il est important de s'assurer que de telles solutions ne créent pas de disparités d'accès à la protection des œuvres générées par l'IA.
Sur le plan positif, l'initiative de Google est en phase avec les préoccupations croissantes concernant les contenus générés par l'IA et les implications potentielles en matière de droits d'auteur. Elle répond également aux nouvelles normes gouvernementales, comme évoqué dans le décret du président Joe Biden sur l'intelligence artificielle.
Cependant, il est important de noter que, malgré ces avancées, aucune solution n'est totalement infaillible, et la vigilance reste nécessaire pour anticiper les éventuelles évolutions des contrefaçons. Certains pourraient craindre que la connaissance qu'une œuvre est marquée puisse influencer le processus créatif, limitant ainsi l'expérimentation et l'innovation artistique.
En conclusion, l'intégration de filigranes inaudibles dans la musique générée par l'IA par Google est une avancée positive pour renforcer la traçabilité et la protection des contenus. Cependant, la technologie doit continuer à évoluer pour rester en phase avec les défis en constante mutation de la contrefaçon numérique.
Sources : Google, YouTube
Et vous ?
Les filigranes actuels de l’IA sont-ils suffisamment fiables pour empêcher la contrefaçon ?
Quel est votre avis sur le sujet ?
Voir aussi :
Microsoft annonce la disponibilité de DALL-E 3 pour tous les utilisateurs de Bing Chat et de Bing Image Creator, des filigranes permettent d'identifier les images comme étant générées par l'IA
Les chercheurs affirment que les filigranes actuels de l'IA sont faciles à supprimer, Microsoft a ajouté des filigranes dans Bing Image Creator et Google a conçu SynthID