Des chercheurs de l’université du Maryland ont examiné la fiabilité des filigranes actuels de l’IA et ont constaté qu’il est facile pour les mauvais acteurs d’ajouter ou de supprimer des filigranes. Les filigranes sont des logos ou des motifs visibles qui peuvent apparaître sur n’importe quel objet, y compris les images générées par l’IA, pour décourager la contrefaçon. Bien que les filigranes soient invisibles à l’œil nu, ils peuvent aider à lutter contre l’utilisation abusive de contenus générés par l’intelligence artificielle et peuvent même être intégrés dans des programmes d’apprentissage automatique mis au point par des géants de la technologie tels que Google. Les chercheurs ont pu facilement échapper aux méthodes actuelles de filigrane pendant les tests et ont trouvé qu’il était encore plus facile d’ajouter de faux emblèmes.Les filigranes sont des dessins qui peuvent être apposés sur des images pour les identifier. Depuis les empreintes physiques sur le papier jusqu'au texte translucide et aux symboles que l'on voit aujourd'hui sur les photos numériques, ils ont évolué tout au long de l'histoire. Les filigranes traditionnels ne suffisent pas à identifier les images générées par l'IA, car ils sont souvent appliqués comme un timbre sur une image et peuvent facilement être supprimés. Par exemple, les filigranes discrets qui se trouvent dans le coin d'une image peuvent être supprimés à l'aide de techniques d'édition de base.
L'art génératif crée un terrain propice à la création de fausses images et d'autres informations erronées. Dans le contexte de l'intelligence artificielle, le filigrane peut permettre à un ordinateur de détecter si un texte ou une image est généré par une intelligence artificielle. Même s'ils sont invisibles à l'œil nu, les filigranes permettent de lutter contre l'utilisation abusive de contenus générés par l'intelligence artificielle et peuvent même être intégrés dans des programmes d'apprentissage automatique mis au point par des géants de la technologie tels que Google. D'autres acteurs majeurs dans ce domaine, de l'OpenAI à Meta et Amazon, se sont engagés à développer une technologie de filigrane pour lutter contre la désinformation.
Microsoft a amélioré son créateur d’images dans Bing Chat avec le nouveau modèle DALL-E 3 d’OpenAI, qui peut produire des images plus originales et plus réalistes à partir de textes. DALL-E 3 est intégré à Bing Chat et ChatGPT, ce qui permet aux utilisateurs de créer et d’affiner leurs images en conversant avec un chatbot. DALL-E 3 dispose également de nouveaux outils de sécurité pour éviter de créer des images inappropriées ou protégées par le droit d’auteur. Microsoft ajoute aussi des filigranes et un système de modération du contenu dans Bing Image Creator.
Il est difficile de trouver le bon équilibre entre l'imperceptibilité et la résistance aux manipulations d'images. Les filigranes très visibles, souvent ajoutés sous forme de couche avec un nom ou un logo en haut d'une image, posent également des problèmes esthétiques à des fins créatives ou commerciales. De même, certains filigranes imperceptibles développés précédemment peuvent être perdus par de simples techniques d'édition telles que le redimensionnement.
C'est pourquoi des chercheurs en informatique de l'université du Maryland (UMD) ont décidé d'examiner et de comprendre à quel point il est facile pour de mauvais acteurs d'ajouter ou de supprimer des filigranes. Soheil Feizi, professeur à l'UMD, a déclaré à Wired que les résultats obtenus par son équipe confirment son scepticisme quant à l'absence d'applications de filigrane fiables à l'heure actuelle. Les chercheurs ont pu facilement échapper aux méthodes actuelles de filigrane pendant les tests et ont trouvé qu'il était encore plus facile d'ajouter de faux emblèmes à des images qui n'avaient pas été générées par l'IA. Mais au-delà de la facilité avec laquelle il est possible de contourner les filigranes, une équipe de l'UMD a notamment mis au point un filigrane qu'il est pratiquement impossible de retirer d'un contenu sans compromettre complètement la propriété intellectuelle. Cette application permet de détecter le vol de produits.
Un nouveau type de filigrane pour les images d'IA
SynthID est un outil permettant de filigraner et d'identifier les images générées par l'IA. Cette technologie incorpore un filigrane numérique directement dans les pixels d'une image, ce qui le rend imperceptible à l'œil humain, mais détectable pour l'identification. Elle a été développée par Google DeepMind et affinée en partenariat avec Google Research. SynthID pourrait également évoluer avec d'autres modèles d'IA et d'autres modalités que l'imagerie, comme l'audio, la vidéo et le texte.
Google a conçu SynthID de manière à ce qu'il ne compromette pas la qualité de l'image et permette au filigrane de rester détectable, même après des modifications telles que l'ajout de filtres, la modification des couleurs et l'enregistrement avec différents schémas de compression avec perte - le plus souvent utilisés pour les JPEG.
SynthID utilise deux modèles d'apprentissage profond - pour le filigrane et l'identification - qui ont été entraînés ensemble sur un ensemble varié d'images. Le modèle combiné est optimisé en fonction d'une série d'objectifs, notamment l'identification correcte du contenu filigrané et l'amélioration de l'imperceptibilité en alignant visuellement le filigrane sur le contenu original.
SynthID permet aux clients de Vertex AI de créer des images générées par l'IA de manière responsable et de les identifier en toute confiance. Bien que cette technologie ne soit pas parfaite, nos tests...
La fin de cet article est réservée aux abonnés. Soutenez le Club Developpez.com en prenant un abonnement pour que nous puissions continuer à vous proposer des publications.