Chaque fois que le site est rafraîchi, une image débordant de réalisme présente le visage d’une personne. Phillip Wang, ingénieur en logiciel chez Uber, a créé la page pour démontrer les capacités du GAN, puis l'a publiée sur le groupe public "Intelligence artificielle et apprentissage en profondeur".
Le code sous-jacent qui a rendu cela possible, intitulé StyleGAN, a été écrit par Nvidia et fait l'objet d'un article qui n'avait pas encore été approuvé par des pairs. Ce type de réseau de neurones a le potentiel de révolutionner la technologie du jeu vidéo et de la modélisation 3D, mais, comme presque tout type de technologie, il pourrait également être utilisé à des fins plus sinistres. Rappelons par exemple que les deepfakes, ou des images générées par ordinateur superposées à des images ou des vidéos existantes, peuvent être utilisés pour diffuser de faux récits d’actualité ou d’autres canulars. C’est donc dans un but de sensibilisation que Wang a choisi de faire cette page Web.
S’il fallait simplifier, nous pourrions dire que le GAN implique que deux réseaux travaillent l’un contre l’autre. Le premier va être nourri en données brutes qu’il va décomposer. À partir de ces données, il va tenter de créer une image. Il va ensuite soumettre cette image à un autre réseau qui, lui, n’a que des photos ou images réelles dans sa base de données. Ce deuxième réseau va alors juger de l’image et va informer le premier de son jugement. Si l’image ne ressemble pas au résultat attendu, le premier algorithme va recommencer le processus. Si le résultat correspond, il va être informé qu’il est sur la bonne voie et finir par comprendre ce qu’est une bonne image. Une fois qu’il est suffisamment entraîné, il peut en produire à la chaîne.
Début avril 2019, NVidia a publié en open source StyleGAN.
Une technologie qui fait le bonheur des startups
Des startups d'intelligence artificielle ont décidé de vendre des images de visages générés par ordinateur qui ressemblent à la réalité, offrant aux entreprises la possibilité « d'augmenter la diversité » de leurs annonces sans avoir besoin d'êtres humains.
Une entreprise propose de vendre diverses photos pour des brochures marketing et a déjà signé des clients, y compris une application de rencontres qui a l'intention d'utiliser les images dans un chatbot. Une autre entreprise a déclaré qu'elle allait faire plus que générer des têtes par une IA et se lancer dans la génération de faux corps dès ce mois-ci.
StyleGAN, la technologie utilisée pour créer de tels visages est disponible en open source et s'améliore rapidement, permettant aux startups de créer facilement des contrefaçons si convaincantes qu'elles peuvent tromper l'œil humain. Les systèmes s'entraînent sur des bases de données massives de visages réels, puis tentent de reproduire leurs caractéristiques dans de nouveaux designs.
Mais les experts en IA craignent que les contrefaçons ne conduisent à une nouvelle génération d'escrocs, de bots et d'espions, qui pourraient utiliser les photos pour créer des personnages en ligne imaginaires, masquer les biais d'embauche et nuire aux efforts visant à apporter de la diversité aux industries. Le fait qu'un tel logiciel ait désormais un modèle commercial pourrait également alimenter une plus grande érosion de la confiance sur un Internet déjà attaqué par des campagnes de désinformation, des vidéos deepfake et d'autres techniques trompeuses.
Elana Zeide, diplômé en intelligence artificielle, droit et politique à l'Université de Californie à la faculté de droit de Los Angeles, a déclaré que la technologie « met en évidence le peu de pouvoir et de connaissances dont disposent les utilisateurs par rapport à la réalité de ce qu'ils voient en ligne ».
« Il n'y a pas de réalité objective pour comparer ces photos », a-t-elle déclaré. « Nous sommes habitués à des mondes physiques avec une entrée sensorielle... mais avec cela, nous n'avons pas de réponses instinctives ou enseignées sur la façon de détecter ce qui est réel et ce qui ne l'est pas. C'est épuisant ».
l'IA est capable de faire des variantes d'une même personne
Icons8, une firme de design basée en Argentine qui vend des illustrations numériques et des photos d'archives, a lancé son activité en ligne Generated.photos le mois dernier, offrant « des modèles divers à la demande à l'aide de l'IA ».
Le site permet à quiconque de filtrer les fausses photos en fonction de l'âge (de « nourrisson » à « personnes âgées »), de l'origine ethnique (y compris « blanc », « latino », « asiatique » et « noir ») et de l'émotion (« joie », « neutre » , « surprise »), ainsi que le sexe, la couleur des yeux et la longueur des cheveux. Le système montre cependant un certain nombre de lacunes et de biais étranges : par exemple, la seule couleur de peau disponible pour les nourrissons est le blanc.
La société affirme que ses visages pourraient être utiles pour les clients qui ont besoin de dynamiser du matériel promotionnel, de remplir des prototypes ou d'illustrer des concepts trop délicats pour un modèle humain, tels que des « situations embarrassantes » et des « procédures pénales ». Son guide en ligne promet également aux clients qu'ils peuvent « augmenter la diversité » et « réduire les biais » en incluant « de nombreuses origines ethniques différentes dans vos projets ».
Certains émettent des réserves sur l'utilisation d'une telle technologie
Alors que les startups proposent d'offrir aux entreprises l'illusion de la diversité avec l'IA, leurs systèmes ont un défaut crucial: ils imitent uniquement les ressemblances qu'ils ont déjà vues. Valerie Emanuel, cofondatrice basée à Los Angeles de l'agence de talents Role Models Management, a déclaré qu'elle craignait que ce genre de fausses photos ne transforme le médium en monoculture, dans laquelle la plupart des visages se ressemblent.
« Nous voulons créer plus de diversité et montrer des visages uniques dans la publicité à l'avenir », a déclaré Emanuel. « Cela homogénéise un seul regard ».
Icons8 a créé ses visages en premier en prenant des dizaines de milliers de photos d'environ 70 modèles dans des studios du monde entier, a déclaré Ivan Braun, fondateur de la société. Les collègues de Braun (qui travaillent à distance aux États-Unis, en Italie, en Israël, en Russie et en Ukraine) ont ensuite passé plusieurs mois à préparer une base de données, à nettoyer les images, à étiqueter les données et à organiser les photos selon les spécifications précises de l'ordinateur.
Une fois ces images prêtes, les ingénieurs ont ensuite utilisé StyleGAN pour générer un flot de nouvelles photos, générant 1 million d'images en une seule journée. Son équipe a ensuite sélectionné les 100 000 images les plus convaincantes, qui ont été mises à la disposition du public. Les prochains mois ils ont l'intention d'en proposer plus.
La société, a déclaré Braun, a signé trois clients au cours de sa première semaine : une université américaine, une application de rencontres et une société de planification des ressources humaines. Braun a refusé de nommer les clients. Les clients peuvent télécharger jusqu'à 10 000 photos par mois à partir de 100 $.
Une autre entreprise, la startup basée à San Francisco, Rosebud AI, offre à ses clients une galerie de 25 000 photos « de modèles personnalisés d'IA de différentes ethnies ». Lisha Li, la fondatrice de l'entreprise, a déclaré qu'elle avait d'abord commercialisé les photos comme un moyen pour les petites entreprises sur les sites de vente en ligne d'inventer des modèles élégants sans avoir besoin de photographies coûteuses.
Les images sources de son entreprise proviennent de bases de données en ligne de photos gratuites et non protégées, et le système permet aux clients de superposer facilement différents visages sur un ensemble de corps changeant. Elle promeut le système comme un outil puissant pour augmenter les capacités des photographes, les laissant facilement adapter les modèles pour un shooting de mode à la nationalité ou l'origine ethnique du spectateur.
Le système est proposé à un groupe limité de clients, que la société évalue individuellement dans l'espoir de bloquer les mauvais acteurs. Environ 2000 clients potentiels sont sur la liste d'attente.
Les techniques d'apprentissage automatique sont open source, permettant à pratiquement n'importe qui de les utiliser et de les développer. Et le logiciel s'améliore tout le temps: une nouvelle version de StyleGAN, dévoilée le mois dernier par des chercheurs en IA de Nvidia, promet des méthodes de génération plus rapides et des images de meilleure qualité.
Les chercheurs disent que les images sont un cadeau pour les fournisseurs de désinformation, car contrairement aux vraies photos prises ailleurs, elles ne peuvent pas être facilement retracées. De telles contrefaçons sont déjà utilisées, y compris sur Facebook, où les vérificateurs des faits ont trouvé les images utilisées pour créer de faux profils pour promouvoir des pages présélectionnées ou des idées politiques.
Dans un autre cas, il a été établi que le profil LinkedIn d'une jeune femme prétendument nommée Katie Jones, qui a créé des liens avec de hauts responsables de Washington, se servait d'une image générée par l'IA. Des experts du contre-espionnage ont déclaré à l'Associated Press qu'il portait les signatures d'espionnage étranger.
La création d'images générées par l'IA à ce volume pourrait être extrêmement coûteuse, car le processus nécessite une puissance de calcul extraordinaire. Mais la société de Braun, comme d'autres, bénéficie de la concurrence entre Google et Amazon dans le cloud computing, qui offrent tous deux des « crédits » que les start-ups peuvent utiliser pour un travail intensif en IA à des tarifs fortement réduits.
Braun a déclaré que la crainte que des images générées par l'IA soient utilisées à des fins de désinformation ou d'abus est raisonnable, ajoutant : « nous devons nous en inquiéter. La technologie est déjà là, nous devons faire avec ». Mais la solution à ce problème, a-t-il dit, n'est pas la responsabilité d'entreprises comme la sienne : au lieu de cela, il faudra une « combinaison de changement social, de changement technologique et de politique ». (La société n'utilise aucune mesure d'authentification, comme des filigranes, pour aider les gens à vérifier si les images sont réelles ou des images générées par une IA).
Source : Associated Press, Analysis, NVidia, Rosebud AI, Generated.Photos
Et vous ?
Que pensez-vous de cette technologie dans l'absolu ?
Étant donné que cette technologie a déjà été utilisée par des acteurs malveillants (notamment la personne avec un faux compte LinkedIn en contact avec de hauts responsables de Washington) faut-il craindre le pire ?
Quels sont les scénarios catastrophes que vous pouvez imaginer avec cette technologie ?
Quels pourraient être les cas d'utilisation les plus intéressants ?
Un raccourci pour certaines plateformes qui pourraient donner l'illusion de la diversité ?
Dans le cas d'espèce, l'IA qui est capable de générer des visages réalistes est-elle une menace pour les mannequins de publicité ? Dans quelle mesure ?
Voir aussi :
Airbnb prétend que son IA peut prédire si les clients sont des psychopathes, après avoir scanné leur vie en ligne et regroupé des informations sur eux
Samsung a créé un nouveau logiciel qui utilise l'IA et l'appareil photo de votre téléphone, pour suivre les mouvements de vos doigts pendant qu'ils tapent sur un clavier invisible en face de vous
L'année 2020 marquera les débuts d'une véritable adoption de l'IA dans les entreprises, selon une étude d'IBM
Ubisoft a construit une nouvelle IA pour apprendre à une voiture à se conduire dans un jeu de course, en utilisant l'apprentissage par renforcement