Chaque fois que le site est rafraîchi, un nouveau graphisme est présenté à l’internaute. Phillip Wang, ingénieur en logiciel chez Uber, avait lancé une idée similaire avec son site Web ThisPersonDoesnotExist.com (cette personne n’existe pas) pour démontrer les capacités du GAN et sensibiliser le public à cette technologie.
Pour être plus précis, il s’est servi de StyleGAN, une technologie publiée en open source par Nvidia. Dans ce dépôt, l'équipe de NVidia a mis à disposition des ressources pour permettre la génération d'images. En dehors du jeu de données Flickr-Faces-HQ, tous les matériaux de StyleGAN sont sous licence Creative Commons BY-NC 4.0 : vous pouvez donc utiliser, redistribuer et adapter le matériel à des fins non commerciales, à condition de donner le crédit voulu en citant l'article de NVidia et en indiquant les modifications que vous avez apportées.
Cette fois-ci, Michael Friesen s’est servi de la même technologie en version 2 (StyleGAN2 publié le 19 décembre 2019) pour générer ces œuvres d’art. L’algorithme a été entraîné avec des photos issues de Modern Art Code pour créer de toutes nouvelles œuvres d’art. L’outil a été également utilisé pour créer des photos de chats (à cette page), de chevaux (à cette page), de molécules (à cette page), d’actualités (à cette page), de scénarios de discussion au bureau (à cette page).
Image générée par l'IA
Comment fonctionnent les GAN ?
Le concept de GAN a été introduit pour la première fois en 2014 par le célèbre informaticien Ian Goodfellow, et depuis lors, Nvidia est à la pointe de la technologie. Tero Karras, chercheur principal de la société, a dirigé de nombreuses études sur le GAN.
Un GAN est un modèle génératif où deux réseaux sont placés en compétition dans un scénario de théorie des jeux. Le premier réseau est le générateur, il génère un échantillon (ex. une image), tandis que son adversaire, le discriminateur essaie de détecter si un échantillon est réel ou bien s'il est le résultat du générateur. L'apprentissage peut être modélisé comme un jeu à somme nulle. Ces programmes informatiques se font concurrence des millions de fois afin d’affiner leurs compétences en matière de génération d’images jusqu’à ce qu’ils aient la capacité de créer des images complètes.
S’il fallait simplifier, nous pourrions dire que le GAN implique que deux réseaux travaillent l’un contre l’autre. Le premier va être nourri en données brutes qu’il va décomposer. À partir de ces données, il va tenter de créer une image. Il va ensuite soumettre cette image à un autre réseau qui, lui, n’a que des photos ou images réelles dans sa base de données. Ce deuxième réseau va alors juger de l’image et va informer le premier de son jugement. Si l’image ne ressemble pas au résultat attendu, le premier algorithme va recommencer le processus. Si le résultat correspond, il va être informé qu’il est sur la bonne voie et finir par comprendre ce qu’est une bonne image. Une fois qu’il est suffisamment entraîné, il peut en produire à la chaîne.
Il faut noter que les GAN ne servent pas seulement dans le domaine de l'art ou du jeu vidéo. En Russie, l'Institut de physique et de technologie de Moscou développe des GAN qui seraient capables d'"inventer" de nouvelles structures moléculaires dans le cadre de la recherche pharmaceutique. Ils seraient employés pour exploiter au mieux les propriétés spécifiques de molécules utilisées pour la fabrication de médicaments. L'existence de cette technologie pourrait apporter pour la recherche un gain de temps et de coûts, et améliorer l'efficacité ou réduire les effets secondaires de certains médicaments comme l'aspirine. Sur le principe, les informations sur des composés aux propriétés médicinales reconnues sont intégrées dans le Generative Adversarial Autoencodeur, une extension du GAN, ajusté pour faire ressortir ces mêmes données.
Artur Kadurin, développeur au sein du groupe Mail.Ru et conseiller indépendant chez Insilico Medecine, une entreprise américaine, annonce que : "Les GAN sont vraiment la ligne de front des neurosciences. Il est clair qu'ils peuvent être utilisés pour une gamme de tâches beaucoup plus large que la simple génération d'images et de musique. Nous avons testé cette approche avec la bio-informatique et obtenu d'excellents résultats."
Cependant, bien que des progrès ont été notés dans l'apprentissage de ces GAN et qu'ils peuvent apporter une meilleure compréhension en biologie et chimie, il n'en reste pas moins que leur utilisation dans des essais cliniques n’est pas encore fiable.
Source : site web
Et vous ?
Que pensez-vous de ce type de technologie ?
Les œuvres générées par une IA doivent-elles être déclarées comme telles de peur de voir des individus en usurper la paternité ?
Quelles utilisations pouvez-vous imaginer de StyleGAN ?