IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)

Vous êtes nouveau sur Developpez.com ? Créez votre compte ou connectez-vous afin de pouvoir participer !

Vous devez avoir un compte Developpez.com et être connecté pour pouvoir participer aux discussions.

Vous n'avez pas encore de compte Developpez.com ? Créez-en un en quelques instants, c'est entièrement gratuit !

Si vous disposez déjà d'un compte et qu'il est bien activé, connectez-vous à l'aide du formulaire ci-dessous.

Identifiez-vous
Identifiant
Mot de passe
Mot de passe oublié ?
Créer un compte

L'inscription est gratuite et ne vous prendra que quelques instants !

Je m'inscris !

DALL-E Mini serait la machine à mèmes IA préférée d'Internet,
L'application de génération d'images permet de comprendre comment l'IA peut déformer la réalité

Le , par Bruno

195PARTAGES

8  0 
Hugging Face, une société qui héberge des projets d'intelligence artificielle open source, a vu le trafic vers un outil de génération d'images d'IA appelé DALL-E Mini monté en flèche. Cela fait plus d'un an qu'un développeur indépendant a créé cette application. Elle utilise une seule ligne de texte pour générer neuf images en réponse à n'importe quel texte tapé.

DALL-E Mini a été inspiré par un outil de création d'images d'IA plus puissant appelé DALL-E. Le groupe de recherche en intelligence artificielle OpenAI a créé une nouvelle version de DALL-E, son programme de génération de texte en image. DALL-E 2 est une version à plus haute résolution et à plus faible latence du système original, qui produit des images représentant les descriptions écrites par les utilisateurs. Il comprend également de nouvelles fonctionnalités, comme l'édition d'une image existante.

Nommé d'après l'artiste surréaliste Salvador Dali et le personnage robot de Pixar, Wall-E, le prédécesseur du modèle, DALL-E, a été lancé l'année dernière. Ce logiciel est capable de créer des images dans différents styles artistiques lorsqu'il est guidé par des entrées de texte : il génère des images à partir de ce que vous lui décrivez. Vous demandez un cœur anatomiquement réaliste, ou un dessin animé d'un bébé radis chinois en tutu promenant un chien, et il fera de son mieux pour créer une image qui y correspond.


DALL-E est plus puissant mais n'est pas ouvertement disponible, par crainte qu'il ne soit utilisé à mauvais escient. La version DALL-E 2 est censée être plus polyvalente et capable de générer des images à partir de légendes à des résolutions plus élevées. Elle est également dotée de nouvelles capacités. Il s'agissait d'un test limité mais fascinant de la capacité de l'IA à représenter visuellement des concepts, qu'il s'agisse de la représentation banale d'un mannequin en chemise de flanelle, d'une « girafe en tortue » ou de l'illustration d'un radis promenant un chien.

Il est devenu courant que les percées de la recherche en IA soient rapidement reproduites ailleurs, souvent en quelques mois, et DALL-E n'a pas fait exception. Boris Dayma, consultant en apprentissage automatique basé à Houston, au Texas, affirme avoir été fasciné par le document de recherche original de DALL-E. Bien qu'OpenAI n'ait pas publié de code, il a pu assembler la première version de DALL-E Mini lors d'un hackathon organisé par Hugging Face et Google en juillet 2021.

La première version produisait des images de mauvaise qualité, souvent difficiles à reconnaître, mais Dayma a continué à l'améliorer depuis. La semaine dernière, il a rebaptisé son projet Craiyon, après qu'OpenAI lui a demandé de changer le nom pour éviter toute confusion avec le projet DALL-E original. Le nouveau site affiche des publicités, et Dayma prévoit également une version premium de son générateur d'images.

Le modèle d'IA de DALL-E Mini crée des images en s'appuyant sur des modèles statistiques glanés lors de l'analyse de quelque 30 millions d'images étiquetées, afin d'extraire les liens entre les mots et les pixels. Dayma a compilé ces données d'apprentissage à partir de plusieurs collections d'images publiques collectées sur le web, dont une publiée par OpenAI.

Générer une image à partir d'un texte

Que voulez-vous voir ?

Un fauteuil d'avocat qui s'envole dans l'espace


Le système peut commettre des erreurs, notamment parce qu'il ne comprend pas vraiment comment les objets doivent se comporter dans le monde physique. Les petites bribes de texte sont souvent ambiguës, et les modèles d'IA ne saisissent pas leur signification comme le font les gens. Pourtant, Dayma a été étonné par ce que les gens ont tiré de sa création au cours des dernières semaines. Mon message le plus créatif était « La tour Eiffel sur la lune », dit-il. « Maintenant, les gens font des choses folles et ça marche ».

Certaines de ces invites ont cependant entraîné DALL-E Mini dans des directions discutables. Le système n'a pas été formé au contenu explicite, et il est conçu pour bloquer certains mots-clés. Malgré cela, des utilisateurs ont partagé des images provenant d'invites incluant des crimes de guerre, des fusillades dans des écoles et l'attaque du World Trade Center.

La manipulation d'images par l'IA, y compris la falsification d'images de personnes réelles appelée "deepfakes", est devenue une préoccupation pour les chercheurs en IA, les législateurs et les organisations à but non lucratif qui luttent...
La fin de cet article est réservée aux abonnés. Soutenez le Club Developpez.com en prenant un abonnement pour que nous puissions continuer à vous proposer des publications.

Une erreur dans cette actualité ? Signalez-nous-la !

Avatar de Mingolito
Expert éminent https://www.developpez.com
Le 04/07/2022 à 18:57
C'est bien, n'importe quel guignol peut désormais générer une super image en 1 minute, et se prétendre "artiste" en ayant aucune formation ni talent, et vendre ses "œuvres" a prix fort à des gogos

Et pour les graphistes en entreprise n'en parlons pas, 20 minutes de travail effectif par jour payé 7 heures, et le reste : encore plus de temps libre pour aller mater du twerk sur TikTok !
2  0