DALL-E 3 est une percée dans la génération de texte à partir d'images, grâce à un réseau neuronal profond capable de produire des images à partir d'invites en langage naturel. Il s'appuie sur le succès des modèles précédents, tels que :
- Pertinence et suivi des messages : DALL-E 3 suit l'invite de l'utilisateur avec encore plus de précision et de fiabilité que les modèles précédents. Pour obtenir les meilleurs résultats, Microsoft recommande de fournir un niveau de détail plus élevé dans l'invite - plus il y a d'informations, plus l'image finale sera raffinée ;
- Cohérence : DALL-E 3 génère des images encore plus photoréalistes que les autres modèles pour un ensemble varié d'invites. Les images sont non seulement visuellement attrayantes, mais aussi logiquement cohérentes avec l'invite ;
- Esthétique : DALL-E 3 génère des images non seulement réalistes, mais aussi créatives et artistiques. Les images peuvent être stylisées de manière unique, avec un style qui répond à la créativité de l’utilisateur.
Demandez à Bing Chat de « créer une image d'un enfant mystifié découvrant un oiseau inhabituel qui n'existe pas, prise de vue au-dessus de l'épaule, midi, détaillée ».
DALL-E 3 est la dernière version du modèle d’OpenAI qui transforme le texte en image. Il s’appuie sur ChatGPT, un chatbot d’IA très apprécié, pour répondre aux demandes des utilisateurs en images. OpenAI souligne la qualité de DALL-E 3 qui produit des images fidèles et détaillées même avec des demandes compliquées. L’entreprise rappelle aussi l’importance de surveiller la production de contenus indésirables ou illégaux. DALL-E 3 dispose donc de filtres qui refusent les demandes d’images de personnalités ou d’artistes vivants.
OpenAI dit qu’il saisit mieux les demandes qu’avant et qu’il peut produire des images plus originales et plus réalistes. Il est aussi fait pour être plus simple à utiliser ; DALL-E 3 fonctionne avec Bing Chat et ChatGPT au lieu de former un produit séparé, ce qui permet de créer et d’ajuster une image en discutant avec un chatbot. Dans Bing Image Creator, Microsoft met aussi des marques d’eau dans chaque image pour les signaler comme étant générées par l’IA et a développé son propre système de contrôle du contenu.
La génération d'une image avec la plateforme consomme tellement d'énergie que les responsables de l'entreprise craignaient que ses serveurs ne s'effondrent si trop de personnes essayaient de l'utiliser en même temps. DALL-E 3 permet de créer des bandes dessinées en toute simplicité et peu d'efforts.
DALL-E 3 crée des bandes dessinées en un clin d’œil et fait trembler les auteurs
Selon les témoignages sur les réseaux sociaux, l'outil d'IA d'OpenAI permet de générer plusieurs panneaux, voir un scénario complet, d'une bande dessinée en moins de 5 minutes. Cette prouesse a suscité des sueurs froides chez les créateurs de bandes dessinées, qui craignent de voir la valeur de leur travail chuté sur le marché et de se faire progressivement remplacer par les outils d'IA de génération d'images.
En outre, cette version a également suscité des critiques acerbes de la part de la communauté et des créateurs de bandes dessinées. Ces derniers se sont indignés contre le fait que DALL-E 3 puisse copier et réutiliser leurs travaux, notamment leurs scénarios et leurs œuvres visuelles. Par exemple, un internaute a partagé en ligne une courte « bande dessinée » de quatre panneaux créée à l'aide de DALL-E 3. On peut distinguer clairement les personnages comme Batman, le Joker et Robin qui sont protégés par le droit d'auteur. Son message a suscité un tollé sur les médias sociaux, certains critiquant l'idée de célébrer une « bande dessinée créée par l'IA ».
Microsoft prévoit d'utiliser la technologie DALL-E dans d'autres domaines que Bing. La société travaille par exemple sur un outil de création d'images par IA dans l'application Paint, appelé Paint Cocreator, qui intégrera le modèle DALL-E directement dans Windows. En théorie, tout le monde peut utiliser DALL-E 3 via Bing, mais quelques fois, le système s'est avéré « incapable de traiter de nouvelles demandes » et a refusé de créer mon image. Les serveurs sont apparemment surchargés depuis un certain temps : Mikhail Parakhin, de Microsoft, a déclaré : « Nous nous attendions à un fort intérêt, mais nous ne nous attendions pas à un tel engouement ».
Depuis le lancement de Bing Image Creator, plus d'un milliard d'images ont été générées, contribuant à inspirer la créativité des internautes. Bing Image Creator a créé des histoires illustrées, des vignettes pour le contenu des médias sociaux, des arrière-plans de PC, des inspirations de design, et bien d'autres choses encore.
Source : Microsoft
Et vous ?
Que pensez-vous des outils de génération d'images alimentés par l'IA ?
Quels impacts ces outils d'IA pourraient-ils avoir sur l'industrie des bandes dessinées ?
Que pensez-vous de DALL-E 3 et de son intégration dans Bing Chat et de Bing Image Creator ?
Les outils d'IA tels que DALL-E 3 peuvent-ils améliorer le travail des créateurs de bandes dessinées ?
Voir aussi :
OpenAI lance DALL-E 3 ChatGPT, la dernière version de son outil pour la génération d'images à partir de textes, afin d'aider les créateurs et les autres utilisateurs
Dall-E 2 : le générateur d'images IA développé par OpenAI est disponible en bêta, il peut produire une large gamme d'images à partir de quelques mots
Stable Diffusion de Stability AI serait le modèle d'IA le plus important de tous les temps, contrairement à GPT-3 et DALL-E 2, il apporte des applications du monde réel ouvertes pour les utilisateurs