Google va relancer l'outil de génération d'images de personnes par l'IA, après avoir "mise en pause" la fonction

à la suite du tollé suscité par des résultats historiquement inexacts

Le 30 août 2024 à 18:37, par Jade Emy

883PARTAGES

Google va relancer l'outil de génération d'images de personnes par l'IA, après avoir "mise en pause" la fonction à la suite du tollé suscité par des résultats historiquement inexactes.

Google va relancer Imagen 3, l'outil de création d'images de personnes générées par l'IA. L'entreprise a mis en pause cette option de Gemini en février 2024 à la suite d'inexactitudes et d'une série de controverses. Imagen 3 ne prendra pas en charge les personnes identifiables de manière photo-réaliste, les représentations de mineurs ou les scènes excessivement gores, violentes ou sexuelles.

Février dernier, Gemini, l'outil d'intelligence artificielle (IA) de Google qui peut créer des images en réponse à des requêtes écrites, était critiqué pour avoir généré des représentations des personnes historiques inexactes dans de nombreux résultats. Par exemple, l'IA générait les pères fondateurs des États-Unis ou les soldats allemands de l'époque nazie, des personnages spécifiquement blancs, en tant que personnes de couleur. Google était notamment accusé de former le chatbot à être trop "woke".

Google a présenté ses excuses pour ce qu’il décrit comme des "inexactitudes dans certaines représentations de génération d'images historiques". Google ajoute que "cela fait partie du processus d'alignement - itération sur le retour d'information."En d'autre terme, les erreurs seraient le résultat d'une correction excessive des problèmes de préjugés raciaux. De plus, Google a suspendu l'option de génération d'images de personnes par Gemini pendant qu'elle effectuait les modifications nécessaires.

Récemment, Google a déclaré qu'il permettrait bientôt aux utilisateurs de créer des images de personnes à l'aide de son outil d'IA Gemini, après avoir l'avoir "mis en pause". Dave Citron, directeur principal des produits pour Gemini, a indiqué qu'un accès anticipé au nouveau générateur Imagen 3 de Google serait disponible pour les utilisateurs de Gemini Advanced, Business et Enterprise à partir de l'anglais dans les jours à venir.

Dave Citron a déclaré : "Nous nous sommes efforcés d'apporter des améliorations techniques au produit, ainsi que des ensembles d'évaluation améliorés, des exercices de red-teaming et des principes de produit clairs". Le red-teaming fait référence à une pratique utilisée par les entreprises pour tester leurs produits afin d'en détecter les vulnérabilités.

Google a interrompu sa fonction de génération d'images au début de l'année après avoir déclaré qu'elle présentait des "inexactitudes" dans les images historiques. Par exemple, un utilisateur a demandé à l'outil de générer l'image d'un soldat allemand en 1943, et celui-ci a créé un ensemble de soldats racialement diversifiés portant des uniformes militaires allemands. Une autre requête portant sur une représentation historique d'un roi britannique médiéval a également généré un ensemble d'images racialement diversifiées, dont une femme souveraine.

Selon M. Citron, Imagen 3 ne prend pas en charge les individus identifiables de manière photoréaliste, les représentations de mineurs ou les scènes excessivement gores, violentes ou sexuelles. "Bien entendu, comme pour tout outil d'IA générative, toutes les images créées par Gemini ne seront pas parfaites, mais nous continuerons à écouter les commentaires des premiers utilisateurs pour continuer à nous améliorer", ajoute M. Citron.

Imagen 3, sera déployé dans Gemini, pour les utilisateurs Gemini Advanced, Business et Enterprise. M. Citron conclut : "Nous allons progressivement déployer cette fonctionnalité, afin de l'offrir bientôt à un plus grand nombre d'utilisateurs et de langues."

Voici la présentation d'Imagen 3 par Google :

Générer des images de haute qualité avec Imagen 3

Nous avons amélioré nos capacités de génération d'images créatives et, dans les jours à venir, nous apporterons notre dernier modèle de génération d'images, Imagen 3, à Gemini Apps et étendrons sa disponibilité pour les utilisateurs dans toutes les langues.

Exemple d'invite : Une image animée d'un minuscule dragon sortant d'un œuf dans une prairie ensoleillée, entouré de curieux papillons lumineux. Des couleurs vives, des écailles détaillées

Imagen 3 établit une nouvelle norme en matière de qualité d'image, en générant des images avec seulement quelques mots. Vous pouvez même demander à Gemini de créer des images dans différents styles - comme des paysages photoréalistes, des peintures à l'huile texturées ou des scènes fantaisistes en pâte à modeler.

Imagen 3 offre des fonctionnalités avancées de génération d'images, assorties de protections intégrées et conformes à nos principes de conception de produits. Sur un large éventail de points de référence, Imagen 3 se comporte favorablement par rapport aux autres modèles de génération d'images disponibles. Comme pour Imagen 2, nous utilisons SynthID, notre outil de filigrane pour les images générées par l'IA.

Nos principes de conception sont clairs : du début à la fin, vous gardez le contrôle du processus de création. Si l'image initiale que vous obtenez ne répond pas à vos attentes, il vous suffit d'indiquer à Gemini ce que vous souhaitez modifier et il vous proposera une nouvelle image.

Dans les prochains jours, nous commencerons également à déployer la génération d'images de personnes, avec une version d'accès anticipé pour nos utilisateurs de Gemini Advanced, Business et Enterprise, à partir de l'anglais. Nous nous sommes efforcés d'apporter des améliorations techniques au produit, ainsi que des ensembles d'évaluation améliorés, des exercices de red-teaming et des principes de produit clairs.

Avec Imagen 3, nous avons fait des progrès significatifs en offrant une meilleure expérience utilisateur lors de la génération d'images de personnes. Nous ne soutenons pas la génération d'individus photoréalistes et identifiables, de représentations de mineurs ou de scènes excessivement gores, violentes ou sexuelles. Bien entendu, comme pour tout outil d'IA générative, toutes les images créées par Gemini ne seront pas parfaites, mais nous continuerons à écouter les commentaires des premiers utilisateurs pour continuer à nous améliorer. Nous déploierons progressivement cette fonctionnalité, afin de l'offrir bientôt à un plus grand nombre d'utilisateurs et de langues.

Source : Google

Et vous ?

Avez-vous utilisé cet outil ou un outil similaire, et si oui qu'en pensez-vous ?

Pensez-vous que cette décision de Google de relancer l'outil controversé est crédible ou pertinente ?

Voir aussi :

Le PDG de Google qualifie de « totalement inacceptables » les erreurs de diversité commises par l'IA Gemini. Elles ont coûté 90 milliards de dollars à la capitalisation boursière de l'entreprise

Comment la créativité a quitté les chats IA : le prix de la réduction des biais dans les LLM. Si la censure est efficace pour réduire les biais et la toxicité, elle conduit à une réduction du potentiel créatif

Les choses sont sur le point d'empirer pour l'IA générative : DALL-E d'OpenAI et Midjourney ont généré des images et marques protégées sans y être invités par des utilisateurs

Vous avez lu gratuitement 6 332 articles depuis plus d'un an.
Soutenez le club developpez.com en souscrivant un abonnement pour que nous puissions continuer à vous proposer des publications.

Une erreur dans cette actualité ? Signalez-nous-la !

Votre nom : Votre e-mail :

Décrivez l'erreur que vous souhaitez porter à notre connaissance :

Identifiez-vous

Créer un compte

Google va relancer l'outil de génération d'images de personnes par l'IA, après avoir "mise en pause" la fonction

à la suite du tollé suscité par des résultats historiquement inexacts

Identifiant
Mot de passe

Mot de passe oublié ?

Identifiez-vous

Créer un compte

Google va relancer l'outil de génération d'images de personnes par l'IA, après avoir "mise en pause" la fonction à la suite du tollé suscité par des résultats historiquement inexacts

Google va relancer l'outil de génération d'images de personnes par l'IA, après avoir "mise en pause" la fonction

à la suite du tollé suscité par des résultats historiquement inexacts