Whisk permet aux utilisateurs de saisir des images pour le sujet, une pour la scène et une pour le style, générant ainsi de nouveaux visuels par le biais d'un processus automatisé. L'utilisateur peut ensuite les remixer pour créer quelque chose d'unique, qu'il s'agisse d'une peluche numérique, d'un pin's en émail ou d'un autocollant.
En coulisses, le modèle Gemini AI de Google rédige automatiquement des légendes détaillées pour les images téléchargées. Il transmet ensuite ces descriptions pour être traitées par le dernier modèle de génération d'images de Google, Imagen 3. Ce processus permet de capturer l'essence des images d'entrée, et non une réplique exacte, tout en permettant des réinterprétations créatives. Ainsi, l'utilisateur peut facilement remixer ses sujets, ses scènes et ses styles de manière originale.
Étant donné que Whisk n'extrait que quelques caractéristiques clés des images d'entrée, il peut générer des résultats qui diffèrent des attentes de l'utilisateur. Par exemple, le sujet généré peut avoir une taille, un poids, une coiffure ou un teint de peau différents. Ces caractéristiques pouvant être cruciales pour un projet et reconnaissant que Whisk peut se tromper, Google a indiqué qu'il permettait aux utilisateurs d'afficher et de modifier les invites sous-jacentes à tout moment.
Lors des premiers tests effectués par Google auprès d'artistes et de créateurs, Whisk a été décrit comme un nouveau type d'outil créatif, et non comme un éditeur d'images traditionnel. Selon Google, Whisk a été conçu pour une exploration visuelle rapide, et non pour des modifications au pixel près. Il s'agit donc d'un outil d'IA qui permet d'explorer des idées de manière nouvelle et créative, en permettant aux utilisateurs de travailler avec des dizaines d'options et de télécharger celles qu'ils aiment.
Cet outil expérimental, lancé aux États-Unis le 16 décembre 2024, s'inscrit dans le cadre des efforts continus de Google Labs pour faire progresser les solutions créatives basées sur l'IA.
Source : Google
Et vous ?
Que pensez-vous de Whisk et de ses fonctionnalités ?
Trouvez-vous qu'il s'agit d'un outil utile et intéressant, ou plutôt d'un gadget supplémentaire ?
Voir aussi :
Google va relancer l'outil de génération d'images de personnes par l'IA, après avoir "mise en pause" la fonction, à la suite du tollé suscité par des résultats historiquement inexacts
Google va commencer à étiqueter les images générées par l'IA dans ses résultats de recherche, car plus de 70 % des consommateurs craignent d'être dupés par des IA