IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)

Vous êtes nouveau sur Developpez.com ? Créez votre compte ou connectez-vous afin de pouvoir participer !

Vous devez avoir un compte Developpez.com et être connecté pour pouvoir participer aux discussions.

Vous n'avez pas encore de compte Developpez.com ? Créez-en un en quelques instants, c'est entièrement gratuit !

Si vous disposez déjà d'un compte et qu'il est bien activé, connectez-vous à l'aide du formulaire ci-dessous.

Identifiez-vous
Identifiant
Mot de passe
Mot de passe oublié ?
Créer un compte

L'inscription est gratuite et ne vous prendra que quelques instants !

Je m'inscris !

Google lance Nano Banana Pro, un générateur d'images par IA mis à jour et alimenté par Gemini 3 : « Il est incroyable pour les infographies », déclare Josh Woodward, vice-président de Google Labs et Gemini

Le , par Anthony

5PARTAGES

4  0 
Google a lancé Nano Banana Pro, un nouveau générateur d'images basé sur son modèle d'intelligence artificielle (IA) Gemini 3, soulignant ainsi l'accélération des efforts de l'entreprise dans le domaine des outils multimédias génératifs. Cette mise à jour améliore la précision de la conception, le rendu multilingue du texte et la cohérence des caractères, élargissant ainsi les capacités de la plateforme au-delà de son prédécesseur. Ce lancement intervient alors que Google intensifie sa concurrence avec OpenAI, dans un contexte de demande croissante des utilisateurs et d'engagement poussé dans son écosystème d'IA.

Le jeudi 20 novembre, Google a lancé Nano Banana Pro, son tout dernier outil d'édition et de génération d'images par intelligence artificielle (IA), poursuivant ainsi sur sa lancée après le lancement de son nouveau modèle Gemini 3, conçu pour surpasser ses concurrents, comme GPT-5.1. Lancée huit mois après Gemini 2.5, la nouvelle génération de modèles Gemini promet des interactions nécessitant moins d’indications, tandis que la plateforme d’agents Antigravity introduit une approche de développement orientée tâches.

Dans le même élan, Google avait déjà renforcé l'application Gemini avec le modèle d'IA Nano Banana afin d'améliorer ses capacités d'édition d'images. Cette mise à jour, axée sur le traitement avancé des photos, a été décrite par certains observateurs comme susceptible de faire de l'ombre à des solutions établies telles que Photoshop, illustrant ainsi l'ambition croissante de Google dans le domaine des usages créatifs de l'IA.

Josh Woodward, vice-président de Google Labs et Gemini, a déclaré que les capacités de Nano Banana Pro allaient au-delà de sa version initiale, lancée fin août. « Il est incroyable pour créer des infographies. Il peut créer des présentations PowerPoint. Il peut prendre jusqu'à 14 images différentes, ou cinq caractères différents, et conserver en quelque sorte la cohérence de ces caractères », a-t-il déclaré.


Il a ajouté que les utilisateurs internes ont testé cette fonctionnalité en saisissant des extraits de code et même des CV LinkedIn pour créer des infographies. « Je pense que cette capacité à visualiser des choses qui, auparavant, n'étaient peut-être pas considérées comme un support visuel, est l'un des aspects magiques que les gens découvrent avec cet outil », a déclaré Josh Woodward.

La version originale de Nano Banana est devenue virale sur les réseaux sociaux lorsque les utilisateurs ont transformé des photos d'eux-mêmes ou de leurs animaux de compagnie en figurines 3D hyperréalistes. Josh Woodward a écrit dans un post X en septembre que le produit avait contribué à ajouter 13 millions de nouveaux utilisateurs à l'application Gemini en l'espace de quatre jours.

Nano Banana Pro, qui est basé sur Gemini 3 Pro, a contribué à des records historiques du cours de l'action. Le 20 novembre, l'action d'Alphabet a augmenté de 4 %.

Créer un flux de travail créatif complet

Selon Google, Nano Banana Pro excelle dans la conception visuelle, la connaissance du monde et la génération de texte, ce qui permet aux entreprises de :

  • Déployer plus rapidement des campagnes mondiales localisées. Le modèle prend en charge le rendu de texte dans plusieurs langues. Les utilisateurs peuvent même prendre une image et traduire le texte qu'elle contient, afin que leur travail créatif soit immédiatement prêt pour d'autres pays.
  • Créer des ressources visuelles plus précises et riches en contexte. Nano Banana Pro étant connecté à Google Search, il comprend le contexte du monde réel. Les utilisateurs peuvent ainsi générer des cartes, des diagrammes et des infographies qui reflètent fidèlement les faits et les détails, ce qui est idéal pour les manuels de formation ou les guides techniques où la précision est essentielle.
  • Conserver un contrôle créatif plus fort et une fidélité à la marque. Selon Google, le maintien de la cohérence de la marque, du produit ou du personnage est souvent le plus grand défi lorsque l'on utilise l'IA pour les ressources créatives. Nano Banana Pro permet à une équipe créative de garder le contrôle grâce à sa fenêtre de contexte visuel étendue. Cela peut être considéré comme une « suggestion en quelques clics » pour les designers : en permettant aux utilisateurs de télécharger jusqu'à 14 images de référence, ils peuvent désormais charger simultanément un guide de style complet, comprenant les logos, les palettes de couleurs, les rotations de personnages et les photos de produits. Cela garantit que le modèle dispose du contexte complet nécessaire pour correspondre à l'identité d'une marque. Si l'utilisateur a besoin d'affiner le résultat, il lui suffit de décrire le changement en utilisant un langage naturel pour ajouter, supprimer ou remplacer des détails. Nano Banana Pro prend en charge des images jusqu'à 4K pour un niveau de détail et une netteté supérieurs sur plusieurs formats d'image.

Nano Banana Pro et Nano Banana sont ainsi conçus pour alimenter un flux de travail créatif complet. Les utilisateurs peuvent commencer avec Nano Banana pour une conceptualisation rapide, puis passez à Nano Banana Pro lorsqu'ils ont besoin d'une fidélité maximale pour des ressources prêtes à la production.


Cas d'utilisation

Répondre aux besoins commerciaux : les deux modèles Nano Banana et Nano Banana Pro s'inscrivent dans le cadre de responsabilité partagée de Google, et ils permettent aux utilisateurs de garantir la transparence et une utilisation responsable grâce au filigrane SynthID intégré à chaque ressource générée. Google s'est engagé à répondre aux besoins commerciaux des utilisateurs avec une indemnisation des droits d'auteur dès la mise à disposition générale.


Prompt : Traduis tout le texte en anglais figurant sur les trois boîtes jaunes et bleues en coréen, sans modifier le reste.

Recherche approfondie : Nano Banana Pro peut utiliser Google Search pour effectuer des recherches sur des sujets en fonction de la requête des utilisateurs et déterminer comment présenter des informations factuelles et fondées.


Prompt : Crée une infographie qui montre comment préparer un elaichi chai.

Composition avancée : Les utilisateurs peuvent ajouter jusqu'à 14 images de référence pour combiner des éléments, mélanger des scènes et transférer des designs afin de créer quelque chose d'entièrement nouveau. Nano Banana Pro conserve la qualité d'un élément développé, mais le fournit en quelques minutes.


Prompt : Photo de style éditorial, mannequin féminin portant un jean, un haut jaune à pois, un bandeau, des talons rouges et un sac noir au bras. Elle tient un matcha latte glacé dans une main et, dans l'autre, la laisse d'un chien chow-chow. Elle se tient devant une maison à Beverly Hills et regarde l'appareil photo. Respecte l'esthétique générale et la palette de couleurs de la photo avec la maison. Il y a un logo blanc « Love Letters » avec une ombre à 10 % d'opacité dans le coin inférieur gauche.

Rendu de texte avancé : Les utilisateurs peuvent générer du texte clair et précis dans les images, ouvrant ainsi la voie à des cas d'utilisation pour les maquettes de produits, les affiches et les schémas pédagogiques. Cela peut inclure le placement naturel du texte (par exemple, le texte s'enroulant autour d'un objet) et la prise en charge de diverses polices et styles.


Prompt : Crée une image représentant la phrase « Combien de bois une marmotte pourrait-elle couper si une marmotte pouvait couper du bois » à partir de bois coupé par une marmotte.

Intensification de la concurrence avec ChatGPT d'OpenAI

La sortie de Nano Banana Pro intervient alors que Google s'efforce de gagner du terrain sur OpenAI dans la course à l'IA générative, qui s'est déclenchée après la sortie de ChatGPT en 2022.

La semaine dernière, OpenAI a annoncé deux mises à jour de son modèle GPT-5 afin de le rendre « plus chaleureux par défaut et plus conversationnel », ainsi que « plus efficace et plus facile à comprendre dans son utilisation quotidienne », a déclaré la société. ChatGPT est actuellement en tête de la liste des applications gratuites sur l'App Store d'Apple, suivi de Gemini en deuxième position.

L'application Gemini compte à ce jour plus de 650 millions d'utilisateurs actifs par mois, et la fonctionnalité AI Overviews alimentée par Gemini compte 2 milliards d'utilisateurs par mois, a déclaré Google dans un communiqué. Le PDG d'OpenAI, Sam Altman, a déclaré en octobre que ChatGPT avait atteint 800 millions d'utilisateurs actifs par semaine.

Forte demande pour les outils Gemini

Josh Woodward a...
La fin de cet article est réservée aux abonnés. Soutenez le Club Developpez.com en prenant un abonnement pour que nous puissions continuer à vous proposer des publications.

Une erreur dans cette actualité ? Signalez-nous-la !