IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)

Vous êtes nouveau sur Developpez.com ? Créez votre compte ou connectez-vous afin de pouvoir participer !

Vous devez avoir un compte Developpez.com et être connecté pour pouvoir participer aux discussions.

Vous n'avez pas encore de compte Developpez.com ? Créez-en un en quelques instants, c'est entièrement gratuit !

Si vous disposez déjà d'un compte et qu'il est bien activé, connectez-vous à l'aide du formulaire ci-dessous.

Identifiez-vous
Identifiant
Mot de passe
Mot de passe oublié ?
Créer un compte

L'inscription est gratuite et ne vous prendra que quelques instants !

Je m'inscris !

OpenAI lance GPT Image 1.5, son dernier modèle IA de génération d'images, pour rivaliser avec Gemini Nano Banana de Google
Offrant des vitesses de génération d'images jusqu'à quatre fois plus rapides

Le , par Jade Emy

0PARTAGES

3  0 
OpenAI lance GPT Image 1.5, son dernier modèle IA de génération d'images, pour rivaliser avec Gemini Nano Banana de Google, offrant des vitesses de génération d'images jusqu'à quatre fois plus rapides

OpenAI a commencé à déployer GPT Image 1.5, son dernier modèle de génération d'images, après la sortie récente de GPT 5.2. Le modèle est disponible dans ChatGPT et via l'API OpenAI. Il offre des vitesses de génération d'images jusqu'à quatre fois plus rapides qu'auparavant, ce qui réduit les temps d'attente, en particulier pendant les pics d'utilisation et sur le niveau gratuit. Cette mise à jour arrive dans un contexte de concurrence croissante de la part de Google, Gemini Nano Banana Pro ayant entraîné une forte augmentation de l'utilisation de Gemini et de solides performances de référence.

En novembre, Google a lancé Nano Banana Pro, un nouveau générateur d'images basé sur son modèle d'intelligence artificielle (IA) Gemini 3, soulignant ainsi l'accélération des efforts de l'entreprise dans le domaine des outils multimédias génératifs. Cette mise à jour améliore la précision de la conception, le rendu multilingue du texte et la cohérence des caractères, élargissant ainsi les capacités de la plateforme au-delà de son prédécesseur. Ce lancement intervient alors que Google intensifie sa concurrence avec OpenAI, dans un contexte de demande croissante des utilisateurs et d'engagement poussé dans son écosystème d'IA.

En réponse, OpenAI a commencé à déployer GPT Image 1.5, son dernier modèle de génération d'images, après la sortie récente de GPT 5.2. Le modèle est disponible dans ChatGPT et via l'API OpenAI. Il offre des vitesses de génération d'images jusqu'à quatre fois plus rapides qu'auparavant, ce qui réduit les temps d'attente, en particulier pendant les pics d'utilisation et sur le niveau gratuit. Cette mise à jour arrive dans un contexte de concurrence croissante de la part de Google, Gemini Nano Banana Pro ayant entraîné une forte augmentation de l'utilisation de Gemini et de solides performances de référence.

ChatGPT Images ajoute désormais des contrôles de style de post-production plus avancés afin de maintenir la cohérence visuelle entre les différentes modifications. Ces outils permettent de préserver la ressemblance faciale, l'éclairage, la composition et la tonalité des couleurs à travers de multiples itérations. Le modèle suit également les instructions d'édition avec plus de précision, permettant aux utilisateurs d'ajouter, de supprimer, de combiner, de mélanger ou de transposer des éléments. Le rendu du texte a également été amélioré, avec une meilleure prise en charge des textes plus denses et plus petits que dans les versions précédentes.

OpenAI introduit également une section Images dédiée dans la barre latérale de ChatGPT, avec des filtres prédéfinis et des suggestions rapides. GPT Image 1.5 est déployé auprès de tous les utilisateurs à partir d'aujourd'hui, tandis que GPT 4o reste disponible via les paramètres personnalisés. Parallèlement à cette mise à jour, OpenAI a annoncé l'intégration prochaine d'Apple Music, qui permettra à ChatGPT de créer des recommandations musicales et des listes de lecture qui s'ouvrent directement dans l'application Apple Music sur ordinateur et iOS.


Voici quelques améliorations de ce modèle :

Des modifications précises qui préservent l'essentiel

Désormais, lorsque vous demandez des modifications sur une image téléchargée, le modèle respecte votre intention de manière plus fiable, jusque dans les moindres détails, en ne modifiant que ce que vous demandez tout en conservant des éléments tels que l'éclairage, la composition et l'apparence des personnes de manière cohérente entre les entrées, les sorties et les modifications ultérieures.

Cela permet d'obtenir des résultats qui correspondent à votre intention : des retouches photo plus utiles, des essais de vêtements et de coiffures plus crédibles, ainsi que des filtres stylistiques et des transformations conceptuelles qui conservent l'essence de l'image originale. Ensemble, ces améliorations signifient que ChatGPT peut agir comme un studio de création dans votre poche, capable à la fois de modifications pratiques et de réinterprétations expressives.

- Modification

Le modèle excelle dans différents types de modifications, notamment l'ajout, la suppression, la combinaison, le mélange et la transposition, afin que vous obteniez les changements souhaités sans perdre ce qui rend l'image spéciale.


- Transformations créatives

La créativité du modèle transparaît à travers des transformations qui modifient et ajoutent des éléments, tels que du texte et des mises en page, afin de donner vie à vos idées tout en préservant les détails importants. Ces transformations fonctionnent aussi bien pour des concepts simples que pour des concepts plus complexes, et sont faciles à essayer à l'aide des styles et des idées prédéfinis dans la nouvelle fonctionnalité ChatGPT Images⁠(s'ouvre dans une nouvelle fenêtre) — aucune invite écrite n'est nécessaire.


- Améliorations supplémentaires de la qualité

Le modèle s'améliore également dans d'autres domaines qui se traduisent par des résultats plus immédiatement utilisables, comme le rendu de nombreux petits visages et l'aspect naturel des résultats.


Cette annonce intervient alors qu'au cours d'une interview qui a fait l'effet d'une bombe, Mo Gawdat, l'ancien directeur commercial de Google X, a dressé un tableau sombre de l'avenir de l'intelligence artificielle. Selon lui, l'IA ne se contentera pas de prendre des emplois, mais provoquera une période de « 15 ans d'enfer » qui débutera plus tôt que nous le pensons. Gawdat a mis en garde contre le déplacement massif d'emplois, touchant même des professions que l'on croyait à l'abri... même des fonctions comme PDG. Il a expliqué que les systèmes d'IA de plus en plus sophistiqués seront en mesure de reproduire les compétences humaines de manière plus efficace et à moindre coût, rendant de nombreux postes superflus.

Source : OpenAI

Et vous ?

Pensez-vous que cette annonce est crédible ou pertinente ?
Quel est votre avis sur le sujet ?

Voir aussi :

L'IA virale de génération d'images intégrée à ChatGPT fait « fondre » les GPU d'OpenAI, elle surcharge les serveurs de l'entreprise et sera donc temporairement limitée, selon Sam Altman, PDG d'OpenAI

Microsoft AI annonce le premier générateur d'images créé en interne, MAI-Image-1, qui se classe n° 9 au classement LMArena face aux modèles les plus performants d'OpenAI et de Google

OpenAI publie GPT-5.2 après une alerte de type « code rouge » déclenchée par Google. L'entreprise affirme que son nouveau modèle d'IA surpasse Gemini et égale les humains sur 70 % des tâches professionnelles
Vous avez lu gratuitement 4 922 articles depuis plus d'un an.
Soutenez le club developpez.com en souscrivant un abonnement pour que nous puissions continuer à vous proposer des publications.

Une erreur dans cette actualité ? Signalez-nous-la !