OpenAI déploie GPT-5.4 Mini et Nano pour une IA d'entreprise en temps réel et à faible latence, apportant de nombreux atouts de GPT-5.4 à des petits modèles plus rapides et plus efficaces

Le 18 mars 2026 à 08:53, par Jade Emy

73PARTAGES

OpenAI déploie GPT-5.4 Mini et Nano pour une IA d'entreprise en temps réel et à faible latence, apportant de nombreux atouts de GPT-5.4 à des petits modèles plus rapides et plus efficaces

OpenAI a lancé GPT‑5.4 mini et nano, ses petits modèles les plus performants à ce jour. Ils apportent de nombreux atouts de GPT‑5.4 à des modèles plus rapides et plus efficaces, conçus pour des charges de travail à gros volume. GPT‑5.4 mini est conçu pour les charges de travail où la latence influence directement l’expérience produit : assistants de codage réactifs, sous-agents exécutant rapidement des tâches de support, systèmes capables de capturer et d’interpréter des captures d’écran, et applications multimodales qui raisonnent sur des images en temps réel. GPT‑5.4 nano est la version la plus petite et la plus rapide de GPT‑5.4, elle est dédiée aux tâches pour lesquelles la vitesse et le coût comptent le plus.

OpenAI est une entreprise américaine d'intelligence artificielle (IA), connue pour ses grands modèles de langage tels que GPT-4o, la série de modèles de génération d'images DALL-E et le modèle de génération de vidéos Sora. Son lancement de ChatGPT en novembre 2022 a déclenché un intérêt mondial pour les agents conversationnels et l'IA générative. ChatGPT est un agent conversationnel d'IA. ChatGPT utilise des transformeurs génératifs préentraînés, comme GPT-5, pour générer du texte ou des images.

Début mars, OpenAI a dévoilé son très attendu modèle GPT-5.4. L'entreprise affirme que GPT-5.4 est son système le plus performant à ce jour pour un usage professionnel. Ce modèle combine un raisonnement avancé, des capacités de codage et la possibilité d'utiliser de manière autonome des ordinateurs et des logiciels. Il est disponible dans ChatGPT sous le nom GPT-5.4 Thinking, dans l'API et dans Codex, et décliné en deux variantes : Thinking et Pro. OpenAI a déclaré que GPT-5.4 prend en charge jusqu'à 1 million de tokens de contexte dans l'API et Codex. GPT-5.4 intensifie la concurrence pour les clients professionnels, jusqu'ici le bastion d'Anthropic.

Récemment, OpenAI a lancé GPT‑5.4 mini et nano, ses petits modèles les plus performants à ce jour. Ils apportent de nombreux atouts de GPT‑5.4 à des modèles plus rapides et plus efficaces, conçus pour des charges de travail à gros volume. GPT‑5.4 mini est une version nettement améliorée de GPT‑5 mini en matière de code, de raisonnement, de compréhension multimodale et d’utilisation d’outils, tout en étant plus de deux fois plus rapide. Il se rapproche également des performances du modèle plus grand GPT‑5.4 sur plusieurs évaluations, notamment SWE-Bench Pro et OSWorld-Verified.

GPT‑5.4 mini est conçu pour les charges de travail où la latence influence directement l’expérience produit : assistants de codage réactifs, sous-agents exécutant rapidement des tâches de support, systèmes capables de capturer et d’interpréter des captures d’écran, et applications multimodales qui raisonnent sur des images en temps réel. Dans ces contextes, le meilleur modèle n’est souvent pas le plus grand : c’est celui qui peut répondre rapidement, utiliser les outils de manière fiable et rester performant sur des tâches professionnelles complexes.

GPT‑5.4 nano est la version la plus petite et la plus rapide de GPT‑5.4, elle est dédiée aux tâches pour lesquelles la vitesse et le coût comptent le plus. Il s'agit également d'une amélioration significative de la version GPT‑5 nano. Ce modèle est recommandé pour la classification, l'extraction de données, le classement et les sous-agents qui gèrent des tâches de support plus simples.

Codage

Selon OpenAI, GPT‑5.4 mini est particulièrement efficace dans les flux de travail de programmation qui bénéficient d'itérations rapides. Le modèle gère les modifications ciblées, la navigation dans le codebase, la génération front-end et les boucles de débogage avec une faible latence, ce qui en fait un bon choix pour des tâches de code devant être exécutées plus rapidement et à moindre coût.

Dans les benchmarks, GPT‑5.4 mini surpasse systématiquement GPT‑5 mini à latence comparable et se rapproche des taux de réussite de GPT‑5.4 tout en étant beaucoup plus rapide, offrant l’un des meilleurs compromis performance-latence pour les flux de travail de développement.

GPT‑5.4 mini convient également aux systèmes qui combinent des modèles de tailles différentes. Dans Codex, par exemple, un modèle plus grand comme GPT‑5.4 peut gérer la planification, la coordination et la décision finale, tout en déléguant à des sous-agents GPT‑5.4 mini qui prennent en charge des sous-tâches plus ciblées en parallèle—comme rechercher dans une base de code, examiner un fichier volumineux ou traiter des documents complémentaires.

Ce schéma devient plus utile alors que les modèles plus petits deviennent plus rapides et plus performants. Au lieu d’utiliser un seul modèle pour tout, les développeurs peuvent concevoir des systèmes où les modèles plus grands décident quoi faire et où les modèles plus petits exécutent rapidement les tâches à grande échelle. OpenAI affirme que GPT‑5.4 mini est le mini modèle le plus puissant à ce jour pour ce type de flux de travail.

Utilisation d’un ordinateur

GPT‑5.4 mini est également performant sur les tâches multimodales, en particulier celles liées à l’utilisation de l’ordinateur. Le modèle peut interpréter rapidement des captures d’écran d’interfaces utilisateur complexes afin d’exécuter des tâches d’utilisation de l’ordinateur avec rapidité. Sur OSWorld-Verified, GPT‑5.4 mini se rapproche de GPT‑5.4 tout en surpassant nettement GPT‑5 mini.

Disponibilité et tarification

GPT‑5.4 mini est disponible dans API, Codex et ChatGPT. Dans API, GPT‑5.4 mini prend en charge les entrées de texte et d'image, l'utilisation d'outils, l'appel de fonction, la recherche web, la recherche de fichiers, l'utilisation d'un ordinateur et les compétences. Il dispose d'une fenêtre de contexte de 400k et coûte $0.75 par million de tokens en entrée et $4.50 par million de tokens en sortie.

Dans Codex, GPT‑5.4 mini est disponible dans l’application Codex, le CLI, l’extension IDE et sur le web. Il n’utilise que 30 % du quota GPT‑5.4, ce qui permet aux développeurs de traiter rapidement des tâches de code plus simples dans Codex pour environ un tiers du coût. Les agents peuvent également être configurés pour utiliser GPT‑5.4 mini par défaut, permettant aux sous-agents qui gèrent un travail moins exigeant en raisonnement de s'exécuter sur le modèle moins cher.

Dans ChatGPT, GPT‑5.4 mini est disponible pour les utilisateurs Free et Go via la fonctionnalité « Thinking » du menu +. Pour tous les autres utilisateurs, GPT‑5.4 mini est disponible comme solution de repli en cas de limitation de débit pour GPT‑5.4 Thinking. GPT‑5.4 nano est uniquement disponible via l’API et coûte 0,20 $ par million de tokens en entrée et 1,25 $ par million de tokens en sortie.

Cette annonce intervient alors que les documents internes d'OpenAI prévoient une perte de 14 milliards de $ en 2026, qui serait environ trois fois plus importante que les premières estimations pour 2025. Selon le rapport, OpenAI s'attend à perdre 44 milliards de dollars entre 2023 et fin 2028, avant de dégager un bénéfice de 14 milliards de dollars en 2029. Le rapport affirme également que la consommation de trésorerie d'OpenAI n'est pas aussi grave qu'on le pensait auparavant, la société n'ayant dépensé que 340 millions de dollars au cours du premier semestre de l'exercice financier le plus récent. Conquérir un nouveau marché représente donc la perspective d'OpenAI pour améliorer sa santé financière.

Source : OpenAI

Et vous ?

Pensez-vous que cette annonce est crédible ou pertinente ?

Quel est votre avis sur le sujet ?

Voir aussi :

Ce que GPT-5.4 d'OpenAI va changer concrètement pour les développeurs : des fuites de code révèlent une fenêtre de contexte d'un à deux millions de tokens et un mode de raisonnement « extrême »

Google lance son tout dernier modèle d'IA, Gemini 3.1 Flash-Lite, conçu pour être le plus rapide et le plus rentable de la série Gemini 3

Le dernier modèle Anthropic, Claude Sonnet 4.6, apporte des améliorations en matière de codage, d'utilisation de l'ordinateur, de raisonnement dans un contexte étendu et de planification d'agents

Vous avez lu gratuitement 5 848 articles depuis plus d'un an.
Soutenez le club developpez.com en souscrivant un abonnement pour que nous puissions continuer à vous proposer des publications.

Une erreur dans cette actualité ? Signalez-nous-la !

Votre nom : Votre e-mail :

Décrivez l'erreur que vous souhaitez porter à notre connaissance :

Identifiez-vous

Créer un compte

OpenAI déploie GPT-5.4 Mini et Nano pour une IA d'entreprise en temps réel et à faible latence, apportant de nombreux atouts de GPT-5.4 à des petits modèles plus rapides et plus efficaces

Identifiant
Mot de passe

Mot de passe oublié ?