OpenAI présente GPT-5.4, doté de capacités accrues en matière de « travail intellectuel » et s'attaque directement à Anthropic,

Un lancement sur fond de polémiques liées à ses liens avec le gouvernement

Le 6 mars 2026 à 08:20, par Mathis Lucas

200PARTAGES

OpenAI présente GPT-5.4, doté de capacités accrues en matière de « travail intellectuel » et s'attaque directement à Anthropic
un lancement sur fond de polémiques liées à ses liens avec le gouvernement

OpenAI dévoile son très attendu modèle GPT-5.4. L'entreprise affirme que GPT-5.4 est son système le plus performant à ce jour pour un usage professionnel. Ce modèle combine un raisonnement avancé, des capacités de codage et la possibilité d'utiliser de manière autonome des ordinateurs et des logiciels. Il est disponible dans ChatGPT sous le nom GPT-5.4 Thinking, dans l'API et dans Codex, et décliné en deux variantes : Thinking et Pro. OpenAI a déclaré que GPT-5.4 prend en charge jusqu'à 1 million de tokens de contexte dans l'API et Codex. GPT-5.4 intensifie la concurrence pour les clients professionnels, jusqu'ici le bastion d'Anthropic.

Les mises à jour de dans le secteur de l'IA ne ralentissent pas. Littéralement deux jours après le lancement par OpenAI d'un nouveau modèle sous-jacent pour ChatGPT appelé GPT-5.3 Instant, la société présente une autre mise à jour encore plus importante : GPT-5.4. Le nouveau modèle consolide certaines des capacités qu'OpenAI avait auparavant réparties entre différents modèles, en réunissant les capacités de codage, de raisonnement et d'action.

Les points forts de cette version concernent l'efficacité, OpenAI indiquant que GPT-5.4 utilise beaucoup moins de jetons (47 % de moins pour certaines tâches) que ses prédécesseurs et, ce qui est sans doute encore plus impressionnant, un nouveau mode d'utilisation « natif » de la machine disponible via l'API et Codex, qui permet à GPT-5.4 de naviguer sur l'ordinateur d'un utilisateur comme comme un humain et de travailler sur plusieurs applications.

OpenAI lance également une nouvelle suite d'intégrations ChatGPT permettant à GPT-5.4 d'être directement connecté à Microsoft Excel et Google Sheets, ce qui favorise une analyse granulaire et l'exécution automatisée des tâches. Cela devrait accélérer le travail de toutes les équipes, mais pourrait accentuer les craintes de licenciements de cols blancs, dans la foulée d'offres similaires proposées par Claude d'Anthropic et sa nouvelle application Cowork.

L'entreprise affirme ensuite que GPT-5.4 prend en charge jusqu'à 1 million de tokens de contexte dans l'API et Codex, ce qui permet aux agents de planifier, d'exécuter et de vérifier des tâches sur de longues périodes. Cependant, le coût par million de tokens double dès que l'entrée dépasse 272 000 tokens.

Contrôle natif de l'ordinateur : une première avec l'IA ChatGPT

La nouveauté la plus importante mise en avant par OpenAI est que GPT-5.4 est son premier modèle polyvalent doté de capacités natives de pointe en matière d'utilisation de l'ordinateur dans Codex et l'API, permettant aux agents de contrôler des ordinateurs et d'effectuer des flux de travail en plusieurs étapes dans différentes applications. Les agents IA se popularisent rapidement, notamment au sein des entreprises de développement de logiciels.

OpenAI explique que le modèle peut à la fois écrire du code pour faire fonctionner des ordinateurs via des bibliothèques telles que Playwright et émettre des commandes de souris et de clavier en réponse à des captures d'écran. OpenAI revendique également une avancée significative dans la navigation Web par les agents. Les résultats des tests de performance sont présentés comme la preuve qu'il ne s'agit pas simplement d'une interface utilisateur.

Sur BrowseComp, qui mesure la capacité des agents IA à naviguer de manière persistante sur le Web pour trouver des informations difficiles à localiser, OpenAI rapporte que GPT-5.4 s'améliore de 17 % en valeur absolue par rapport à GPT-5.2, et que GPT-5.4 Pro atteint 89,3 %, ce qui est présenté comme une nouvelle référence en la matière. Sur OSWorld-Verified, GPT-5.4 affiche un taux de réussite de 75,0 %, contre seulement 47,3 % pour GPT-5.2.

OSWorld-Verified mesure la navigation sur ordinateur à l'aide de captures d'écran et d'actions au clavier et à la souris. (Les performances humaines rapportées sont de 72,4 %.) Sur WebArena-Verified, GPT-5.4 atteint un taux de réussite de 67,3 % en utilisant à la fois des interactions basées sur le DOM et des captures d'écran. Sur Online-Mind2Web, il affiche un score de 92,8 % en utilisant uniquement des observations basées sur des captures d'écran.

Amélioration de la vision et du traitement des documents

OpenAI établit également un lien entre l'utilisation d'un ordinateur et l'amélioration de la vision et du traitement des documents. Sur MMMU-Pro, GPT-5.4 atteint un taux de réussite de 81,2 % sans utiliser d'outils, contre 79,5 % pour GPT-5.2. Dans un billet de blogue, l'entreprise affirme avoir obtenu ce résultat en utilisant une fraction des « jetons de réflexion ». Sur OmniDocBench, l'erreur moyenne de GPT-5.4 est de 0,109, contre 0,140 pour GPT-5.2.

L'article décrit également une prise en charge étendue des entrées d'images haute fidélité, avec un niveau de détail « original » pouvant atteindre 10,24 millions de pixels. OpenAI positionne GPT-5.4 comme étant conçu pour des flux de travail plus longs et en plusieurs étapes, un travail qui ressemble de plus en plus à celui d'un agent conservant un état à travers de nombreuses actions plutôt qu'à celui d'un chatbot répondant une seule fois.

Recherche d'outils et amélioration de l'orchestration des outils

Selon OpenAI, l'approche naïve consistant à déverser toutes les définitions d'outils dans le prompt crée une taxe sur chaque requête : coût, latence et pollution contextuelle. GPT-5.4 introduit la recherche d'outils dans l'API comme solution structurelle. Au lieu de tout recevoir à l'avance, il reçoit une liste allégée d'outils ainsi qu'une fonction de recherche, et il ne récupère les définitions complètes des outils que lorsqu'elles sont réellement nécessaires.

OpenAI a rapporté que cela offre un gain d'efficacité considérable. L'entreprise décrit le gain d'efficacité à l'aide d'une comparaison concrète : sur 250 tâches du benchmark MCP Atlas de Scale, exécutées avec 36 serveurs MCP activés, la configuration de la recherche d'outils a réduit l'utilisation totale de jetons d'environ 47 % tout en atteignant la même précision qu'une configuration qui exposait toutes les fonctions MCP directement dans le contexte.

Ce chiffre de 47 % concerne spécifiquement la configuration de la recherche d'outils dans cette évaluation et ne signifie pas que GPT-5.4 utilise 47 % de jetons en moins pour chaque type de tâche. Des tests indépendants sont nécessaires pour confirmer les gains d'efficacité revendiqués par OpenAI.

Améliorations pour les développeurs et les workflows de codage

GPT-5.4 combine les atouts de GPT-5.3-Codex en matière de codage avec des capacités plus puissantes en matière d'outils et d'utilisation informatique, ce qui est important lorsque les tâches ne sont pas ponctuelles. Selon les tests de l'entreprise, GPT-5.4 égale ou surpasse GPT-5.3-Codex sur SWE-Bench Pro tout en offrant une latence plus faible dans les efforts de raisonnement. Codex bénéficie également de réglages au niveau du flux de travail.

OpenAI affirme que le mode/fast offre des performances jusqu'à 1,5 fois plus rapides sur tous les modèles pris en charge, y compris GPT-5.4, le décrivant comme le même modèle et la même intelligence, « mais en plus rapide ». Et il décrit la sortie d'une compétence Codex expérimentale, « Playwright (Interactive) ».

Une suite d'intégrations pour Microsoft Excel et Google Sheets

Outre le développement de logiciels, les entreprises spécialisées dans l'IA telles qu'OpenAI et Anthropic tentent d'améliorer la productivité des travailleurs dans de nombreux autres domaines. Parallèlement à ce lancement, OpenAI annonce une suite de produits d'IA sécurisés dans ChatGPT, conçus pour les entreprises et les institutions financières, et optimisés par GPT-5.4 pour un raisonnement financier avancé et une modélisation basée sur Excel.

La pièce maîtresse est ChatGPT pour Excel et Google Sheets (bêta), qu’OpenAI décrit comme ChatGPT intégré directement dans des feuilles de calcul pour créer, analyser et mettre à jour des modèles financiers complexes à l'aide des formules et des structures auxquelles les équipes font déjà confiance.

La suite comprend de nouvelles intégrations d'applications ChatGPT destinées à unifier les données du marché, des entreprises et les données internes en un seul flux de travail, notamment FactSet, MSCI, Third Bridge et Moody's. Elle introduit également des « skills » (compétences) réutilisables pour les tâches financières récurrentes telles que les prévisions de résultats, l'analyse comparative, l'analyse DCF et la rédaction de notes d'investissement.

Les performances de l'IA par rapport au travail professionnel

Sur GDPval, un benchmark populaire couvrant le « travail intellectuel bien défini » dans 44 professions, OpenAI rapporte que GPT-5.4 égale ou dépasse les professionnels du secteur dans 83,0 % des comparaisons, contre 71,0 % pour GPT-5.2. La société souligne également des améliorations spécifiques dans les types d'artefacts qui ont tendance à exposer les faiblesses du modèle : tableaux structurés, formules, cohérence narrative et qualité de conception.

Par ailleurs, dans un benchmark interne couvrant les tâches de modélisation de feuilles de calcul inspirées de celles qu'un analyste junior en banque d'investissement pourrait effectuer, OpenAI rapporte que son nouveau modèle GPT-5.4 atteint un score moyen de 87,5 %, contre 68,4 % pour GPT-5.2.

Et sur un ensemble de questions d'évaluation des présentations, OpenAI indique que les évaluateurs humains ont préféré les présentations de GPT-5.4 à celles de GPT-5.2 dans 68,0 % des cas, citant une esthétique plus forte, une plus grande variété visuelle et une utilisation plus efficace de la génération d'images.

OpenAI décrit son nouveau modèle GPT-5.4 comme son modèle le plus factuel à ce jour. Brendan Foody, PDG de Mercor, a déclaré que GPT-5.4 est le meilleur modèle que la société ait essayé et a ajouté que GPT-5.4 est désormais en tête du classement APEX-Agents de Mercor pour les services professionnels, en mettant l'accent sur les livrables à long terme tels que les présentations PowerPoint, les modèles financiers et les analyses juridiques.

OpenAI vivement critiqué pour son accord avec le Pentagone

Cette mise à jour arrive à un moment critique pour le laboratoire d'IA de San Francisco. ChatGPT aurait perdu de nombreux utilisateurs au profit de son concurrent Anthropic ces derniers jours, après qu'OpenAI a annoncé un accord avec le Pentagone. L'annonce de l'accord faisait suite à une querelle publique entre l'administration Trump et Anthropic concernant les limitations qu'Anthropic souhaitait imposer aux applications militaires de ses modèles.

On ne sait pas exactement combien de personnes ont quitté le navire ni si cela a entraîné une baisse substantielle de la base massive de plus de 900 millions d'utilisateurs du produit. Toutefois, la concurrence s'intensifie sur le marché des grands modèles de langage (LLM) et OpenAI n'est plus le leader incontesté d'autrefois. Les performances des modèles de la série GPT-5 ont rencontré des difficultés et n'ont pas créé un écart substantiel avec la concurrence.

En concluant en urgence un accord avec le département américain de la Défense quelques heures après la mise au ban d'Anthropic, OpenAI espérait se positionner avantageusement dans la course aux contrats militaires. Mais la manœuvre a déclenché un tollé public sans précédent, obligeant le PDG Sam Altman à faire amende honorable et à renégocier les termes du contrat pour y intégrer des garanties explicites contre la surveillance domestique des citoyens américains.

Pour tirer parti des difficultés d'OpenAI, Anthropic a étendu la fonctionnalité de mémoire, auparavant réservée aux abonnés, aux utilisateurs gratuits et a introduit un outil permettant d'importer de la mémoire depuis d'autres sources. Anthropic affirme que le 2 mars a été la journée la plus fructueuse de son histoire en matière de nouvelles inscriptions. Cette mise à jour vise à soutenir l'objectif d'OpenAI de rester compétitif malgré ses problèmes financiers.

Disponibilité

GPT-5.4 se décline en deux versions : GPT-5.4 Thinking et GPT-5.4 Pro, cette dernière étant conçue pour les tâches les plus complexes. Les deux versions sont disponibles dans l'API payante et dans l'outil d'ingénierie logicielle Codex, tandis que GPT-5.4 Thinking sera accessible à tous les abonnés payants de ChatGPT (Plus, le forfait à 20 dollars par mois et plus) et Pro sera réservé aux utilisateurs de ChatGPT Pro (200 dollars par mois) et du forfait Enterprise.

Les utilisateurs de ChatGPT Free pourront également tester GPT-5.4, mais uniquement lorsque leurs requêtes seront automatiquement redirigées vers le modèle. OpenAI espère regagner la confiance des utilisateurs avec GPT-5.4 et reprendre de l'avance sur ses concurrents, notamment Google et Anthropic.

Source : OpenAI

Et vous ?

Quel est votre avis sur le sujet ?

Que pensez-vous des nouveautés introduites par GPT-5.4 ?

Que pensez-vous des nouvelles capacités de ChatGPT en matière de codage ?

GPT-5.4 introduit le contrôle natif de l'ordinateur. Laisserez-vous ChatGPT prendre le contrôle de votre machine ?

Voir aussi

Ce que GPT-5.4 d'OpenAI va changer concrètement pour les développeurs : des fuites de code révèlent une fenêtre de contexte d'un à deux millions de tokens et un mode de raisonnement « extrême »

Anthropic blacklisté pour avoir refusé la surveillance de masse, OpenAI en profite et conclut un accord avec le Pentagone, alimentant la campagne #CancelChatGPT où plusieurs se désabonnent en masse

OpenAI admet avoir bâclé son contrat avec le Pentagone : Sam Altman amende l'accord sous pression après un boycott massif de ChatGPT en faveur de Claude

Vous avez lu gratuitement 37 895 articles depuis plus d'un an.
Soutenez le club developpez.com en souscrivant un abonnement pour que nous puissions continuer à vous proposer des publications.

Une erreur dans cette actualité ? Signalez-nous-la !

Votre nom : Votre e-mail :

Décrivez l'erreur que vous souhaitez porter à notre connaissance :

Identifiez-vous

Créer un compte

OpenAI présente GPT-5.4, doté de capacités accrues en matière de « travail intellectuel » et s'attaque directement à Anthropic,

Un lancement sur fond de polémiques liées à ses liens avec le gouvernement

Identifiant
Mot de passe

Mot de passe oublié ?

Identifiez-vous

Créer un compte

OpenAI présente GPT-5.4, doté de capacités accrues en matière de « travail intellectuel » et s'attaque directement à Anthropic, Un lancement sur fond de polémiques liées à ses liens avec le gouvernement

OpenAI présente GPT-5.4, doté de capacités accrues en matière de « travail intellectuel » et s'attaque directement à Anthropic,

Un lancement sur fond de polémiques liées à ses liens avec le gouvernement