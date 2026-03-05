alpha-gpt-5.4

Un million ou deux millions de tokens : la guerre des chiffres

Le mode « Extreme » : dépenser plus de calcul pour penser mieux

Codex au centre : les agents comme enjeu principal

Le 27 février 2026, un ingénieur d'OpenAI soumet une pull request dans le dépôt public de Codex. Rien d'exceptionnel en apparence  jusqu'à ce que la communauté repère une ligne de vérification de version indiquant que la nouvelle fonctionnalité de traitement d'images en pleine résolution nécessite au minimum GPT-5.4. L'équipe s'en est aperçue en cinq heures et a effectué sept force-push successifs pour remplacer la référence par GPT-5.3-Codex. Trop tard. Les screenshots avaient déjà circulé sur X.Ce premier incident en a appelé d'autres. Un employé prénommé Thibault a accidentellement publié une capture d'écran montrant GPT-5.4 comme option sélectionnable dans l'interface de Codex, avant de supprimer le post rapidement. Un utilisateur a également signalé l'apparition brève d'un endpointdans l'API publique une pratique cohérente avec la façon dont OpenAI prépare habituellement ses déploiements en phases alpha.La somme de ces indices involontaires constitue un tableau assez précis. Et quand The Information a confirmé plusieurs de ces éléments auprès d'une source interne, la rumeur est devenue information vérifiable.Le détail technique qui a le plus mobilisé les forums techniques porte sur l'amplitude exacte de la fenêtre de contexte. Selon The Information, GPT-5.4 disposera d'une fenêtre de contexte d'un million de tokens, soit plus du double des 400 000 tokens actuellement disponibles dans GPT-5.2. Mais une autre lecture des fuites, analysée notamment par NxCode à partir des commits Git, suggère une fenêtre de deux millions de tokens  soit un facteur cinq par rapport à la fenêtre de 400 000 tokens de GPT-5.La distinction n'est pas cosmétique. Le chiffre de deux millions de tokens reste pour l'heure non corroboré par le code source d'OpenAI lui-même, selon AwesomeAgents. Il convient donc de distinguer ce qui est confirmé (un million de tokens selon The Information) de ce qui est spéculatif (deux millions selon les inférences communautaires).Même en retenant l'hypothèse basse, le bond est considérable pour OpenAI. Il serait plus juste de décrire cette évolution comme un rattrapage : Gemini et Claude proposent déjà des contextes d'un million de tokens. Google Gemini 2.5 Pro en dispose depuis plusieurs mois ; Claude Opus 4.6, sorti début février 2026, embarque lui aussi cette capacité assortie d'un support pour les équipes d'agents en parallèle. OpenAI était à la traîne sur ce point précis.Les implications pratiques d'un tel contexte dépassent largement le benchmark. Des équipes juridiques pourraient traiter l'intégralité d'un dossier dans une seule fenêtre de conversation ; des équipes de développement pourraient charger des bases de code entières pour une analyse et un refactoring multi-fichiers sans fragmentation. La transition de centaines de milliers à plusieurs millions de tokens ne constitue pas une évolution incrémentale  elle change fondamentalement quelles tâches sont réalisables en une seule interaction avec le modèle.L'autre grande nouveauté annoncée est l'introduction d'un mode de raisonnement baptisé « Extreme ». Ce mode permettrait au modèle d'allouer substantiellement plus de temps et de ressources computationnelles aux questions difficiles. Ce mode vise les chercheurs plutôt que les utilisateurs ordinaires qui souhaitent des réponses rapides.La formulation mérite d'être mise en perspective. OpenAI propose déjà dans GPT-5.2 un réglage de "thinking time" avec plusieurs niveaux (Light, Standard, Extended, xHigh). Le mode Extreme de GPT-5.4 s'inscrit dans cette trajectoire, mais pousserait le curseur bien au-delà de ce qui est actuellement disponible. L'analogie serait celle d'un processeur pouvant théoriquement faire tourner un algorithme plus longtemps pour améliorer sa réponse  avec un coût en compute directement répercuté sur l'utilisateur ou l'entreprise.Ce positionnement cible explicitement les usages de haute valeur : recherche académique, modélisation scientifique, ingénierie logicielle complexe. Pas le grand public cherchant à rédiger un email, mais le data scientist ou l'ingénieur qui a besoin que le modèle soutienne une chaîne de raisonnement sur plusieurs heures sans dériver.GPT-5.4 devrait être...