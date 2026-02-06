OpenAI est une entreprise américaine d'intelligence artificielle (IA) fondée en 2015 à San Francisco en Californie. Sa mission est de développer et de promouvoir une intelligence artificielle générale « sûre et bénéfique à toute l'humanité ». L'entreprise est connue pour ses grands modèles de langage tels que GPT-4o, la série de modèles de génération d'images DALL-E et le modèle de génération de vidéos Sora.
En août 2021, OpenAI a annoncé Codex, un outil d'autocomplétion de code disponible dans certains EDI tels que Visual Studio Code et Neovim. Il s'agissait d'une version modifiée et opérationnelle de GPT-3, affinée à partir de gigaoctets de code source dans une douzaine de langages de programmation. C'était le modèle original qui alimentait GitHub Copilot. En avril 2025, OpenAI a publié Codex CLI sur GitHub sous licence Apache 2.0, un agent IA qui s'exécute localement sur l'ordinateur de l'utilisateur. Ils ont également annoncé un modèle de langage, codex-mini-latest, disponible uniquement derrière une API. Il s'agissait d'une version affinée de o4-mini, spécialement entraînée pour être utilisée dans Codex CLI.
En mai 2025, OpenAI a annoncé le lancement d'un aperçu de recherche d'un outil distinct ayant un objectif similaire, également nommé Codex, basé sur une version affinée d'OpenAI o3. Il s'agit d'un agent logiciel qui effectue des tâches de programmation informatique, notamment la rédaction de fonctionnalités, la réponse à des questions sur le code source, l'exécution de tests et la proposition de PR pour révision. Début février 2026, OpenAI a lancé une application autonome pour son assistant de codage IA, Codex, disponible sur les ordinateurs Apple. L'application vise à faciliter la gestion simultanée de plusieurs agents IA par les développeurs de logiciels, a déclaré OpenAI.
Les outils de codage IA ont connu un essor fulgurant au cours de l'année dernière, ces annonces représentent les efforts d'OpenAI pour gagner des parts de marché sur ses concurrents tels qu'Anthropic et Cursor. Récemment, OpenAI a lancé un nouveau modèle de codage, GPT-5.3-Codex. La société a déclaré que ce nouveau modèle avait amélioré ses « capacités de raisonnement et de connaissances professionnelles » et qu'il fonctionnerait 25 % plus rapidement que son prédécesseur.
OpenAI précise que le nouveau modèle GPT-5.3-Codex est son « premier modèle qui a contribué à sa propre création ». Lors de l'annonce de GPT-5.3-Codex, OpenAI a déclaré : « L'équipe Codex a utilisé les premières versions pour déboguer sa propre formation, gérer son propre déploiement et diagnostiquer les résultats des tests et des évaluations. Notre équipe a été impressionnée par la capacité de Codex à accélérer son propre développement. »
Les personnes qui croient en la singularité technologique, ou « singularité », parlent d'un point de basculement à partir duquel la technologie s'améliore d'elle-même, entraînant une explosion incontrôlée des progrès technologiques. Avec cette annonce, OpenAI affirme donc que nous disposons désormais d'exemples concrets d'IA s'améliorant d'elle-même. Nous ne savons pas exactement dans quelle mesure GPT-5.3-Codex a participé à son propre développement, mais cette nouvelle révèle à quel point les modèles d'IA de pointe sont devenus avancés, en particulier dans l'écriture de code. « Avec GPT-5.3-Codex, Codex passe d'un agent capable d'écrire et de réviser du code à un agent capable de faire presque tout ce que les développeurs et les professionnels peuvent faire sur un ordinateur », affirme OpenAI.
Cette annonce intervient dans un contexte, où les experts doutent de plus en plus d'OpenAI. Récemment, un expert financier affirme qu'OpenAI est sur le point de se retrouver à court d'argent. Les géants technologiques comme Google peuvent utiliser leurs énormes réserves financières pour investir des centaines de milliards dans l'IA, ce qui n'est pas le cas d'OpenAI. Il s'attend à ce qu'OpenAI fasse faillite « au cours des 18 prochains mois ». Il affirme : « Quelle que soit la richesse du prix final de l'IA, les marchés financiers semblent peu susceptibles de le fournir. »
Voici un extrait de l'annonce d'OpenAI :
Présentation de GPT-5.3-Codex
GPT‑5.3-Codex établit un nouveau record dans l'industrie sur SWE-Bench Pro et Terminal-Bench, et affiche de solides performances sur OSWorld et GDPval, quatre benchmarks que nous utilisons pour mesurer les capacités de codage, d'agent et dans le monde réel.
Codage
GPT‑5.3-Codex atteint des performances de pointe sur SWE-Bench Pro, une évaluation rigoureuse de l'ingénierie logicielle dans le monde réel. Alors que SWE‑bench Verified ne teste que Python, SWE‑Bench Pro couvre quatre langages et est plus résistant à la contamination, plus difficile, plus diversifié et plus pertinent pour l'industrie. Il dépasse également de loin les performances de pointe précédentes sur Terminal-Bench 2.0, qui mesure les compétences terminales dont un agent de codage comme Codex a besoin. Il est à noter que GPT‑5.3‑Codex y parvient avec moins de jetons que n'importe quel modèle précédent, ce qui permet aux utilisateurs d'en créer davantage.
Développement web
La combinaison de capacités de codage de pointe, d'améliorations esthétiques et de compactage donne naissance à un modèle capable de réaliser un travail remarquable, en créant de toutes pièces des jeux et des applications complexes et hautement fonctionnels en quelques jours. GPT‑5.3-Codex comprend également mieux votre intention lorsque vous lui demandez de créer des sites web courants, par rapport à GPT‑5.2-Codex. Les invites simples ou insuffisamment précisées sont désormais remplacées par défaut par des sites plus fonctionnels et des paramètres par défaut plus judicieux, vous offrant ainsi une base plus solide pour donner vie à vos idées.
Au-delà du codage
Les ingénieurs logiciels, les concepteurs, les chefs de produit et les scientifiques des données font bien plus que générer du code. GPT‑5.3‑Codex est conçu pour prendre en charge toutes les tâches du cycle de vie des logiciels : débogage, déploiement, surveillance, rédaction de PRD, édition de textes, recherche sur les utilisateurs, tests, mesures, etc. Ses capacités agissantes vont au-delà des logiciels et vous aident à créer tout ce que vous souhaitez, qu'il s'agisse de présentations PowerPoint ou d'analyses de données dans des feuilles de calcul.
Grâce à des compétences personnalisées similaires à celles utilisées pour les précédents résultats GDPval, GPT‑5.3‑Codex affiche également de solides performances dans le domaine du travail intellectuel professionnel, tel que mesuré par GDPval, à égalité avec GPT‑5.2. GDPval est une évaluation publiée par OpenAI en 2025 qui mesure les performances d'un modèle sur des tâches intellectuelles bien définies dans 44 professions. Ces tâches comprennent notamment la création de présentations, de feuilles de calcul et d'autres produits de travail.
OSWorld est un benchmark d'utilisation informatique où l'agent doit accomplir des tâches de productivité dans un environnement informatique de bureau visuel. GPT‑5.3-Codex démontre des capacités d'utilisation informatique bien supérieures à celles des modèles GPT précédents.
Ensemble, ces résultats en matière de codage, de front-end, d'utilisation informatique et de tâches du monde réel montrent que GPT-5.3-Codex n'est pas seulement meilleur dans des tâches individuelles, mais marque également un changement radical vers un agent unique et polyvalent capable de raisonner, de construire et d'exécuter tout l'éventail des tâches techniques du monde réel.
Comment nous avons utilisé Codex pour former et déployer GPT‑5.3-Codex
Les récentes améliorations rapides de Codex s'appuient sur les fruits de projets de recherche menés pendant des mois, voire des années, dans l'ensemble d'OpenAI. Ces projets de recherche sont accélérés par Codex, et de nombreux chercheurs et ingénieurs d'OpenAI décrivent leur travail actuel comme étant fondamentalement différent de ce qu'il était il y a seulement deux mois. Même les premières versions de GPT‑5.3-Codex ont démontré des capacités exceptionnelles, permettant à notre équipe de travailler avec ces versions antérieures pour améliorer la formation et soutenir le déploiement des versions ultérieures.
Codex est utile pour un très large éventail de tâches, ce qui rend difficile d'énumérer de manière exhaustive toutes les façons dont il aide nos équipes. À titre d'exemple, l'équipe de recherche a utilisé Codex pour surveiller et déboguer le processus de formation de cette version. Cela a accéléré la recherche au-delà du débogage des problèmes d'infrastructure : cela a permis de suivre les modèles tout au long de la formation, de fournir une analyse approfondie de la qualité des interactions, de proposer des corrections et de créer des applications riches permettant aux chercheurs humains de comprendre précisément en quoi le comportement du modèle différait de celui des modèles précédents.
L'équipe d'ingénieurs a utilisé Codex pour optimiser...
