
OpenAI présente Codex, un agent d'IA de génie logiciel basé sur le cloud qui peut travailler sur de nombreuses tâches en parallèle, alimenté par codex-1. Disponible dès aujourd'hui pour les utilisateurs de ChatGPT Pro, Team et Enterprise, et bientôt pour les utilisateurs Plus.
Dans le but d'injecter l'IA dans une plus grande partie du processus de programmation, OpenAI a lancé en avril dernier Codex CLI, un "agent" de codage conçu pour fonctionner localement à partir d'un logiciel terminal. Annoncé en même temps que les nouveaux modèles d'IA d'OpenAI, o3 et o4-mini, Codex CLI relie les modèles d'OpenAI au code local et aux tâches informatiques. Grâce à Codex CLI, les modèles d'OpenAI peuvent écrire et modifier du code sur un bureau et effectuer certaines actions, comme déplacer des fichiers.
Récemment, OpenAI, éditeur de ChatGPT, a déploié "Codex" pour ChatGPT, un agent d'IA qui automatise et délègue les tâches de programmation pour les ingénieurs en logiciel. L'entreprise affirme que Codex pourrait aider les développeurs à réaliser davantage de choses en déléguant leurs tâches à différents agents. L'idée est d'accélérer le développement et de devenir plus productif grâce à l'IA.
Mais comment fonctionne Codex ? Selon OpenAI, Codex est basé sur codex-1, qui est une nouvelle version de ChatGPT basée sur le modèle o3 existant, mais il a été optimisé pour le codage, ce qui se traduit par une plus grande précision. Codex extrait la base de code de Github et reflète étroitement le style des PR existants. Il peut écrire du nouveau code, proposer des pull requests et exécuter chaque tâche dans son propre bac à sable.
"L'exécution d'une tâche prend généralement entre 1 et 30 minutes, en fonction de sa complexité, et vous pouvez suivre la progression de Codex en temps réel", indique OpenAI. "Une fois que Codex a terminé une tâche, il enregistre ses changements dans son environnement. Codex fournit des preuves vérifiables de ses actions par le biais de citations de journaux de terminal et de résultats de tests, ce qui vous permet de retracer chaque étape franchie au cours de la réalisation d'une tâche".
Il serait intéressant de voir les performances de ce nouvel agent d'IA pour le codage. En effet, la tendance actuelle montre que les éditeurs de code traditionnels évoluent vers des interfaces plus "intelligentes". Deux acteurs récents dominent les débats : Cursor et Windsurf (issu de Codeium). Tous deux se présentent comme des EDI « IA-empowered » destinés à accélérer le codage et améliorer la productivité. Des rapports ont même révélé qu'OpenAI a envisagé d'acquérir Cursor avant de se tourner vers Windsurf.

Vous pouvez accéder à Codex via la barre latérale de ChatGPT et lui assigner de nouvelles tâches de codage en tapant une invite et en cliquant sur "Code". Si vous souhaitez poser une question à Codex sur votre base de code, cliquez sur "Demander". Chaque tâche est traitée indépendamment dans un environnement séparé et isolé, préchargé avec votre base de code. Codex peut lire et éditer des fichiers, ainsi qu'exécuter des commandes, y compris des harnais de test, des linters et des vérificateurs de type. L'exécution d'une tâche prend généralement entre 1 et 30 minutes, en fonction de sa complexité, et vous pouvez suivre la progression de Codex en temps réel.
Une fois que Codex a terminé une tâche, il enregistre les changements dans son environnement. Codex fournit des preuves vérifiables de ses actions par le biais de citations de journaux de terminal et de résultats de tests, ce qui vous permet de retracer chaque étape franchie au cours de l'exécution de la tâche. Vous pouvez ensuite examiner les résultats, demander d'autres révisions, ouvrir une demande GitHub ou intégrer directement les changements dans votre environnement local. Dans le produit, vous pouvez configurer l'environnement Codex pour qu'il corresponde le plus possible à votre environnement de développement réel.
Codex peut être guidé par des fichiers AGENTS.md placés dans votre dépôt. Il s'agit de fichiers texte, semblables à README.md, dans lesquels vous pouvez indiquer à Codex comment naviguer dans votre base de code, quelles commandes exécuter pour les tests et comment respecter au mieux les pratiques standard de votre projet. Comme les développeurs humains, les agents Codex sont plus performants lorsqu'ils disposent d'environnements de développement configurés, de configurations de test fiables et d'une documentation claire.
Sur les évaluations de codage et les benchmarks internes, codex-1 montre de fortes performances même sans fichiers AGENTS.md ou échafaudage personnalisé.
Voici la politique d'OpenAI concernant les agents IA :

Avec cette annonce, OpenAI publie également une version plus petite de codex-1, une version de o4-mini conçue spécifiquement pour être utilisée dans Codex CLI. Ce nouveau modèle prend en charge des flux de travail plus rapides dans le CLI et est optimisé pour les questions-réponses et l'édition de code à faible latence, tout en conservant les mêmes points forts en matière de suivi des instructions et de style. Il est disponible comme modèle par défaut dans Codex CLI et dans l'API en tant que codex-mini-latest.
OpenAI rend plus facile également la connexion de votre compte développeur à Codex CLI. Au lieu de générer et de configurer manuellement un jeton API, vous pouvez maintenant vous connecter avec votre compte ChatGPT et sélectionner l'organisation API que vous souhaitez utiliser. Ils vont automatiquement générer et configurer la clé API pour vous.
Disponibilité, prix et limitations de Codex
Codex est disponible pour les utilisateurs de ChatGPT Pro, Enterprise et Team dans le monde entier, avec un support pour Plus et Edu à venir. Les utilisateurs auront un accès généreux et sans frais supplémentaires pendant les semaines à venir afin que vous puissiez explorer ce que Codex peut faire. Après cela, un accès à taux limité et des options de prix seront déployés, qui vous permettront d'acheter de l'utilisation supplémentaire à la demande.
Pour les développeurs qui construisent avec codex-mini-latest, le modèle est disponible sur l'API Responses au prix de 1,50 $ pour 1M de jetons d'entrée et de 6 $ pour 1M de jetons de sortie, avec une remise de 75 % sur la mise en cache rapide.
Codex n'en est qu'à ses débuts. En tant qu'avant-première de recherche, il manque actuellement des fonctionnalités telles que les entrées d'images pour le travail frontal et la possibilité de corriger le cours de l'agent pendant qu'il travaille. En outre, la délégation à un agent distant prend plus de temps que l'édition interactive, ce qui peut nécessiter un certain temps d'adaptation. Au fil du temps, l'interaction avec les agents du Codex ressemblera de plus en plus à une collaboration asynchrone avec des collègues. Au fur et à mesure que les capacités des modèles progressent, les agents devraient s'occuper de tâches plus complexes sur des périodes prolongées.
Voici les projections d'OpenAI concernant son agent IA :

Et vous ?


Voir aussi :



Vous avez lu gratuitement 848 articles depuis plus d'un an.
Soutenez le club developpez.com en souscrivant un abonnement pour que nous puissions continuer à vous proposer des publications.
Soutenez le club developpez.com en souscrivant un abonnement pour que nous puissions continuer à vous proposer des publications.