OpenAI présente Codex, un agent d'IA de génie logiciel basé sur le cloud qui peut travailler sur de nombreuses tâches en parallèle, alimenté par codex-1. Disponible dès aujourd'hui pour les utilisateurs de ChatGPT Pro, Team et Enterprise, et bientôt pour les utilisateurs Plus.Dans le but d'injecter l'IA dans une plus grande partie du processus de programmation, OpenAI a lancé en avril dernier Codex CLI, un "agent" de codage conçu pour fonctionner localement à partir d'un logiciel terminal. Annoncé en même temps que les nouveaux modèles d'IA d'OpenAI, o3 et o4-mini, Codex CLI relie les modèles d'OpenAI au code local et aux tâches informatiques. Grâce à Codex CLI, les modèles d'OpenAI peuvent écrire et modifier du code sur un bureau et effectuer certaines actions, comme déplacer des fichiers.
Récemment, OpenAI, éditeur de ChatGPT, a déploié "Codex" pour ChatGPT, un agent d'IA qui automatise et délègue les tâches de programmation pour les ingénieurs en logiciel. L'entreprise affirme que Codex pourrait aider les développeurs à réaliser davantage de choses en déléguant leurs tâches à différents agents. L'idée est d'accélérer le développement et de devenir plus productif grâce à l'IA.
Mais comment fonctionne Codex ? Selon OpenAI, Codex est basé sur codex-1, qui est une nouvelle version de ChatGPT basée sur le modèle o3 existant, mais il a été optimisé pour le codage, ce qui se traduit par une plus grande précision. Codex extrait la base de code de Github et reflète étroitement le style des PR existants. Il peut écrire du nouveau code, proposer des pull requests et exécuter chaque tâche dans son propre bac à sable.
"L'exécution d'une tâche prend généralement entre 1 et 30 minutes, en fonction de sa complexité, et vous pouvez suivre la progression de Codex en temps réel", indique OpenAI. "Une fois que Codex a terminé une tâche, il enregistre ses changements dans son environnement. Codex fournit des preuves vérifiables de ses actions par le biais de citations de journaux de terminal et de résultats de tests, ce qui vous permet de retracer chaque étape franchie au cours de la réalisation d'une tâche".
Il serait intéressant de voir les performances de ce nouvel agent d'IA pour le codage. En effet, la tendance actuelle montre que les éditeurs de code traditionnels évoluent vers des interfaces plus "intelligentes". Deux acteurs récents dominent les débats : Cursor et Windsurf (issu de Codeium). Tous deux se présentent comme des EDI « IA-empowered » destinés à accélérer le codage et améliorer la productivité. Des rapports ont même révélé qu'OpenAI a envisagé d'acquérir Cursor avant de se tourner vers Windsurf.
Vous pouvez accéder à Codex via la barre latérale de ChatGPT et lui assigner de nouvelles tâches de codage en tapant une invite et en cliquant sur "Code". Si vous souhaitez poser une question à Codex sur votre base de code, cliquez sur "Demander". Chaque tâche est traitée indépendamment dans un environnement séparé et isolé, préchargé avec votre base de code. Codex peut lire et éditer des fichiers, ainsi qu'exécuter des commandes, y compris des harnais de test, des linters et des vérificateurs de type. L'exécution d'une tâche prend généralement entre 1 et 30 minutes, en fonction de sa complexité, et vous pouvez suivre la progression de Codex en temps réel.
Une fois que Codex a terminé une tâche, il enregistre les changements dans son environnement. Codex fournit des preuves vérifiables de ses actions par le biais de citations de journaux de terminal et de résultats de tests, ce qui vous permet de retracer chaque étape franchie au cours de l'exécution de la tâche. Vous pouvez ensuite examiner les résultats, demander d'autres révisions, ouvrir une demande GitHub ou intégrer directement les changements dans votre environnement local. Dans le produit, vous pouvez configurer l'environnement Codex pour qu'il corresponde le plus possible à votre environnement de développement réel.
Codex peut être guidé par des fichiers AGENTS.md placés dans votre dépôt. Il s'agit de fichiers texte, semblables à README.md, dans lesquels vous pouvez indiquer à Codex comment naviguer dans votre base de code, quelles commandes exécuter pour les tests et comment respecter au mieux les pratiques standard de votre projet. Comme les développeurs humains, les agents Codex sont plus performants lorsqu'ils disposent d'environnements de développement configurés, de configurations de test fiables et d'une documentation claire.
Sur les évaluations de codage et les benchmarks internes, codex-1 montre de fortes...
La fin de cet article est réservée aux abonnés. Soutenez le Club Developpez.com en prenant un abonnement pour que nous puissions continuer à vous proposer des publications.