OpenAI vient de lancer Codex, un agent de codage directement intégré à ChatGPT. Son objectif ? Vous filer un coup de main sur les tâches de développement un peu répétitives, voire carrément pénibles. Écrire une fonctionnalité, corriger un bug, comprendre un bout de code, proposer une pull request… Codex peut tout gérer en parallèle pendant que vous faites autre chose. Voilà pour l’idée générale. Maintenant, entrons un peu dans le détail.
Comment fonctionne Codex dans ChatGPT ?
Codex ne remplace pas votre éditeur de code habituel, mais il s’en rapproche dangereusement. Depuis la barre latérale de ChatGPT, vous pouvez lui assigner des tâches via un simple prompt, en cliquant sur le bouton « Code ». À partir de là, l’agent part bosser dans un environnement isolé, configuré avec votre dépôt GitHub (si connecté), vos dépendances et tout ce qu’il faut pour simuler votre setup de dev.
Chaque tâche est exécutée dans un conteneur séparé, sans accès à Internet, ce qui évite les dérives. Codex peut lire les fichiers, exécuter des tests, appliquer un linter, faire des modifications… et vous montrer ce qu’il a fait. En clair, il ne balance pas du code au hasard : il justifie ses actions avec des logs, des commits et des sorties de test.
Vous pouvez suivre l’avancement en temps réel, consulter les résultats, demander des révisions ou même lancer une pull request directement depuis ChatGPT. Si vous avez besoin de guider l’agent, un fichier AGENTS.md peut être ajouté à votre dépôt. Il sert à lui expliquer comment fonctionne votre projet, comment le tester et quelles règles respecter.
Ce que Codex sait faire (et ne sait pas faire)
Codex n’est pas là pour vous piquer votre job de développeur non plus. Il a été conçu pour vous faire gagner du temps sur les tâches que vous avez sans doute déjà repoussées trois fois cette semaine. Concrètement, voici ce qu’il peut faire à votre place :
- Créer des fonctionnalités à partir de simples instructions textuelles,
- Corriger des bugs dans votre code existant,
- Répondre à des questions techniques sur votre base de code,
- Rédiger ou améliorer des tests,
- Proposer des pull requests, prêtes à être relues et intégrées.
Et comme tout bon assistant, il bosse en parallèle sur plusieurs tâches, chaque action étant isolée dans son propre conteneur. En général, il lui faut entre 1 et 30 minutes pour finir une tâche, selon la complexité.
Mais Codex a aussi ses limites. Par exemple :
- Il ne peut pas prendre en compte des images (pas encore d’analyse d’interface ou de maquettes frontend).
- Il est impossible de corriger sa trajectoire en cours de route : une fois la tâche lancée, vous devez attendre le résultat final avant d’interagir à nouveau.
- Les tâches très longues ou complexes restent hors de portée. On est encore loin du remplacement d’un dev senior sur un sprint complet.
Enfin, comme le rappelle OpenAI, il est crucial de relire et valider manuellement le code généré. Codex peut expliquer ce qu’il a fait, fournir des logs et des résultats de tests, mais il n’est pas infaillible. Et il vaut mieux éviter de déployer un bug bien emballé.
Un environnement contrôlé pour éviter les dérapages
Chaque tâche que vous confiez à Codex est exécutée dans un conteneur cloud isolé, sans accès à Internet. L’agent n’a donc aucun moyen d’aller fouiller sur des sites externes ou de piocher dans des API tierces. Il bosse uniquement avec ce que vous lui fournissez : le code de votre dépôt, les dépendances déjà en place et les consignes que vous avez données.
Ce fonctionnement en sandbox a deux avantages :
- Il limite les risques de sécurité, notamment en bloquant toute tentative (intentionnelle ou non) de créer un code potentiellement malveillant.
- Il favorise la reproductibilité : les environnements sont maîtrisés, et Codex peut montrer précisément ce qu’il a fait, avec logs et résultats de tests à l’appui.
OpenAI insiste d’ailleurs sur ce point : Codex est entraîné pour refuser les demandes suspectes, comme l’écriture de malware. L’agent est capable de distinguer une vraie tâche de développement d’une demande douteuse. Et au moindre doute, il vous le signale.
Codex CLI : l’agent qui bosse directement dans le terminal
En parallèle de Codex dans ChatGPT, OpenAI propose aussi Codex CLI, un outil open source à utiliser directement dans votre terminal. Ici, pas d’interface web ni de conteneur cloud : tout se passe en local, avec un agent plus léger, mais toujours capable de vous filer un coup de main sur vos projets.
Codex CLI embarque une version allégée du modèle codex-1, optimisée pour des tâches rapides comme :
- répondre à une question technique,
- modifier un bout de code,
- ou rédiger un script simple.
L’idée, c’est d’avoir un assistant qui réagit vite, sans latence et qui peut s’intégrer facilement dans vos habitudes de dev. Et pour simplifier la configuration, plus besoin de bidouiller une clé API à la main : vous pouvez vous connecter avec votre compte ChatGPT et choisir l’organisation à utiliser.
Petit bonus : les utilisateurs ChatGPT Plus et Pro peuvent récupérer 5 à 50 dollars de crédits API gratuits, valables pendant un mois, s’ils utilisent Codex CLI avec leur compte.
Disponibilité, tarification et ce qui arrive ensuite
Depuis ce jour, vendredi 16 mai 2025, Codex est accessible aux abonnés ChatGPT Pro, Team et Enterprise. Pour les utilisateurs Plus et Edu, il faudra attendre encore un peu, mais l’arrivée est prévue. Pendant quelques semaines, l’accès est gratuit, le temps pour OpenAI de récolter des retours. Ensuite, des limitations d’usage seront mises en place, avec un système de crédits à acheter selon vos besoins.
Du côté de Codex CLI, le modèle codex-mini-latest est déjà disponible dans l’API, à 1,50 $ les 1 million de tokens en entrée et 6 $ les 1 million de tokens en sortie. OpenAI applique aussi un rabais de 75 % sur les prompts mis en cache, pour réduire la facture.
Quant à la suite ? OpenAI prévoit d’améliorer Codex pour le rendre plus interactif : pouvoir ajuster une tâche en cours, suivre l’avancement en temps réel ou encore mieux l’intégrer dans vos outils (IDE, tracker de bugs, CI, etc.). À terme, l’objectif est de transformer Codex en un véritable coéquipier virtuel, capable d’épauler les développeurs sans casser leur flux de travail.
Source : OpenAI