Pourquoi le « Vibe Coding » est en voie de disparition : nous quittons l'ère du codage informel assisté par l'IA pour entrer dans la discipline plus rigoureuse de l'ingénierie des agents, selon Andrej KarpathyLors d'une interview, Andrej Karpathy a expliqué pourquoi le « vibe coding » est en voie de disparition. Lors de la conférence AI Ascent 2026, Andrej Karpathy explique pourquoi nous quittons l'ère du codage informel assisté par l'IA pour entrer dans la discipline plus rigoureuse de l'« ingénierie agentique ». Il explique notamment que les agents IA agissent comme des « entités stagiaires » : incroyablement puissants, mais nécessitant un nouveau type de jugement humain. Il partage également sa vision de l'avenir avec l'essor de l'ingénierie agentique.
Andrej Karpathy, né le 23 octobre 1986, est un chercheur en IA slovaquo-canadien. Andrej Karpathy est membre fondateur du groupe de recherche sur l'intelligence artificielle OpenAI, où il est chercheur scientifique de 2015 à 2017. En juin 2017, il devient le directeur de l'intelligence artificielle de Tesla. Il est nommé l'un des innovateurs de moins de 35 ans du MIT Technology Review pour l'année 2020. Après avoir pris un congé sabbatique de plusieurs mois chez Tesla, il annonce qu'il quitte l'entreprise en juillet 2022. Depuis février 2023, il réalise des vidéos YouTube sur la création de réseaux de neurones artificiels.
En février 2023, Karpathy annonce qu'il revient chez OpenAI, et il quitte à nouveau l'entreprise un an plus tard, courant février 2024. Quelques mois plus tard, en juillet, il annonce développer Eureka Labs, un nouveau type d’école autour de l’IA. En février 2025, il forge le terme de vibe coding pour désigner le développement de logiciel à l'aide d'assistants IA. En Mai 2026, il annonce rejoindre Anthropic.
Le vibe coding consiste a accepté le code généré par l’intelligence artificielle (IA), souvent sans réelle compréhension de son fonctionnement. Même si Andrej Karpathy est l'inventeur du terme « vibe coding », et a contribué à populariser la pratique, il s'est opposé à l'idée selon laquelle les ingénieurs logiciels devraient cesser complètement de coder, ce qui contraste fortement avec la vision d'avenir défendue par Jensen Huang, PDG de Nvidia.
Karpathy a admis qu'il ne s'était « jamais senti aussi dépassé en tant que programmeur », mais s'est abstenu d'approuver la position radicale de Huang. Alors que Huang souhaite que les ingénieurs de Nvidia consacrent « zéro pour cent de leur temps à la syntaxe » et « cent pour cent de leur temps à la découverte de problèmes », l'expérience de Karpathy raconte une autre histoire. Lors de la création de son dernier projet, Nanochat, il a tout écrit à la main, car les agents IA « ne fonctionnaient tout simplement pas assez bien et n'étaient d'aucune utilité ». Le désaccord met en évidence un fossé grandissant dans la Silicon Valley quant à la mesure dans laquelle les ingénieurs devraient réellement s'appuyer sur les outils de codage IA.
Récemment, lors d'une interview, Andrej Karpathy a expliqué pourquoi le « vibe coding » est en voie de disparition. Lors de la conférence AI Ascent 2026, Andrej Karpathy explique pourquoi nous quittons l'ère du codage informel assisté par l'IA pour entrer dans la discipline plus rigoureuse de l'« ingénierie agentique ». Il explique notamment que les agents IA agissent comme des « entités stagiaires » : incroyablement puissants, mais nécessitant un nouveau type de jugement humain. Il partage également sa vision de l'avenir avec l'essor de l'ingénierie agentique.
Voici la transcription d'un extrait de son interview :
Question :L'année dernière, tu as inventé le terme « vibe coding », et aujourd'hui, on évolue dans un univers qui semble un peu plus sérieux, plus axé sur l'ingénierie agentique. Selon toi, quelle est la différence entre les deux, et comment qualifierais-tu concrètement ce dans quoi on se trouve aujourd'hui ?
Andrej Karpathy : Je dirais que le « vibe coding » consiste à relever le niveau de base pour tout le monde en ce qui concerne ce qu'il est possible de faire en matière de logiciels. Donc, le niveau de base augmente, tout le monde peut faire du « vibe coding » sur n’importe quoi, et c’est génial, incroyable. Mais je dirais que l’« ingénierie agentique » consiste à préserver le niveau de qualité qui existait auparavant dans le domaine des logiciels professionnels. On ne peut pas introduire de vulnérabilités à cause du « vibe coding ». On reste responsable de son logiciel, tout comme avant ; mais peut-on aller plus vite ? Spoiler : oui, c’est possible ; mais comment s’y prendre correctement ?
Et donc, pour moi, l’ingénierie agentique – quand je l’appelle ainsi parce que je pense que c’est en quelque sorte une discipline d’ingénierie : vous avez ces agents, qui sont comme des entités pointues, ils sont un peu faillibles, un peu stochastiques, mais ils sont extrêmement puissants. Et la question est de savoir comment les coordonner pour aller plus vite sans sacrifier votre niveau de qualité. Et y parvenir correctement, c'est le domaine de l'ingénierie agentique. Je les vois donc comme deux choses distinctes. L'une consiste peut-être à relever le niveau minimum, tandis que l'autre consiste, disons, à extrapoler.
Et ce que je constate, je pense, c'est qu'il existe un plafond très élevé en matière de capacités d'ingénierie agentique. Auparavant, on parlait souvent de l'ingénieur « 10x ». Je pense que c'est bien plus que ça. 10x, ce n'est pas le gain de vitesse que l'on obtient. Il me semble que les personnes qui excellent dans ce domaine atteignent des sommets bien supérieurs à 10x, d'après ce que je vois actuellement.
Question : J'aime beaucoup cette façon de présenter les choses. Une chose que Sam Altman a dite lors de sa venue à AI Ascent l'année dernière, et qui m'a marqué, c'est que les différentes générations utilisent ChatGPT différemment. Ainsi, si vous avez la trentaine, vous l'utilisez comme substitut à la recherche Google, mais si vous êtes adolescent, ChatGPT est votre porte d'entrée vers Internet. Quel est le parallèle avec le codage aujourd'hui ? Si nous observions deux personnes coder à l'aide d'OpenClaw, de Claude Code ou de Codex, l'une que vous jugeriez médiocre et l'autre que vous considéreriez comme parfaitement à l'aise avec l'IA. Comment décririez-vous la différence ?
Andrej Karpathy : Je pense qu’il s’agit simplement d’essayer de tirer le meilleur parti des outils disponibles, d’utiliser toutes leurs fonctionnalités, d’investir dans sa propre configuration. Tout comme auparavant, tous les ingénieurs ont l’habitude de tirer le meilleur parti des outils qu’ils utilisent. Que ce soit Vim ou VS Code, ou maintenant Claude Code, Codex, etc. Il s’agit simplement d’investir dans sa configuration et d’utiliser un grand nombre des outils à sa disposition. Et je pense que ça ressemble un peu à ça. Je pense aussi qu’une réflexion connexe est que beaucoup de gens recrutent peut-être dans cette optique. Parce qu’ils veulent embaucher des ingénieurs très autonomes.
Je pense que, ce que je constate, c’est que la plupart des gens n’ont toujours pas repensé leur processus de recrutement pour évaluer les capacités des ingénieurs autonomes. Par exemple, si vous proposez des énigmes à résoudre, c'est encore l'ancien paradigme. Je dirais que le recrutement doit plutôt consister à confier un très gros projet et à observer comment quelqu'un le met en œuvre. Par exemple, écrivons un clone de Twitter pour les agents, puis rendons-le vraiment performant, vraiment sécurisé, et demandons ensuite à des agents de simuler une activité sur ce Twitter. Ensuite, j’utiliserai 10 Codex 5.4X pour essayer de pirater ce site web déployé, et ils vont essayer de le pirater, mais ils ne devraient pas y parvenir. Ça pourrait ressembler à ça. Donc, observer les gens dans ce contexte, les voir construire des projets plus ambitieux et utiliser les outils, c’est peut-être ce que je regarderais en priorité.
Question : Et à mesure que les agents en font davantage, quelle compétence humaine pensez-vous qui devient plus précieuse, et non moins ?
Andrej Karpathy : C'est une bonne question. Je pense qu'à l'heure actuelle, la réponse est que les agents cataloguent ces entités internes. C'est donc remarquable : vous devez toujours être en charge de l'esthétique, du jugement, du goût et d'un peu de supervision.
L'un de mes exemples préférés illustrant le côté étrange des agents concerne Menu Gen. Vous vous inscrivez avec un compte Google, mais vous achetez des crédits via un compte Stripe, et les deux ont des adresses e-mail. Et mon agent a en fait essayé, en gros, lorsque vous achetez des crédits, de les attribuer en utilisant l'adresse e-mail de Stripe pour l'adresse e-mail Google. Comme s'il n'y avait pas d'identifiant utilisateur unique pour les personnes. Il essayait de faire correspondre les adresses e-mail, mais on pouvait utiliser des adresses différentes pour Stripe et Google, et du coup, il n’associait pas les fonds. C’est le genre de choses sur lesquelles ces agents commettent encore des erreurs. Pourquoi utiliser des adresses e-mail pour essayer de corréler les fonds ? Elles peuvent être arbitraires. On peut utiliser des e-mails différents, etc. C’est vraiment bizarre de faire ça.
Je pense donc que ce sont les utilisateurs qui doivent prendre en charge ce cahier des charges, ce plan, et pour être honnête, je n'apprécie même pas vraiment le mode « plan ». Je veux dire, c'est évidemment très utile, mais je pense qu'il y a ici quelque chose de plus général : il faut travailler avec son agent pour concevoir un cahier des charges très détaillé. Et peut-être, c'est une hypothèse, qu'il s'agisse essentiellement de la documentation, puis de demander aux agents de la rédiger, vous étant chargé de la supervision et des catégories de haut niveau, tandis que les agents s'occupent d'une grande partie du travail en coulisses. Je pense donc que vous ne vous souciez pas de certains détails.
Prenons par exemple les tableaux ou les tenseurs dans les réseaux neuronaux. Il y a une multitude de détails entre PyTorch et NumPy, et tous les autres outils comme Pandas, etc., pour tous les petits détails des API. Et j’ai déjà oublié la différence entre « keep dims » et « keep them », ou s’il s’agit de « dim », « axis », « reshape », « permute » ou « transpose ». Je ne me souviens plus de tout ça, parce que ce n’est pas nécessaire. C’est le genre de détails dont s’occupe le stagiaire, car il a une très bonne mémoire. Mais vous devez tout de même savoir, par exemple, qu’il y a un tenseur sous-jacent, qu’il y a une vue sous-jacente, et que vous pouvez alors manipuler la vue du même stockage, ou que vous pouvez avoir un stockage différent, ce qui serait moins efficace. Comme nous comprenons toujours ce que ces éléments font et certains des principes fondamentaux, vous ne copiez pas inutilement de la mémoire, etc. Mais les détails des API sont désormais confiés à d'autres. Vous êtes donc responsable de l'orientation, de l'ingénierie, de la conception, de la cohérence, de vous assurer que vous demandez les bonnes choses, et de préciser que, oui, il faut que ce soient des identifiants utilisateur uniques pour que nous ayons tout ce qu'il faut. Vous vous occupez donc d’une partie de la conception et du développement, et les ingénieurs se chargent de remplir les cases vides. C’est un peu là où nous en sommes actuellement, et je pense que c’est ce que tout le monde, bien sûr, constate en ce moment.
Question : Pensez-vous qu’il y ait une chance que ce goût et ce jugement perdent de leur importance avec le temps, ou est-ce que le plafond ne fera que continuer à monter ?
Andrej Karpathy : Oui, c’est une bonne question. Je dirais que j’espère que ça s’améliore. Je pense que la raison pour laquelle ça ne s’améliore pas pour l’instant, c’est probablement parce que ça ne fait pas partie de la RL. Il n’y a probablement pas d’esthétique, de coût ou de récompense, ou alors ce n’est pas assez bon, ou quelque chose comme ça. Je pense vraiment que quand on regarde le code, parfois, j’ai un peu le cœur qui s’arrête, parce que ce n’est pas forcément un code super génial tout le temps, et c’est très gonflé, et il y a beaucoup de copier-coller, et il y a des abstractions maladroites qui sont fragiles, et même si ça marche, c’est juste vraiment moche. J’espère vraiment que ça pourra s’améliorer dans les futurs modèles.
Un bon exemple, c'est aussi ce projet micro GPT où j'essayais de simplifier l'entraînement des LLM au maximum. Les modèles détestent ça. Ils n'y arrivent pas. J'ai essayé, j'essaie sans cesse de demander à un LLM de simplifier davantage, encore plus, mais il n'y arrive tout simplement pas. On a l’impression d’être en dehors des circuits de l’apprentissage par renforcement. On a vraiment l’impression, vous savez, qu’on arrache des dents. Ce n’est pas à la vitesse de la lumière. Donc, je pense que les humains restent aux commandes, mais je pense aussi qu’il y a quelque chose de fondamental, encore une fois, qui empêche cela. C’est juste que le moment n’est pas encore venu. Oui.
Question : J’aimerais donc revenir sur cette idée de formes d’intelligence irrégulières. Vous avez abordé ce sujet dans un article très stimulant sur les animaux par opposition aux fantômes. L’idée est que nous ne construisons pas des animaux, nous invoquons des fantômes. Ce sont des formes d’intelligence irrégulières façonnées par les données et les fonctions de récompense, mais pas par la motivation intrinsèque, le plaisir, la curiosité ou l’autonomisation. Des choses qui sont en quelque sorte apparues par le biais de l’évolution. Pourquoi ce cadre est-il important ? Et en quoi cela change-t-il concrètement la façon dont vous les construisez, les déployez, les évaluez, voire leur faites confiance ?
Andrej Karpathy : Je pense que si j’ai écrit là-dessus, c’est parce que j’essaie de comprendre ce que sont ces choses. Car si vous avez un bon modèle de ce qu’elles sont ou ne sont pas, vous serez plus à même de les utiliser. Je pense sincèrement que je ne sais pas si c'est le cas, je ne suis pas sûr que cela ait réellement un pouvoir concret. Je pense que c'est un peu de la philosophie, mais je pense qu'il s'agit simplement d'accepter le fait que ces choses ne sont pas, vous savez, de l'intelligence animale. C'est comme si, si vous leur criiez dessus, cela n'allait pas les faire fonctionner mieux ou moins bien, ou n'aurait aucun impact. Tout cela ressemble en quelque sorte à ces circuits de simulation statistique où le substrat est le pré-entraînement, donc comme des statistiques. Et puis il y a le RL qui vient s’ajouter par-dessus. Donc, ça augmente en quelque sorte les répartitions et c’est peut-être juste une sorte d’état d’esprit sur ce dans quoi je m’engage, sur ce qui est susceptible de fonctionner ou non, ou sur la manière de le modifier. Mais en réalité, je ne sais pas si j'ai cinq résultats évidents sur la manière d'améliorer votre système. Il s'agit plutôt d'être méfiant et de comprendre au fil du temps.
Cet interview rappelle ces déclarations antérieurs. L'ancien cadre de Tesla avait déclaré qu'il faudrait au moins dix ans supplémentaires pour qu'une entreprise ou un laboratoire de recherche spécialisé dans l'IA parvienne à développer l'AGI, un niveau d'intelligence hypothétique qui permettrait à un système d'IA d'effectuer des tâches complexes à un niveau équivalent ou supérieur à celui des humains. L'une des raisons de cette attente de dix ans est que personne n'a encore réussi à développer un système d'IA capable d'apprendre en continu.
« Ils ne sont pas capables d'apprendre de manière continue. On ne peut pas simplement leur dire quelque chose et espérer qu'ils s'en souviennent. Ils ont des lacunes cognitives et cela ne fonctionne tout simplement pas. Il faudra environ une décennie pour résoudre tous ces problèmes », a déclaré Andrej Karpathy.
Le fondateur d'Eureka Labs a également révélé qu'il avait lui-même succombé à l'engouement autour de l'IA générative, en particulier à l'idée que 2025 serait l'année des agents IA. « Je ne sais pas exactement qui a dit cela, mais ils faisaient allusion au fait que cette année serait celle des agents en ce qui concerne les LLM et leur évolution. Cela m'a interpellé, car il y a une certaine surestimation dans le secteur. À mon avis, il serait plus juste de parler de la décennie des agents », a-t-il déclaré.
Et vous ?
Pensez-vous que cette déclaration est crédible ou pertinente ?
Quel est votre avis sur le sujet ?Voir aussi
L'IA aurait radicalement transformé le codage au point de remplacer bientôt tous les développeurs ? Il n'y a pas de "Vibe Engineering", par Sergey Tselovalnikov
Vos pull requests slop vibe-codées ne sont pas les bienvenues, car les outils de codage basés sur l'IA posent un nouveau problème aux responsables de projets open source, par Sam Saffron
Il existe une meilleure façon de coder avec l'IA, par Namanyay Goel
Vous avez lu gratuitement 2 687 articles depuis plus d'un an.
Soutenez le club developpez.com en souscrivant un abonnement pour que nous puissions continuer à vous proposer des publications.
Soutenez le club developpez.com en souscrivant un abonnement pour que nous puissions continuer à vous proposer des publications.
