IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)

Vous êtes nouveau sur Developpez.com ? Créez votre compte ou connectez-vous afin de pouvoir participer !

Vous devez avoir un compte Developpez.com et être connecté pour pouvoir participer aux discussions.

Vous n'avez pas encore de compte Developpez.com ? Créez-en un en quelques instants, c'est entièrement gratuit !

Si vous disposez déjà d'un compte et qu'il est bien activé, connectez-vous à l'aide du formulaire ci-dessous.

Identifiez-vous
Identifiant
Mot de passe
Mot de passe oublié ?
Créer un compte

L'inscription est gratuite et ne vous prendra que quelques instants !

Je m'inscris !

L'IA n'est pas prête à remplacer les développeurs humains pour le débogage, selon des chercheurs de Microsoft.
Elle ne peut pas déboguer les logiciels de manière fiable même si elle a accès à des outils

Le , par Stéphane le calme

322PARTAGES

11  0 
L'IA n'est pas prête à remplacer les développeurs humains pour le débogage, selon des chercheurs de Microsoft
Les agents d'IA ne peuvent pas déboguer les logiciels de manière fiable même lorsqu'ils ont accès à des outils

Alors que les modèles d’intelligence artificielle générative comme ChatGPT, Claude, Gemini ou CodeWhisperer font déjà figure d’assistants prometteurs pour l’écriture de code, une nouvelle étude menée par des chercheurs de Microsoft met un sérieux bémol à l’enthousiasme ambiant : l’IA n’est pas encore à la hauteur lorsqu’il s’agit de déboguer efficacement du code réel.

La prolifération continue des outils de codage de l'IA ne stimule pas seulement l'efficacité des développeurs, elle signale également un avenir où l'IA générera une part croissante de tout nouveau code. Thomas Dohmke, PDG de GitHub, l'a prédit en 2023, lorsqu'il a déclaré que « tôt ou tard, 80 % du code sera écrit par Copilot ».

Les petites et grandes entreprises de logiciels utilisent déjà largement l'IA pour générer du code. Garry Tan, de Y Combinator, a noté que 95 % du code d'un quart des dernières start-ups de Y Combinator était écrit par de grands modèles de langage.

En fait, selon Microsoft, la plupart des développeurs passent la majeure partie de leur temps à déboguer le code, et non à l'écrire. Des chercheurs de son écurie déclare d'ailleurs :

« En tant que mainteneurs de dépôts de logiciels libres populaires, nous nous sentons concernés par ce constat. Mais que se passerait-il si un outil d'IA pouvait proposer des correctifs pour des centaines de problèmes ouverts, et si nous n'avions qu'à les approuver avant de les fusionner ? C'est ce qui nous a incités à maximiser les gains de temps potentiels des outils de codage IA en leur apprenant à déboguer le code.

« Par débogage, nous entendons le processus interactif et itératif de correction du code. Les développeurs émettent généralement des hypothèses sur la raison du plantage de leur code, puis rassemblent des preuves en parcourant le programme et en examinant les valeurs des variables. Ils utilisent souvent des outils de débogage tels que pdb (débogueur Python) pour les aider à recueillir des informations. Ce processus est répété jusqu'à ce que le code soit corrigé.

« Les outils de codage IA d'aujourd'hui stimulent la productivité et excellent à suggérer des solutions aux bogues sur la base du code disponible et des messages d'erreur. Cependant, contrairement aux développeurs humains, ces outils ne recherchent pas d'informations supplémentaires lorsque les solutions échouent, ce qui laisse certains bogues sans réponse, comme vous pouvez le voir dans cette démonstration simple qui montre comment une colonne mal étiquetée fait échouer les outils de codage d'aujourd'hui. Les utilisateurs peuvent ainsi avoir l'impression que les outils de codage de l'IA ne comprennent pas tout le contexte des problèmes qu'ils tentent de résoudre ».


Debug-gym : un environnement pour les outils de codage de l'IA afin d'apprendre à déboguer le code comme des programmeurs

Il existe peu de domaines dans lesquels l'IA a été déployée de manière aussi robuste que dans celui du développement de logiciels. Du « vibe coding » (une nouvelle pratique dans laquelle des personnes, dont certaines ont une expérience limitée du codage, développent rapidement des logiciels à l'aide d'outils de codage assistés par l'IA, sans se préoccuper de l'efficacité du code tant qu'il est fonctionnel) à GitHub Copilot, en passant par les startups qui créent des applications rapides avec l'aide de LLM, l'IA est déjà profondément intégrée. Même Google a déclaré avoir généré 25% de son code par IA.

Toutefois, ceux qui prétendent que nous ne sommes qu'à quelques mois du remplacement de la plupart des développeurs par des agents d'IA devraient revoir leurs attentes, car les modèles ne sont pas assez performants en matière de débogage, et le débogage occupe la majeure partie du temps d'un développeur. C'est ce que suggère Microsoft Research, qui a créé un nouvel outil appelé debug-gym pour tester et améliorer la façon dont les modèles d'IA peuvent déboguer les logiciels.

Debug-gym (disponible sur GitHub et détaillé dans un billet de blog) est un environnement qui permet aux modèles d'IA d'essayer de déboguer n'importe quel dépôt de code existant en ayant accès à des outils de débogage qui ne font pas historiquement partie du processus pour ces modèles. Microsoft a constaté que sans cette approche, les modèles sont très mauvais dans les tâches de débogage. Avec cette approche, ils s'améliorent, mais sont encore loin de ce que peut faire un développeur humain expérimenté.

Voici comment les chercheurs de Microsoft décrivent debug-gym :

« Une question de recherche naturelle émerge : dans quelle mesure les LLM peuvent-ils utiliser des outils de débogage interactifs tels que pdb ? Pour explorer cette question, nous avons lancé debug-gym - un environnement qui permet aux agents de réparation de code d'accéder à des outils pour un comportement actif de recherche d'informations. Debug-gym élargit l'espace d'action et d'observation d'un agent grâce au retour d'information de l'utilisation des outils, ce qui permet de définir des points d'arrêt, de naviguer dans le code, d'imprimer des valeurs variables et de créer des fonctions de test. Les agents peuvent interagir avec les outils pour étudier le code ou le réécrire, s'ils ont confiance. Nous pensons que le débogage interactif avec des outils appropriés peut permettre aux agents de codage de s'attaquer à des tâches réelles de génie logiciel et qu'il est au cœur de la recherche sur les agents basée sur le LLM. Les corrections proposées par un agent de codage doté de capacités de débogage, puis approuvées par un programmeur humain, seront fondées sur le contexte de la base de code, de l'exécution du programme et de la documentation, plutôt que de s'appuyer uniquement sur des suppositions basées sur des données d'entraînement vues précédemment ».

Vous trouverez ci-dessous les résultats des tests effectués avec debug-gym.


Les agents qui utilisent des outils de débogage sont nettement plus performants que ceux qui n'en utilisent pas, mais leur taux de réussite n'est pas encore assez élevé

Une approche efficace mais qui souligne les limites de l'outil

Cette approche est beaucoup plus efficace que celle qui consiste à s'appuyer sur les modèles tels qu'ils sont habituellement utilisés, mais lorsque votre meilleur cas est un taux de réussite de 48,4 %, vous n'êtes pas prêt pour le primetime. Les limites sont probablement dues au fait que les modèles ne comprennent pas parfaitement comment utiliser au mieux les outils et que leurs données d'entraînement actuelles ne sont pas adaptées à ce cas d'utilisation.

« Nous pensons que cela est dû à la rareté des données représentant un comportement décisionnel séquentiel (par exemple, les traces de débogage) dans le corpus d'entraînement LLM actuel », indique le billet de blog. « Cependant, l'amélioration significative des performances... valide le fait qu'il s'agit d'une direction de recherche prometteuse ».

Ce rapport initial n'est que le début des efforts, affirme le billet. L'étape suivante consiste à « affiner un modèle de recherche d'informations spécialisé dans la collecte des informations nécessaires à la résolution des bogues ». Si le modèle est volumineux, la meilleure solution pour réduire les coûts d'inférence pourrait être de « construire un modèle de recherche d'informations plus petit qui puisse fournir des informations pertinentes au modèle plus important ».

Ce n'est pas la première fois que nous voyons des résultats qui suggèrent que certaines des idées ambitieuses sur les agents d'IA remplaçant directement les développeurs sont assez éloignées de la réalité. De nombreuses études ont déjà montré que même si un outil d'IA peut parfois créer une application qui semble acceptable à l'utilisateur pour une tâche précise, les modèles ont tendance à produire un code chargé de bogues et de vulnérabilités de sécurité, et ils ne sont généralement pas capables de résoudre ces problèmes.

Il s'agit d'une première étape sur la voie des agents de codage IA, mais la plupart des chercheurs s'accordent à dire que le meilleur résultat sera probablement un agent qui fera gagner beaucoup de temps à un développeur humain, et non un agent capable de faire tout ce qu'il peut faire.


L'IA est en train de créer une génération de programmeurs illettrés

C'est le constat amer d'un développeur qui raconte son expérience avec l'IA. Voici un extrait de son billet :

Il y a de cela quelques jours, Cursor est tombé en panne lors d'un arrêt de ChatGPT.

J'ai regardé fixement mon terminal, faisant face à ces messages d'erreur rouges que je déteste voir. Une erreur AWS est apparue. Je ne voulais pas la résoudre sans l'aide de l'intelligence artificielle (IA).

Après 12 ans de codage, j'étais devenu plus mauvais dans mon propre métier. Et ce n'est pas une hyperbole : c'est la nouvelle réalité des développeurs logiciels.

La décrépitude

Elle s'est insinuée subtilement en moi.

Tout d'abord, j'ai cessé de lire la documentation. Pourquoi s'embêter quand l'IA pouvait expliquer les choses instantanément ?

Ensuite, mes compétences en matière de débogage en ont pris un coup. Les traces de pile me semblent désormais inaccessibles sans l'IA. Je ne lis même plus les messages d'erreur, je me contente de les copier et de les coller.

Je suis devenu un presse-papier humain, un simple intermédiaire entre mon code et un LLM.

Auparavant, chaque message d'erreur m'apprenait quelque chose. Aujourd'hui ? La solution apparaît comme par magie et je n'apprends rien. La dopamine des réponses instantanées a remplacé la satisfaction d'une véritable compréhension.

La compréhension en profondeur est la prochaine chose qui a été affectée. Vous vous souvenez avoir passé des heures à comprendre pourquoi une solution fonctionne ? Aujourd'hui, je me contente d'appliquer les suggestions de l'IA. Si elles ne fonctionnent pas, j'améliore le contexte et je demande à nouveau à l'IA. C'est un cycle de dépendance croissante.

Viennent ensuite les changements émotionnels. Auparavant, la résolution de nouveaux problèmes faisait partie du plaisir de programmer. Maintenant, je suis frustré si l'IA ne me donne pas de solution en 5 minutes.

Le plus effrayant ? Je suis en train de construire un outil de développement alimenté par l'IA, mais je ne peux pas me débarrasser du sentiment que je contribue au problème même qui érode nos compétences collectives.

Source : Microsoft

Et vous ?

Que pensez-vous de cette étude de Microsoft ? Vous semble-t-elle pertinente ou crédible ?

Faut-il ralentir l’intégration de l’IA dans le développement logiciel sans garde-fous humains ?

Les éditeurs d’EDI devraient-ils imposer des alertes de « confiance faible » dans les suggestions IA ?

Peut-on entraîner des IA réellement performantes en débogage sans accès à des millions d’exemples de sessions humaines ?

Le débogage est-il une compétence inimitable par les LLM, ou juste une question de data et de calcul ?

Comment sensibiliser les jeunes développeurs aux limites actuelles de ces outils, dans un contexte où ils sont omniprésents dans les formations ?
Vous avez lu gratuitement 751 articles depuis plus d'un an.
Soutenez le club developpez.com en souscrivant un abonnement pour que nous puissions continuer à vous proposer des publications.

Une erreur dans cette actualité ? Signalez-nous-la !

Avatar de RenarddeFeu
Membre averti https://www.developpez.com
Le 14/04/2025 à 11:50
L'IA, c'est le cancre qui a triché lors de l'examen en copiant sur son petit camarade sans réfléchir. Des fois le code marche, d'autres non.
6  0 
Avatar de L33tige
Membre expérimenté https://www.developpez.com
Le 14/04/2026 à 11:44
Citation Envoyé par calvaire Voir le message
+1, et j'ajoute, c'est quand on est en position de force qu'on peut être exigeant.
Trouver vite un emploi,s mettre un max de coté pour générer des revenus passifs.

Dans mon cas par exemple je peux être autosuffisant avec mon portefeuille de dividende (meme si je perd mon emplois je suis pas pressé de trouver car je gagne assez d'argent avec mes investissements pour m'auto financer), j'ai un emplois, j'alloue une partie de mon temps de travail pour me former sur les technos en vogue sur le marché du travail (l'ia notamment). J'ai suivie à distance les cours d'ia de l'université de stanford par exemple et j'ai les certifs, ca coute à peine quelques centaine de $.

Dans ces conditions, aucun patron ne peut me mettre la pression et je suis intéressant sur le marché du travail (linkedin est un très bon benchmark et dashboard pour ca)
Je peux imposer mes conditions de travail et mon salaire. Ce qui n'a pas toujours été le cas, j'ai commencé dans des esn de merde a faire des taches peu intéressante comme pisser du java. Mais c'est grâce a la valeurs travail qu'on peut s’élever dans la société et devenir quelqu'un.
Trop compliqué je préfère naitre riche et hériter.

Vous inquiétez pas ça va ruisseler.
5  0 
Avatar de imperio
Membre chevronné https://www.developpez.com
Le 14/04/2026 à 16:22
Citation Envoyé par calvaire Voir le message
on ne choisit pas ou l'on nait, ni nos parents, par contre on est tous responsable de nos choix dans la vie.
même fils de paysan au fin fond du pakistan, on peut finir comme un riche et prestigieux medecin/avocat aux USA.

Mais il faut se lever le matin et se bouger les fesses.... avec internet et encore plus aujourd'hui avec l'ia il n'y a aucune excuse pour pas se former.
Ah la fameuse méritocratie ? Qui a été prouvée comme n'existant pas dans les faits à tellement de reprises que ça devient une chimère protégée par une minorité (souvent riche).
6  1 
Avatar de kain_tn
Expert éminent https://www.developpez.com
Le 08/07/2025 à 20:02
Citation Envoyé par Anthony Voir le message
Quel est votre avis sur le sujet ?
Trouvez-vous la position du PDG de GitHub crédible ou pertinente ?
Pour commencer, je pense qu'on devrait arrêter de parler d'IA pour un produit qui n'a d'intelligent que le nom.

Maintenant, même si je pense effectivement que leurs IA génératives ne peuvent pas remplacer un développeur compétent, qu'elles posent des problèmes éthiques et juridiques (vol de code et violation de licences), qu'il y a mille et une façons de les pousser à produire du code non-sécurisé (l'idée d'utiliser les Rule Files, par exemple, est à mourir de rire), et qu'elles sont absolument nullissimes dès qu'il s'agit de produire quelque chose qui n'a pas déjà été inventé, je suis d'accord avec le PDG de Github sur le fait que "savoir coder manuellement reste une compétence irremplaçable".

Dommage que le reste du management chez Microsoft pense que ça vaut le coup de dépenser des milliards pour cette purge dans l'espoir de virer plus de gens...

Plus sérieusement, je pense que Thomas Dohmke a réalisé deux choses:
  • Si tout le code est généré par des IA (du code jetable, donc, vu la mémoire de poisson rouge des agents d'IA), alors plus besoin de le versionner, et par conséquent plus besoin de GitHub
  • S'il a moins de repositories sur GitHub, il n'a plus rien pour entraîner ses IA
4  0 
Avatar de sanzalure
Membre à l'essai https://www.developpez.com
Le 09/07/2025 à 11:53
Ce ne sont pas les programmeurs mais les décideurs qu'il faudrait congédier. Dans les entreprises, ce sont les travailleurs qui font le vrai travail, la haute direction est peuplée d'imposteurs qui font n'importe quoi. Il suffit d'observer l'état de la situation mondiale pour le constater. Le problème ne vient pas d'en bas, il vient d'en haut. Pas besoin d'être un génie pour s'en rendre compte.
4  0 
Avatar de Anselme45
Membre extrêmement actif https://www.developpez.com
Le 14/04/2026 à 10:37
Citation Envoyé par melka one Voir le message
La génération Z a bon dos, j'en fait pas partie.
Et moi, je reçois des candidats de la génération Z!!!

Quand un mec se présente à un interview, on ne commence pas par un "Dans votre société, on peut voyager pour apprendre les langues?"

Réponse: "On est pas une école de langue ni une agence de voyage qui vous paie pour apprendre ce que vous auriez déjà dû faire avant de vous présenter!!!"
7  3 
Avatar de MisterMoa
Nouveau Candidat au Club https://www.developpez.com
Le 15/04/2026 à 12:31
Citation Envoyé par calvaire Voir le message
+1, et j'ajoute... Dans mon cas... je peux être ...avec mon ...car je ...j'alloue ...J'ai suivie... j'ai les certifs

Dans ces conditions, aucun ... ne peut me mettre la pression... et je suis intéressant

Je peux imposer...
Un peu d'humilité dans tes postes : merci.
4  0 
Avatar de Christophe
Responsable Systèmes https://www.developpez.com
Le 15/04/2026 à 18:13
ne pas oublier le réseau, je n'ai jamais postulé dans ma vie en dehors de mon 1er job.
oui, mais ce n'est pas donné à tout le monde d'en avoir un de réseau, encore moins aux débutants que sont les jeunes diplômés.
4  0 
Avatar de RenarddeFeu
Membre averti https://www.developpez.com
Le 15/12/2025 à 22:21
Travailler pour les entreprises de la tech n'a jamais été un placement d'avenir. Tu prends le gros salaire tant qu'il tombe et tu espères passer entre les mailles du filet à chaque restructuration.

Alors oui, si t'as de la chance, que tu as rejoint Microsoft à la fin des années 80 par exemple, tu peux en ressortir millionnaire. Hélas, de nos jours, ce sont surtout les investisseurs qui font la culbute financière et non les salariés.
3  0 
Avatar de mach1974
Membre averti https://www.developpez.com
Le 16/12/2025 à 16:00
il est marrant de prendre l'IA comme symptome alors que la crise des subprimes aux USA refait son entrée . On a peut-être embauché des dev qui n'en sont pas .... les emplois étaient du bull shit . des gens PO pour gérer des besoins alors que les dev qui codent suffisent pour planifier, faire des tests et des AO
3  0