IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)

Vous êtes nouveau sur Developpez.com ? Créez votre compte ou connectez-vous afin de pouvoir participer !

Vous devez avoir un compte Developpez.com et être connecté pour pouvoir participer aux discussions.

Vous n'avez pas encore de compte Developpez.com ? Créez-en un en quelques instants, c'est entièrement gratuit !

Si vous disposez déjà d'un compte et qu'il est bien activé, connectez-vous à l'aide du formulaire ci-dessous.

Identifiez-vous
Identifiant
Mot de passe
Mot de passe oublié ?
Créer un compte

L'inscription est gratuite et ne vous prendra que quelques instants !

Je m'inscris !

Une étude révèle que les outils d'IA de codage ralentissent les développeurs tout en leur donnant l'illusion d'être plus rapides,
Ils ont mis 19 % plus de temps à accomplir les tâches de codage

Le , par Mathis Lucas

266PARTAGES

11  0 
Les assistants d'IA de codage sont censés accélérer le développement de logiciels. Les entreprises d'IA comme Microsoft affirment que leurs outils améliorent déjà la productivité des développeurs, mais les études rigoureuses indépendantes révèlent le contraire. Une nouvelle étude du Model Evaluation & Threat Research rapporte que l'utilisation d'outils d'IA fait perdre du temps aux développeurs. Ils s'attendaient à une augmentation de 24 % de leur productivité, mais l'équipe a constaté un ralentissement de 19 %. Une précédente étude a révélé que l'utilisation d'outils d'IA n'augmente pas la vitesse de codage, mais augmente significativement le taux de bogues.

Le débat se poursuit au sein de la communauté des développeurs, avec des opinions divergentes sur les véritables avantages en matière de productivité des outils d'IA de codage, soulignant la nécessité d'une évaluation minutieuse de leur impact dans le monde réel. Si certaines entreprises ont fait état de gains de productivité significatifs grâce aux outils d'IA, d'autres ont constaté qu'ils introduisaient des erreurs et compliquaient les processus de débogage.

Les outils de codage ont été un cas d'utilisation précoce évident dans la ruée vers l'IA générative. Cependant, certaines observations montrent que les développeurs débutants ont souvent du mal à égaler l'efficacité des développeurs confirmés, même lorsqu'ils se font aider par les assistants d'IA.

La nouvelle étude du Model Evaluation & Threat Research (METR) rapporte que les outils d'IA de codage ralentissaient les développeurs, alors qu'on s'attendait à ce qu'il en soit autrement. Le METR est un organisme à but non lucratif qui se consacre à l'évaluation des capacités et de l'alignement des modèles d'apprentissage automatique. Il collabore avec des laboratoires d'IA tels qu'Anthropic et OpenAI pour réaliser des évaluations préliminaires de leurs modèles.

Méthodologie

L'étude a porté sur 16 développeurs expérimentés qui travaillent sur de grands projets open source. Les développeurs ont fourni une liste de problèmes réels (corrections de bogues, nouvelles fonctionnalités, etc.) qu'ils devaient traiter - 246 au total - et ont prévu combien de temps ces tâches allaient prendre. Ensuite, les chercheurs ont attribué au hasard à chaque problème l'autorisation ou l'interdiction d'utiliser l'IA pendant le travail sur le problème.



Lorsque l'IA est autorisée, les développeurs peuvent utiliser les outils de leur choix (principalement Cursor Pro avec Claude 3.5/3.7 Sonnet) ; lorsqu'elle est interdite, ils travaillent sans l'aide de l'IA générative. Les développeurs accomplissent ces tâches (qui durent en moyenne deux heures chacune) tout en enregistrant leur écran, puis déclarent eux-mêmes le temps total de mise en œuvre dont ils ont eu besoin. Le travail s'est déroulé entre février et juin 2025.

Principaux résultats

Lorsque les développeurs sont autorisés à utiliser des outils d'IA, ils mettent 19 % plus de temps à résoudre les problèmes, ce qui représente un ralentissement significatif qui va à l'encontre des convictions et des prévisions des experts. L'écart entre la perception et la réalité est frappant : les développeurs s'attendaient à ce que l'IA les accélère de 24 %, et même après avoir subi le ralentissement, ils pensaient encore que l'IA les avait accélérés de 20 %.


« Nous pouvons clairement constater que les développeurs mettent beaucoup plus de temps lorsqu'ils sont autorisés à utiliser des outils d'IA », ont écrit les chercheurs dans leur rapport. L'équipe indique que le ralentissement induit par l'IA générative peut être attribué à cinq facteurs :

  • optimisme excessif quant à l'utilité de l'IA (les développeurs avaient des attentes irréalistes) ;
  • grande familiarité des développeurs avec les référentiels (les développeurs étaient suffisamment expérimentés pour que l'aide de l'IA n'ait rien à leur apporter) ;
  • référentiels vastes et complexes (l'IA est moins performante dans les grands référentiels de plus d'un million de lignes de code) ;
  • faible fiabilité de l'IA (les développeurs ont accepté moins de 44 % des suggestions générées et ont ensuite passé du temps à les nettoyer et à les réviser) ;
  • contexte implicite du référentiel (l'IA ne comprenait pas le contexte dans lequel elle opérait).


D'autres considérations telles que la latence de génération de l'IA et l'incapacité à fournir aux modèles un contexte optimal (entrée) peuvent avoir joué un rôle dans les résultats, mais les chercheurs affirment qu'ils ne sont pas certains de l'impact de ces éléments sur l'étude.

L'IA n'est pas toujours à la hauteur des espérances

D'autres études ont tiré des conclusions similaires. Une étude de l'entreprise Qodo, spécialisée dans les outils d'IA de codage, a montré que certains des avantages de l'assistance logicielle de l'IA sont amoindris par la nécessité d'effectuer un travail supplémentaire pour vérifier les suggestions de code de l'IA. Une étude économique a montré que l'IA générative n'a eu aucun impact sur l'emploi ou les salaires, sur la base de données provenant du Danemark.


Une étude d'Intel a montré que les PC propulsés par l'IA rendent les utilisateurs moins productifs. Enfin, les employés d'un centre d'appel d'une compagnie d'électricité chinoise affirment que si l'assistance de l'IA peut accélérer certaines tâches, elle les ralentit également en créant davantage de travail.

Les outils d'IA de codage augmentent le taux de bogues

Une étude publiée en septembre 2024 par la société d'analyse Uplevel indique que les améliorations de productivité promises par l'IA sont loin d'être au rendez-vous, si tant est qu'elles existent. Uplevel rapporte que l'utilisation de GitHub Copilot (de Microsoft) n'augmente pas la vitesse de codage, mais augmente significativement le taux de bogues. Selon les données de l'étude, l'utilisation de GitHub Copilot a introduit 41 % de bogues supplémentaires.

« Cela suggère que Copilot peut avoir un impact négatif sur la qualité du code. Les responsables de l...
La fin de cet article est réservée aux abonnés. Soutenez le Club Developpez.com en prenant un abonnement pour que nous puissions continuer à vous proposer des publications.

Une erreur dans cette actualité ? Signalez-nous-la !

Avatar de olsimare
Membre chevronné https://www.developpez.com
Le 16/07/2025 à 20:23
En tant qu'utilisateur de Claude et avec quelques années de dev (pour pas dire beaucoup), je peux parfaitement concevoir que pour un dev débutant ça va générer des problèmes...
En tant qu'observateur externe, ça en génère déjà, car les gars qui font des revues de codes m'en parlent.

Donc mon avis : avant de savoir manier une perceuse, faut déjà savoir manier une chignole !
4  0 
Avatar de jnspunk
Membre habitué https://www.developpez.com
Le 14/07/2025 à 12:30
L'étude ne fait pas la distinction entre l'utilisation de l'assistant de codage pour effectuer des tâches fastidieuses, comme rédiger des commentaires, des aides ou de petits algorithmes tenant sur quelques lignes, et l'utilisation de l'assistant pour écrire l'intégralité du code.
Dans le premier cas, il n'y a ni bug ni perte de temps, alors que dans le second cas, une multitude de bugs peuvent surgir.

En mettant tous les développeurs dans le même panier, l'étude devient inutile.
Il serait important de différencier ceux qui ne savent pas coder ni utiliser les modèles de langage, des développeurs expérimentés qui maîtrisent leur travail et savent se servir de ces modèles pour optimiser leur efficacité.
5  2 
Avatar de Matthieu Vergne
Expert éminent https://www.developpez.com
Le 30/08/2025 à 0:59
Je n'ai qu'une seule chose à dire suite à ça :

Avoir plus de la moitié des professionnels qui insèrent du code qu'ils ne comprennent pas, c'est scandaleux.

Soit c'est ce qu'on a déjà aujourd'hui avec des gens qui copient le code depuis des sources Web sans comprendre ce que ça fait, auquel cas il va être temps de faire du nettoyage dans nos rangs en trouvant des méthodes pour identifier ces comportements irresponsables, soit c'est la nouvelle tendance et c'est très inquiétant. Car en associant ça aux jeunes diplômés qui ont du mal à trouver un job parce que l'employeur préfère utiliser une IA, on a un cocktail qui peut faire régresser le domaine du dév logiciel : stagnation de l'expertise (ne cherche pas à comprendre) + non renouvellement des troupes (pas d'embauche des jeunes).

Par contre, cela n'est en rien la responsabilité de l'IA, qui n'est qu'un outil : c'est la responsabilité pleine et entère des dévs qui font sans comprendre et des employeurs qui n'assurent pas la relève.
3  0 
Avatar de Metal3d
Membre habitué https://www.developpez.com
Le 16/07/2025 à 20:11
L'étude qui a pris un panel de 100 personnes moyennes en code, qui demandent à l'IA de coder tout le logiciel. Là où nous, on a fait une étude interne sur 300 développeurs de tous les niveaux, avec une IA de complétion et deux LLM à dispo, qui démontre que le groupe témoin sans outils IA a mis 25% de temps en plus.
J'ai pas trouvé le lien de l'étude de l'article, donc je fais une hypothèse.

Édit, j'ai vu le lien pardon. C'est une étude quali avec 16 dev. On ne peut pas sortir de chiffres avec ça. Bref, encore des gens qui n'ont pas capté l'importance du panel.
1  0 
Avatar de gluttony
Membre du Club https://www.developpez.com
Le 17/07/2025 à 8:37
On a adopté GitHub copilot au boulot (développeurs expérimentés, plus de 10 ans de dev dans les pattes pour la plupart), autant il est nul pour les réponses aux questions malgré le fait qu'il ait accès à tout le code (un ChatGPT ou Le Chat sont beaucoup plus pertinents même sans contexte, pourtant copilot est sensé être basé sur ChatGPT, on ne comprend vraiment pas), autant en auto-complétion on est unanime, ça fait gagner un temps fou.
Quelques expériences:
  • Ne serait-ce que pour ajouter des membres, notamment dans un store ts par exemple, on l'ajoute, puis pour chaque fonctions (initial state, getters, mutations, ...) on se pose sur la ligne du membre existant précédent, on fait entrée et il écrit la ligne qui va bien, ça parait pas grand chose, mais quand on en a pas mal à rajouter ça fait vraiment gagner du temps,
  • Pour des choses un peu plus complexe on met un commentaire avec ce qu'on veut, puis entrée et il nous colle le pavé qui va (presque) bien, suffit de relire un peu, faire quelques corrections mais le gros est fait beaucoup plus rapidement que de tout taper à la main,
  • Pour une nouvelle fonction on fait entrée après l'accolade ouvrante et rien qu'avec le nom il nous pond le gros du boulot, idem bien sûr: relire, toujours, et corriger si besoin,
  • Plus globalement, quand on passe sur un nouveau langage/framework, ça aide pas mal à apprendre la syntaxe plus rapidement qu'en cherchant à droite et à gauche.


Après oui c'est sûr ça a ses limites, il ne fait pas espérer qu'il nous ponde du code super complexe nécessitant des compétences dans un domaine spécifique, même si ça a l'ai magique pour un non développeur on ne va pas faire un soft entier avec ça (ou alors un petit truc dans un coin), exemple: un collègue qui n'y connaissait pas grand chose en Python a voulu essayer de faire un petit outil interne avec IHM Qt, alors oui ça a fait le taff, il a fait ça beaucoup plus vite que s'il avait dû tout apprendre, par contre ça va bien pour ce cas car même avec ça le code est difficilement maintenable (tout dans un seul .py).

Bref, ça a ses avantages et ses inconvénients, mais le plus gros des inconvénients c'est juste "nous", pauvres humains , trop de gens croient que l'IA c'est magique mais non, il faut quand même un minimum de réflexion/vérification derrière si on veut garder un code propre, maintenable et surtout qui fait ce qu'on veut.
2  1 
Avatar de djm44
Membre régulier https://www.developpez.com
Le 16/07/2025 à 0:23
C'est un article dédié à la quantophrénie
0  0 
Avatar de IGY-Francia
Inactif https://www.developpez.com
Le 17/07/2025 à 15:15
certaines observations montrent que les développeurs débutants ont souvent du mal à égaler l'efficacité des développeurs confirmés, même lorsqu'ils se font aider par les assistants d'IA.”

Et bien tout est dit ! Un développeur novice va certainement utiliser l’IA pour comprendre et résoudre certaines choses "assez futiles" pour un développeur confirmé. Est-ce que l’étude prend en compte les niveaux des développeurs ? Ou bien étaient-ils tous suffisamment expérimentés ?

Un autre point qui me semble important de souligner: les outils qu’ils ont privilégiés. Je prépare en ce moment un article sur la programmation Python et l’IA et de ce que j’ai lu jusqu’ici, le choix de l’outil et la version choisie comptent tout autant que les années d’expérience du dev.

contexte implicite du référentiel (l'IA ne comprenait pas le contexte dans lequel elle opérait).”

Oui l’IA répond en fonction de ce qui a été “dit” auparavant. En termes de codage, il n’est pas rare que l’assistant IA ne comprenne pas ce qu’on attend de lui. C’est surtout le cas pour des requêtes et prompts complexes, des cas isolés liés à des besoins métiers très précis.

Selon vous, les futurs modèles d'IA se révèleront-ils plus efficaces en matière de codage ?

J’ai envie de dire oui. Par contre pour quand ? On s’en rapproche petit à petit et je suis sûre que certaines études le démontreront tôt ou tard. Et n’oublions pas le fait que la majorité des études comme celles-ci sont très biaisées. On choisit les outils dont on veut faire l’éloge et on parle des résultats insatisfaisants de ce qu’on n’apprécie pas tant que ça (idées préconçues, mauvaises expériences, etc) . A méditer.

0  0 
Avatar de jcdesco
Nouveau Candidat au Club https://www.developpez.com
Le 15/07/2025 à 22:18
Une étude dit aussi que la chloroquine guérit le coronavirus, le SIDA, le cancer du foie et la débilité mentale mais uniquement à forte doses.
1  7