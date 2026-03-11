Envoyé par Stéphane le calme Envoyé par Le retour des métriques absurdes



L'une des dimensions les plus préoccupantes de cette tendance concerne les indicateurs retenus pour mesurer l'adoption. Le nouveau système d'évaluation de la performance de Meta sera capable de suivre le nombre de lignes de code qu'un ingénieur a écrites avec l'assistance de l'IA.



Les praticiens du développement logiciel ont immédiatement reconnu l'absurdité de cette démarche. Le nombre de lignes de code comme indicateur de productivité est une idée largement discréditée depuis les années 1990. L'histoire de l'informatique regorge d'exemples célèbres : la réduction du nombre de lignes de code est souvent le signe d'une meilleure conception logicielle, pas d'un manque de travail. Chez Apple en 1982 déjà, l'ingénieur Bill Atkinson était crédité de « -2000 lignes de code » dans les rapports internes, parce qu'il avait réussi à optimiser un composant graphique de QuickDraw en supprimant du code redondant  ce qui était en réalité une performance remarquable.



En intégrant des métriques d'utilisation de l'IA basées sur la quantité de code généré, les entreprises créent mécaniquement une incitation à produire du code verbeux et inutilement volumineux. Les développeurs qui souhaitent satisfaire aux indicateurs sans réellement changer leur méthode de travail ont déjà trouvé des parades : certains utilisent les outils de génération de code comme un simple système d'auto-complétion avancé, en acceptant puis en supprimant les suggestions, ce qui suffit à gonfler les métriques sans modifier substantiellement le processus. D'autres configurent des tâches automatiques pour consommer des tokens d'API sans aucune valeur productive. La loi de Goodhart, formulée dans les années 1970 par l'économiste britannique Charles Goodhart  « quand une mesure devient un objectif, elle cesse d'être une bonne mesure »  s'applique ici avec une précision chirurgicale.

Les ingénieurs séniors, premières victimes des métriques aveugles



Les études sur le sujet pointent vers une réalité contre-intuitive : l'IA générative est souvent moins utile pour les ingénieurs les plus expérimentés. Les profils juniors, qui manquent de contexte et de bases solides dans certains domaines, peuvent effectivement gagner en vitesse d'exécution grâce aux assistants de code. Les ingénieurs séniors, eux, travaillent souvent sur des problèmes suffisamment complexes, spécifiques et mal documentés pour que les modèles de langage soient peu pertinents.



En imposant des métriques d'adoption indifférenciées à l'ensemble de leurs équipes, les entreprises risquent d'inverser leur avantage compétitif : pénaliser les ingénieurs les plus expérimentés  précisément ceux dont les jugements permettent d'éviter les erreurs d'architecture coûteuses  au profit de profils qui génèrent du code rapidement mais sans nécessairement en comprendre les implications techniques profondes.



La question de la dette technique est à cet égard centrale. Le code généré par les LLM est fonctionnel dans l'immédiat, mais il n'est pas nécessairement maintenable ni évolutif. Intégré massivement sans relecture critique, il peut constituer une bombe à retardement pour les bases de code des grandes entreprises, qui devront dans quelques années consacrer des ressources importantes à le refactoriser ou à en comprendre les subtilités. Les développeurs qui acceptent aveuglément les suggestions de l'IA pour satisfaire aux métriques accélèrent peut-être leur évaluation de performance de court terme au détriment de la santé technique à long terme de leur entreprise.

Je dirais oui et non. Bien sûr si on ne prend réellement en compte que le code ajouté, et pas celui supprimé et les gains de refactorisation, ou même du remplacement par des bibliothèques externes plus éprouvées...Mais la question que je me pose c'est: comment on fait concrètement pour mesure l'impact (positif ou négatif) de l'utilisation de l'IA, pour savoir si au final c'est un bon ou mauvais outils, on le garde ou pas, ça vaut ce que ça coûte ou pas. Les coûts qu'il engendre sont quand même important pour une entreprise, et pas seulement en terme d'abonnement ou financièrement, selon les cas il y a aussi les infrastructures, l'énergie. On peut même prendre en compte la polution. Dans quelques années on aura sans doute plus de recul pour juger facilement, mais actuellement comment on fait pour se prononcer.J'ai fait un essai rapidement dans ma boîte il y a quelques semaines en regardant si on pouvait voir un impact avant/après la généralisation de l'utilisation de l'IA par les dev, en regardant les évolutions dans la base de code git. Un script assez simple et basique, sans rien d'intelligent derrière. Le résultat a été qu'entre les merges avec squash, les merges sans squash, les rebases, les branches temporaires créées par les dev, les features branches en attente, etc... Les graphiques que j'ai obtenu... c'était un peu n'importe quoi, à part des pics autour des dates de release... Bref je ne risque par de voir l'impacte de l'utilisation de l'IA là dessus.Mais du coup, comment on fait concrètement. Est-ce que ça existe des métriques réellement mesurables dans des environnement de production quotidiens (pas seulement des métriques conceptuelles). Les fournisseurs d'IA nous promettent monts et merveilles mais font bien attention à ne proposent aucune métrique concrète.J'imagine que tout métrique pourrait être considérée comme "absurde". Mais, personne de lui demande d'être intelligente, juste d'apporter une information effective, qui est ce qu'elle, utile pour un usage en particulier et dont il ne fait pas attendre plus.Là je suis assez en désaccord, je ne pense pas que les dev seniors (j'en suis un) soient désavantagés par rapport à des juniors. Je trouve qu'on sait plus précisément ce qu'on veut et par où emmener le LLM, on sait mieux juger des réponses. En tout cas je trouve que, à part peut être un temps d'adoption un plus plus lent (et encore), au final je ne me sens pas du tout défavorisé.Pour faire de la veille techno et se mettre à jour plus rapidement sur les dernières technos c'est bien pratique aussi.