IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)

Vous êtes nouveau sur Developpez.com ? Créez votre compte ou connectez-vous afin de pouvoir participer !

Vous devez avoir un compte Developpez.com et être connecté pour pouvoir participer aux discussions.

Vous n'avez pas encore de compte Developpez.com ? Créez-en un en quelques instants, c'est entièrement gratuit !

Si vous disposez déjà d'un compte et qu'il est bien activé, connectez-vous à l'aide du formulaire ci-dessous.

Identifiez-vous
Identifiant
Mot de passe
Mot de passe oublié ?
Créer un compte

L'inscription est gratuite et ne vous prendra que quelques instants !

Je m'inscris !

Génération de code à l'aide de grands modèles de langage : 62 % du code généré contient des erreurs d'API
Qui auraient des conséquences inattendues si le code était introduit dans un logiciel réel

Le , par Jade Emy

11PARTAGES

7  0 
Récemment, les grands modèles de langage (LLM) ont montré une capacité extraordinaire à comprendre le langage naturel et à générer du code de programmation. Les ingénieurs logiciels ont l'habitude de consulter les LLM lorsqu'ils sont confrontés à des questions de codage. Bien que des efforts aient été faits pour éviter les erreurs de syntaxe et aligner le code sur la sémantique prévue, la fiabilité et la robustesse de la génération de code à partir des LLM n'ont pas encore fait l'objet d'une étude approfondie.

La mauvaise utilisation des API dans le code généré pourrait conduire à des problèmes graves, tels que les fuites de ressources, les plantages de programme. Les utilisateurs des services de génération de code LLM sont en fait les développeurs qui sont les plus vulnérables à ce code qui semble correct. Ce sont toujours des développeurs novices qui ne sont pas familiers avec les API que les LLM génèrent du code pour eux. Par conséquent, ils peuvent difficilement détecter les abus dans le code généré par les LLM, ce qui facilite davantage l'application de codes incorrects dans les logiciels du monde réel. Les repères et les ensembles de données d'évaluation de code existants se concentrent sur l'élaboration de petites tâches telles que les questions de programmation dans les entretiens de codage, ce qui s'écarte toutefois du problème des développeurs qui demanderaient au LLM une aide au codage dans le monde réel.


Pour combler cette lacune, Li Zhong et Zilong Wang proposent dans leur travail un ensemble de données RobustAPI pour évaluer la fiabilité et la robustesse du code généré par les LLM. Ils ont recueilli 1208 questions de codage de StackOverflow sur 24 API Java représentatives. Ils ont résumé les schémas d'utilisation abusive courants de ces API et les évaluons sur des LLM courants et populaires. Les résultats de l'évaluation montrent que même pour GPT-4, 62% du code généré contient des abus d'API, ce qui entraînerait des conséquences inattendues si le code était introduit dans un logiciel réel.

Vous pourrez trouver les détails de leur étude dans le lien source.

Source : "A Study on Robustness and Reliability of Large Language Model Code Generation"

Et vous ?

Pensez-vous que cette étude est crédible ou pertinente ?
Quel est votre avis sur le sujet ?

Voir aussi :

GPT-4 est capable d'améliorer ses performances de 30 % en utilisant un processus d'auto-réflexion, consistant à demander au modèle d'apprendre de ses erreurs pour pouvoir ensuite s'auto-corriger

GPT Pilot pourrait coder l'ensemble d'une application pendant que vous supervisez l'écriture du code, d'après son créateur

92 % des développeurs utiliseraient des outils d'intelligence artificielle selon une enquête de GitHub auprès des développeurs

Une erreur dans cette actualité ? Signalez-nous-la !

Avatar de Mister Nono
Membre chevronné https://www.developpez.com
Le 14/09/2023 à 11:18
Et bien oui, on dit tous ceux qui veulent l'entendre que l'IA est le passage obligé, alors tout le monde s'y engouffre : même pour vendre un article à 0,01€.

  • L'investissement : sans limite pour certains
  • L'éthique : exit pour d'autres
  • L'écologie : à quoi cela sert pour la plupart
  • La vie privée : cela existe-t-il encore ? (1984 - Orson Well)
  • Le profit : oui pour presque tous


A quand la fin de cette " boulimie " sans mesure des conséquences, tant humaines qu'humanitaire ?

Comme il était beau le temps où l'informatique n'existait pas... On pouvait rêver, avoir des projets d'avenir, connaitre des liens sociaux forts, être en phase avec la nature, dormir du sommeil du juste, être bien dans sa peau, connaitre le bonheur et l'amour vrai...
1  0 
Avatar de Axel Mattauch
Membre averti https://www.developpez.com
Le 01/07/2024 à 11:50
Juste une suggestion...

Ne serait-il pas plus pertinent de s'appuyer sur l'IA pour tester les codes produits et laisser le codage aux humains?
1  0 
Avatar de ext_3125
Membre à l'essai https://www.developpez.com
Le 01/12/2023 à 7:48
Que pensez-vous des résultats de cette enquête de GitHub ? Trouvez-vous qu'ils sont crédibles ou pertinents ?
ils ne sont pas crédible du tout.

Pensez-vous que ces résultats obtenus sur une base USA on un sens pour l'ensemble des développeurs ?
Ils n'ont pas de sens, car ils sont limités à zone géographique particulière et qui n'est pas forcément représentative du reste de la communauté mondiale des dévoloppeurs logiciels.

Utilisez-vous des outils de codage à base d'IA au sein de votre entreprise ? Si oui, comment évaluez-vous l'utilisation de ces outils ?
Non, le projet ne le permet pas.

À titre personnel, non plus. De plus, il m'a été remonté par des collègues qui l'ont essayé en dehors de travail que les solutions proposées étaient bourrées d'erreurs.
Dans ce cas, je n'en vois pas l'intérêt.
0  0 
Avatar de smarties
Expert confirmé https://www.developpez.com
Le 11/06/2024 à 14:19
Pour ma part, tout ce qui n'est pas auto-hébergé présente plus de risque de sécurité. Si je devais décider, ça devrait forcément être une solution auto-hébergeable.

Je trouve la démarche inversée, se sont les dirigeant qui poussent l'utilisation de l'IA alors que ça devrait être ceux qui codent qui testent et fassent les demandes pour ce genre d'outils.

Je suppose que les dirigeants sont sollicités par des commerciaux afin de leur vendre le produit, créer potentiellement un faux besoin.
0  0