IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)

Vous êtes nouveau sur Developpez.com ? Créez votre compte ou connectez-vous afin de pouvoir participer !

Vous devez avoir un compte Developpez.com et être connecté pour pouvoir participer aux discussions.

Vous n'avez pas encore de compte Developpez.com ? Créez-en un en quelques instants, c'est entièrement gratuit !

Si vous disposez déjà d'un compte et qu'il est bien activé, connectez-vous à l'aide du formulaire ci-dessous.

Identifiez-vous
Identifiant
Mot de passe
Mot de passe oublié ?
Créer un compte

L'inscription est gratuite et ne vous prendra que quelques instants !

Je m'inscris !

Microsoft 365 Copilot : la version « omnisciente » de Clippy dopée à l'IA va automatiser l'analyse des données dans Excel
Rédiger des documents dans Word basés sur d'autres fichiers et bien plus

Le , par Stéphane le calme

20PARTAGES

9  0 
Copilot, l'outil d’IA commercial de GitHub, est critiqué par la communauté du logiciel open source,
Pour sa reproduction aveugle des blocs de code

Un outil de programmation alimenté par l’intelligence artificielle qui facilite la recherche d'échantillons de code peut sembler une aubaine pour les développeurs de logiciels, mais l'accueil réservé au nouvel outil Copilot de GitHub a été un peu plus froid. Si certains développeurs sont enthousiasmés par son potentiel, d’autres sont frustrés par la façon dont l’outil, permettant aux codeurs de gagner du temps, a été construit. En effet, GitHub Copilot tire le contexte des commentaires et du code et recommande instantanément des lignes individuelles et des fonctions entières. Mais ces derniers craignent que l'outil ne permette de contourner les exigences en matière de licence pour le code open source et de violer les droits d'auteur des utilisateurs individuels.

Copilot a été lancé en fin juin dans le cadre d'une Preview technique sur invitation uniquement, promettant de faire gagner du temps en répondant au code des utilisateurs par ses propres suggestions intelligentes. Ces suggestions sont basées sur des milliards de lignes de code public dont les utilisateurs ont publiquement contribué à GitHub, en utilisant un système d'IA appelé Codex de la société de recherche OpenAI.

Si Copilot représente un gain de temps considérable que certains qualifient de "magique", d'autres développeurs se montrent sceptiques, craignant que l'outil ne permette de contourner les exigences en matière de licence pour le code source ouvert et de violer les droits d'auteur des utilisateurs individuels.

Armin Ronacher, un éminent développeur de la communauté open source, est l’un des développeurs qui ont été frustrés par la façon dont Copilot a été construit. Il a expérimenté l’outil, a publié une capture d'écran sur Twitter, en trouvant étrange que Copilot, un outil d'intelligence artificielle qui est commercialisé, puisse produit du code protégé par le droit d'auteur.


Fonctionnement de GitHub Copilot

GitHub décrit Copilot comme l'équivalent IA de la "programmation en paire", dans laquelle deux développeurs travaillent ensemble sur un seul ordinateur. L'idée est qu'un développeur peut apporter de nouvelles idées ou repérer des problèmes que l'autre développeur aurait pu manquer, même si cela nécessite plus d'heures de travail.

Dans la pratique, cependant, Copilot est plutôt un outil utilitaire de gain de temps, qui intègre les ressources que les développeurs devraient autrement chercher ailleurs. Lorsque les utilisateurs saisissent des données dans Copilot, l'outil leur suggère des extraits de code à ajouter en cliquant sur un bouton. Ainsi, ils n'ont pas à passer du temps à chercher dans la documentation de l'API ou à rechercher des exemples de code sur des sites comme StackOverflow.


Un réseau neuronal dans GitHub Copilot est entraîné à l'aide de volumes massifs de données, constituées du code : des millions de lignes téléchargées par les 65 millions d'utilisateurs de GitHub, la plus grande plateforme au monde permettant aux développeurs de collaborer et de partager leur travail. Le but est que Copilot en apprenne suffisamment sur les modèles de code pour pouvoir faire du hacking lui-même. Il peut prendre le code incomplet d'un partenaire humain et terminer le travail en ajout les parties manquantes. Dans la plupart des cas, il semble réussir à le faire. GitHub prévoit de vendre l'accès à l'outil aux développeurs.

Comme pour la plupart des outils d'IA, GitHub souhaite également que Copilot devienne plus intelligent au fil du temps en fonction des données qu'il collecte auprès des utilisateurs. Lorsque les utilisateurs acceptent ou rejettent les suggestions de Copilot, son modèle d'apprentissage automatique utilisera ce retour d'information pour améliorer les suggestions futures, de sorte que l'outil deviendra peut-être plus humain à mesure qu'il apprendra.

Vives réactions de la communauté open source

Peu après le lancement de Copilot, certains développeurs ont commencé à s'alarmer de l'utilisation d'un code public pour entraîner l'IA de l'outil. L'une des préoccupations est que si Copilot reproduit des parties suffisamment importantes du code existant, il pourrait violer les droits d'auteur ou blanchir le code open source dans des utilisations commerciales sans licence appropriée. L'outil peut également recracher des informations personnelles que les développeurs ont publiées, et dans un cas, il a reproduit le code largement cité du jeu PC Quake III Arena de 1999, y compris le commentaire du développeur John Carmack.


L’utilisateur Hogan a aussi ajouté dans son fil de discussion : « Ce qui serait vraiment drôle, c'est que les gens qui maintiennent des dépôts populaires commençaient à mettre du mauvais code exprès ».

GitHub affirme que les dérapages de Copilot sont rares. Mais un autre utilisateur de Twitter, répondant au post de Ronacher, a écrit : « Et ici nous avons la preuve directe que GitHub reproduit directement un morceau de code sous GPL, ce qui prouve que c'est un outil vraiment dangereux à utiliser dans des environnements commerciaux ». Dans une autre réponse, on peut lire : « Lol, c'est du blanchiment de code… »

Un porte-parole de Github, a refusé de commenter et s'est contenté de renvoyer à la FAQ existante de la société sur la page Web de Copilot, qui reconnaît que l'outil peut produire des extraits de code textuels à partir de ses données d'entraînement. Cela se produit environ 0,1 % du temps, selon GitHub, généralement lorsque les utilisateurs ne fournissent pas suffisamment de contexte autour de leurs demandes ou lorsque le problème a une solution banale.

« Nous sommes en train de mettre en place un système de suivi de l'origine pour détecter les rares cas où le code est répété à partir de l'ensemble des données de formation, afin de vous aider à prendre de bonnes décisions en temps réel concernant les suggestions de GitHub Copilot », indique la FAQ de l'entreprise.

Entre-temps, le PDG de GitHub, Nat Friedman, a fait valoir sur un site de réseau social que la formation de systèmes d'apprentissage automatique sur des données publiques est une utilisation équitable, tout en reconnaissant que « la propriété intellectuelle et l'intelligence artificielle feront l'objet d'une discussion politique intéressante » à laquelle l'entreprise participera activement.

Cela n'a pas convenu à certains utilisateurs de GitHub qui disent que l'outil dépend de leur code et néglige leurs attentes quant à la façon dont il sera utilisé. La société a récolté du code libre d'utilisation et du code protégé par des droits d'auteur et « a mis le tout dans un mixeur afin de vendre la bouillie à des intérêts commerciaux et propriétaires », a déclare une programmeuse et conceptrice de jeux basée dans le Colorado dont les tweets sur le sujet sont devenus viraux. « On a l'impression de se moquer de l'open source ».

Dans un de ses tweets, elle a écrit : « GitHub Copilot a, de son propre aveu, été formé sur des montagnes de code GPL, donc je ne vois pas bien en quoi il ne s'agit pas d'une forme de blanchiment de code open source dans des œuvres commerciales. La phrase "il ne reproduit généralement pas les morceaux exacts" n'est pas très satisfaisante ».


« Le droit d'auteur ne couvre pas seulement le copier-coller ; il couvre les travaux dérivés. GitHub Copilot a été formé sur du code open source et la somme totale de tout ce qu'il sait a été tirée de ce code. Il n'y a pas d'interprétation possible du terme "dérivé" qui n'inclue pas cela », a-t-elle écrit. « La génération précédente d'IA a été entraînée sur des textes et des photos publics, sur lesquels il est plus difficile de revendiquer des droits d'auteur, mais celle-ci est tirée de grands corpus de travaux avec des licences très explicites testées par les tribunaux, donc j'attends avec impatience les inévitables /massifs/ recours collectifs à ce sujet ».

Sources : GitHub, Tweets (1, 2 & 3)

Et vous ?

Quel est votre avis sur GitHub Copilot ?
Que pensez-vous des commentaires des développeurs qui sont frustrés par la façon dont l’outil est construit ?
Que se passera-t-il si un code privé créé avec l’aide de Copilot viole les droits d'auteur ?

Voir aussi :

Microsoft crée un autocompléteur de code à l'aide de GPT-3, le système de génération de texte d'OpenAI, pour combler le manque de développeurs dans le monde
Open AI présente DALL-E (comme GPT-3), un modèle qui crée des images à partir de texte, pour un large éventail de concepts exprimables en langage naturel
OpenAI a publié l'IA de génération de texte qu'il disait trop dangereuse pour être divulguée, mais le modèle n'est pas encore parfait
Une IA génère des images de corps entiers de personnes qui n'existent pas, avec des modèles et des tenues photoréalistes
Vous avez lu gratuitement 5 articles depuis plus d'un an.
Soutenez le club developpez.com en souscrivant un abonnement pour que nous puissions continuer à vous proposer des publications.

Une erreur dans cette actualité ? Signalez-nous-la !

Avatar de ValCapri
Membre habitué https://www.developpez.com
Le 26/01/2024 à 23:18
Oui, l'IA peut générer du code de mauvaise qualité. Pour moi, GitHub Copilot est plus à considérer comme une autocompletetion enrichi. Et il est bien souvent bluffant à ce niveau.

Par contre, l'IA de Jetbrains me semble de bien meilleur qualité et notamment le refactoring où il te propose des aides intéressantes.

Maintenant, ce sont des aides, ça ne remplace pas l'humain derrière.
3  0 
Avatar de Prox_13
Membre éprouvé https://www.developpez.com
Le 17/03/2023 à 16:30
Peut-être que pour quelqu'un qui tape ce genre de mail toute la journée, cet usage de l'IA serait utile ?

Trois autres points :
Serait-il toujours possible d'apprendre de nouveaux mots ou de maintenir son vocabulaire, avec une utilisation aussi expéditive ?
Est-ce que le gain de temps est suffisant entre le fait de taper le mail directement et rédiger un énoncé clair pour avoir le résultat escompté ?
C'est assez irrespectueux je trouve de s'adresser à une personne à travers l'IA, non ? Il n'est même plus question de prendre la peine de s'adresser directement à la personne...
2  0 
Avatar de
https://www.developpez.com
Le 24/03/2023 à 10:59
Moins de deux ans après son lancement, GitHub Copilot écrit déjà 46 % du code et aide les développeurs à coder jusqu'à 55 % plus rapidement.
ça sort d'où ces chiffres bidons ? #marketingInside
2  0 
Avatar de kain_tn
Expert éminent https://www.developpez.com
Le 08/11/2024 à 9:53
Citation Envoyé par Jade Emy Voir le message

Pensez-vous que "Copilot Vision" est crédible ou pertinente ?
Quel est votre avis sur les fonctionnalités d'IA ?
Quelle horreur...

Au passage, leur truc ressemble fortement au projet Jarvis de Google. Donc ben toutes les GAFAM s'y mettent.

Citation Envoyé par Prox_13 Voir le message
Tout comme pour Blizzard Entertainment, on en arrive à se demander si l'entreprise ne se sabote pas d'elle-même.
Aucun risque. Ils sont en monopole. C'est pour ça qu'ils osent faire tout ce qu'ils font.
2  0 
Avatar de kain_tn
Expert éminent https://www.developpez.com
Le 17/03/2023 à 13:25
Ben en même temps, s'ils l'ont vraiment fait, ils auraient tord de le confirmer... On parle de boîtes qui pèsent des milliards de dollars et qui ont les moyen de faire durer des procès sur des décennies...

Citation Envoyé par Stéphane le calme Voir le message
Que pensez-vous de cet outil ? Êtes-vous tenté de l'utiliser ?
Non. Aucun intérêt.
1  0 
Avatar de kain_tn
Expert éminent https://www.developpez.com
Le 17/03/2023 à 19:11
Citation Envoyé par archqt Voir le message
Pour des tâches basiques cela permet de gagner beaucoup de temps. Un exemple, transformer une liste d'emails en une liste de noms + prénoms.

Pour l'exploitation des données, cela va faire gagner un temps important. Il faudra quand même vérifier que tout est bon, un peu comme la génération de code
On va alors bientôt découvrir que la plupart des entreprises ne respectent pas le GDPR puisque leurs employés envoient les données des clients vers ChatGPT. Ou alors il faudra que ces dernières mettent à jour leurs conditions pour dire qu'elles envoient potentiellement toutes les infos de leurs clients vers ChatGPT. Une belle régression en termes de protection des données

Bon, vous me direz, c'est déjà le cas, vu que l'on parle d'une suite office hébergée en dehors des entreprises.
1  0 
Avatar de kain_tn
Expert éminent https://www.developpez.com
Le 24/03/2023 à 9:54
Citation Envoyé par Sandra Coret Voir le message
Que pensez-vous de GitHub Copilot X ?
Une fonctionnalité vocale pour développer. Les Open Spaces vont devenir encore plus un enfer, si c'est adopté
1  0 
Avatar de kain_tn
Expert éminent https://www.developpez.com
Le 24/03/2023 à 13:36
Citation Envoyé par fodger Voir le message
ça sort d'où ces chiffres bidons ? #marketingInside
C'est clair...
1  0 
Avatar de melka one
Membre expérimenté https://www.developpez.com
Le 11/10/2023 à 23:13
Quel est votre avis sur le sujet ?
vu les coups qui sembles lié a la consommation d’énergie L’IA pollue, âpres la mode de la cryptomonnaies qui de part son effondrement actuel aura consommé de l’énergie pour rien au tour de L’IA utilisé entre autre pour la rédaction d'un simple courrier.

reste plus qu'a espérer que le hardware s’améliorera sinon faudra peut etre penser a se débarrasse des action nvidia
1  0 
Avatar de _toma_
Membre éclairé https://www.developpez.com
Le 04/11/2024 à 21:22
Y'a une faute de frappe dans le titre :
ce qui ressemble à une tentative délibérée désespérée de tirer parti de la marque « Apple Intelligence »
1  0