IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)

Vous êtes nouveau sur Developpez.com ? Créez votre compte ou connectez-vous afin de pouvoir participer !

Vous devez avoir un compte Developpez.com et être connecté pour pouvoir participer aux discussions.

Vous n'avez pas encore de compte Developpez.com ? Créez-en un en quelques instants, c'est entièrement gratuit !

Si vous disposez déjà d'un compte et qu'il est bien activé, connectez-vous à l'aide du formulaire ci-dessous.

Identifiez-vous
Identifiant
Mot de passe
Mot de passe oublié ?
Créer un compte

L'inscription est gratuite et ne vous prendra que quelques instants !

Je m'inscris !

Stack Overflow bannit massivement les utilisateurs qui se rebellent contre son partenariat avec OpenAI
En supprimant des réponses afin d'éviter qu'elles ne soient utilisées pour former ChatGPT

Le , par Stéphane le calme

13PARTAGES

9  0 
Stack Overflow, la plateforme bien connue des développeurs pour le partage de connaissances en programmation, se trouve au cœur d’une controverse suite à son partenariat avec OpenAI. Ce partenariat permet à OpenAI d’accéder aux réponses des programmeurs via l’API de Stack Overflow pour entraîner ses modèles d’intelligence artificielle, notamment ChatGPT. Cependant, cette initiative n’a pas été accueillie avec enthousiasme par une partie de la communauté. Certains utilisateurs ont exprimé leur mécontentement en supprimant ou en modifiant leurs réponses publiées sur la plateforme. Ils protestent contre l’utilisation de leur contenu sans possibilité de retrait et critiquent le manque de reconnaissance de leur travail.

OpenAI et la plateforme de développement Stack Overflow ont annoncé un partenariat qui pourrait potentiellement améliorer les performances des modèles d'IA et apporter plus d'informations techniques dans ChatGPT.

OpenAI aura accès à l'API de Stack Overflow et recevra les commentaires de la communauté des développeurs afin d'améliorer les performances des modèles d'IA. OpenAI, à son tour, attribuera à Stack Overflow un lien vers son contenu dans ChatGPT. Les utilisateurs du chatbot verront plus d'informations provenant des archives de connaissances de Stack Overflow s'ils posent des questions techniques ou de codage à ChatGPT. Les entreprises précisent dans le communiqué de presse que cela « favorisera un engagement plus profond à l'égard du contenu ».

Stack Overflow utilisera les grands modèles de langage d'OpenAI pour développer Overflow AI, l'application d'IA générative annoncée l'année dernière. Overflow AI ajouterait à Stack Overflow une recherche en langage naturel alimentée par l'IA. Stack Overflow indique qu'il combinera les commentaires de sa communauté et les tests internes des modèles d'OpenAI dans le cadre de ses projets visant à créer davantage de produits d'IA pour ses utilisateurs.

Citation Envoyé par Stack Overflow
Dans le cadre de cette collaboration :
  • OpenAI utilisera le produit OverflowAPI de Stack Overflow et collaborera avec Stack Overflow pour améliorer les performances des modèles pour les développeurs qui utilisent leurs produits. Cette intégration aidera OpenAI à améliorer ses modèles d'IA en utilisant un contenu amélioré et les commentaires de la communauté Stack Overflow et fournira une attribution à la communauté Stack Overflow dans ChatGPT pour favoriser un engagement plus profond avec le contenu.
  • Stack Overflow utilisera les modèles d'OpenAI dans le cadre du développement d'OverflowAI et travaillera avec OpenAI pour exploiter les résultats des tests internes afin de maximiser les performances des modèles d'OpenAI. Le partenariat d'OpenAI avec Stack Overflow contribuera à renforcer sa mission, qui est de permettre au monde de développer des technologies grâce à la connaissance collective, car Stack Overflow sera en mesure de créer de meilleurs produits qui bénéficieront à la santé, à la croissance et à l'engagement de la communauté de Stack Exchange.

La première série de fonctionnalités sera mise en place d'ici la fin du mois de juin.

Un revirement

L'association avec OpenAI est un revirement remarquable pour Stack Overflow, qui avait initialement interdit les réponses de ChatGPT sur sa plateforme par crainte de réponses de type spams.

De plus, Stack Overflow a été une victime de ChatGPT qui a entraîné une baisse à deux chiffres de son trafic.

David F. Carr, Senior Manager au sein de l'équipe Similarweb, a expliqué que ChatGPT peut générer du code et des explications à partir d’un simple texte, ce qui réduit le besoin de chercher des solutions sur Stack Overflow. Il a comparé aussi ChatGPT avec Copilot, un assistant de codage proposé par GitHub, qui utilise la même technologie que ChatGPT. Il a présenté des données de Similarweb qui montraient que le trafic de Stack Overflow a baissé de 14 % en mars 2023, tandis que celui de ChatGPT et de GitHub a augmenté. Il conclut que ChatGPT et CoPilot représentent une nouvelle façon de coder, plus basée sur l’ingénierie des prompts que sur le copier-coller.

Stack Overflow a commencé à expérimenter des fonctions d'IA générative en avril dernier, promettant de créer des modèles qui « récompensent » les développeurs qui apportent des connaissances à la plateforme. En juillet, la société a lancé un outil de recherche conversationnelle qui permet aux utilisateurs de poser des questions et de recevoir des réponses basées sur la base de données de Stack Overflow, qui compte plus de 58 millions de questions et de réponses, ainsi que des outils permettant aux entreprises d'affiner les recherches sur leur propre documentation et leurs bases de connaissances.

Certains membres de la communauté des développeurs de Stack Overflow se sont rebellés contre ces changements, mettant en avant des préoccupations liées à la validité des informations générées par l'IA, à la surcharge d'informations et à la confidentialité des données pour les contributeurs individuels sur la plateforme.

Ces inquiétudes étaient au moins en partie fondées. Une analyse de plus de 150 millions de lignes de code déposées dans des dépôts de projets au cours des dernières années par GitClear a révélé que les outils de développement génératifs de l'IA entraînaient une augmentation du nombre de codes erronés dans les bases de code. Par ailleurs, des chercheurs en sécurité ont mis en garde contre le fait que ces outils peuvent amplifier les bogues et les problèmes de sécurité existants dans les projets de logiciels.

Mais malgré les défauts apparents, les développeurs adoptent les outils d'IA générative pour au moins certaines tâches de codage. Dans un sondage Stack Overflow de juin 2023, 44 % des développeurs ont déclaré qu'ils utilisaient actuellement des outils d'IA dans leur processus de développement, tandis que 26 % prévoient de le faire prochainement.

Cela a précipité une sorte de crise existentielle pour Stack Overflow. Le trafic sur la plateforme aurait chuté de manière significative depuis la sortie de nouveaux modèles d'IA générative capables l'année dernière - des modèles qui, dans de nombreux cas, ont été formés à partir de données provenant de Stack Overflow.

Aujourd'hui, pour réduire ses coûts, Stack Overflow cherche à conclure des accords de licence avec des fournisseurs d'IA.


Stack Overflow contrarié par les utilisateurs qui suppriment des réponses après le partenariat avec OpenAI

Dans ce monde en constante évolution où le contenu généré par l'utilisateur s'oppose au contenu généré par l'IA, l'annonce récente du partenariat entre Stack Overflow et OpenAI a suscité quelques réactions négatives de la part de la communauté. Des rapports indiquent que plusieurs utilisateurs ont tenté de supprimer leur contenu (questions et réponses) de Stack Overflow avec une certaine difficulté, car le site web ne permet pas de tout supprimer facilement. Ces utilisateurs ont donc décidé de modifier leurs questions et/ou leurs réponses afin de les « défigurer » pour protester contre la coopération entre Stack Overflow et OpenAI.

Stack Overflow bannit-il des comptes pour avoir supprimé du contenu ?

De nombreux utilisateurs ont signalé sur les réseaux sociaux qu'ils avaient reçu un courriel des modérateurs de Stack Overflow indiquant que leurs comptes avaient été placés en attente pendant 7 jours, ou bannis temporairement. Ces utilisateurs ont commencé à tenter de supprimer de nombreux messages, tant des questions que des réponses, qu'ils avaient précédemment publiés sur le site Web de Stack Overflow.

Un développeur nommé Ben a posté une capture d'écran de l'historique des modifications d'un message demandant des conseils de programmation, qu'il avait mis à jour pour dire qu'il avait supprimé la question pour protester contre l'accord avec OpenAI. « Le mouvement vole le travail de tous ceux qui ont contribué à Stack Overflow sans aucun moyen de s'y soustraire », peut-on lire dans le message mis à jour.


Le texte a été annulé moins d'une heure plus tard. Un message du modérateur que Ben a également inclus indique que les messages de Stack Overflow deviennent « une partie des efforts collectifs » des autres contributeurs une fois qu'ils sont rédigés et qu'ils ne doivent être supprimés que « dans des circonstances extraordinaires ». L'équipe de modération a ensuite indiqué qu'elle suspendait le compte de Ben pour une semaine, le temps de prendre contact avec lui « pour éviter tout autre malentendu ».

Sur X/Twitter, un développeur a déclaré :

« LOL. @StackOverflow éprouvent une certaine frustration car plusieurs utilisateurs ont supprimé leurs réponses depuis l'annonce du partenariat avec @OpenAI . En conséquence, ils ont commencé à suspendre les comptes qui se livrent à ce comportement. Il est important de noter que le "droit à l'oubli" ne s'applique plus à vos réponses, conformément aux conditions générales de StackOverflow, qui leur accordent une autorisation spéciale pour conserver toutes les réponses. De plus, la restauration de messages individuels à partir de sauvegardes semble difficile. Lmao ».

[TWITTER]<blockquote class="twitter-tweet"><p lang="en" dir="ltr">LOL. <a href="https://twitter.com/StackOverflow?ref_src=twsrc%5Etfw">@StackOverflow</a> mods are experiencing some frustration as several users have been deleting their answers since the announcement with <a href="https://twitter.com/OpenAI?ref_src=twsrc%5Etfw">@OpenAI</a> partnership. As a result, they have started suspending accounts that engage in this behavior. It's important to note that the &quot;right to… <a href="https://t.co/M2YbKGXpzC">pic.twitter.com/M2YbKGXpzC</a></p>&mdash; nixCraft &#128039; (@nixcraft) <a href="https://twitter.com/nixcraft/status/1788144263928357306?ref_src=twsrc%5Etfw">May 8, 2024</a></blockquote> <script async src="https://platform.twitter.com/widgets.js" charset="utf-8"></script> [/TWITTER]

Vous avez récemment supprimé ou dégradé le contenu de vos messages. Veuillez noter qu'une fois que vous avez posté une question ou une réponse sur ce site, ces messages font partie des efforts collectifs des autres personnes qui ont également contribué à ce contenu. Les messages potentiellement utiles à d'autres personnes ne doivent pas être supprimés, sauf dans des circonstances exceptionnelles. Même si le message n'est plus utile à l'auteur original, cette information est toujours bénéfique à d'autres personnes susceptibles de rencontrer des problèmes similaires à l'avenir - c'est la philosophie sous-jacente de Stack Exchange.

Les suppressions importantes demandent beaucoup d'efforts pour être réparées, veuillez lire « J'ai mieux pensé à ma question ; puis-je la supprimer ? » pour connaître les alternatives possibles. En raison des perturbations que ces incidents peuvent causer, nous avons mis votre compte en attente pendant 7 jours, le temps de vous contacter afin d'éviter tout autre malentendu. Une fois ce problème résolu, votre score de réputation sera rétabli et votre compte reprendra son cours normal.

Nous espérons sincèrement qu'il ne s'agit que d'un malentendu, mais nous comprenons que vous puissiez avoir une raison exceptionnelle de supprimer ce contenu. Si c'est le cas, faites-le nous savoir en répondant à ce message.

Conclusion

Comme d'autres plateformes qui tirent leur valeur du contenu généré par les utilisateurs, Stack Overflow est propriétaire des messages des utilisateurs. Dans le cadre de ses conditions d'utilisation, les utilisateurs « ne peuvent pas révoquer l'autorisation » donnée au site d'utiliser leurs contributions à la plateforme. Mais le site utilise une licence Creative Commons 4.0, qui exige une attribution. Lorsque OpenAI et Stack Overflow ont annoncé leur partenariat, OpenAI a déclaré que ChatGPT attribuerait ses réponses lorsqu'elles proviennent de la plateforme. Google affirme que c'est également une caractéristique de l'accord similaire conclu par Stack Overflow avec Google pour Gemini Cloud.

Le problème qui subsiste est le manque de transparence quant à l'origine des réponses d'un chatbot. Si ChatGPT ou un autre bot répond à une question et qu'une partie de cette réponse ne figure pas dans la source citée, s'agit-il d'une réponse hallucinée ou d'une réponse provenant d'un autre endroit ?

Cette situation met en lumière la tension entre le développement de technologies innovantes et la reconnaissance du travail individuel. Elle invite à une réflexion sur l’avenir de la collaboration entre les humains et l’intelligence artificielle dans le domaine de la programmation.

Sources : annonce du partenariat entre les deux entreprises, Snyk, enquête Stack Overflow

Et vous ?

Quelle devrait être la limite de l’utilisation des contributions des utilisateurs par des tiers, comme OpenAI, dans le cadre de partenariats avec des plateformes telles que Stack Overflow ?
Les utilisateurs devraient-ils avoir le droit de retirer ou de modifier leurs contributions après qu’elles aient été utilisées pour entraîner des modèles d’IA ?
Comment les plateformes en ligne peuvent-elles équilibrer l’amélioration des technologies d’IA avec le respect des droits des contributeurs ?
Stack Overflow devrait-il offrir une compensation ou une reconnaissance supplémentaire aux utilisateurs dont le contenu est utilisé pour entraîner des modèles d’IA ?
Quelles mesures de transparence Stack Overflow et OpenAI devraient-ils prendre pour assurer aux utilisateurs que leurs contributions sont utilisées de manière éthique ?
La propriété intellectuelle sur une plateforme collaborative doit-elle rester individuelle ou devenir collective après publication ?
Dans quelle mesure les termes de service des plateformes en ligne sont-ils clairs et justes concernant l’utilisation des contributions des utilisateurs ?

Une erreur dans cette actualité ? Signalez-nous-la !

Avatar de Psylle
Membre à l'essai https://www.developpez.com
Le 16/10/2024 à 9:47
Votre raisonnement tient si l'I.A. générative ne générait que des vraies réponses. Mais ce n'est pas le cas. Donc on finit par avoir des I.A. génératives qui apprennent avec des mauvaises réponses. Perso, je vois cela comme le problème de la consanguinité. Enfin, il me semble. Non?
8  0 
Avatar de Mingolito
Membre extrêmement actif https://www.developpez.com
Le 16/10/2024 à 18:14
C'est pas des "calculs", si un illuminé a écrit un jour sur un forum qu'il faut manger des cailloux alors ChatGPT te dira de manger des cailloux, histoire vrai

Donc maintenant il y a 10 IA qui vont répondre à tous le monde que "oui il faut manger des cailloux", et ça sera répété encore sur les forums par les utilisateurs idiots, et même encore plus directement par des bots IA qui postent sur les forum, donc non seulement l'IA est conne mais en sus elle s'auto empoisonne, car L'IA c'est un perroquet, une IA ne sais pas raisonner, une IA ne fait que collecter un tas de données, dont un tas de conneries, y compris des livres de fictions qui l'empoisonnent encore plus, pour inventer encore plus de conneries, les IA "hallucinent", et d'après les chercheurs vont continuer à halluciner.

Si tu demandes à une IA de te pondre une fiction, ça sera bien une fiction. Si tu demandes à une IA de te pondre un rapport scientifique, ça sera encore une fiction, une hallucination, une connerie, ou une fake news, au choix.

Un site scientifique a déjà fermé suite à la pollution IA, par des rapports tous faux fait par des IA, et pas assez de chercheurs humains volontaires et disponible vérifier toute cette merde.
4  0 
Avatar de onilink_
Membre émérite https://www.developpez.com
Le 16/10/2024 à 21:36
Chose dont tous ceux qui connaissent un minimum le fonctionnement des modèles d'IA avaient prédit depuis des années.
De toute façon, OpenAI et consort ont déjà volé tout le contenu exploitable du web donc je ne pense pas que ce soit une grosse limitation pour eux.
La quantité de données étant limité, il va falloir jouer dans la qualité. Et c'est pas en aspirant le web post 2024 que l'on va en trouver.

Bref j'ai envie de dire "c'est pas trop tôt".

@revo2211
Même si les réponses étaient vrai, un LLM ou tout autre modèle qui mange ses propres sorties en entrée finis par devenir plus con.
C'est vraiment la base.

Et sur le plan "philosophique", chaque réponse mène à plus de questions.
Quand on a "toutes les réponses" c'est qu'on se plante quelque part. C'est un peu ce qui s'est passé avec la physique pre "quantique" d'ailleurs
3  0 
Avatar de SQLpro
Rédacteur https://www.developpez.com
Le 14/11/2024 à 14:14
On oublie juste de dire que la qualité du code pissé par ces intelligence est rarement optimal et parfois totalement à côté de la plaque...

Cela va provoquer moins de demandes basiques dans stackoverflow, mais des demandes plus précises, plus complexes, avec des réponses plus osphsitiquées...

A +
3  0 
Avatar de Minato Sensei
Membre habitué https://www.developpez.com
Le 15/10/2024 à 15:30
En même temps, fallait s'attendre à ce que les données disponibles pour les entraînements de l'IA se mettent à devenir rares
1  0 
Avatar de revo2211
Nouveau Candidat au Club https://www.developpez.com
Le 19/10/2024 à 9:07
L'IA actuelle n'est pas parfaite car elle est uniquement générative mais par un système de contrôle, les résultats s'amélioreront avec le temps. Actuellement ça génère mais ça ne valide pas.
L'IA génère des datas qui sont ensuite inclues comme source de données dans le modèle et à terme tout le contenu s'empoisonne de lui même. Je ne dirais pas que c'est du cannibalisme mais de l'empoisonnement.

Dans le cadre de l'informatique, il y a assez peu d'algorithme basé sur de l'aléatoire, donc l'IA sera capable de produire un résultat très qualitatif. Comme il y a des outils de validation syntaxique, de compilation, d'exécution et de test, l'IA devrait grandement aider dans ce domaine.

Je vois plutôt les LLM comme des moteurs de recherche. Google donne des liens mais pas de résultats, les LLM donnent des réponses qui peuvent être incorrectes. C'est à l'opérateur de valider les résultats.
Aujourd'hui c'est quand même beaucoup d'esbroufe
0  0 
Avatar de Jules34
Membre émérite https://www.developpez.com
Le 16/10/2024 à 15:55
Citation Envoyé par revo2211 Voir le message
Somme nous pas entrain de toucher un plafond de verre de l'informatique? Si tous les projets sont accomplis, la quête ultime du développeur est terminée. On a créé l'informatique pour automatiser, simplifier, digitaliser les interactions, il faut s'attendre un jour à terminer cette quête. Un peu comme dans un jeu vidéo.
On a créé l'informatique pour faire des calculs. Les relations sociales évolueront en fonction de la société et de ses normes et l'informatique ne sera jamais qu'une béquille à une chose en constante évolution.

Il y aura des calculs à faire aussi longtemps qu'il y aura des hommes. De 1 + 1 à la base de donnée.

Il y en aura toujours à faire. Ceux qui annoncent la fin du progrès ou la fin de l'histoire comme si la technologie actuelle était un graal se trompent à mon sens. L'humanité ne touchera jamais de plafond de verre en la matière, au contraire j'ai le sentiment qu'on s'en éloigne.
0  2 
Avatar de revo2211
Nouveau Candidat au Club https://www.developpez.com
Le 15/10/2024 à 21:04
Du coup l'IA en provoquant la diminution du contenu pertinent sur le web provoque sa propre auto destruction, puisqu'elle n’a plus assez de données pertinentes pour évoluer, et s'empoisone en aspirant son propre contenu.
Et si l'IA apporte des vraies réponses aux questions?, les solutions étant trouvées, les problèmes se résolvent mais le partage des réponses correctes n'a plus lieu.
Il faudrait aller exposer les réponses correctes des IA et ainsi le partage continue.

Quand on possède la réponse on ne poste pas de question sur stackoverflow. On ne pose pas non plus la question quand un proche répond à la question.
Il y a donc un process qui est suivi avant de poster une question sur stackoverflow. On peut d'abord faire une recherche sur google puis ensuite on va sur stackoverflow , en ultime quête.

Ce qui aurait vraiment de la valeur c'est de savoir si un individu trouve les réponses à ses questions et par quel moyen.
Le tout serait de savoir à quel type de question l'IA donne des réponses. Pour les questions simples, l'IA fait très bien son travail donc c'est une avancée.

Si une question est une équation, si l'IA résouds toutes les équations, il y aura moins d'équations.

Somme nous pas entrain de toucher un plafond de verre de l'informatique? Si tous les projets sont accomplis, la quête ultime du développeur est terminée. On a créé l'informatique pour automatiser, simplifier, digitaliser les interactions, il faut s'attendre un jour à terminer cette quête. Un peu comme dans un jeu vidéo.

La solution finale qui est que toutes les meilleures réponses à toutes les équations approchent avec le temps. Ce qui est logique vu que plus on avance, plus on comprend le monde et plus on résouds les équations.
A un moment donné on aura la réponse à toutes nos questions et dans ce cas quelle sera la prochaine quête?
0  4