OpenAI et la plateforme de développement Stack Overflow ont annoncé un partenariat qui pourrait potentiellement améliorer les performances des modèles d'IA et apporter plus d'informations techniques dans ChatGPT.
OpenAI aura accès à l'API de Stack Overflow et recevra les commentaires de la communauté des développeurs afin d'améliorer les performances des modèles d'IA. OpenAI, à son tour, attribuera à Stack Overflow un lien vers son contenu dans ChatGPT. Les utilisateurs du chatbot verront plus d'informations provenant des archives de connaissances de Stack Overflow s'ils posent des questions techniques ou de codage à ChatGPT. Les entreprises précisent dans le communiqué de presse que cela « favorisera un engagement plus profond à l'égard du contenu ».
Stack Overflow utilisera les grands modèles de langage d'OpenAI pour développer Overflow AI, l'application d'IA générative annoncée l'année dernière. Overflow AI ajouterait à Stack Overflow une recherche en langage naturel alimentée par l'IA. Stack Overflow indique qu'il combinera les commentaires de sa communauté et les tests internes des modèles d'OpenAI dans le cadre de ses projets visant à créer davantage de produits d'IA pour ses utilisateurs.
Envoyé par Stack Overflow
Un revirement
L'association avec OpenAI est un revirement remarquable pour Stack Overflow, qui avait initialement interdit les réponses de ChatGPT sur sa plateforme par crainte de réponses de type spams.
De plus, Stack Overflow a été une victime de ChatGPT qui a entraîné une baisse à deux chiffres de son trafic.
David F. Carr, Senior Manager au sein de l'équipe Similarweb, a expliqué que ChatGPT peut générer du code et des explications à partir d’un simple texte, ce qui réduit le besoin de chercher des solutions sur Stack Overflow. Il a comparé aussi ChatGPT avec Copilot, un assistant de codage proposé par GitHub, qui utilise la même technologie que ChatGPT. Il a présenté des données de Similarweb qui montraient que le trafic de Stack Overflow a baissé de 14 % en mars 2023, tandis que celui de ChatGPT et de GitHub a augmenté. Il conclut que ChatGPT et CoPilot représentent une nouvelle façon de coder, plus basée sur l’ingénierie des prompts que sur le copier-coller.
Stack Overflow a commencé à expérimenter des fonctions d'IA générative en avril dernier, promettant de créer des modèles qui « récompensent » les développeurs qui apportent des connaissances à la plateforme. En juillet, la société a lancé un outil de recherche conversationnelle qui permet aux utilisateurs de poser des questions et de recevoir des réponses basées sur la base de données de Stack Overflow, qui compte plus de 58 millions de questions et de réponses, ainsi que des outils permettant aux entreprises d'affiner les recherches sur leur propre documentation et leurs bases de connaissances.
Certains membres de la communauté des développeurs de Stack Overflow se sont rebellés contre ces changements, mettant en avant des préoccupations liées à la validité des informations générées par l'IA, à la surcharge d'informations et à la confidentialité des données pour les contributeurs individuels sur la plateforme.
Ces inquiétudes étaient au moins en partie fondées. Une analyse de plus de 150 millions de lignes de code déposées dans des dépôts de projets au cours des dernières années par GitClear a révélé que les outils de développement génératifs de l'IA entraînaient une augmentation du nombre de codes erronés dans les bases de code. Par ailleurs, des chercheurs en sécurité ont mis en garde contre le fait que ces outils peuvent amplifier les bogues et les problèmes de sécurité existants dans les projets de logiciels.
Mais malgré les défauts apparents, les développeurs adoptent les outils d'IA générative pour au moins certaines tâches de codage. Dans un sondage Stack Overflow de juin 2023, 44 % des développeurs ont déclaré qu'ils utilisaient actuellement des outils d'IA dans leur processus de développement, tandis que 26 % prévoient de le faire prochainement.
Cela a précipité une sorte de crise existentielle pour Stack Overflow. Le trafic sur la plateforme aurait chuté de manière significative depuis la sortie de nouveaux modèles d'IA générative capables l'année dernière - des modèles qui, dans de nombreux cas, ont été formés à partir de données provenant de Stack Overflow.
Aujourd'hui, pour réduire ses coûts, Stack Overflow cherche à conclure des accords de licence avec des fournisseurs d'IA.
Stack Overflow contrarié par les utilisateurs qui suppriment des réponses après le partenariat avec OpenAI
Dans ce monde en constante évolution où le contenu généré par l'utilisateur s'oppose au contenu généré par l'IA, l'annonce récente du partenariat entre Stack Overflow et OpenAI a suscité quelques réactions négatives de la part de la communauté. Des rapports indiquent que plusieurs utilisateurs ont tenté de supprimer leur contenu (questions et réponses) de Stack Overflow avec une certaine difficulté, car le site web ne permet pas de tout supprimer facilement. Ces utilisateurs ont donc décidé de modifier leurs questions et/ou leurs réponses afin de les « défigurer » pour protester contre la coopération entre Stack Overflow et OpenAI.
Stack Overflow bannit-il des comptes pour avoir supprimé du contenu ?
De nombreux utilisateurs ont signalé sur les réseaux sociaux qu'ils avaient reçu un courriel des modérateurs de Stack Overflow indiquant que leurs comptes avaient été placés en attente pendant 7 jours, ou bannis temporairement. Ces utilisateurs ont commencé à tenter de supprimer de nombreux messages, tant des questions que des réponses, qu'ils avaient précédemment publiés sur le site Web de Stack Overflow.
Un développeur nommé Ben a posté une capture d'écran de l'historique des modifications d'un message demandant des conseils de programmation, qu'il avait mis à jour pour dire qu'il avait supprimé la question pour protester contre l'accord avec OpenAI. « Le mouvement vole le travail de tous ceux qui ont contribué à Stack Overflow sans aucun moyen de s'y soustraire », peut-on lire dans le message mis à jour.
Le texte a été annulé moins d'une heure plus tard. Un message du modérateur que Ben a également inclus indique que les messages de Stack Overflow deviennent « une partie des efforts collectifs » des autres contributeurs une fois qu'ils sont rédigés et qu'ils ne doivent être supprimés que « dans des circonstances extraordinaires ». L'équipe de modération a ensuite indiqué qu'elle suspendait le compte de Ben pour une semaine, le temps de prendre contact avec lui « pour éviter tout autre malentendu ».
Sur X/Twitter, un développeur a déclaré :
« LOL. @StackOverflow éprouvent une certaine frustration car plusieurs utilisateurs ont supprimé leurs réponses depuis l'annonce du partenariat avec @OpenAI . En conséquence, ils ont commencé à suspendre les comptes qui se livrent à ce comportement. Il est important de noter que le "droit à l'oubli" ne s'applique plus à vos réponses, conformément aux conditions générales de StackOverflow, qui leur accordent une autorisation spéciale pour conserver toutes les réponses. De plus, la restauration de messages individuels à partir de sauvegardes semble difficile. Lmao ».
LOL. @StackOverflow mods are experiencing some frustration as several users have been deleting their answers since the announcement with @OpenAI partnership. As a result, they have started suspending accounts that engage in this behavior. It's important to note that the "right to… pic.twitter.com/M2YbKGXpzC
— nixCraft 🐧 (@nixcraft) May 8, 2024
Vous avez récemment supprimé ou dégradé le contenu de vos messages. Veuillez noter qu'une fois que vous avez posté une question ou une réponse sur ce site, ces messages font partie des efforts collectifs des autres personnes qui ont également contribué à ce contenu. Les messages potentiellement utiles à d'autres personnes ne doivent pas être supprimés, sauf dans des circonstances exceptionnelles. Même si le message n'est plus utile à l'auteur original, cette information est toujours bénéfique à d'autres personnes susceptibles de rencontrer des problèmes similaires à l'avenir - c'est la philosophie sous-jacente de Stack Exchange.
Les suppressions importantes demandent beaucoup d'efforts pour être réparées, veuillez lire « J'ai mieux pensé à ma question ; puis-je la supprimer ? » pour connaître les alternatives possibles. En raison des perturbations que ces incidents peuvent causer, nous avons mis votre compte en attente pendant 7 jours, le temps de vous contacter afin d'éviter tout autre malentendu. Une fois ce problème résolu, votre score de réputation sera rétabli et votre compte reprendra son cours normal.
Nous espérons sincèrement qu'il ne s'agit que d'un malentendu, mais nous comprenons que vous puissiez avoir une raison exceptionnelle de supprimer ce contenu. Si c'est le cas, faites-le nous savoir en répondant à ce message.
Les suppressions importantes demandent beaucoup d'efforts pour être réparées, veuillez lire « J'ai mieux pensé à ma question ; puis-je la supprimer ? » pour connaître les alternatives possibles. En raison des perturbations que ces incidents peuvent causer, nous avons mis votre compte en attente pendant 7 jours, le temps de vous contacter afin d'éviter tout autre malentendu. Une fois ce problème résolu, votre score de réputation sera rétabli et votre compte reprendra son cours normal.
Nous espérons sincèrement qu'il ne s'agit que d'un malentendu, mais nous comprenons que vous puissiez avoir une raison exceptionnelle de supprimer ce contenu. Si c'est le cas, faites-le nous savoir en répondant à ce message.
Conclusion
Comme d'autres plateformes qui tirent leur valeur du contenu généré par les utilisateurs, Stack Overflow est propriétaire des messages des utilisateurs. Dans le cadre de ses conditions d'utilisation, les utilisateurs « ne peuvent pas révoquer l'autorisation » donnée au site d'utiliser leurs contributions à la plateforme. Mais le site utilise une licence Creative Commons 4.0, qui exige une attribution. Lorsque OpenAI et Stack Overflow ont annoncé leur partenariat, OpenAI a déclaré que ChatGPT attribuerait ses réponses lorsqu'elles proviennent de la plateforme. Google affirme que c'est également une caractéristique de l'accord similaire conclu par Stack Overflow avec Google pour Gemini Cloud.
Le problème qui subsiste est le manque de transparence quant à l'origine des réponses d'un chatbot. Si ChatGPT ou un autre bot répond à une question et qu'une partie de cette réponse ne figure pas dans la source citée, s'agit-il d'une réponse hallucinée ou d'une réponse provenant d'un autre endroit ?
Cette situation met en lumière la tension entre le développement de technologies innovantes et la reconnaissance du travail individuel. Elle invite à une réflexion sur l’avenir de la collaboration entre les humains et l’intelligence artificielle dans le domaine de la programmation.
Sources : annonce du partenariat entre les deux entreprises, Snyk, enquête Stack Overflow
Et vous ?
Quelle devrait être la limite de l’utilisation des contributions des utilisateurs par des tiers, comme OpenAI, dans le cadre de partenariats avec des plateformes telles que Stack Overflow ?
Les utilisateurs devraient-ils avoir le droit de retirer ou de modifier leurs contributions après qu’elles aient été utilisées pour entraîner des modèles d’IA ?
Comment les plateformes en ligne peuvent-elles équilibrer l’amélioration des technologies d’IA avec le respect des droits des contributeurs ?
Stack Overflow devrait-il offrir une compensation ou une reconnaissance supplémentaire aux utilisateurs dont le contenu est utilisé pour entraîner des modèles d’IA ?
Quelles mesures de transparence Stack Overflow et OpenAI devraient-ils prendre pour assurer aux utilisateurs que leurs contributions sont utilisées de manière éthique ?
La propriété intellectuelle sur une plateforme collaborative doit-elle rester individuelle ou devenir collective après publication ?
Dans quelle mesure les termes de service des plateformes en ligne sont-ils clairs et justes concernant l’utilisation des contributions des utilisateurs ?