L'intelligence artificielle est gourmande en données. Tous les aspects de l'IA (modèles d'apprentissage automatique, apprentissage continu, généralisation et analyses prédictives et descriptives) nécessitent de vastes ensembles de données. Plus les données sont diverses et complètes, plus l'IA est performante. C'est pourquoi les données sont souvent considérées comme le « carburant d'entraînement » de l'IA. Les progrès réalisés dans le domaine de l'IA ces dernières années ont été rendus possibles grâce aux données collectées ici et là sur Internet.
OpenAI a entrepris de former des partenariats avec des organes de presse pour former son IA. Le dernier en date étant le quotidien Financial Times.
Un partenariat stratégique
Le partenariat entre le FT et OpenAI est décrit comme une collaboration visant à enrichir ChatGPT avec du contenu attribué, à améliorer l’utilité des modèles de l’IA en intégrant le journalisme du FT, et à collaborer au développement de nouveaux produits et fonctionnalités d’IA pour les lecteurs du FT. Le FT est également devenu client de ChatGPT Enterprise plus tôt cette année, offrant ainsi à tous ses employés l’accès à la technologie pour bénéficier des gains de créativité et de productivité rendus possibles par les outils d’OpenAI.
Selon les termes de l'accord, le FT accordera une licence d'utilisation de son matériel au créateur de ChatGPT pour l'aider à développer une technologie d'IA générative capable de créer des textes, des images et des codes impossibles à différencier des créations humaines. L'accord permet également à ChatGPT de répondre aux questions par de courts résumés d'articles du FT, avec des liens vers FT.com. Cela signifie que les 100 millions d'utilisateurs du chatbot dans le monde peuvent accéder aux articles du FT par l'intermédiaire de ChatGPT, tout en renvoyant à la source originale.
Envoyé par OpenAI
Vers un avenir collaboratif
« Il s'agit d'un accord important à plusieurs égards », a déclaré John Ridding, PDG du groupe FT. « Il reconnaît la valeur de notre journalisme primé et nous donnera un aperçu de la façon dont le contenu est mis en valeur par l'IA. Nous sommes depuis longtemps un leader dans l'innovation des médias d'information, pionnier du modèle d'abonnement et des technologies d'engagement, et ce partenariat nous aidera à rester à la pointe des développements dans la façon dont les gens accèdent à l'information et l'utilisent. »
« Le FT se consacre au journalisme humain, tel qu'il est produit par notre salle de rédaction inégalée, et cet accord élargira la portée de ce travail, tout en approfondissant notre compréhension des demandes et des intérêts des lecteurs », a ajouté Ridding. « Outre les avantages pour le FT, il y a des implications plus larges pour l'industrie. Il est juste, bien sûr, que les plateformes d'IA paient les éditeurs pour l'utilisation de leur matériel. OpenAI comprend l'importance de la transparence, de l'attribution et de la rémunération - autant d'éléments essentiels pour nous. Dans le même temps, il est clairement dans l'intérêt des utilisateurs que ces produits contiennent des sources fiables. »
Brad Lightcap, directeur de l'exploitation d'OpenAI, s'est montré enthousiaste quant à l'évolution de la relation avec le Financial Times : « Notre partenariat et notre dialogue continu avec le FT visent à trouver des moyens créatifs et productifs pour que l'IA renforce les organismes de presse et les journalistes, et enrichisse l'expérience ChatGPT avec un journalisme de classe mondiale en temps réel pour des millions de personnes à travers le monde ».
« Nous sommes impatients d'explorer les résultats pratiques concernant les sources d'information et l'IA dans le cadre de ce partenariat », a déclaré M. Ridding. « Nous apprécions l'opportunité d'être dans la boucle de développement alors que les gens découvrent le contenu d'une nouvelle manière. Comme pour toute technologie transformatrice, il existe un potentiel d'avancées significatives et de défis majeurs, mais il n'est jamais possible de revenir en arrière. Il est important pour nous de représenter un journalisme de qualité au fur et à mesure que ces produits prennent forme - avec les garanties appropriées en place pour protéger le contenu et la marque du FT.
Il s'agit du cinquième accord de ce type conclu par OpenAI au cours de l'année écoulée
L'entreprise a déjà conclu des accords similaires avec Associated Press (États-Unis), Axel Springer (Allemagne), Le Monde (France) et Prisa Media (Espagne). Les conditions financières n'ont pas été divulguées.
Axel Springer devrait gagner des dizaines de millions d'euros par an en permettant à OpenAI d'accéder au contenu de ses publications telles que Bild, Politico et Business Insider. Cet accord comprend un paiement unique pour le contenu historique de l'éditeur et une redevance plus importante versée dans le cadre d'un accord de licence annuel pour permettre à OpenAI d'accéder à des informations plus récentes.
Le New York Times est devenu le premier grand groupe de presse américain à poursuivre OpenAI et Microsoft
En décembre, le New York Times a intenté une action en justice contre OpenAI et Microsoft pour violation des droits d'auteur, affirmant que les entreprises technologiques ont utilisé ses articles pour former des chatbots qui menacent aujourd'hui les emplois des journalistes.
L'action en justice, déposée devant la Cour fédérale de district de Manhattan, affirme que les entreprises ont illégalement fourni des « millions d'articles » à Bing Chat de Microsoft et à ChatGPT d'OpenAI pour développer leurs produits. « Cette action vise à les tenir responsables des milliards de dollars de dommages statutaires et réels qu'elles doivent pour la copie et l'utilisation illégales des œuvres de grande valeur du Times », indique la plainte.
Le Times affirme que les programmes d'intelligence artificielle d'OpenAI et de Microsoft utilisent des modèles de langues étendues qui ont été développés en copiant leurs articles avec un accent particulier. « Les défendeurs cherchent à profiter de l'investissement massif du Times dans son journalisme en l'utilisant pour créer des produits substitutifs sans autorisation ni paiement », indique la plainte.
La plainte du New York Times citait plusieurs exemples où les chatbots d’OpenAI et de Microsoft donnaient aux utilisateurs des extraits quasi textuels de ses articles lorsqu’ils étaient sollicités. Elle accusait OpenAI et Microsoft de vouloir « profiter gratuitement de l’énorme investissement du Times dans le journalisme » et de créer un substitut au journal.
L'éditeur estime que les utilisateurs de la technologie d'OpenAI - que Microsoft applique à l'ensemble de son empire logiciel et cloud - pourraient effectivement contourner le paywall du journal et lire des articles gratuitement en demandant au chatbot de générer des morceaux de texte qu'il a couvert, privant ainsi l'entreprise de l'argent de ses abonnements.
OpenAI a riposté en accusant le New York Times d'avoir payé quelqu'un pour « pirater » ChatGPT afin de générer des paragraphes textuels à partir d'articles de son journal. Par piratage, l'entreprise entend sans doute : se connecter comme d'habitude et lui poser des questions visant à piéger le chatbot IA.
Dans une précédente tentative de décrédibiliser le New York Times, OpenAI avait indiqué :
Nos discussions avec le New York Times semblaient progresser de manière constructive jusqu'à notre dernière communication du 19 décembre. Les négociations portaient sur un partenariat de grande valeur autour de l'affichage en temps réel avec attribution dans ChatGPT, dans lequel le New York Times gagnerait un nouveau moyen de se connecter avec ses lecteurs existants et nouveaux, et nos utilisateurs auraient accès à leurs reportages. Nous avions expliqué au New York Times que, comme toute source unique, son contenu ne contribuait pas de manière significative à la formation de nos modèles existants et n'aurait pas non plus suffisamment d'impact pour les formations futures. Le procès qu'ils ont intenté le 27 décembre - dont nous avons pris connaissance en lisant le New York Times - nous a surpris et déçus.
En cours de route, ils ont mentionné avoir constaté une certaine régurgitation de leur contenu, mais ils ont refusé à plusieurs reprises de partager des exemples, malgré notre engagement à enquêter et à résoudre les problèmes. Nous avons montré à quel point nous prenons cette question au sérieux, comme en juillet, lorsque nous avons supprimé une fonction de ChatGPT immédiatement après avoir appris qu'elle pouvait reproduire du contenu en temps réel de manière involontaire.
Il est intéressant de noter que les régurgitations provoquées par le New York Times semblent provenir d’articles vieux de plusieurs années qui ont proliféré sur plusieurs sites Web tiers. Il semble qu’ils aient intentionnellement manipulé les invites, comprenant souvent de longs extraits d’articles, afin de faire régurgiter notre modèle. Même lorsqu’ils utilisent de telles invites, nos modèles ne se comportent généralement pas comme le laisse entendre le New York Times, ce qui suggère qu’ils ont soit demandé au modèle de régurgiter, soit sélectionné leurs exemples parmi de nombreuses tentatives.
En cours de route, ils ont mentionné avoir constaté une certaine régurgitation de leur contenu, mais ils ont refusé à plusieurs reprises de partager des exemples, malgré notre engagement à enquêter et à résoudre les problèmes. Nous avons montré à quel point nous prenons cette question au sérieux, comme en juillet, lorsque nous avons supprimé une fonction de ChatGPT immédiatement après avoir appris qu'elle pouvait reproduire du contenu en temps réel de manière involontaire.
Il est intéressant de noter que les régurgitations provoquées par le New York Times semblent provenir d’articles vieux de plusieurs années qui ont proliféré sur plusieurs sites Web tiers. Il semble qu’ils aient intentionnellement manipulé les invites, comprenant souvent de longs extraits d’articles, afin de faire régurgiter notre modèle. Même lorsqu’ils utilisent de telles invites, nos modèles ne se comportent généralement pas comme le laisse entendre le New York Times, ce qui suggère qu’ils ont soit demandé au modèle de régurgiter, soit sélectionné leurs exemples parmi de nombreuses tentatives.
Cet accord marque un tournant dans la relation entre les médias et l’intelligence artificielle, promettant d’apporter une nouvelle dimension au journalisme et à l’accès à l’information. Avec les garanties appropriées en place pour protéger le contenu et la marque du FT, cet accord pourrait bien façonner l’avenir de la consommation de contenu et de l’interaction avec l’IA.
Cependant, il serait intéressant de voir comment réagissent les autres parties qui s'estiment spoliées par l'IA d'OpenAI, notamment le New York Times et tous les autres détenteurs de droits qui poursuivent l'entreprise en justice pour violation du copyright.
Source : OpenAI
Et vous ?
Quelles sont les implications de l’utilisation du contenu journalistique pour entraîner des modèles d’IA ?
Comment cet accord pourrait-il changer la manière dont nous consommons les actualités à l’avenir ?
Quels avantages le Financial Times peut-il tirer de ce partenariat avec OpenAI ?
En quoi la collaboration entre les médias et l’IA peut-elle améliorer l’expérience des lecteurs ?
Quelles mesures de sécurité doivent être mises en place pour protéger le contenu et la marque du FT ?
Comment les organisations de presse peuvent-elles s’assurer que l’IA ne compromet pas l’intégrité du journalisme ?
Quel rôle les lecteurs peuvent-ils jouer pour influencer l’avenir de l’IA dans le journalisme ?
Quels défis le FT et OpenAI pourraient-ils rencontrer dans la mise en œuvre de cet accord ?
Comment cet accord pourrait-il influencer la création de contenu par les journalistes ?
Quel est le potentiel de l’IA pour générer des nouvelles qui sont non seulement informatives mais aussi engageantes et créatives ?