IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)

Vous êtes nouveau sur Developpez.com ? Créez votre compte ou connectez-vous afin de pouvoir participer !

Vous devez avoir un compte Developpez.com et être connecté pour pouvoir participer aux discussions.

Vous n'avez pas encore de compte Developpez.com ? Créez-en un en quelques instants, c'est entièrement gratuit !

Si vous disposez déjà d'un compte et qu'il est bien activé, connectez-vous à l'aide du formulaire ci-dessous.

Identifiez-vous
Identifiant
Mot de passe
Mot de passe oublié ?
Créer un compte

L'inscription est gratuite et ne vous prendra que quelques instants !

Je m'inscris !

Les chatbots IA sont utilisés pour produire du contenu sur des sites web de mauvaise qualité afin d'attirer les annonceurs
L'argent de la pub en ligne finance les fermes de contenu basées sur l'IA

Le , par Stéphane le calme

6PARTAGES

14  0 
Des personnes utilisent des chatbots basés sur l’IA pour remplir des sites web de mauvaise qualité avec du texte généré par l’IA afin d'attirer les annonceurs payants, selon un nouveau rapport de l’organisation de recherche médiatique NewsGuard. Au total, ce sont plus de 140 grandes marques qui paient pour des publicités qui se retrouvent sur des sites écrits par l'IA peu fiables, probablement à leur insu.

90% des annonces de grandes marques trouvées sur ces sites d'actualités générés par l'IA ont été diffusées par Google, bien que les propres politiques de l'entreprise interdisent aux sites de placer des annonces diffusées par Google sur des pages qui incluent du « contenu généré automatiquement par du spam ». Cette pratique menace d'accélérer l'arrivée d'un Internet spammé qui est envahi par le contenu généré par l'IA, ainsi que de gaspiller d'énormes quantités d'argent publicitaire.


La plupart des entreprises qui font de la publicité en ligne enchérissent automatiquement sur des spots pour diffuser ces publicités via une pratique appelée « publicité programmatique ». Les algorithmes placent des publicités sur divers sites Web selon des calculs complexes qui optimisent le nombre de vues qu'une publicité pourrait attirer du public cible de l'entreprise. En conséquence, les grandes marques finissent par payer pour des emplacements publicitaires sur des sites Web dont elles n'ont peut-être jamais entendu parler auparavant, avec peu ou pas de surveillance humaine.

Pour en profiter, des fermes de contenu ont vu le jour où des humains peu rémunérés produisent du contenu de mauvaise qualité pour attirer des revenus publicitaires. Ces types de sites Web ont déjà un nom : les sites « faits pour la publicité ». Ils utilisent des tactiques telles que le clickbait, les vidéos en lecture automatique et les publicités contextuelles pour soutirer le plus d'argent possible aux annonceurs. Dans une récente enquête, l'Association of National Advertisers a constaté que 21 % des impressions publicitaires de son échantillon étaient destinées à des sites conçus pour la publicité. Le groupe a estimé qu'environ 13 milliards de dollars sont gaspillés chaque année dans le monde sur ces sites.

Aujourd'hui, l'IA générative offre une nouvelle façon d'automatiser le processus de ferme de contenu et de créer plus de sites indésirables avec moins d'effort, ce qui entraîne ce que NewsGuard appelle « des sites Web d'actualités générés par l'intelligence artificielle peu fiables ». Un site signalé par NewsGuard a produit plus de 1 200 articles par jour.

Certains de ces nouveaux sites sont plus sophistiqués et convaincants que d'autres, avec des photos et des biographies de faux auteurs générées par l'IA. Et le problème se développe rapidement. NewsGuard, qui évalue la qualité des sites Web sur Internet, déclare découvrir environ 25 nouveaux sites générés par l'IA chaque semaine. Il en a trouvé 217 dans 13 langues depuis qu'il a commencé à suivre le phénomène en avril.


La prolifération des UAIN

Selon une analyse de NewsGuard, de grandes marques mondiales soutiennent la prolifération de sites Web d'actualités et d'informations générés par l'intelligence artificielle (UAIN pour unreliable artificial intelligence-generated news) peu fiables en canalisant les dollars publicitaires programmatiques vers le nombre en croissance rapide de ces sites.

Ces publicités semblent avoir été générées par programmation, ce qui signifie qu'au lieu que les entreprises choisissent de faire apparaître leurs publicités sur ces sites, elles ont été positionnées automatiquement via un système qui place des publicités quelle que soit la nature du site Web. Cette approche programmatique finance ainsi des sites de mauvaise qualité et de désinformation, tout en ne protégeant pas la « sécurité de la marque », la plupart des publicités étant placées par Google.

NewsGuard définit les sites Web d'actualités non fiables générés par l'intelligence artificielle (UAIN) comme des sites qui fonctionnent avec peu ou pas de surveillance humaine et publient des articles rédigés en grande partie ou entièrement par des bots. Au cours du mois dernier, les analystes de NewsGuard ont mis à jour le nombre de sites sur son nouveau traceur de sites UAIN de 49 à 217.

Beaucoup de ces sites générés par l'IA semblent être entièrement financés par la publicité programmatique. Certains des sites Web produisent d'énormes volumes d'articles sur lesquels des publicités peuvent être placées - un de ces sites produit en moyenne plus de 1 200 articles par jour - incitant ainsi à la création de ces sites de faible qualité générés par l'IA avec peu ou pas d'éléments apparents de veille éditoriale. Bien que de nombreux annonceurs et leurs agences de publicité maintiennent des «listes d'exclusion» de sites Web «non sécurisés» où leur publicité ne devrait pas apparaître, ces listes ne sont souvent pas tenues à jour et n'ont manifestement pas suivi le rythme de l'augmentation des sites UAIN.

En mai et juin 2023, les analystes de NewsGuard ont identifié 393 publicités programmatiques de 141 grandes marques qui sont apparues sur 55 des 217 sites UAIN identifiés par NewsGuard. Tous les sites Web UAIN que NewsGuard a trouvés n'affichent pas de publicités pour les grandes marques, et certains ne diffusent aucune publicité programmatique. Les publicités trouvées par NewsGuard ont été diffusées à des analystes naviguant sur Internet dans quatre pays : les États-Unis, l'Allemagne, la France et l'Italie.

Parce qu'il est probable qu'aucune des marques ou de leurs agences de publicité n'avait la moindre idée que leurs publicités apparaîtraient sur ces sites peu fiables et pilotés par l'IA, NewsGuard ne les nomme pas. Mais ils comprennent une grande variété d'annonceurs de premier ordre : une demi-douzaine de grandes banques et sociétés de services financiers, quatre grands magasins de luxe, trois grandes marques de vêtements de sport, trois fabricants d'appareils électroménagers, deux des plus grandes sociétés de technologie grand public au monde, deux sociétés mondiales des sociétés de commerce électronique, deux des principaux fournisseurs de haut débit américains, trois services de streaming proposés par les réseaux de diffusion américains, une plate-forme numérique de la Silicon Valley et une grande chaîne de supermarchés européenne.

Plus de 90 % des publicités identifiées par NewsGuard – 356 sur 393 – ont été diffusées à NewsGuard par Google Ads, la plus grande plate-forme en ligne de ce type.


Une annonce pour une entreprise de vêtements de sport est apparue sur NoticiasDeEmprego.com.br, un site Web UAIN qui publie des informations générées par l'IA sur les opportunités d'emploi au Brésil. Le texte indique clairement qu'il s'agit d'une IA

Gagner de l'argent avec de la camelote

NewsGuard a un moyen intelligent d'identifier ces sites Web indésirables écrits par l'IA. Parce que beaucoup d'entre eux sont également créés sans surveillance humaine, ils sont souvent truffés de messages d'erreur typiques des systèmes d'IA générative. Par exemple, un site appelé CountyLocalNews.com contenait des messages tels que « Désolé, je ne peux pas répondre à cette invite car cela va à l'encontre des principes éthiques et moraux... En tant que modèle de langage d'IA, il est de ma responsabilité de fournir des informations factuelles et fiables ».

L'IA de NewsGuard recherche ces extraits de texte sur les sites Web, puis un analyste humain les examine.

« Il semble que la publicité programmatique soit la principale source de revenus de ces sites Web générés par l'IA », déclare Lorenzo Arvanitis, analyste chez NewGuard qui suit le contenu Web généré par l'IA. « Nous avons identifié des centaines d'entreprises Fortune 500 et de marques bien connues et de premier plan qui font de la publicité sur ces sites et qui la soutiennent sans le savoir ».

MIT Technology Review a examiné la liste de près de 400 publicités individuelles de plus de 140 grandes marques que NewsGuard a identifiées sur les sites générés par l'IA qui diffusaient des publicités programmatiques, qui comprenaient des entreprises de nombreux secteurs différents, notamment la finance, la vente au détail, l'automobile, les soins de santé et le commerce électronique. Le coût moyen d'une publicité programmatique était de 1,21 $ pour mille impressions en janvier 2023, et les marques ne vérifient souvent pas tous les placements automatiques de leurs publicités, même si elles coûtent de l'argent.

La réaction de Google

Le produit publicitaire programmatique de Google, appelé Google Ads, est la plus grande bourse de ce type et a réalisé 168 milliards de dollars de revenus publicitaires l'année dernière. La société a été critiquée pour avoir diffusé des annonces sur des fermes de contenu dans le passé, même si ses propres politiques interdisent aux sites de placer des annonces diffusées par Google sur des pages avec du « contenu généré automatiquement par du spam ». Environ un quart des sites signalés par NewsGuard présentaient des publicités programmatiques de grandes marques. Sur les 393 annonces de grandes marques trouvées sur les sites générés par l'IA, 356 ont été diffusées par Google.

« Nous avons des politiques strictes qui régissent le type de contenu qui peut être monétisé sur notre plate-forme », a déclaré Michael Aciman, responsable des communications politiques pour Google, au MIT Technology Review dans un e-mail. « Par exemple, nous n'autorisons pas la diffusion d'annonces à côté de contenu préjudiciable, de spam ou de contenu de faible valeur, ou de contenu qui a été uniquement copié à partir d'autres sites. Lors de l'application de ces politiques, nous nous concentrons sur la qualité du contenu plutôt que sur la façon dont il a été créé, et nous bloquons ou supprimons les publicités de la diffusion si nous détectons des violations. »

La plupart des bourses d'annonces et des plates-formes ont déjà des politiques contre la diffusion d'annonces sur des fermes de contenu, mais elles « ne semblent pas appliquer ces politiques de manière uniforme » et « beaucoup de ces bourses d'annonces continuent de diffuser des annonces sur des sites [conçus pour la publicité] même s'ils semblent enfreindre… les politiques de qualité », déclare Krzysztof Franaszek, fondateur d'Adalytics, une société de criminalistique numérique et de vérification des publicités.

Google a déclaré que la présence de contenu généré par l'IA sur une page n'est pas une violation inhérente : « Nous reconnaissons également que les acteurs malveillants modifient constamment leur approche et peuvent tirer parti de la technologie, telle que l'IA générative, pour contourner nos politiques et nos systèmes d'application », a déclaré Aciman.

Source : NewGuard,

Et vous ?

L’IA, une nouvelle arme pour les sites web faits pour la publicité ?
Que pensez-vous de la pratique de la publicité programmatique?
Avez-vous déjà rencontré des sites web qui utilisent du texte généré par l’IA?
Quelles mesures devraient être prises pour réguler ces sites web de mauvaise qualité?
Quels sont les risques potentiels du contenu généré par l’IA pour la société?
Comment vérifiez-vous la fiabilité et la qualité des sources d’information en ligne?

Une erreur dans cette actualité ? Signalez-nous-la !