IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)

Vous êtes nouveau sur Developpez.com ? Créez votre compte ou connectez-vous afin de pouvoir participer !

Vous devez avoir un compte Developpez.com et être connecté pour pouvoir participer aux discussions.

Vous n'avez pas encore de compte Developpez.com ? Créez-en un en quelques instants, c'est entièrement gratuit !

Si vous disposez déjà d'un compte et qu'il est bien activé, connectez-vous à l'aide du formulaire ci-dessous.

Identifiez-vous
Identifiant
Mot de passe
Mot de passe oublié ?
Créer un compte

L'inscription est gratuite et ne vous prendra que quelques instants !

Je m'inscris !

L'intégration des résumés de l'IA dans les résultats de recherches Google met les éditeurs de sites devant un dilemme : partager leurs données ou mourir

Le , par Stéphane le calme

40PARTAGES

8  0 
Google, en intégrant des réponses générées par l’IA en haut de ses pages de résultats de recherche, crée une situation complexe pour les éditeurs de sites web. Ces derniers doivent désormais choisir entre partager leurs données ou perdre en visibilité en ligne. Le système de résumé de contenu web utilisé par Google pour générer ces réponses est le même que celui qui indexe les pages pour les résultats de recherche.

Voici les points clés à retenir :
  • Partager les données ou disparaître : Les résumés générés par l’IA peuvent réduire le trafic vers les sites d’origine. Bloquer l’IA de Google pourrait même exclure les sites des résultats de recherche.
  • Domination de Google dans la recherche : La position dominante de Google dans la recherche, récemment qualifiée d’abus de position dominante par un tribunal fédéral, lui confère un avantage décisif dans la guerre de l’IA. Cela suscite des inquiétudes en matière de concurrence.
  • Diversification des sources de trafic : Pour survivre, les éditeurs doivent diversifier leurs sources de trafic et ne pas dépendre uniquement de Google.

Le dilemme des éditeurs

Google affiche désormais en haut de ses pages de recherche des réponses pratiques basées sur l'intelligence artificielle, ce qui signifie que les utilisateurs ne peuvent jamais cliquer sur les sites web dont les données sont utilisées pour produire ces résultats. Mais de nombreux propriétaires de sites affirment qu'ils ne peuvent pas se permettre d'empêcher l'intelligence artificielle de Google de résumer leur contenu.

En effet, l'outil de Google qui passe au crible le contenu des sites web pour trouver les réponses de l'IA est le même que celui qui garde trace des pages web pour les résultats de recherche, selon les éditeurs. Bloquer Google, propriété d'Alphabet Inc., de la même manière que les sites ont bloqué certains de ses concurrents en matière d'IA, entraverait également la capacité d'un site à être découvert en ligne.

La domination de Google dans le domaine de la recherche - qu'un tribunal fédéral a qualifié la semaine dernière de monopole illégal - lui confère un avantage décisif dans les guerres d'IA qui se préparent, ce que les startups de recherche et les éditeurs considèrent comme injuste alors que le secteur prend forme. Le dilemme est particulièrement prononcé pour les éditeurs, qui doivent choisir entre offrir leur contenu à des modèles d'IA qui pourraient rendre leurs sites obsolètes et disparaître de la recherche Google, une source importante de trafic.

« Il s'agit d'une crise existentielle pour ces entreprises », a déclaré Joe Ragazzo, éditeur du site d'information Talking Points Memo. « Ce sont deux mauvaises options. Vous abandonnez et vous mourez immédiatement, ou vous vous associez à eux et vous mourrez probablement lentement, car ils finiront par ne plus avoir besoin de vous non plus ».

Google a déclaré qu'AI Overview - les résumés affichés en haut de la page de recherche Google - s'inscrit dans le cadre de son engagement de longue date à fournir des informations de meilleure qualité et à renforcer les opportunités pour les éditeurs et autres entreprises. « Chaque jour, Google envoie des milliards de clics vers des sites à travers le web, et nous avons l'intention de poursuivre cet échange de valeur établi de longue date avec les sites web », a déclaré un porte-parole de Google dans un communiqué. « Grâce aux AI Overview, les internautes trouvent la recherche plus utile et y reviennent plus souvent, ce qui crée de nouvelles opportunités de découverte de contenu. »


La domination de Google dans la recherche

Depuis ses débuts, Google a déployé un logiciel connu sous le nom de Googlebot pour visiter ou « explorer » des millions de sites web, constituant ainsi un répertoire détaillé de l'internet mondial. Cet index a constitué une barrière à l'entrée décourageante pour les entreprises qui ont cherché à créer des moteurs de recherche rivaux au fil des ans, même pour celles qui avaient les poches pleines, comme Microsoft Corp.

L'essor de l'IA générative a déclenché une nouvelle vague de startups cherchant à proposer des produits de recherche dans lesquels des modèles d'IA fournissent des réponses succinctes aux questions des utilisateurs. La popularité des chatbots a semé la panique au sein de Google quant à l'avenir de son moteur de recherche, qui a longtemps semblé invincible. Mais avant que ces startups ne puissent réellement menacer les activités du géant de la recherche, elles doivent parcourir le web. Et ce n'est pas une mince affaire.

L'exploration coûte aux propriétaires de sites web de l'argent, de la puissance de calcul et de l'espace de stockage. C'est pourquoi de nombreux éditeurs incluent un fichier qui définit les règles applicables aux robots qui visitent leurs sites. Les entreprises qui bénéficient de la plus grande marge de manœuvre sont généralement Google et Bing de Microsoft, qui peuvent générer du trafic vers les sites grâce à leurs moteurs de recherche.

Mais les jeunes entreprises de recherche ne peuvent pas promettre un tel trafic avant d'avoir gagné de l'influence, ce qui est l'une des raisons pour lesquelles les jeunes entreprises ont commencé à conclure des accords pour payer les éditeurs afin d'obtenir des licences de contenu, a déclaré Alex Rosenberg, directeur général de Tako Inc, une jeune entreprise d'intelligence artificielle.

« Aujourd'hui, un certain nombre d'entreprises technologiques paient pour des contenus, elles paient pour y avoir accès parce qu'elles en ont besoin pour être en mesure de rivaliser sérieusement avec leurs concurrents », a déclaré Rosenberg. « Alors que Google n'a pas vraiment besoin de le faire ».

Au milieu d'une vague d'accords entre les entreprises de médias et les startups spécialisées dans l'IA, Google est resté à l'écart. À l'exception d'un accord de 60 millions de dollars avec Reddit Inc, Google a fait savoir aux éditeurs, à huis clos, qu'il n'était pas intéressé par des négociations, selon deux personnes au fait de la question, qui ont demandé à ne pas être identifiées en raison du caractère privé de l'information.

Les éditeurs s'inquiètent de l'impact de Google AI Overview

Les entreprises de médias n'ont que peu d'influence sur ces conversations. Au début de l'année, Google a mis en place des aperçus AI, dans lesquels l'entreprise utilise l'IA pour donner des réponses succinctes à certaines questions des utilisateurs en haut de la page de recherche. Les éditeurs se sont immédiatement inquiétés de l'impact que ces réponses pourraient avoir sur leur trafic, mais ils n'avaient aucun moyen clair de répondre à ces craintes.

Google utilise un moteur de recherche distinct pour certains produits d'intelligence artificielle, tels que son chatbot Gemini. Mais son robot principal, Googlebot, sert à la fois aux résumés produits par AI Overview et à la recherche Google. Un porte-parole de l'entreprise a déclaré que Googlebot régit AI Overview parce que l'IA et le moteur de recherche de l'entreprise sont profondément liés. Le porte-parole a ajouté que sa page de résultats de recherche affiche des informations dans une variété de formats, y compris des images et des graphiques. Google a également indiqué que les éditeurs pouvaient empêcher des pages ou des parties de pages spécifiques d'apparaître dans les résumés générés par IA des résultats de recherche, mais que cela empêcherait également ces extraits d'apparaître dans toutes les autres fonctions de recherche de Google, y compris les listes de liens web.

De nombreux éditeurs, qui dépendent souvent des moteurs de recherche pour au moins la moitié de leur trafic, ne sont pas prêts à prendre le risque de réduire leur portée.

La position de Google « sous-estime le risque important que cela représente pour les créateurs de contenu, en particulier ceux qui dépendent de la visibilité de la recherche pour gagner leur vie », a déclaré Marc McCollum, responsable de l'innovation chez Raptive, qui représente les éditeurs et les influenceurs. « En se retirant, les créateurs risquent de réduire involontairement leur présence globale dans les moteurs de recherche, ce qui pourrait nuire à leur capacité à atteindre le public et à générer des revenus. »

Kyle Wiens, le PDG d'iFixit, un site web qui publie des guides de réparation en ligne gratuits pour l'électronique grand public, a déclaré que la relation du site avec Google est « beaucoup plus ténue » qu'avec d'autres entreprises d'IA. « Je peux empêcher ClaudeBot de nous indexer sans nuire à notre activité », a écrit Wiens dans un courriel, en faisant référence au bot de la startup d'IA générative Anthropic. « Mais si je bloque Googlebot, nous perdons du trafic et des clients ».


Les petites entreprises ne sont pas les seules à se battre

OpenAI a récemment lancé SearchGPT, une version test de son chatbot très populaire, conçue pour la recherche. Pourtant, des sites web populaires tels qu'Amazon, Goodreads et Uniqlo ont bloqué le crawler GPT sur leurs sites, selon une documentation publique, ce qui pourrait nuire aux ambitions d'OpenAI dans le domaine de la recherche. OpenAI a déclaré que les sites pouvaient apparaître dans ses résultats de recherche même s'ils choisissaient d'exclure leur contenu de l'entraînement à l'IA.

Un index détaillé du web est un enjeu de taille pour un moteur de recherche, afin d'offrir aux utilisateurs une vue détaillée du contenu de l'internet. Cependant, pour les entreprises qui cherchent à répondre directement aux questions des utilisateurs à l'aide de l'IA, un modèle popularisé par ChatGPT, les données revêtent une autre importance, a déclaré Vladimir Prelovac, fondateur de Kagi, une startup de recherche.

« Les modèles d'IA générative ne sont pas très intelligents en soi », a déclaré Prelovac. « Pour obtenir des résultats d'IA générative de haute qualité, il faut avoir accès à ce même index de recherche.

Le moteur de recherche DuckDuckGo a déclaré que les changements technologiques en cours dans le domaine de la recherche rendent « l'index de Google lié aux préoccupations antitrust encore plus problématique ».

Neeva, une startup de recherche fondée par d'anciens Googlers et rachetée par Snowflake Inc. l'année dernière, a plaidé en faveur de la « neutralité du crawl » afin de permettre aux startups de développer plus facilement leurs index de recherche

Pour Wiens, PDG d'iFixit, l'avantage que Google possède sur les autres entreprises d'IA grâce à son empire de la recherche est au cœur des problèmes antitrust de l'entreprise. « Séparer le moteur de recherche de Google de son travail sur l'intelligence artificielle permettrait de déconflictualiser les choses », a-t-il déclaré.

Source : NYT

Et vous ?

Quelle est votre opinion sur l’utilisation de l’IA pour générer des résumés de contenu ? Pensez-vous que cela améliore l’expérience de recherche ou que cela nuit aux sites d’origine ?
Comment les éditeurs devraient-ils réagir face à cette situation ? Devraient-ils partager leurs données avec Google ou chercher des alternatives ?
Quelles sont les implications pour la concurrence et l’équité dans le domaine de l’IA ? Comment pouvons-nous garantir que les petits éditeurs ne soient pas désavantagés ?

Une erreur dans cette actualité ? Signalez-nous-la !

Avatar de Anselme45
Membre extrêmement actif https://www.developpez.com
Le 21/08/2024 à 9:40
partager leurs données ou mourir
c'est faux!

La réalité est "PAYER ou mourir"

Google a introduit une nouvelle pratique: "Ne pas référencer toutes les pages des sites internet"... Vous pouvez passer par les "Webmaster tools" de Google et demander à ce que vos pages soient référencées et elles ne le seront jamais!!!

Et on ne parle pas de sites "de cul" mais bien de sites d'entreprises tout ce qu'il y a de plus sérieuses!!!

Et donc???

Tu veux avoir des visiteurs sur ton site pro? Ben, tu te paies des pub chez... Google!!!
1  1 
Avatar de Bigb
Membre averti https://www.developpez.com
Le 28/08/2024 à 18:44
Il manque une facette du problème : l'intégration de l'IA dans Google fait baisser les revenus publicitaires de Google, et donc ils n'ont aucune envie de déployer massivement cet outil.
Ils observent si des moteurs de recherche IA arrivent à se développer et les concurrencer. Dans le cas contraire ils garderont des résultats de recherche brouillons ou les publicités sont très difficilement reconnaissables...
0  0