OpenAI lance SearchGPT, un prototype de moteur de recherche propulsé par l'IA, pour défier le monopole de Google,

Mais le produit est sujet aux hallucinations et suscite de nombreuses autres préoccupations

Le 26 juillet 2024 à 15:01, par Mathis Lucas

65PARTAGES

OpenAI lance SearchGPT, un prototype de moteur de recherche propulsé par l'IA, pour défier le monopole de Google
mais le produit est sujet aux hallucinations et suscite de nombreuses autres préoccupations

OpenAI teste une nouvelle plateforme de recherche expérimentale appelée SearchGPT. Il s'agit d'un prototype de moteur de recherche propulsé par l'IA qui vise à fournir aux utilisateurs des réponses rapides et précises provenant du Web. SearchGPT remet directement en question la domination de Google sur le marché de la recherche en ligne. Google détient environ 90 % du marché de la recherche. Le produit vise également à concurrencer des startups comme Perplexity AI, mais il suscite des craintes quant à son impact potentiel sur l'état du Web. SearchGPT pourrait favoriser la diffusion de spams sur le Web, contribuant ainsi le dégrader davantage.

SearchGPT : OpenAI défie la domination de Google sur le marché de la recherche

OpenAI tente de rivaliser avec Google sur un autre front après avoir pris le lead dans la course à l'IA. Le nouveau produit SearchGPT d'OpenAI donne une idée de la vision de l'entreprise sur l'avenir de la recherche en ligne. Le lancement de ChatGPT a déclenché une alerte rouge chez Google, car pour la première fois, le géant technologique faisait face à une menace crédible dirigée contre son monopole sur le marché de la recherche en ligne. Certains analystes considèrent SearchGPT comme un changement technologique capable de bouleverser l'activité et permettre à OpenAI de grignoter des parts de marché à Google.

Le moteur de recherche de SearchGPT d'OpenAI vise à fournir des réponses rapides et opportunes avec des sources claires et pertinentes, présentant des réponses en temps réel et à jour. Bien qu'il ne s'agisse pour l'instant que d'un prototype accessible à 10 000 utilisateurs, il est clair que la bataille autour de la recherche basée sur l'IA est lancée. Le service est piloté par la famille de modèles GPT-4. OpenAI a aussi annoncé qu'il travaille avec des partenaires tiers et utilise des flux de contenus directs pour élaborer ses résultats de recherche. Le but est d'intégrer à terme les fonctions de recherche directement dans ChatGPT.

ChatGPT (et Microsoft Copilot) peut déjà effectuer des recherches sur le Web à l'aide de Bing, mais SearchGPT semble être l'interface conçue par OpenAI pour la recherche Web assistée par l'IA. SearchGPT tente de rationaliser le processus de recherche d'informations en ligne en combinant les modèles d'IA d'OpenAI (y compris GPT-4o) avec des données Web en temps réel. À l'instar de ChatGPT, les utilisateurs peuvent poser des questions complémentaires à SearchGPT, le modèle conservant le contexte tout au long de la conversation. SearchGPT s'ouvre sur une zone de texte qui demande à l'utilisateur "Que cherchez-vous ?".

Selon OpenAI, SearchGPT comprend des fonctions qui attribuent une place importante aux sources basées sur le Web, ce qui est peut-être le plus important du point de vue de l'exactitude. Les réponses comprennent des citations et des liens en ligne, tandis qu'une barre latérale affiche des liens supplémentaires vers les sources. Toutefois, l'entreprise n'a pas encore indiqué comment elle obtient ses données Web en temps réel et si elle s'associe à un fournisseur de moteur de recherche existant (comme il le fait actuellement avec Bing pour ChatGPT) ou si elle construit son propre système d'exploration et d'indexation du Web.

C'est le début de ce qui pourrait devenir une menace significative pour Google. Signe de l'importance des enjeux dans la guerre des moteurs de recherche, l'action de Google a dégringolé jeudi après-midi quelques minutes après l'incursion très attendue d'OpenAI dans le domaine de la recherche. Les actions de Google ont terminé la journée en baisse de 3 %, à 169,16 dollars. Mais le potentiel de SearchGPT à faire de l'ombre à Google suscite le scepticisme.

SearchGPT soulève de nombreuses préoccupations en matière de droit d'auteur

Les entreprises d'IA comme Google, OpenAI et Microsoft sont confrontées à de nombreuses plaintes pour violation de droit d'auteur. Les procédures sont en cours et toute l'industrie attend avec impatience les décisions des tribunaux. En attendant, OpenAI semble avoir pris note du retour de bâton et affirme adopter une approche nettement différente. Dans un billet de blogue, OpenAI souligne que SearchGPT a été développé en collaboration avec divers partenaires de l'information, dont des organisations telles que les propriétaires du Wall Street Journal, l'Associated Press et Vox Media. Mais le défi n'est pas pour autant résolu.

« Les partenaires de l'information nous ont fait part de leurs commentaires précieux et nous continuons à leur demander leur avis », a expliqué Kayla Wood, porte-parole d'OpenAI. Les éditeurs auront la possibilité de gérer la façon dont ils apparaissent dans SearchGPT. Ils pourront refuser que leur contenu soit utilisé pour entraîner les modèles d'OpenAI et qu'il apparaisse quand même dans les fonctions de recherche. « SearchGPT est conçu pour aider les utilisateurs à entrer en contact avec les éditeurs en les citant de manière visible et en créant des liens vers eux dans les recherches », indique le billet de blogue d'OpenAI.

OpenAI a ajouté : « les réponses comportent des attributions et des liens clairs, en ligne, afin que les utilisateurs sachent d'où vient l'information et puissent rapidement s'engager avec encore plus de résultats dans une barre latérale avec des liens de source ». Malgré ses efforts, OpenAI pourrait être confronté aux mêmes défis que la startup Perplexity AI, qui propose également un moteur de recherche basé sur l'IA. SearchGPT pourrait se tromper dans les attributions ou copier en bloc des articles des éditeurs, ce qui pourrait constituer un problème. Perplexity AI fait face à de nombreuses plaintes portant sur ces points.

Plusieurs rapports allèguent que Perplexity AI se livrerait à vol cynique de toute information publiée en ligne et les administrateurs de sites Web ne semblent avoir aucun moyen d'empêcher cela à l'heure actuelle. Un développeur a découvert que Perplexity AI ignore les instructions du fichier robots.txt, qui contrôle les robots d'indexation (crawlers), et accède aux sites Web pour extraire des informations, même lorsque les administrateurs interdisent l'accès à l'agent utilisateur de l'entreprise. Forbes a également accusé Perplexity AI de voler les articles de presse des médias et de les partager sans nommer clairement ses sources.

Le PDG de Perplexity AI, Arvind Srinivas, a répondu à l'accusation de Forbes en déclarant que la nouvelle fonctionnalité de son service avait des contours irréguliers et que l'entreprise l'améliora avec davantage de retours d'information. Outre Forbes, l'éditeur de magazines Conde Nast a envoyé une lettre de cessation et d'abstention à Perplexity. Mais comme cela a été largement rapporté, depuis des mois, OpenAI a essayé de jouer gentiment avec certaines entreprises de médias en accordant des licences pour les résultats de recherche et pour alimenter leur contenu dans ChatGPT, au lieu de le racler sans permission.

Nicholas Thompson, PDG de The Atlantic, est cité dans le billet de blogue d'OpenAI sur la première de SearchGPT jeudi comme louant l'arrangement. « La recherche basée sur l'IA va devenir l'un des principaux moyens utilisés par les internautes pour naviguer sur Internet, et il est crucial, en ces premiers jours, que la technologie soit construite d'une manière qui valorise, respecte et protège le journalisme et les éditeurs », a-t-il déclaré.

SearchGPT est sujet aux hallucinations et pourrait contribuer à dégrader le Web

Après le lancement de ChatGPT, Google a réagi en lançant rapidement un concurrent appelé Bard, rebaptisé par la suite Gemini. Google a ensuite utilisé les réponses de Gemini pour compléter ses liens de recherche dans le cadre d'une fonctionnalité appelée "AI Overview". Mais ces soi-disant aperçus de l'IA ont été si largement critiqués pour leurs "hallucinations" ou leurs réponses incorrectes ou bizarres que Google a réduit la fréquence de leur apparition, qui est passée de 84 % des requêtes à moins de 15 % en juin. (Par exemple, dans une réponse, l'IA a suggéré à un utilisateur de mettre de la colle sur une pizza.)

Selon les experts, les hallucinations peuvent être causées par divers facteurs, notamment des données d'entraînement insuffisantes, des hypothèses incorrectes formulées par le modèle ou des biais dans les données utilisées pour former le modèle. Les hallucinations de l'IA peuvent constituer un problème pour les systèmes d'IA utilisés pour prendre des décisions importantes, comme les diagnostics médicaux ou les transactions financières. Selon certains critiques, nous nous dirigeons vers un Internet bourré de pépins, de spams et d'escroqueries. Les hallucinations pourraient contribuer à dégrader davantage l'état du Web.

« Nous y sommes déjà. Mais à l'avenir, cela va être bien pire. En quelques minutes, on peut inonder le Web avec un nombre illimité d'articles, de posts ou de tweets. Les politiciens s'en serviront, les lobbies s'en serviront, les entreprises s'en serviront. Le pouvoir, l'influence et l'argent. Les entreprises exacerbent ce processus en faisant preuve d'une incroyable myopie et en traitant les ressources humaines comme des déchets absolus », a écrit un critique.

Ces craintes sont renforcées par les produits basés sur l'IA comme SearchGPT, Perplexity AI et AI Overviews. Pour l'instant, les hallucinations, ainsi que les erreurs générales de planification et de raisonnement, restent un problème critique non résolu dans l'IA générative. Plusieurs experts, dont Abeba Birhane, conseillère principale en matière de responsabilité de l'IA chez Mozilla, ont clairement indiqué qu'il n'existait peut-être pas de moyen fiable de se débarrasser complètement des "hallucinations" de l'IA. En outre, la raréfaction des sources de données pour la formation de l'IA pourrait contribuer à aggraver le problème.

Un nombre croissant d'utilisateurs se plaignent de la dégradation continue de la qualité des résultats des moteurs de recherche. Des chercheurs allemands se sont penchés sur la question dans le cadre d'une étude publiée au début de l'année et leur rapport semble donner raison aux utilisateurs. Elle rapporte que la qualité des résultats de Google et de ses rivaux est en déclin et que les choses ne feront probablement qu'empirer avec l'avènement de l'IA générative.

L'IA est un gouffre financier et la recherche basée sur l'IA consomme beaucoup d'énergie

Les progrès rapides d'OpenAI ont permis à ChatGPT de gagner des millions d'utilisateurs, mais les coûts de l'entreprise s'accumulent. The Information a rapporté cette semaine que les coûts de formation et d'inférence de l'IA chez OpenAI pourraient atteindre 7 milliards de dollars cette année, les millions d'utilisateurs de la version gratuite de ChatGPT ne faisant qu'augmenter les coûts de calcul. SearchGPT sera gratuit lors de son lancement initial, et selon les analystes, comme ce nouveau service semble ne pas avoir de publicité pour le moment, il est clair que l'entreprise devra bientôt trouver une solution de monétisation.

Selon le rapport de The Information, les dépenses d'OpenAI dépassent de loin celles de ses rivaux, comme Anthropic, soutenu par Amazon, qui prévoit un taux d'absorption de 2,7 milliards de dollars en 2024. Les dépenses élevées d'OpenAI pourraient obliger l'entreprise à conclure un nouveau cycle de financement dans les 12 mois pour renforcer son bilan. Selon les données de Tracxn, OpenAI a déjà réalisé sept tours de financement, levant plus de 11 milliards de dollars, le plus récent étant un tour privé avec ARK Investment Management en avril pour une somme non divulguée. Mais ce n'est pas tout.

Le rapport indique également qu'OpenAI gère une entreprise coûteuse qui pourrait perdre jusqu'à 5 milliards de dollars en 2024, ce qui mettrait le fabricant de ChatGPT à court de liquidités dans les 12 mois à venir. Alors qu'OpenAI est considéré par beaucoup comme le leader en matière d'IA, l'écart avec la concurrence ne cesse de se réduire. Pourtant, ses besoins en matière de financement sont loin de diminuer, les entrées ne couvrant vraisemblablement pas tous ses besoins.

Aussi, Gary Marcus, le fondateur et directeur général de Geometric Intelligence (racheté par Uber), estime que, vu le contexte, les investisseurs devraient se poser les questions suivantes : Quel est leur plus-value ? Une technologie unique ? Quel est leur chemin vers la rentabilité alors que Meta offre gratuitement des technologies similaires ? Ont-ils une « killer app » ? La technologie sera-t-elle un jour fiable ? Qu'est-ce qui est réel et qu'est-ce qui n'est qu'une démo ?

Par ailleurs, une étude a souligné que les résumés de recherche fournis par l'IA consomment 10 fois plus d'énergie qu'une recherche normale sur Google. Selon Alex de Vries, fondateur de Digiconomist, chaque fois que vous effectuez une recherche comme « combien de cailloux dois-je manger » et que l'IA de Google vous répond « au moins un petit caillou par jour », vous consommez environ trois wattheures d'électricité. C'est dix fois la consommation d'énergie d'une recherche traditionnelle sur Google et à peu près l'équivalent de la quantité d'énergie utilisée pour parler pendant une heure sur un téléphone fixe.

La situation est telle que l’intelligence artificielle entraîne la surcharge des réseaux électriques et fait craindre une pénurie. L'intelligence artificielle est un énorme gouffre à électricité. Aux États-Unis, les analystes rapportent que les réseaux électriques atteignent peu à peu leur limite.

Source : OpenAI

Et vous ?

Quel est votre avis sur le sujet ?

Que pensez-vous du moteur de recherche SearchGPT d'OpenAI ?

SearchGPT peut-il faire de l'ombre au moteur de recherche de Google ?

La recherche basée sur l'IA est-elle une alternative viable malgré les hallucinations de l'IA ?

Voir aussi

Mark Zuckerberg imagine un avenir où les créateurs de contenu créent des clones d'eux-mêmes à l'aide de l'IA, alors que la faible qualité du contenu généré par l'IA contribue à la dégradation de l'état du Web

Les résumés de recherche fournis par l'IA consomment 10 fois plus d'énergie qu'une recherche normale sur Google, d'après des rapports : sauvons la planète en désactivant l'IA dans Google Search

OpenAI pourrait perdre 5 milliards de dollars cette année et se retrouver à court de liquidités dans 12 mois, selon un rapport qui évoque ses dépenses colossales en formation des modèles d'IA et en rémunération

Vous avez lu gratuitement 344 articles depuis plus d'un an.
Soutenez le club developpez.com en souscrivant un abonnement pour que nous puissions continuer à vous proposer des publications.

Une erreur dans cette actualité ? Signalez-nous-la !

Votre nom : Votre e-mail :

Décrivez l'erreur que vous souhaitez porter à notre connaissance :

Identifiez-vous

Créer un compte

OpenAI lance SearchGPT, un prototype de moteur de recherche propulsé par l'IA, pour défier le monopole de Google,

Mais le produit est sujet aux hallucinations et suscite de nombreuses autres préoccupations

Identifiant
Mot de passe

Mot de passe oublié ?

Identifiez-vous

Créer un compte

OpenAI lance SearchGPT, un prototype de moteur de recherche propulsé par l'IA, pour défier le monopole de Google, Mais le produit est sujet aux hallucinations et suscite de nombreuses autres préoccupations

OpenAI lance SearchGPT, un prototype de moteur de recherche propulsé par l'IA, pour défier le monopole de Google,

Mais le produit est sujet aux hallucinations et suscite de nombreuses autres préoccupations