
SearchGPT : OpenAI défie la domination de Google sur le marché de la recherche
OpenAI tente de rivaliser avec Google sur un autre front après avoir pris le lead dans la course à l'IA. Le nouveau produit SearchGPT d'OpenAI donne une idée de la vision de l'entreprise sur l'avenir de la recherche en ligne. Le lancement de ChatGPT a déclenché une alerte rouge chez Google, car pour la première fois, le géant technologique faisait face à une menace crédible dirigée contre son monopole sur le marché de la recherche en ligne. Certains analystes considèrent SearchGPT comme un changement technologique capable de bouleverser l'activité et permettre à OpenAI de grignoter des parts de marché à Google.
Le moteur de recherche de SearchGPT d'OpenAI vise à fournir des réponses rapides et opportunes avec des sources claires et pertinentes, présentant des réponses en temps réel et à jour. Bien qu'il ne s'agisse pour l'instant que d'un prototype accessible à 10 000 utilisateurs, il est clair que la bataille autour de la recherche basée sur l'IA est lancée. Le service est piloté par la famille de modèles GPT-4. OpenAI a aussi annoncé qu'il travaille avec des partenaires tiers et utilise des flux de contenus directs pour élaborer ses résultats de recherche. Le but est d'intégrer à terme les fonctions de recherche directement dans ChatGPT.
ChatGPT (et Microsoft Copilot) peut déjà effectuer des recherches sur le Web à l'aide de Bing, mais SearchGPT semble être l'interface conçue par OpenAI pour la recherche Web assistée par l'IA. SearchGPT tente de rationaliser le processus de recherche d'informations en ligne en combinant les modèles d'IA d'OpenAI (y compris GPT-4o) avec des données Web en temps réel. À l'instar de ChatGPT, les utilisateurs peuvent poser des questions complémentaires à SearchGPT, le modèle conservant le contexte tout au long de la conversation. SearchGPT s'ouvre sur une zone de texte qui demande à l'utilisateur "Que cherchez-vous ?".
Selon OpenAI, SearchGPT comprend des fonctions qui attribuent une place importante aux sources basées sur le Web, ce qui est peut-être le plus important du point de vue de l'exactitude. Les réponses comprennent des citations et des liens en ligne, tandis qu'une barre latérale affiche des liens supplémentaires vers les sources. Toutefois, l'entreprise n'a pas encore indiqué comment elle obtient ses données Web en temps réel et si elle s'associe à un fournisseur de moteur de recherche existant (comme il le fait actuellement avec Bing pour ChatGPT) ou si elle construit son propre système d'exploration et d'indexation du Web.
C'est le début de ce qui pourrait devenir une menace significative pour Google. Signe de l'importance des enjeux dans la guerre des moteurs de recherche, l'action de Google a dégringolé jeudi après-midi quelques minutes après l'incursion très attendue d'OpenAI dans le domaine de la recherche. Les actions de Google ont terminé la journée en baisse de 3 %, à 169,16 dollars. Mais le potentiel de SearchGPT à faire de l'ombre à Google suscite le scepticisme.
SearchGPT soulève de nombreuses préoccupations en matière de droit d'auteur
Les entreprises d'IA comme Google, OpenAI et Microsoft sont confrontées à de nombreuses plaintes pour violation de droit d'auteur. Les procédures sont en cours et toute l'industrie attend avec impatience les décisions des tribunaux. En attendant, OpenAI semble avoir pris note du retour de bâton et affirme adopter une approche nettement différente. Dans un billet de blogue, OpenAI souligne que SearchGPT a été développé en collaboration avec divers partenaires de l'information, dont des organisations telles que les propriétaires du Wall Street Journal, l'Associated Press et Vox Media. Mais le défi n'est pas pour autant résolu.
« Les partenaires de l'information nous ont fait part de leurs commentaires précieux et nous continuons à leur demander leur avis », a expliqué Kayla Wood, porte-parole d'OpenAI. Les éditeurs auront la possibilité de gérer la façon dont ils apparaissent dans SearchGPT. Ils pourront refuser que leur contenu soit utilisé pour entraîner les modèles d'OpenAI et qu'il apparaisse quand même dans les fonctions de recherche. « SearchGPT est conçu pour aider les utilisateurs à entrer en contact avec les éditeurs en les citant de manière visible et en créant des liens vers eux dans les recherches », indique le billet de blogue d'OpenAI.
OpenAI a ajouté : « les réponses comportent des attributions et des liens clairs, en ligne, afin que les utilisateurs sachent d'où vient l'information et puissent rapidement s'engager avec encore plus de résultats dans une barre latérale avec des liens de source ». Malgré ses efforts, OpenAI pourrait être confronté aux mêmes défis que la startup Perplexity AI, qui propose également un moteur de recherche basé sur l'IA. SearchGPT pourrait se tromper dans les attributions ou copier en bloc des articles des éditeurs, ce qui pourrait constituer un problème. Perplexity AI fait face à de nombreuses plaintes portant sur ces points.
Plusieurs rapports allèguent que Perplexity AI se livrerait à vol cynique de toute information publiée en ligne et les administrateurs de sites Web ne semblent avoir aucun moyen d'empêcher cela à l'heure actuelle. Un développeur a découvert que Perplexity AI ignore les instructions du fichier robots.txt, qui contrôle les robots d'indexation (crawlers), et accède aux sites Web pour extraire des informations, même lorsque les administrateurs interdisent l'accès à l'agent utilisateur de l'entreprise. Forbes a également accusé Perplexity AI de voler les articles de presse des médias et de les partager sans nommer clairement ses sources.
Le PDG de Perplexity AI, Arvind Srinivas, a répondu à l'accusation de Forbes en déclarant que la nouvelle fonctionnalité de son service avait des contours irréguliers et que l'entreprise l'améliora avec davantage de retours d'information. Outre Forbes, l'éditeur de magazines Conde Nast a envoyé une lettre de cessation et d'abstention à Perplexity. Mais comme cela a été largement rapporté, depuis des mois, OpenAI a essayé de jouer gentiment avec certaines entreprises de médias en accordant des licences pour les résultats de recherche et pour alimenter leur contenu dans ChatGPT, au lieu de le racler sans permission.
Nicholas Thompson, PDG de The Atlantic, est cité dans le billet de blogue d'OpenAI sur la première de SearchGPT jeudi comme louant l'arrangement. « La recherche basée sur l'IA va devenir l'un des principaux moyens utilisés par les internautes pour naviguer sur Internet, et il est crucial, en ces premiers jours, que la technologie soit construite d'une manière qui valorise, respecte et protège le journalisme et les éditeurs », a-t-il déclaré.
SearchGPT est sujet aux hallucinations et pourrait contribuer à dégrader le Web
Après le lancement de ChatGPT, Google a réagi en lançant rapidement un concurrent appelé Bard, rebaptisé par la suite Gemini. Google a ensuite utilisé les réponses de Gemini pour compléter ses liens de recherche dans le cadre d'une fonctionnalité appelée "AI Overview". Mais ces soi-disant aperçus de l'IA ont été si largement critiqués pour leurs "hallucinations" ou leurs réponses incorrectes ou bizarres que Google a réduit la fréquence de leur apparition, qui est passée de 84 % des requêtes à moins de 15 % en juin. (Par exemple, dans une réponse, l'IA a suggéré à un utilisateur de mettre de la colle sur une pizza.)
Selon les experts, les hallucinations peuvent être causées par divers facteurs, notamment des données d'entraînement insuffisantes, des hypothèses incorrectes formulées par le modèle ou des biais dans les données utilisées pour former le modèle. Les hallucinations de l'IA peuvent constituer un problème pour les systèmes d'IA utilisés pour prendre des décisions importantes, comme les diagnostics médicaux ou les transactions financières. Selon certains critiques, nous nous dirigeons vers un Internet bourré de pépins, de spams et d'escroqueries. Les hallucinations pourraient contribuer à dégrader davantage l'état du Web.
« Nous y sommes déjà. Mais à l'avenir, cela va être bien pire. En quelques minutes, on peut inonder le Web avec un nombre illimité d'articles, de posts ou de tweets. Les politiciens s'en serviront, les lobbies s'en serviront, les entreprises s'en serviront. Le pouvoir, l'influence et l'argent. Les entreprises exacerbent ce processus en faisant preuve d'une incroyable myopie et en traitant les ressources humaines comme des déchets absolus », a écrit un critique.
Ces craintes sont renforcées par les produits basés sur l'IA comme SearchGPT, Perplexity AI et AI Overviews. Pour l'instant, les hallucinations, ainsi que les erreurs générales de planification et de raisonnement, restent un problème critique non résolu dans l'IA générative. Plusieurs experts, dont Abeba Birhane, conseillère principale en matière de responsabilité de l'IA chez Mozilla, ont clairement indiqué qu'il n'existait peut-être pas de moyen fiable de se débarrasser complètement des "hallucinations" de l'IA. En outre, la raréfaction des sources de données pour la formation de l'IA pourrait contribuer à aggraver le problème.
Un nombre croissant d'utilisateurs se plaignent de la dégradation continue de la qualité des résultats des moteurs de recherche. Des chercheurs allemands se sont penchés sur la question dans le cadre d'une étude publiée au début de l'année et leur rapport semble donner raison aux utilisateurs. Elle rapporte que la qualité des résultats de Google et de ses rivaux est en déclin et que les choses ne feront probablement qu'empirer avec l'avènement de l'IA générative.
[B][SIZE=3]L'IA est un gouffre[/size=3]...
La fin de cet article est réservée aux abonnés. Soutenez le Club Developpez.com en prenant un abonnement pour que nous puissions continuer à vous proposer des publications.