IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)

Vous êtes nouveau sur Developpez.com ? Créez votre compte ou connectez-vous afin de pouvoir participer !

Vous devez avoir un compte Developpez.com et être connecté pour pouvoir participer aux discussions.

Vous n'avez pas encore de compte Developpez.com ? Créez-en un en quelques instants, c'est entièrement gratuit !

Si vous disposez déjà d'un compte et qu'il est bien activé, connectez-vous à l'aide du formulaire ci-dessous.

Identifiez-vous
Identifiant
Mot de passe
Mot de passe oublié ?
Créer un compte

L'inscription est gratuite et ne vous prendra que quelques instants !

Je m'inscris !

Google surpris en train d'indexer publiquement les conversations des utilisateurs avec Bard AI dans les résultats de recherches
L'entreprise assure qu'elle travaille sur une solution

Le , par Stéphane le calme

0PARTAGES

10  0 
Google Bard, le produit d’intelligence artificielle conversationnelle du géant de la recherche, a subi une grande mise à jour la semaine dernière qui a suscité des critiques mitigées. Mais cette semaine, une autre fonctionnalité plus ancienne de Bard fait l’objet d’un examen attentif : le consultant SEO Gagan Ghotra a observé que Google Search avait commencé à indexer les liens de partage de conversation de Bard dans ses pages de résultats de recherche, exposant potentiellement des informations que les utilisateurs voulaient garder confidentielles ou privées.

Google Bard est un chatbot qui utilise un modèle de langage génératif pour converser avec les utilisateurs sur différents sujets. Il peut répondre à des questions, raconter des histoires, écrire des poèmes, créer des images et plus encore. Il a été disponible fin 2022 aux États-Unis, avec une liste d’attente limitée. Depuis lors, il a attiré l’attention de nombreux utilisateurs curieux et enthousiastes, mais aussi de certains critiques et régulateurs. Certains ont souligné les risques potentiels de l’IA générative, comme la diffusion de fausses informations, la violation de la vie privée, la manipulation ou le plagiat. D’autres ont remis en question la qualité et la fiabilité des réponses de Bard, qui peuvent être incohérentes, imprécises ou offensantes. Google a répondu à ces préoccupations en affirmant que Bard est un projet expérimental et non un produit fini, et qu’il suit ses principes en matière d’IA, qui visent à assurer le respect des personnes, la justice sociale, la sécurité et la responsabilité.

En mai, Google a annoncé sa disponibilité générale dans plus de 180 pays, hormis les pays de l'UE et le Canada. Ce n'est qu'en juillet qu'il a enfin été lancé en Europe et prenait désormais en charge plus de 40 langues.


Google a commencé à indexer les liens de partage de conversation de Bard dans ses pages de résultats de recherche

Cela signifie que si une personne utilisait Bard pour lui poser une question, puis partageait le lien avec un tiers désigné, par exemple son conjoint, son ami ou son partenaire commercial, la conversation accessible à ce lien pouvait à son tour être récupérée par le robot d’indexation de Google et apparaître publiquement, au vu et au su de tout le monde, dans ses résultats de recherche. Sur X (anciennement Twitter), Ghotra a posté une capture d’écran montrant plusieurs conversations de Bard indexées par Google Search.


Le chercheur scientifique de Google Brain, Peter J. Liu, a répondu à Ghotra sur X en notant que l’indexation de Google Search ne concernait que les conversations que les utilisateurs avaient choisi de partager, et non toutes les conversations de Bard. Ce à quoi Ghotra a rétorqué : « La plupart des utilisateurs ne seraient pas conscients du fait que le partage de conversation signifie qu’elle serait indexée par Google et qu’elle apparaîtrait dans les SERP, la plupart des gens, même moi, pensaient qu’il s’agissait d’une fonctionnalité pour partager la conversation avec un ami ou un collègue et qu’elle ne serait visible que par les personnes qui ont l’URL de la conversation ».

Finalement, le compte Google SearchLiaison de Google sur X, qui fournit des « informations sur le fonctionnement de la recherche Google », a écrit à Ghotra pour dire « Bard permet aux gens de partager des chats, s’ils le souhaitent. Nous n’avons pas non plus l’intention que ces chats partagés soient indexés par la recherche Google. Nous travaillons à les empêcher d’être indexés maintenant ». Un porte-parole de Google a réitéré les commentaires du compte SearchLiaison, précisant que les conversations partagées de Bard ne sont pas disponibles avec les nouvelles intégrations de Google Bard avec Gmail, Google Docs et Google Drive.

Même si Google dit qu’il travaille sur une solution, l’erreur ne fait pas du bien à l'image de Bard ou des ambitions de Google en matière d’IA grand public, surtout face à la concurrence intense d’autres chatbots IA rivaux comme ChatGPT d’OpenAI, qui est très populaire. Les utilisateurs de Bard ont toujours été invités à ne pas partager d’informations sensibles avec les chatbots IA, mais la visibilité publique de ces conversations renforce l’urgence de ce conseil.

Des inquiétudes naissantes

L’incident soulève également des questions sur la façon dont Google gère les données des utilisateurs de Bard, et s’il existe des garanties suffisantes pour protéger leur vie privée et leur sécurité. Selon la politique de confidentialité de Google, Bard « collecte et stocke les données que vous fournissez lorsque vous utilisez le service, y compris les données que vous saisissez, les données que vous générez et les données que vous partagez ». Google affirme également qu’il utilise ces données pour « améliorer le service, développer de nouvelles fonctionnalités et produits, et personnaliser le service pour vous ». Cependant, il n’est pas clair si Google partage ces données avec des tiers, ou s’il les utilise à des fins publicitaires ou commerciales.

Certains utilisateurs de Bard se sont plaints que le service leur a montré des publicités ciblées en fonction de leurs conversations, ce qui suggère que Google analyse le contenu de leurs chats pour leur proposer des produits ou des services pertinents. Par exemple, un utilisateur a rapporté sur X qu’après avoir discuté avec Bard de son intérêt pour les jeux vidéo, il a commencé à voir des publicités pour des consoles de jeux et des jeux en ligne. Un autre utilisateur a déclaré sur X qu’après avoir demandé à Bard de l’aider à rédiger un essai sur le changement climatique, il a reçu des publicités pour des organisations environnementales et des produits écologiques.

Google n’a pas confirmé ni nié qu’il utilise les données de Bard à des fins publicitaires, mais il a déclaré dans sa politique de confidentialité qu’il peut « afficher des publicités personnalisées pour vous en fonction de vos intérêts et de votre activité sur le service et sur d’autres sites et applications Google ». Google affirme également qu’il respecte les paramètres de confidentialité des utilisateurs, et qu’il leur permet de contrôler les types de publicités qu’ils voient et de désactiver la personnalisation des publicités.

Quoi qu’il en soit, les utilisateurs de Bard devraient être conscients des risques potentiels liés à l’utilisation d’un service d’IA conversationnelle qui peut accéder, stocker et analyser leurs données personnelles. Ils devraient également être prudents lorsqu’ils partagent des liens de conversation avec d’autres personnes, car ils pourraient involontairement exposer leurs informations à des moteurs de recherche ou à des tiers malveillants. Google Bard est un outil puissant et divertissant, mais il n’est pas sans failles ni dangers.

Une plainte a dénoncé le pillage des données pour entraîner son chatbot

Le cabinet Clarkson Law Firm a déposé une plainte devant le tribunal fédéral du district nord de Californie en juillet affirmant que Google a « volé secrètement tout ce qui a été créé et partagé sur internet par des centaines de millions d’Américains », y compris leurs œuvres créatives et protégées par le droit d’auteur, leurs photographies et même leurs emails.

« Depuis des années, Google récolte ces données en secret, sans prévenir ni demander l’autorisation à quiconque », indique la plainte. Elle ajoute que Google a également pris des données provenant de sites web payants ou de sites connus pour héberger des collections illégales de livres et d’œuvres créatives.

La plainte fait référence à une mise à jour de la politique de confidentialité de Google datant du 1er juillet, qui stipule que la société peut collecter des informations « publiquement disponibles en ligne » pour entraîner ses modèles d’IA et créer des produits comme Google Translate, Bard ou ses capacités d’IA dans le cloud.

Ci-dessous, un extrait de la plainte :

Il est apparu très récemment que Google volait secrètement tout ce qui avait été créé et partagé sur Internet par des centaines de millions d'Américains. Google a pris toutes nos informations personnelles et professionnelles, nos travaux créatifs et rédigés, nos photographies et même nos e-mails - la quasi-totalité de notre empreinte numérique - et les utilise pour créer des produits commerciaux d'intelligence artificielle ("IA" comme "Bard", le chatbot que Google a récemment lancé pour concurrencer le « ChatGPT » d'OpenAI. Pendant des années, Google a récolté ces données en secret, sans préavis ni consentement de quiconque.

Ce vol massif d'informations personnelles a stupéfié les internautes du monde entier, mais Google n'est pas le seul mauvais acteur de la nouvelle économie de l'IA. Selon les termes de la FTC, l'ensemble de l'industrie technologique "sprinte pour faire de même", c'est-à-dire pour aspirer autant de données qu'elle peut trouver. En effet, les grands modèles de langage sur lesquels s'exécutent les produits d'IA dépendent de la consommation de quantités massives de données pour "former" l'IA. Sans cela, les produits d'IA seraient sans valeur.

Les données personnelles de toutes sortes, en particulier les données de conversation entre humains, sont essentielles au processus de formation à l'IA. C'est ainsi que des produits comme Bard développent des capacités de communication humaines. Les œuvres créatives et expressives sont tout aussi précieuses car c'est ainsi que les produits d'IA apprennent à "créer" de l'art.

La FTC a lancé un avertissement sévère à l'industrie de l'IA le mois dernier concernant ce sprint soudain pour collecter autant de données de formation qu'elle peut en trouver : "L'apprentissage automatique n'est pas une excuse pour enfreindre la loi... Les données que vous utilisez pour améliorer vos algorithmes doivent être légalement collectées. … les entreprises feraient bien de tenir compte de cette leçon".

Sources : Gagan Gohtra, Google SearchLiaison

Et vous ?

Comment réagiriez-vous si vous découvriez que vos conversations avec Bard ont été indexées par Google Search et sont accessibles au public ?
Quelles sont les mesures que vous prenez pour protéger vos données personnelles lorsque vous utilisez Bard ou d’autres services d’IA conversationnelle ?
Utilisez-vous Bard ou un de ses concurrents ? Si oui, quels sont les scénarios ou les domaines dans lesquels vous utilisez l'IA générative le plus souvent ? Quels sont les bénéfices que vous en retirez ?

Une erreur dans cette actualité ? Signalez-nous-la !

Avatar de Mingolito
Membre extrêmement actif https://www.developpez.com
Le 22/02/2024 à 17:13
Avant Gemini cette connerie wokiste est déjà dans les films américains depuis des années et sur les films historiques ça choque.

Aussi bien je trouve ça très bien d'avoir des séries avec un casting international comme par exemple on a vu sur Heroes, Lost, etc, d'autant que c'est vu dans le monde entier alors c'est cool pour tous le monde, aussi bien avoir dans les films historiques par exemple des nazis noirs ou je ne sais quelle autre imbécilité Woke c'est pénible, bientôt Hollywood va nous sortir un nouveau Biopic avec Napoléon et le personnage sera joué par un Chinois transsexuel
10  1 
Avatar de OrthodoxWindows
Membre émérite https://www.developpez.com
Le 10/02/2024 à 23:42
Marrant comme les entreprises qui s'inquiète des "risques" des images de nus générés par IA sont aussi celles qui pompent allégrement les données privées pour former leurs modèles.
A l'opposé, l'IA l'open-source ne s'inquiète pas des risques mais respecte plus la vie privée
4  0 
Avatar de Diablo150
Membre régulier https://www.developpez.com
Le 22/02/2024 à 18:49
Ils jouent d'autant plus les wokes car ils ont arrêtés ou au moins diminués les effectifs "diversitaires" parce qu'embaucher des tonnes de gens suivant leur type et non leurs compétences ça va un moment.

Heureusement pour le moment Stable diffusion est à peu près épargné par ces conneries.
4  0 
Avatar de irrmichael
Membre du Club https://www.developpez.com
Le 28/01/2024 à 15:10
Mistral 8B fait presque aussi bien que les modèles propriétaires à 80B et +, le jour où Mistral sortira un 80B, il faudra un gpt 6 pour l'égaler
Quant à Bard, il excelle surtout dans les tours de passe passe , un échec dès le départ et qui ne fait pas mieux un an après
3  0 
Avatar de fatbob
Membre éclairé https://www.developpez.com
Le 31/01/2024 à 15:58
Plus google avance et plus je suis content de ne l'utiliser que comme un moteur de recherche secondaire en cas de réponse insuffisamment pertinente de mon premier choix (actuellement Lilo qui se base sur bing mais sans collecter les données perso tout en reversant une partie de leurs revenus publicitaires à des projets de notre choix).
A vrai dire, je trouve d'ailleurs que les réponses de google, de plus en plus polluées par les pubs et les sites purement commerciaux, sont de moins en moins intéressantes (comprendre : il est de plus en plus rare que google m'apporte une réponse pertinente quand Lilo ne n'a pas fait).

Je trouve démentiel qu'une entreprise puisse s'octroyer le droit d'utiliser des données d'un passé lointain alors que les utilisateurs n'ont jamais donné leur accord.

Le pire, c'est que même si un jour la justice déclare cela illégal, ce sera trop tard. Personne n'ordonnera à google de détruire BARD parce qu'il sera construit sur une base totalement immorale (d'ailleurs, on voit bien que chatGPT peut piller internet sans problème, au contraire des vilains pirates qui veulent simplement mater un film sans se taper en plus de la pub).

Et pour citer le grand George (Abitbol) :
"Monde de merde."
4  1 
Avatar de Aiekick
Membre extrêmement actif https://www.developpez.com
Le 10/02/2024 à 2:55
J'en penses qu'on a pas besoin d'une ia pour faire du code propre, c'est plus un outil pour les script kiddies
3  0 
Avatar de Anselme45
Membre extrêmement actif https://www.developpez.com
Le 12/02/2024 à 11:01
Où est l'Union Européenne et son RGPD?

Où est la CNIL, son bras armé en France?

Ben ils regardent ailleurs... Occupés à emmerder la PME qui aurait l'idée d'enregistrer les activités de ses employés qui posent problèmes (vol, etc...), occupés à emmerder l'éditeur de logiciel qui veut mettre en place des rapports statistiques dans ses progiciels...
2  0 
Avatar de irrmichael
Membre du Club https://www.developpez.com
Le 22/02/2024 à 20:19
Bard Gemini cumule les échecs depuis un an.
ça répond à coté, sinon les présentations publiques sont fake, puis là le générateur de photo fait n'importe quoi.
Croire qu'il n'y a personne chez Google pour tester ces outils avant leur publication ?
Pour moi, Google a perdu la course à l'IA. C'est fini.
2  0 
Avatar de 23JFK
Membre expert https://www.developpez.com
Le 29/02/2024 à 22:47
Citation Envoyé par commandantFred Voir le message
...
N'importe qui peut mettre un casque de martien à un humain d'ethnie anti-martienne sous GIMP et ça n'a jamais fait jaser personne...

Le problème c'est que dans le cas présent, il n'a jamais été demandé à l'IA de faire preuve de fantaisie ou "d'imagination". Les requêtes étaient du genre : Montres-moi un authentique Viking de l'Histoire Norvégienne.
Se retrouver avec un Booba à casque ou un Gengis Khan sur un drakkar, ce n'est clairement pas ce qui était demandé.
2  0 
Avatar de commandantFred
Membre averti https://www.developpez.com
Le 03/02/2024 à 1:26
Je viens de lui demander deux images en rapport avec mon bouquin. Il est allé les chercher sur EpicGames et les a affichées sans la moindre modification. Attention aux droits donc. Je ne doute pas qu'il s'améliore par la suite.
2  1