Gemini : Google sauvegarde par défaut vos conversations avec son chatbot IA séparément pendant des années

Ce qui soulève des questions de sécurité

Le 10 février 2024 à 21:26, par Stéphane le calme

76PARTAGES

Un nouveau document d'assistance choquant de Google a suscité l'indignation après avoir dévoilé comment son application Gemini Chatbot stocke en fait les données des utilisateurs par défaut en ligne. Cette pratique est observée sur le web, pour les utilisateurs d'iOS et ceux d'Android. « Les conversations qui ont été examinées ou annotées par des réviseurs humains (et les données connexes telles que votre langue, le type d'appareil, les informations de localisation ou les commentaires) ne sont pas supprimées lorsque vous supprimez votre activité Gemini Apps, car elles sont conservées séparément et ne sont pas connectées à votre compte Google. En revanche, elles sont conservées pendant une période pouvant aller jusqu'à trois ans », révèle Google dans une page d'assistance.

Ne tapez rien dans Gemini, la famille d'applications GenAI de Google, qui soit incriminant (ou que vous ne voudriez pas que quelqu'un d'autre voie). C'est l'avertissement (en quelque sorte) lancé par Google, qui, dans un nouveau document d'assistance, explique comment il recueille les données des utilisateurs de ses applications de chatbot Gemini pour le web, Android et iOS.

Google précise que des annotateurs humains lisent, étiquettent et traitent régulièrement les conversations avec Gemini (même si ces conversations sont « déconnectées » des comptes Google - afin d'améliorer le service. (Il n'est pas précisé si ces annotateurs sont internes ou externalisés, ce qui pourrait avoir une incidence sur la sécurité des données ; Google ne le précise pas). Ces conversations sont conservées jusqu'à trois ans, avec des « données connexes » telles que les langues et les appareils utilisés par l'utilisateur, ainsi que sa localisation.

Envoyé par Google

Quelles données sont collectées

Lorsque vous interagissez avec les applications Gemini, Google collecte les informations suivantes :

Conversations
Localisation
Commentaires
Informations d'utilisation

Lorsque vous utilisez Gemini pour vous faire aider sur mobile, Google traite des informations supplémentaires pour vous comprendre, vous répondre et vous aider, tout en vous permettant de garder les mains libres.

Comment Google utilise ces données

Ces données aident Google à fournir, améliorer et développer ses produits et services, ainsi que ses technologies de machine learning, telles que celles sur lesquelles s'appuient les applications Gemini.

Voici quelques exemples :

Les applications Gemini utilisent vos conversations précedentes, votre position et les informations associées pour générer une réponse.
Nous examinons vos commentaires et nous les utilisons pour renforcer la sécurité des applications Gemini. Nous les utilisons également pour réduire les problèmes courants liés aux grands modèles de langage.

Quelle est donc la solution ? Comment éviter que cela ne se produise ?

Selon Google, la seule solution semble être de désactiver les applications de Gemini en cliquant sur l'onglet Mon activité, car cette option est activée par défaut et empêche l'accès aux discussions futures ou leur stockage en ligne.

En revanche, si vous êtes plus préoccupé par les chats individuels ou les invites effectuées via Gemini, ne vous inquiétez pas, vous pouvez les supprimer via l'écran Activité des applications dont vous avez été témoin en ligne.

Google a indiqué que les chats effectués par l'intermédiaire de Gemini peuvent toujours être stockés dans la base de données, même si l'activité de Gemini est désactivée. Mais ces données sont conservées pendant 72 heures afin de garantir la sécurité de l'utilisateur sur Gemini et d'améliorer l'expérience de l'utilisateur lors de l'utilisation des applications.

C'est pourquoi le fabricant d'Android avertit désormais les utilisateurs de ne plus ajouter dans les chats des données sensibles ou piratées qu'ils n'auraient jamais voulu exposer pour améliorer les produits et les services, sans parler de la technologie d'apprentissage automatique : « Veuillez ne pas saisir d'informations confidentielles dans vos conversations ni de données que vous ne voudriez pas qu'un évaluateur voie ou que Google utilise pour améliorer nos produits, nos services et nos technologies d'apprentissage automatique », écrit Google.

Il faut dire que les règles de collecte et de conservation des données de GenAI de Google ne diffèrent pas tellement de celles de ses rivaux. OpenAI, par exemple, enregistre tous les chats avec ChatGPT pendant 30 jours, que la fonction d'historique des conversations de ChatGPT soit désactivée ou non, sauf dans les cas où l'utilisateur a souscrit à un plan d'entreprise assorti d'une politique de conservation des données personnalisée.

Un équilibre difficile

La politique de Google illustre les défis inhérents à l'équilibre entre la protection de la vie privée et le développement de modèles GenAI qui se nourrissent des données des utilisateurs pour s'améliorer eux-mêmes.

Les politiques libérales de conservation des données de la GenAI ont récemment mis les fournisseurs dans le collimateur des autorités de régulation.

L'été dernier, la FTC a demandé à OpenAI des informations détaillées sur la manière dont l'entreprise contrôle les données utilisées pour l'entraînement de ses modèles, y compris les données des consommateurs, et sur la manière dont ces données sont protégées lorsqu'elles sont accessibles à des tiers. Du côté de l'Europe, l'autorité italienne de protection des données a déclaré qu'OpenAI ne disposait pas d'une « base juridique » pour la collecte et le stockage massifs de données à caractère personnel en vue de l'entraînement de ses modèles GenAI.

Alors que les outils de GenAI prolifèrent, les organisations se méfient de plus en plus des risques liés à la protection de la vie privée.

OpenAI, Microsoft, Amazon, Google et d'autres proposent des produits GenAI destinés aux entreprises qui ne veulent explicitement pas conserver les données pendant un certain temps, que ce soit pour la formation des modèles ou à d'autres fins. Cependant, les consommateurs - comme c'est souvent le cas - n'ont pas droit à l'erreur.

Une enquête récente de Cisco a révélé que 63 % des entreprises ont établi des limites quant aux données pouvant être introduites dans les outils de GenAI, tandis que 27 % d'entre elles ont complètement interdit la GenAI. La même enquête a révélé que 45 % des employés ont saisi des données « problématiques » dans les outils de GenAI, notamment des informations sur les employés et des fichiers non publics concernant leur employeur.

[QUOTE]L'IA générative suscite des inquiétudes croissantes en matière de protection de la vie privée

« Les organisations considèrent la GenAI comme une technologie fondamentalement différente avec de nouveaux défis à prendre en compte », a déclaré Dev Stahlkopf, directeur juridique de Cisco. « Plus de 90% des personnes interrogées pensent que la GenAI nécessite de nouvelles techniques pour gérer les données et les risques. C'est là qu'une gouvernance réfléchie entre en jeu. La préservation de la...

La fin de cet article est réservée aux abonnés. Soutenez le Club Developpez.com en prenant un abonnement pour que nous puissions continuer à vous proposer des publications.

Une erreur dans cette actualité ? Signalez-nous-la !

Votre nom : Votre e-mail :

Décrivez l'erreur que vous souhaitez porter à notre connaissance :

Identifiez-vous

Créer un compte

Gemini : Google sauvegarde par défaut vos conversations avec son chatbot IA séparément pendant des années

Ce qui soulève des questions de sécurité

Identifiant
Mot de passe

Mot de passe oublié ?

Identifiez-vous

Créer un compte

Gemini : Google sauvegarde par défaut vos conversations avec son chatbot IA séparément pendant des années Ce qui soulève des questions de sécurité

Gemini : Google sauvegarde par défaut vos conversations avec son chatbot IA séparément pendant des années

Ce qui soulève des questions de sécurité