Vous êtes nouveau sur Developpez.com ? Créez votre compte ou connectez-vous afin de pouvoir participer !

Vous devez avoir un compte Developpez.com et être connecté pour pouvoir participer aux discussions.

Vous n'avez pas encore de compte Developpez.com ? Créez-en un en quelques instants, c'est entièrement gratuit !

Si vous disposez déjà d'un compte et qu'il est bien activé, connectez-vous à l'aide du formulaire ci-dessous.

Identifiez-vous
Identifiant
Mot de passe
Mot de passe oublié ?
Créer un compte

L'inscription est gratuite et ne vous prendra que quelques instants !

Je m'inscris !

Un prestataire de Google a divulgué plus de mille enregistrements vocaux de Google Assistant
Ce que déplore l'entreprise

Le , par Bill Fassinou

57PARTAGES

10  0 
Les technologies d’assistance vocale ont fait irruption dans nos vies depuis l’avènement de l’Internet des Objets (IdO) et se développent à une vitesse sans précédent. Mais, ce que beaucoup ignorent peut-être est que ce développement nécessite une atteinte à la politique de confidentialité des données que ces petits objets enregistrent. Google, Amazon, tout comme les autres entreprises qui développent des technologies d’assistance vocale estiment que pour assurer l’avancée de la technologie, les enregistrements audios des utilisateurs sont enregistrés et analysés par certains de leurs employés qu’ils appellent des experts en langue.

Cette semaine, un employé de Google, un employé parmi ceux que Google appelle des experts en langue, a permis au média belge VRT NWS d’avoir accès à plus d’un millier d’enregistrements vocaux enregistrés via l’assistant vocal Google Home des utilisateurs. Le média a ensuite réalisé une vidéo pour mettre en évidence la façon dont les données vocales et les transcriptions issues des enregistrements faits par l’assistant Google Home sont gérées. Mis à par ce fait, ce dernier a également laissé les journalistes de VRT NWS consulter le logiciel utilisé pour réviser ou analyser les enregistrements. Le rapport confirme ce que beaucoup de personnes savent déjà, mais n’y a-t-il pas de risque ?

VRT NWS a pu écouter plus de mille extraits enregistrés via Google Assistant. Dans ces enregistrements, le média estime avoir clairement pu entendre les adresses, ainsi que d’autres informations sensibles des utilisateurs. « Cela nous a facilité la tâche de trouver les personnes impliquées et de les confronter aux enregistrements audio », a déclaré le média. Bien sûr, Google, Amazon et Apple, avec son assistant vocal intelligent Siri, ont toujours insisté sur le fait « qu’ils ne sont pas intéressés par ce que vous dites, mais par la façon dont vous le dites ». Cependant, écouter les enregistrements est un rappel frappant du fait que tout ce que vous dites à un assistant vocal ou dans son voisinage est enregistré.


Selon les explications fournies à VRT NWS, Google sous-traite la tâche d’écoute à des professionnels externes. Ils se connectent à une partie sécurisée de l'outil contenant une liste des extraits audio à analyser. Environ trois sources auraient confirmé que c'est ainsi que Google fonctionne. La reconnaissance vocale génère automatiquement un script des enregistrements. Les employés doivent ensuite vérifier pour décrire l'extrait le plus fidèlement possible : s'agit-il d'une voix de femme, d'un homme ou d'un enfant ? Qu'est-ce qu’ils disent ? Ils écrivent et décrivent avec soin tout ce qu’ils entendent. Pour Google, ces descriptions améliorent constamment ses moteurs de recherche, ce qui entraîne de meilleures réactions aux commandes.

Savoir que des personnes travaillant pour Google écoutent indirectement de tels enregistrements soulève des questions sur la confidentialité. Le média belge a rapporté que pour éviter que des extraits soient automatiquement liés à un utilisateur, les employés qui sont chargés d’analyser les transcriptions sont déconnectés des informations de l'utilisateur. Ils suppriment le nom d'utilisateur et le remplacent par un numéro de série anonyme. Mais, d’après la vidéo qu'il a présentée, ce dernier estime qu'il n'est nul besoin d’être un spécialiste des fusées pour retrouver l'identité de quelqu'un. Il vous suffira d’écouter attentivement ce qui se dit, a-t-il expliqué.

De plus, rapporte-t-il, s’ils ne savent pas comment écrit, un mot, un extrait, un nom, etc., ces employés doivent rechercher chaque mot, adresse, nom personnel ou nom de société sur Google ou sur Facebook. De cette manière, ils découvrent souvent rapidement l'identité de la personne qui parle. Le média belge a indiqué qu’il a écouté « plus de mille extraits, dont 153 étaient des conversations qui n'auraient jamais dû être enregistrées et au cours desquelles la commande “OK Google” n'a clairement pas été donnée ». « Mais dès que quelqu'un dans le voisinage prononce un mot qui sonne un peu comme “OK Google”, Google Home commence à enregistrer », a confirmé VRT NWS.

Cela signifie logiquement que de nombreuses conversations sont enregistrées de manière non intentionnelle. L’assistant a enregistré par exemple des conversations dans la chambre à coucher, des conversations entre parents et enfants, mais aussi des appels professionnels qui contiennent de nombreuses informations jugées confidentielles. Des enregistrements erronés peuvent également se produire lorsque quelqu'un appuie sur le mauvais bouton de son téléphone ou donne une commande par inadvertance. Ces informations sont enregistrées et stockées et risqueraient inévitablement d’être divulguées à des pirates informatiques, des gouvernements ou des organes de presse belges. Il arrive également des moments où les enregistrements concernent des agressions ou d’autres types de violence.

« L'une de nos trois sources indépendantes a déclaré qu'il avait dû décrire un enregistrement dans lequel il avait entendu une femme en détresse définitive », a indiqué VRT NWS. Que sont censés faire les employés avec ces informations ? Aucune directive claire n’a été spécifiée concernant de tels cas. C'est une question d'éthique importante. Selon le média, les employés reçoivent uniquement des instructions spécifiques concernant les numéros de compte et les mots de passe. Celles-ci sont marquées comme des informations sensibles. Google n’est cependant pas resté indifférent face à cette divulgation qu’il a qualifiée comme une faille de sécurité grave.

« Nous venons d'apprendre qu'un de ces réviseurs de langue a violé nos politiques de sécurité des données en divulguant des données audio néerlandaises confidentielles », a déclaré Google. Selon un porte-parole de l’entreprise, « ce travail est d’une importance cruciale pour développer des technologies permettant de maintenir des produits tels que Google Assistant ». D’après les indications de Google, seulement 0,2 % de tous les extraits audios sont examinés par ses experts en langue. Il a également ajouté que les extraits sonores ne sont pas associés aux comptes d'utilisateur dans le cadre du processus de révision. Les réviseurs ne doivent pas transcrire les conversations en arrière-plan ni d'autres bruits, mais uniquement les extraits qui sont dirigés vers Google.

Néanmoins, pour certaines personnes, ces objets, malgré leur utilité très précieuse, se révèlent de plus en plus comme étant le dispositif d’espionnage le plus sophistiqué jamais conçu. « Le gouvernement, le FBI, la NSA et les autres agences de renseignement dans les autres pays du monde ne se sont pas encore rendu compte du potentiel de surveillance énorme qu’offrent ces objets, ou ils le sont déjà et attendent de trouver la bonne stratégie pour l’exploiter. Ce qui est sûr, personne ne devra faire confiance à Google, Apple ou n’importe qui d’autre pour garantir sa sécurité et sa vie privée et la confidentialité de ses données si le gouvernement venait à réclamer les enregistrements vocaux de leurs assistants intelligents », ont-ils déclaré.

Sources : VRT NWS, Google

Et vous ?

Qu'en pensez-vous ?

Voir aussi

Amazon confirme que les enregistrements vocaux des clients d'Alexa sont conservés pour toujours, tant qu'ils ne les suppriment pas manuellement

Les travailleurs d'Amazon écoutent ce que vous dites à Alexa, son assistant vocal intelligent et en parlent dans un forum de discussion interne

Project Alias « pirate » les enceintes connectées Amazon Echo et Google Home pour protéger la vie privée des utilisateurs

Nest : la société est morte à Google I/O 2019, avec son écosystème, ses comptes, son pare-feu de confidentialité ; place maintenant à Google Nest

Une erreur dans cette actualité ? Signalez-le nous !

Avatar de sergio_is_back
Membre émérite https://www.developpez.com
Le 15/07/2019 à 12:32
Citation Envoyé par onilink_ Voir le message
C'est simple, un tel système peut être en local, et donc toute reconnaissance vocale restera chez toi.
D’où l’intérêt d'avoir des technos comme ça en open source, sinon tu es obligé de passer par le cloud via de grosses boites qui feront ce qu'elles veulent, elles.
Que ce soit local ou non, je n'ai pas besoin de ce genre de gadget !
9  1 
Avatar de bcag2
Membre habitué https://www.developpez.com
Le 15/07/2019 à 12:02
C'est pour cela qu'il faut une/des alternatives libre(s) à ces GAFAM,
n'hésitez pas à participer à l'initiative de Mozilla dans ce sens : common voice
https://voice.mozilla.org/fr
6  0 
Avatar de sergio_is_back
Membre émérite https://www.developpez.com
Le 15/07/2019 à 12:08
Citation Envoyé par bcag2 Voir le message
C'est pour cela qu'il faut une/des alternatives libre(s) à ces GAFAM,
n'hésitez pas à participer à l'initiative de Mozilla dans ce sens : common voice
https://voice.mozilla.org/fr
Quand on ne veut pas être enregistré et écouté on invite pas ce genre de bestiole chez soi... De plus j'ai toujours pas compris l’intérêt de ces trucs là !
6  0 
Avatar de onilink_
Membre expérimenté https://www.developpez.com
Le 15/07/2019 à 14:30
Citation Envoyé par sergio_is_back Voir le message
Que ce soit local ou non, je n'ai pas besoin de ce genre de gadget !
Moi non plus, mais ça reste quand même beaucoup mieux que ce genre de techno existe en open source et local, pour ceux qui justement en ont l'utilité ou le besoin.
Parce que ça peut être utile, par exemple pour les mal voyants, ou encore juste pour le travail car avec un système customisé, tu peux créer tes propres commandes.

Il faut aussi penser au cas ou si ce genre de techno se démocratise vraiment, si tu vas chez quelqu'un qui en a un, je préfère mille fois qu'il ai un truc custom local qui tourne sur un rpi plutôt qu'un google home ou nos conversation vont être espionnées si tu forces pas la personne à l'éteindre...
4  0 
Avatar de jc_granit
Nouveau membre du Club https://www.developpez.com
Le 15/07/2019 à 16:30
L'internet des objets à encore frappé: Un gadget de plus, totalement inutile, mais un parfait espion de son intimité!
4  0 
Avatar de onilink_
Membre expérimenté https://www.developpez.com
Le 15/07/2019 à 22:27
@7gyY9w1ZY6ySRgPeaefZ
Le problème c'est que les GAFAM nous montrent tous les jours qu'elles exploitent ce genre de données... justement pour des choses qu'elles ne devraient pas.
Bref, tout aussi illégal, mais avec une portée bien plus dangereuse car il est plus difficile de couler un géant du web qu'un petit développeur dans son coin.

Et on voit bien que les nombreux scandales de Facebook n'ont pas suffit a faire changer la donne. Car bien avant le scandale de CA, il y en a eu un petit paquet. Mais tout le monde s'en foutait et ça a pas été très médiatisé.
Au final le scandale de CA les gens sont "offusqués" mais... ils restent quand même sur FB pour la plupart.
Les amendes infligés sont aussi dérisoires quand on voit l'argent qu'ils se font grâce à l'utilisation illégale de ces données.
3  0 
Avatar de onilink_
Membre expérimenté https://www.developpez.com
Le 15/07/2019 à 12:25
Citation Envoyé par sergio_is_back Voir le message
Quand on ne veut pas être enregistré et écouté on invite pas ce genre de bestiole chez soi... De plus j'ai toujours pas compris l’intérêt de ces trucs là !
C'est simple, un tel système peut être en local, et donc toute reconnaissance vocale restera chez toi.
D’où l’intérêt d'avoir des technos comme ça en open source, sinon tu es obligé de passer par le cloud via de grosses boites qui feront ce qu'elles veulent, elles.
3  1 
Avatar de jc_granit
Nouveau membre du Club https://www.developpez.com
Le 15/07/2019 à 16:33
Un prestataire de Google a divulgué plus de mille enregistrements vocaux de Google Assistant
Un prestataire... Un tiers à qui une GAFAM a vendu des données... Etc...

Le problème a toujours la même origine: Les GAFAM collectent les données de leur clients mais en plus les mettent à disposition de sociétés tierces qui elles...

C'est sans fin et totalement incontrôlable!
2  0 
Avatar de 7gyY9w1ZY6ySRgPeaefZ
Expert confirmé https://www.developpez.com
Le 15/07/2019 à 19:00
Je m'étonne toujours de voir des personnes sur un forum de professionnels de l'informatique s'offusquer de fuites de données...
Dans le cadre de votre travail, n'avez-vous jamais eu accès à des données plus ou moins sensibles mais que vous avez utilisé tout même sans sourciller ?
Je suis dba alors vous pensez bien que si j'étais sans éthique et mal intentionné je serais devenu riche... ou black-listé et sans emploi !
Un exemple, une banque a un problème avec un vieux logiciel employé pour les gros comptes et je demande plus d'information pour trouver le problème. Je reçois par courriel une liste de clients dans un excel « sécurisé » dans un zip avec mot de passe... Je vous laisse dénombrer le nombre de failles de sécurité là-dedans... Et ce que j'aurais potentiellement pu faire de ces trop nombreuses informations...
Des exemples comme ça, j'en ai bien sûr des tonnes sans doute comme nous tous...

Est-ce que le problème ne serait pas plus fondamental à notre secteur au lieu de simplement cibler les GAFA - qui sont juste de très grosses boites informatiques ni plus pures ni moins capitalistes que la majorité de nos employeurs ?
2  0 
Avatar de Anselme45
Membre extrêmement actif https://www.developpez.com
Le 16/07/2019 à 12:22
Citation Envoyé par transgohan Voir le message

Et au final même avec un bon micro ce n'est pas très performant...
Ce n'est pas performant parce que tu as oublié le secret de fabrication: Avoir des humains qui écoutent les conversations en jouant à l'IA!
2  0