Google Home est une famille d’enceintes connectées à Internet que la firme de Mountain View associe à un programme informatique qui leur confère de « l’intelligence. » Dans le jargon du milieu, on parle d’assistant personnel intelligent et, du côté de la firme de Mountain View, c’est l’application Google Assistant que l’on retrouve aussi sur les smartphones qui officie.
Dans le principe, l’assistant personnel associé à un appareil (enceinte connectée, smartphone) est conçu pour recueillir les commandes vocales émises par un utilisateur. Ces dernières sont transmises à un serveur distant qui les analyse et donne suite à la requête que l’utilisateur a formulée. Le processus d’enregistrement est lancé par une commande vocale dédiée, ce qui suppose que sans elle rien ne se passe.
La Fondation de radio-télévision néerlandaise a obtenu une dizaine de tels enregistrements d’un collaborateur de Google – un employé d’un sous-traitant de la firme de Mountain View – qui, pour faire montre de crédibilité, a présenté son contrat de travail. L’organisme de la radiodiffusion flamande VRT est, par le même biais, rentré en possession d’un millier de contenus audios.
Dans ses conditions d’utilisateur, la firme de Mountain View n’est pas explicite à ce propos, mais ce qu’il faut bien souligner certains enregistrements sont passés en revue par des opérateurs humains. Le collaborateur de Google qui a tenu a resté sous anonymat l’a fait savoir. « Il est important que les gens se rendent compte que des tiers écoutent ces contenus », dit-il.
Ce dernier reçoit de Google quelques centimes par enregistrement pour écrire ce qu’il entend. « Sur les extraits, vous pouvez entendre comment des gens demandent à Google Home de régler l'alarme ou de vérifier les heures d'ouverture d'un magasin. D'autres demandent à Google de jouer leur musique préférée ou posent une question ludique pour tester l'appareil. Mais selon l'employé de Google, il lui arrive parfois d'entendre des commandes vocales très personnelles, par exemple des hommes qui demandent à Google de chercher des contenus pornographiques.
L’employé rapporte qu’il arrive aussi que l'enceinte connectée de la firme de Mountain View enregistre sans mot clé d'activation (Ok Google). Résultat des courses : certains audios n’ont rien à voir avec des commandes vocales destinées aux systèmes de Google. Il dit avoir écouté une douzaine d’échanges du type querelles ou conversations intimes. « Je me souviens d'un long extrait dans lequel j'ai senti qu'il y avait de la violence physique, dans lequel quelqu'un était dans le besoin, avec beaucoup de bruits de fond », rapporte la Fondation de radio-télévision néerlandaise.
Google a riposté à ces développements via un un billet de blog qui classe la fuite comme une faille de sécurité occasionée par le sous-traitant. L'entreprise a expliqué que ce processus d'examen est nécessaire pour que ses produits fonctionnent bien dans plusieurs langues, ce, bien que le même processus existe pour les enregistrements en anglais.
« Nous travaillons avec des experts en langues du monde entier pour améliorer nos technologies de traitement de la parole. Nous nous appuyons sur des transcriptions faites à partir d'un petit nombre de clips audio. Ce travail est crucial pour le développement de la technologie qui rend possible des produits tels que l'assistant Google. Les experts en langues ne passent en revue qu'environ 0,2 % de tous les clips audio qui ne sonte pas liés à des données personnelles. Nous avons récemment appris que l'un de ces experts en langue aurait violé notre politique de sécurité des données en divulguant des clips audio en néerlandais. Nous enquêtons de façon active sur cette affaire et lorsque nous constatons une violation de notre politique, nous prenons des mesures rapides qui peuvent aller jusqu'à la résiliation de notre contrat avec le partenaire », a déclaré Google en réponse aux publications liées à ces développements.
Ces derniers ne sont pas sans faire penser à ceux qui concernent un concurrent direct de la firme de Mountain View dans la filière des assistants personnels vocaux – Amazon. Il y a peu, le géant mondial du commerce en ligne a confirmé qu’il conserve les enregistrements vocaux obtenus via Alexa tant que les utilisateurs ne les suppriment pas. L’entreprise constitue ainsi une base de données de contenus audios dans laquelle ses employés peuvent puiser. Derrière, il y a un travail d’écoute, de transcription et d’annotation qui est fait par ces derniers.
Comme Google, Amazon a indiqué que ces employés ne passent en revue qu’un très faible échantillon d’enregistrements vocaux Alexa. En sus, l’entreprise a fait savoir que ces employés n’ont pas directement accès aux informations permettant d’identifier la personne ou le compte dans le cadre de ce flux de travail. Amazon se veut claire sur ceci que les opérations de traitement de données sont menées avec le terme confidentialité comme maître mot.
« Nous prenons au sérieux la sécurité et la confidentialité des informations personnelles de nos clients. Nous n'annotons qu'un nombre extrêmement faible d'interactions provenant d'un ensemble aléatoire de clients afin d'améliorer l’expérience de nos clients. Par exemple, ces informations nous aident à former nos systèmes de reconnaissance vocale et de compréhension du langage naturel, afin qu'Alexa puisse mieux comprendre vos demandes, ou nous assurer que le service fonctionne au mieux pour tout le monde. Nous mettons en œuvre des garanties techniques et opérationnelles strictes et avons une politique de tolérance zéro envers les abus sur notre système. Dans ce cadre, les employés n'ont pas d'accès direct à des informations qui leur permettraient d'identifier une personne ou un compte. Nous traitons toutes les informations avec la plus grande confidentialité, utilisons l'authentification multifactorielle pour restreindre l'accès, le cryptage du service et les audits de notre environnement de contrôle pour le protéger, et les clients peuvent également supprimer leurs interactions vocales avec Alexa à tout moment », a répondu l’entreprise.
Source : Fondation de radio-télévision néerlandaise, Google
Et vous ?
Qu’en pensez-vous ?
Aviez-vous connaissance de ce que ces enregistrements sont écoutés à nouveau par des humains ?
Cette approche est-elle d'une absolue nécessité en matière d'intelligence artificielle ?
Voir aussi :
Amazon atteint 100 millions de vente d'appareils intégrant Alexa, son assistant vocal intelligent
Amazon révèle que plus de 10 000 employés travaillent sur Alexa ainsi que sur les appareils Echo qu'il alimente
Alexa, le système vocal intelligent d'Amazon compte environ 80 000 applications dans son Store, mais aucune de vraiment célèbre
Des tiers écoutent ce que vous dites à Google Home au motif de ce qu'il faut améliorer l'IA
D'après Google
Des tiers écoutent ce que vous dites à Google Home au motif de ce qu'il faut améliorer l'IA
D'après Google
Le , par Patrick Ruiz
Une erreur dans cette actualité ? Signalez-nous-la !