IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)

Vous êtes nouveau sur Developpez.com ? Créez votre compte ou connectez-vous afin de pouvoir participer !

Vous devez avoir un compte Developpez.com et être connecté pour pouvoir participer aux discussions.

Vous n'avez pas encore de compte Developpez.com ? Créez-en un en quelques instants, c'est entièrement gratuit !

Si vous disposez déjà d'un compte et qu'il est bien activé, connectez-vous à l'aide du formulaire ci-dessous.

Identifiez-vous
Identifiant
Mot de passe
Mot de passe oublié ?
Créer un compte

L'inscription est gratuite et ne vous prendra que quelques instants !

Je m'inscris !

Amazon dévoile des fonctionnalités d'IA générative pour Alexa
Qui contribueraient à rendre Alexa encore plus intuitive, plus intelligente et plus utile

Le , par Jade Emy

0PARTAGES

4  0 
Lors de la présentation au siège d'Amazon, situé à Arlington, en Virginie, David Limp, vice-président chargé des appareils et des services, a présenté une série de mises à jour pour les appareils équipés d'Alexa. L'entreprise a également présenté en avant-première un ensemble de lunettes connectées à Internet et une tablette murale destinée à contrôler différents appareils domestiques intelligents. Cependant, l'événement le plus marquant a été l'introduction d'un grand modèle de langage (LLM) qui permet d'améliorer les capacités d'Alexa. L'entreprise considère le passage à l'intelligence artificielle générative comme un moyen de faire de l'IA de l'assistant virtuel omniprésent un assistant personnel capable de tenir une conversation engageante.

Ces dernières années, Amazon a souvent parlé de l'âge d'or de l'intelligence artificielle (IA). Des idées qui semblaient relever de la science-fiction il n'y a pas si longtemps sont aujourd'hui une réalité, et il n'y a pas de meilleur exemple qu'Alexa. Ce qui n'était au départ qu'un croquis sur un tableau blanc s'est transformé en un paradigme informatique entièrement nouveau, qui a fondamentalement changé la façon dont les gens interagissent avec la technologie dans leur foyer. Avec plus d'un demi-milliard d'appareils vendus et des dizaines de millions d'interactions chaque heure, Alexa fait désormais partie de la famille dans des millions de foyers. Amazon a toujours considéré Alexa comme un service évolutif, et l'a continuellement amélioré depuis le jour de son lancement en 2014.

Une mission de longue date a été de rendre une conversation avec Alexa aussi naturelle que de parler à un autre humain, et avec le développement rapide de l'IA générative, ce que nous avions imaginé est maintenant à portée de main. Aujourd'hui, nous sommes ravis de partager un avant-goût de ce que l'avenir nous réserve.

Il s'agit d'un premier aperçu d'une Alexa plus intelligente et plus conversationnelle, alimentée par l'IA générative. Elle est basée sur un nouveau modèle de langage étendu (LLM) qui a été conçu sur mesure et spécifiquement optimisé pour les interactions vocales, et les choses que les clients d'Amazon aiment : obtenir des informations en temps réel, contrôler efficacement leur maison intelligente et maximiser leur divertissement à domicile. Amazon pense que ce modèle sera le moteur de l'avenir d'Alexa et qu'il permettra d'améliorer cinq capacités fondamentales :

1. La conversation

Nous beaucoup étudié la conversation au cours des dernières années et nous savons que la conversation va au-delà des mots. Dans toute conversation, nous traitons des tonnes d'informations supplémentaires, telles que le langage corporel, la connaissance de la personne avec laquelle vous parlez et le contact visuel.
Pour permettre cela avec Alexa, Amazon a fusionné les données des capteurs d'un Echo (la caméra, les données vocales, sa capacité à détecter la présence) avec des modèles d'IA capables de comprendre ces signaux non verbaux. Ils se sont également attachés à réduire la latence afin que les conversations se déroulent naturellement, sans pause, et que les réponses soient d'une longueur adaptée à la voix, et non l'équivalent d'un paragraphe lu à haute voix. Lorsque vous demandez les dernières informations sur un sujet d'actualité, vous obtenez une réponse succincte contenant uniquement les informations les plus pertinentes.

2. Utilité dans le monde réel

Pour être vraiment utile, Alexa doit être capable d'agir dans le monde réel, ce qui a été l'un des défis non résolus avec les LLM - comment intégrer les API à grande échelle et les invoquer de manière fiable pour prendre les bonnes mesures. Ce nouveau LLM Alexa sera connecté à des centaines de milliers d'appareils et de services du monde réel via des API. Il améliore également la capacité d'Alexa à traiter les nuances et les ambiguïtés, comme le ferait une personne, et à prendre des mesures intelligentes.

Par exemple, le LLM vous donne la possibilité de programmer des routines complexes entièrement à la voix - les clients peuvent simplement dire : "Alexa, tous les soirs de la semaine à 21 heures, annonce qu'il est l'heure de coucher les enfants, tamise les lumières à l'étage, allume la lumière du porche et met en marche le ventilateur dans la chambre". Alexa programmera alors automatiquement cette série d'actions pour qu'elles aient lieu tous les soirs à 21 heures.

3. Personnalisation et contexte

Un LLM pour la maison doit être personnalisé pour vous et votre famille. Tout comme une conversation avec une autre personne serait façonnée par le contexte (comme vos conversations précédentes ou le contexte situationnel), Alexa doit faire de même. La prochaine génération d'Alexa sera capable de proposer des expériences uniques basées sur les préférences que vous avez partagées, les services avec lesquels vous avez interagi et les informations sur votre environnement. Alexa transmet également un contexte pertinent tout au long des conversations, comme le font les humains en permanence. Les gens utilisent des pronoms, des phrases d'accroche et construisent le contexte des lieux, des moments ou des scènes dont nous parlons. Posez à Alexa une question sur un musée et vous pourrez lui poser une série de questions complémentaires sur les heures d'ouverture, les expositions et l'emplacement sans avoir besoin de rappeler le contexte préalable, comme le nom ou le jour où vous prévoyez d'y aller.

4. Personnalité

Les clients nous ont dit à maintes reprises qu'ils aimaient la personnalité d'Alexa. Vous ne voulez pas d'un compagnon robotique dans votre maison, et je dirais que la personnalité d'Alexa est l'une des principales raisons de l'adoption massive d'Alexa. Comme nous l'avons toujours dit, le dîner le plus ennuyeux est celui où personne n'a d'opinion et, avec ce nouveau LLM, Alexa aura un point de vue, ce qui rendra les conversations plus intéressantes.
Alexa peut vous dire quels films auraient dû remporter un Oscar, se réjouir avec vous lorsque vous répondez correctement à une question de quiz ou rédiger une note enthousiaste que vous enverrez à un ami pour le féliciter de sa récente remise de diplôme.

5. La confiance

Il ne devrait pas y avoir de compromis entre la confiance et la performance. Des clients du monde entier ont accueilli Alexa chez eux et, pour qu'elle soit vraiment utile dans leur vie quotidienne, Amazon doit continuer à créer des expériences qu'ils aiment et en lesquelles ils ont confiance. Alors que l'intégration de l'IA générative apporte une infinité de nouvelles possibilités, l'engagement d'Amazon à gagner la confiance de ses clients ne changera pas. Comme pour tous produits, ils concevront des expériences pour protéger la vie privée et la sécurité de nos clients, et pour leur donner le contrôle et la transparence.

Selon Amazon, il s'agit de la plus grande intégration d'un LLM, de services en temps réel et d'une suite d'appareils et elle ne se limite pas à un onglet dans un navigateur. Et ce n'est qu'un début : grâce à l'IA générative, Amazon est également en mesure d'améliorer un certain nombre de composants essentiels de l'expérience Alexa.

L'un de ces composants est la façon dont les clients démarrent une interaction avec Alexa. Nous nous appuierons sur l'expérience actuelle en permettant aux clients qui choisissent de s'inscrire à Visual ID d'entamer une conversation avec Alexa simplement en faisant face à l'écran d'un Echo Show, sans qu'aucun mot d'ordre ne soit nécessaire. Le résultat est l'expérience de conversation la plus naturelle que nous ayons jamais construite. Deuxièmement, nous avons construit un tout nouveau moteur de reconnaissance vocale conversationnelle (CSR) en utilisant de grands modèles. En tant qu'humains, nous marquons souvent des pauses au cours d'une conversation pour rassembler nos idées ou insister sur un point, et l'identification de ces indices est incroyablement difficile pour une IA.
Ce nouveau moteur CSR est capable de s'adapter à ces pauses naturelles courantes et à ces hésitations, ce qui permet des conversations plus fluides et plus naturelles. Enfin, l'IA générative a permis d'améliorer la technologie de synthèse vocale, en utilisant un grand modèle de transformateur pour rendre Alexa beaucoup plus expressive et à l'écoute des indices de conversation. Cela signifie qu'Alexa s'adaptera à vos signaux et modulera sa réponse et son ton comme dans une conversation humaine.

Grâce à ces améliorations, l'intelligence artificielle personnelle, qui est déjà la meilleure au monde, sera encore plus performante.

Nous sommes au début d'une aventure qui, selon nous, mènera à une nouvelle version d'Alexa alimentée par l'IA générative. Nous continuerons à développer et à ajouter de nouvelles fonctionnalités dans le cadre d'un aperçu gratuit, qui sera bientôt disponible pour les clients d'Alexa aux États-Unis. Nous savons que les clients nous feront part de leurs commentaires et nous sommes impatients de les entendre.
Source : Amazon

Et vous ?

Quel est votre avis sur le sujet ?

Voir aussi :

« L'IA générative n'est qu'une phase. La prochaine phase sera l'IA interactive dans laquelle des machines interactives effectueront des tâches à votre place », affirme un cofondateur de DeepMind

Siri, Alexa, Cortana et Google Assistant : lequel est le meilleur parmi ces assistants numériques ? Une étude les compare suivant plusieurs critères

L'atteinte d'une forme d'IA de niveau humain est-elle plus rapide que prévu ? Il y aurait une chance sur deux pour qu'une « AGI » soit conçue,
Testée et annoncée publiquement d'ici 2040

Une erreur dans cette actualité ? Signalez-nous-la !