Malgré quelques lacunes, telles que l'absence de zoom, ces lunettes offrent une expérience convaincante, surtout lorsqu'elles sont utilisées en déplacement. L'IA fait partie des nombreuses caractéristiques de ces lunettes, qui sont également appréciées pour leur capacité de livestreaming, leur qualité audio et leur caméra POV. En fin de compte, l'intégration réussie de l'IA multimodale renforce l'idée que les lunettes intelligentes sont bien plus qu'un simple accessoire de mode, mais plutôt un outil multifonctionnel qui s'intègre naturellement dans la vie quotidienne de l'utilisateur.
Imaginons que vous voyagiez et que vous essayiez de lire un menu en français. Ces lunettes intelligentes peuvent utiliser leur caméra intégrée et l'intelligence artificielle Meta pour traduire le texte à votre place, vous donnant l'information dont vous avez besoin sans avoir à sortir votre téléphone ou à fixer un écran.
Meta AI rend vos lunettes intelligentes avec l'IA multimodale
Lorsque les lunettes intelligentes Ray-Ban Meta ont été lancées à l'automne dernier, elles constituaient un outil de capture de contenu très intéressant et une paire d'écouteurs étonnamment solide. Mais il leur manquait une fonctionnalité essentielle : l'IA multimodale. Il s'agit en fait de la capacité d'un assistant d'intelligence artificielle à traiter plusieurs types d'informations, comme des photos, du son et du texte. Quelques semaines après le lancement, Meta a mis en place un programme d'accès anticipé, mais pour tous les autres, l'attente est terminée. L'IA multimodale arrive pour tout le monde.
« Nos lunettes intelligentes de deuxième génération, en partenariat avec EssilorLuxottica, se sont envolées des rayons - elles se vendent plus vite que nous ne pouvons les fabriquer. Et juste à temps pour la saison des lunettes de soleil, nous élargissons la collection de lunettes intelligentes Ray-Ban Meta avec de nouveaux styles conçus pour s'adapter à davantage de formes de visage afin que vous puissiez trouver la paire parfaite. Nous ajoutons également de nouvelles fonctionnalités, y compris des mises à jour de l'intelligence artificielle Meta, pour rendre les lunettes encore plus utiles », déclare Meta sur son blog officiel.
L'IA multimodale est une intelligence artificielle qui combine plusieurs types, ou modes, de données afin de créer des déterminations plus précises, de tirer des conclusions plus perspicaces ou de faire des prédictions plus exactes sur des problèmes du monde réel. Les systèmes d'IA multimodale s'entraînent avec et utilisent la vidéo, l'audio, la parole, les images, le texte et une série d'ensembles de données numériques traditionnelles. Plus important encore, l'IA multimodale signifie que de nombreux types de données sont utilisés en tandem pour aider l'IA à établir le contenu et à mieux interpréter le contexte, ce qui manquait à l'IA antérieure.
À la base, l'IA multimodale suit l'approche familière de l'IA fondée sur les modèles d'IA et l'apprentissage automatique. Les modèles d'IA sont les algorithmes qui définissent la manière dont les données sont apprises et interprétées, ainsi que la manière dont les réponses sont formulées sur la base de ces données. Les données, une fois ingérées par le modèle, entraînent et construisent le réseau neuronal sous-jacent, établissant ainsi une base de réponses appropriées.
Au fur et à mesure que de nouvelles données sont ingérées, l'IA fait des déterminations et génère des réponses à partir de ces données pour l'utilisateur. Ces résultats, ainsi que l'approbation de l'utilisateur ou d'autres récompenses, sont réinjectés dans le modèle pour l'aider à continuer à s'affiner et à s'améliorer. La différence fondamentale entre l'IA multimodale et l'IA monomodale traditionnelle réside dans les données.
Une IA monomodale est généralement conçue pour fonctionner avec une seule source ou un seul type de données. Par exemple, une IA financière utilise les données financières de l'entreprise, ainsi que des données plus générales sur l'économie et le secteur industriel, pour effectuer des analyses, faire des projections financières ou repérer des problèmes financiers potentiels pour l'entreprise. En d'autres termes, l'IA monomodale est adaptée à une tâche spécifique.
En revanche, l'IA multimodale ingère et traite des données provenant de sources multiples, notamment la vidéo, les images, la parole, le son et le texte, ce qui permet des perceptions plus détaillées et plus nuancées de l'environnement ou de la situation en question. Ce faisant, l'IA multimodale simule plus fidèlement la perception humaine.
De l'audio intégré à l'appareil photo ultra-large de 12 MP, les lunettes intelligentes Ray-Ban Meta sont bourrées de technologie. Actuellement aux États-Unis et au Canada, il est possible de bénéficier également de Meta AI - un assistant intelligent qui aide à accomplir des tâches, à créer et à se connecter avec les personnes et les choses. Il suffit de dire « Hey Meta » et de poser des questions ! Il est possible de contrôler les lunettes à l'aide de commandes vocales et, grâce à Meta AI, accéder à des informations en temps réel.
Meta a commencé à tester une mise à jour multimodale de l'IA en décembre, afin que les utilisateurs puissent interroger leurs lunettes sur ce qu’ils voient et qu'elles leur donnent des réponses ou des suggestions intelligentes et utiles. Cela signifie qu’il est possible de faire plus de choses avec ces lunettes. Meta déploie cette fonctionnalité sur toutes les lunettes intelligentes Ray-Ban Meta aux États-Unis et au Canada en version bêta.
L'Échec des Google Glass et les questions autour des lunettes Ray-Ban Meta
L'année dernière, les lunettes Ray-Ban de Meta ont suscité une controverse concernant la reconnaissance faciale, avec des inquiétudes quant à une éventuelle généralisation de cette technologie. L'exemple de la Chine met en garde contre les dangers potentiels, où la police utilise déjà des lunettes similaires pour des applications de reconnaissance faciale. Ces dispositifs sont connectés à une base de données interne contenant des informations sur les personnes recherchées. Ils automatisent le processus d'identification des individus en comparant les visages capturés avec ceux de la base de données. Si une correspondance est trouvée, les détails de la personne sont transmis à l'agent de police. Ces lunettes ont déjà été utilisées avec succès pour appréhender des criminels et détecter l'utilisation de fausses identités lors de voyages.
Les avis expriment des doutes quant à l'utilité réelle de cette fonctionnalité, remettant en question son potentiel à fournir une expérience significative. Certains se demandent même quel est l'intérêt d'un appareil qui se contente de parler sans afficher d'informations à l'écran, tandis que d'autres comparent ces lunettes à d'autres produits comme les Google Glass, soulignant leurs défauts et limitations.
Les raisons de l'échec des Google Glass ont été examinées sous différents angles. Outre les préoccupations quant à leur praticité au quotidien, avec une caméra constamment positionnée sur le visage, des restrictions ont été imposées dans certains établissements tels que les bars et les restaurants, entraînant une marginalisation du dispositif. En outre, plusieurs facteurs ont contribué à son manque de succès :
- les Google Glass ont été commercialisées comme un produit haut de gamme, affichant un prix élevé ;
- Google a tenté de créer une communauté exclusive d'utilisateurs, positionnant les Glass comme un accessoire de mode prisé par les initiés ;
- des efforts ont été déployés pour associer les lunettes à l'industrie de la mode, les présentant lors de défilés et dans des campagnes publicitaires ciblées.
Cependant, malgré ces stratégies, le produit a été largement critiqué pour son coût prohibitif, ses préoccupations en matière de sécurité et de vie privée, contribuant ainsi à son échec sur le marché.
Malgré l'ajout de l'IA multimodale, les lunettes intelligentes Ray-Ban Meta pourraient ne pas entièrement satisfaire les attentes des utilisateurs. Les réactions sont mitigées, avec des commentaires sceptiques sur l'utilité et la pertinence de cette technologie dans ce contexte. Ainsi, bien que les lunettes Ray-Ban Meta offrent diverses fonctionnalités, leur capacité à répondre aux besoins et aux attentes des utilisateurs reste à confirmer.
En parallèle, l'intégration de la reconnaissance faciale dans des lunettes de soleil soulève d'importantes préoccupations concernant la vie privée et une surveillance généralisée. Certains critiques estiment que cette technologie pourrait renforcer la surveillance de l'État. De plus, les lunettes intelligentes, telles que celles promues par Google et Meta, sont considérées comme des dispositifs connectés qui pourraient compromettre la confidentialité des utilisateurs. Des experts mettent en garde contre les risques potentiels associés à l'Internet des Objets, soulignant les menaces inhérentes à ces avancées technologiques.
Source : Meta
Et vous ?
Quel est votre avsi sur le sujet ?
Pour ou contre la généralisation de l'utilisation de lunettes connectées dotées d'IA ?
Voir aussi :
Meta va ajouter des fonctionnalités d'intelligence artificielle à ses lunettes connectées Ray-Ban. Disponibles en accès anticipé, elles s'activent en disant "Hey Meta" suivi d'une requête
Meta suscite des craintes en matière de protection de la vie privée après la sortie de lunettes intelligentes à 299 $ équipées de caméras cachées, qui permettent de filmer des individus à leur insu