Google lance enfin une application autonome pour son IA Gemini sur l'iPhone
L'ubiquité est une capacité primordiale dans la course à l'IA. Les entreprises engagées dans la bataille se sont empressées de créer des applications de bureau et des applications mobiles pour leurs chatbots d'IA afin de leur donner de nouvelles capacités, mais aussi de s'assurer qu'ils sont en face des utilisateurs le plus souvent possible. Google vient de lancer l'application iOS de son chatbot d'IA Gemini, un pas de plus pour étendre son IA aux utilisateurs de l'iPhone.
L'application gratuite est simple et directe : il s'agit simplement d'une fenêtre de chat et d'une liste de vos chats précédents. Gemini est multimodal, ce qui signifie que vous pouvez l'interroger avec du texte, de la voix ou votre appareil photo, et il vous donnera des réponses. Cette application autonome est en fait identique à la section Gemini de l'application Google, ou à ce que vous obtiendriez en ouvrant un navigateur et en vous rendant sur le site Web de Gemini.
L'application Gemini inclut l'accès à Gemini Live, un mode de chat plus interactif et conversationnel, similaire au mode vocal de ChatGPT. Gemini Live est disponible sur Android depuis quelques semaines, mais c'est la première fois qu'il est utilisable sur l'iPhone. Un utilisateur a rapporté : « lors de mes brefs essais jusqu'à présent, il fonctionne très bien, et lorsque vous utilisez Live, il apparaît à la fois dans Dynamic Island de l'iPhone et sur votre écran de verrouillage ».
Gemini Live gère les conversations naturelles avec des interruptions et des changements de sujet. La fonction offre dix options vocales distinctes et prend en charge 12 langues. Le générateur d'images premium de Google, Imagen 3, est intégré à l'application. Une nouvelle fonction « Extensions » permet de connecter Gemini à d'autres services de Google, comme YouTube et Gmail, dans le cadre de conversations uniques. Ce qui pourrait représenter un avantage.
L'intérêt de l'application Gemini est de placer l'icône sur votre écran d'accueil et de vous donner quelque chose à assigner au bouton d'action ou à l'un des autres points d'accès rapide de votre iPhone. D'une simple pression et en une demi-seconde, vous pouvez discuter avec Gemini. Cet accès est essentiel pour toute entreprise qui souhaite que les utilisateurs prennent l'habitude de discuter avec des chatbots.
L'application iOS de Gemini intensifie la concurrence entre Google et ses rivaux
Le lancement d'une application Gemini sur iOS par Google intensifie la concurrence avec ses rivaux dans le domaine de l'IA mobile. Selon le PDG de Microsoft AI, Mustafa Suleyman, « Microsoft Copilot se veut un compagnon IA pour tous ». Gemini adopte une approche similaire en ajoutant des capacités d'interaction vocale et de génération d'images. Les deux entreprises s'empressent de conquérir des parts de marché avant qu'Apple ne lance ses propres fonctions d'IA.
Au-delà des capacités de base des chatbots d'IA générative, les entreprises font également la course pour développer des outils d'IA plus sophistiqués. Selon un rapport de Bloomberg, OpenAI, dont la technologie alimente de nombreuses fonctionnalités d'IA de Microsoft, prévoit de lancer un agent autonome appelé « Operator » qui pourrait gérer des tâches telles que le codage et la réservation de voyages. Ce qui pourrait séduire de nombreux nouveaux utilisateurs.
Ces développements montrent comment les assistants d'IA tels que Gemini pourraient passer d'une simple interface de chat à des aides numériques plus complètes. Microsoft prévoit également de mettre à jour Copilot et a annoncé en octobre que les utilisateurs pourraient créer des agents autonomes dans Copilot Studio dans le courant de l'année. « Les agents autonomes peuvent comprendre la nature de votre travail et agir en votre nom », a déclaré Microsoft.
Pendant ce temps, Google serait en train de faire passer sa rivalité en matière d'IA avec OpenAI au niveau supérieur avec des modèles de « raisonnement ». Un rapport publié par Bloomberg en octobre indique que les équipes de Google ont progressé ces derniers mois dans la mise au point de logiciels pour les modèles d'IA qui ressemblent à des capacités de raisonnement humaines. Le rapport cite des personnes anonymes au fait des projets du géant de la recherche.
Google travaille depuis longtemps sur les capacités de « raisonnement » des modèles d'IA, notamment dans le cadre de ses travaux sur l'incitation à la réflexion en chaîne. Mais de nouvelles études montrent que les modèles d'IA les plus avancés ont des capacités médiocres en matière de raisonnement.
Le remplacement de Google Assistant par Gemini suscite plusieurs critiques
Google a annoncé en août 2024 que Gemini remplace désormais Google Assistant comme assistant virtuel par défaut sur le Pixel 9. Malheureusement, Gemini ne semble pas du tout prêt pour ce cas d'utilisation. L'intégration a laissé de côté de nombreuses fonctionnalités essentielles tout en visant une expérience plus conversationnelle. Les critiques de changement dénoncent un acharnement de Google visant à tuer Google Assistant prématurément.
Alors que Gemini vise à utiliser de grands modèles de langage pour des interactions plus conversationnelles, il ne parvient pas à effectuer des tâches de base essentielles pour une utilisation quotidienne. Bien que Google affirme que Gemini peut maintenant gérer un grand nombre d'instructions identiques à celles d'Assistant, des testeurs ont rapporté que ce n'est pas ce qu'ils ont constaté. Une série de fonctions ne fonctionnent pas correctement, voire pas du tout.
Google Assistant étant programmé pour exécuter un ensemble limité de tâches strictement définies, son expérience utilisateur est relativement simple, même si elle n'est pas nécessairement sophistiquée. Mais si l'on essaie d'effectuer un grand nombre de ces mêmes tâches avec Gemini, le modèle échoue. (Par ailleurs, Gemini va consommer probablement beaucoup plus d'énergie que Google Assistant.) Voici une liste des principales lacunes de Gemini :
- les résultats locaux sont moins efficaces : les requêtes portant sur les heures d'ouverture des commerces locaux ne renvoient qu'un contexte minimal sans aucun lien utile ;
- impossibilité de prendre des notes : les utilisateurs ne peuvent plus dicter des notes, ce qui représente une perte importante en matière de productivité ;
- absence du support des listes de tâches : contrairement à Assistant, Gemini ne peut pas faciliter la gestion des listes de tâches ;
- prévisions météorologiques imprécises : les utilisateurs signalent des erreurs de localisation dans les données météorologiques, ce qui frustre ceux qui souhaitent obtenir des mises à jour en temps voulu ;
- pas de navigation immédiate : les demandes d'itinéraires ne lancent pas la navigation immédiate, ce qui retarde l'expérience de l'utilisateur ;
- intégration limitée des services musicaux : alors que Google Assistant peut lire de la musique ou des podcasts provenant de YouTube, Spotify, Apple Music, Deezer et d'autres services de streaming, Gemini n'est connecté qu'à YouTube Music ;
- pas de liens directs vers le streaming : les utilisateurs doivent localiser manuellement le contenu au lieu d'être dirigés automatiquement ;
- perte de la capacité de recherche de photos : les demandes d'images spécifiques dans Google Photos ne sont pas prises en charge ;
- perte de l'information sur les actualités : la fonction d'information quotidienne est supprimée et remplacée par des conseils peu utiles ;
- des temps de réponse plus lents : les réponses de Gemini sont beaucoup plus lentes que celles d'Assistant, ce qui diminue la qualité de l'expérience utilisateur.
En somme, comme tous les autres chatbots, Gemini est très limité sur votre téléphone. Il ne peut pas modifier les paramètres ou accéder à d'autres applications. En revanche, il peut accéder à d'autres applications Google, ce qui reste le principal avantage de Gemini. Vous pouvez demander à Gemini de jouer de la musique et il lancera YouTube Music. Sur les appareils Android comme sur l'iPhone, vous pouvez lui demander un itinéraire et il vous enverra sur Google Maps.
Il ne s'agit que d'un petit aperçu de ce que Gemini espère être sur Android et de ce qu'Apple essaie de faire avec Siri : utiliser l'IA pour rendre tout ce qui se trouve sur votre téléphone un peu plus interactif et accessible. Mais tout cela n'a pas d'importance si les gens n'utilisent pas les chatbots ; la course pour votre écran d'accueil est donc lancée. L'application Gemini peut désormais être téléchargée sur l'App Store, offrant un nouveau choix aux utilisateurs d'IA générative.
Source : Google
Et vous ?
Quel est votre avis sur le sujet ?
Voir aussi
Gemini devient l'assistant virtuel par défaut sur les téléphones Pixel 9, mais l'IA de Google échoue fréquemment dans les tâches de base et certaines fonctionnalités clés de Google Assistant sont absentes
Google lance Gemini Live, un chatbot d'IA à commande vocale gratuit pour les utilisateurs d'Android, Gemini Live permettrait d'avoir des conversations naturelles avec un assistant d'IA
Gemini : Google sauvegarde par défaut vos conversations avec son chatbot IA séparément pendant des années, ce qui soulève des questions de sécurité