Google a annoncé Gemini 2.0, une IA capable d'aider les joueurs à comprendre les règles et stratégies des jeux vidéo en analysant les actions à l'écran et en proposant des suggestions en temps réel. Ces agents, qui peuvent également utiliser Google Search pour enrichir leurs conseils, sont testés sur des jeux comme Clash of Clans et Hay Day. Bien que prometteurs, ces outils semblent encore peu performants pour offrir une véritable valeur ajoutée. Parallèlement, Google développe Genie 2, un modèle capable de créer des mondes virtuels à partir d'une image, bien que ses capacités restent limitées à de courtes durées.Ces agents sont capables de « comprendre le jeu à partir des actions visibles à l'écran et de fournir des suggestions en temps réel », expliquent Demis Hassabis, PDG de Google DeepMind, et Koray Kavukcuoglu, directeur technologique. Ils ajoutent que ces agents peuvent également « utiliser Google Search pour accéder à une vaste base de connaissances sur les jeux en ligne ».
Actuellement, Google teste leurs capacités à interpréter les règles et défis dans des titres comme Clash of Clans et Hay Day de Supercell. Bien que prometteuse, cette technologie semble encore en phase préliminaire, et son utilité reste incertaine. Par exemple, il est légitime de se demander si un tel agent est réellement nécessaire pour des tâches simples comme rappeler des quêtes.
Par ailleurs, Google innove aussi dans le domaine des jeux vidéo en développant Genie 2, un modèle permettant de générer des mondes virtuels jouables à partir d’une simple image. Cependant, cette technologie est encore limitée, les mondes créés n’étant cohérents que pendant « une minute maximum », selon les précisions de l’entreprise.
Envoyé par
Sundar Pichai
L'information est au cœur du progrès humain. C'est pourquoi nous nous concentrons depuis plus de 26 ans sur notre mission, qui consiste à organiser l'information mondiale et à la rendre accessible et utile. Et c'est pourquoi nous continuons à repousser les frontières de l'IA pour organiser cette information à travers chaque entrée et la rendre accessible via n'importe quelle sortie, afin qu'elle puisse vous être vraiment utile.
Telle était notre vision lorsque nous avons présenté Gemini 1.0 en décembre dernier. Premier modèle conçu pour être nativement multimodal, Gemini 1.0 et 1.5 ont permis de grandes avancées en matière de multimodalité et de contexte long pour comprendre les informations à travers le texte, la vidéo, les images, l'audio et le code, et en traiter beaucoup plus.
Aujourd'hui, des millions de développeurs construisent avec Gemini. Et cela nous aide à réimaginer tous nos produits - y compris les 7 qui comptent 2 milliards d'utilisateurs - et à en créer de nouveaux. NotebookLM est un excellent exemple de ce que la multimodalité et le contexte long peuvent permettre aux gens, et c'est la raison pour laquelle il est aimé par tant d'entre eux.
L'année dernière, nous avons investi dans le développement de modèles plus agentiques, c'est-à-dire capables de mieux comprendre le monde qui vous entoure, d'anticiper plusieurs étapes et d'agir en votre nom, sous votre supervision.
Aujourd'hui, nous sommes ravis de lancer notre nouvelle ère de modèles conçus pour cette nouvelle ère agentique : nous présentons Gemini 2.0, notre modèle le plus performant à ce jour. Grâce à de nouvelles avancées en matière de multimodalité - comme la sortie native d'images et de sons - et d'utilisation d'outils natifs, il nous permettra de construire de nouveaux agents d'IA qui nous rapprocheront de notre vision d'un assistant universel.
Nous mettons la version 2.0 à la disposition des développeurs et des testeurs de confiance dès aujourd'hui. Et nous travaillons rapidement pour l'intégrer dans nos produits, en commençant par Gemini et Search. À partir d'aujourd'hui, le modèle expérimental Gemini 2.0 Flash sera disponible pour tous les utilisateurs de Gemini.
Nous lançons également une nouvelle fonctionnalité appelée Deep Research, qui utilise des capacités avancées de raisonnement et de contexte long pour agir comme un assistant de recherche, en explorant des sujets complexes et en compilant des rapports en votre nom. Elle est disponible dès aujourd'hui dans Gemini Advanced.
Aucun produit n'a été autant transformé par l'IA que la recherche. Nos aperçus d'IA touchent maintenant 1 milliard de personnes, leur permettant de poser des types de questions entièrement nouveaux - devenant rapidement l'une de nos fonctions de recherche les plus populaires.
Dans une prochaine étape, nous apportons les capacités de raisonnement avancées de Gemini 2.0 aux aperçus d'IA afin de traiter des sujets plus complexes et des questions à plusieurs étapes, y compris des équations mathématiques avancées, des requêtes multimodales et du codage. Nous avons commencé des tests limités cette semaine et nous les déploierons plus largement au début de l'année prochaine. Nous continuerons à proposer des aperçus de l'IA dans d'autres pays et d'autres langues au cours de l'année prochaine.
Les avancées de la version 2.0 s'appuient sur des investissements réalisés au cours des dix dernières années dans notre approche complète et différenciée de l'innovation en matière d'IA. Elle s'appuie sur du matériel personnalisé tel que Trillium, notre TPU de sixième génération. Les TPU ont alimenté 100 % de l'entraînement et de l'inférence de Gemini 2.0, et aujourd'hui Trillium est généralement disponible pour les clients afin qu'ils puissent également construire avec.
Si Gemini 1.0 visait à organiser et à comprendre les informations, Gemini 2.0 vise à les rendre beaucoup plus utiles. J'ai hâte de voir ce que cette nouvelle ère nous apportera.
Quand l’IA rencontre les jeux vidéo : opportunités et controversesLa présentation de Gemini 2.0 par Google suscite à la fois de l'enthousiasme et des interrogations. Cette technologie pourrait transformer l'expérience ludique, notamment pour les novices ou les joueurs cherchant à optimiser leur stratégie. Cependant, les tests actuels révèlent des limitations importantes, notamment dans la précision et l'efficacité des agents.
Les perspectives offertes par ces agents IA vont au-delà de l'assistance basique. Imaginez un monde où chaque personnage non joueur (PNJ) d'un jeu aurait une « conscience » propre, capable de coopérer, d'interagir et d'évoluer en temps réel. Ce concept pourrait révolutionner les jeux de rôle ouverts et les simulations, en créant des environnements dynamiques et immersifs. Cependant, cette vision ambitieuse soulève des défis techniques et éthiques, notamment concernant la triche et la dépendance excessive aux IA dans des contextes compétitifs.
Un autre enjeu concerne la capacité des agents à fournir des conseils réellement pertinents. Les premiers retours montrent des failles importantes, comme des erreurs d'interprétation dans des jeux simples tels que les échecs ou le Solitaire. Cela met en évidence que, malgré leur potentiel, ces outils en sont encore à un stade expérimental.
Enfin, les critiques pointent la nécessité d'un équilibre : les agents doivent enrichir l'expérience de jeu sans en ôter l'essence ou réduire l'implication active des joueurs. Si ces technologies atteignent leur maturité, elles pourraient redéfinir notre relation aux jeux vidéo, mais pour l'instant, elles posent plus de questions qu'elles n'apportent de réponses concrètes.
Source :
GoogleEt vous ? Quel est votre avis sur le sujet ?
Les joueurs ont-ils réellement besoin d’une IA pour comprendre des jeux vidéo relativement simples comme Clash of Clans et Hay Day ?
Voir aussi : L'IA Gemini de Google dispose désormais de sa propre application iPhone qui s'accompagne de la prise en charge Gemini Live, qui permet aux utilisateurs d'avoir des conversations naturelles avec le chatbot Google annonce deux nouveaux modèles IA Gemini, la réduction du prix de la version 1.5 Pro, l'augmentation des limites de taux, ainsi que la mise à jour des paramètres de filtre par défaut