IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)

Vous êtes nouveau sur Developpez.com ? Créez votre compte ou connectez-vous afin de pouvoir participer !

Vous devez avoir un compte Developpez.com et être connecté pour pouvoir participer aux discussions.

Vous n'avez pas encore de compte Developpez.com ? Créez-en un en quelques instants, c'est entièrement gratuit !

Si vous disposez déjà d'un compte et qu'il est bien activé, connectez-vous à l'aide du formulaire ci-dessous.

Identifiez-vous
Identifiant
Mot de passe
Mot de passe oublié ?
Créer un compte

L'inscription est gratuite et ne vous prendra que quelques instants !

Je m'inscris !

Google dévoile le projet Mariner, son premier agent d'IA autonome capable de naviguer sur les navigateurs web, de contrôler le curseur et de remplir des formulaires pour reproduire les interactions en ligne

Le , par Anthony

60PARTAGES

4  0 
Google dévoile le projet Mariner, son premier agent d'IA autonome capable de naviguer sur les navigateurs web, de contrôler le curseur et de remplir des formulaires pour reproduire les interactions en ligne

Google a dévoilé ce 11 décembre 2024 le Project Mariner, son premier agent d'intelligence artificielle (IA) capable de naviguer de manière autonome sur les navigateurs web, par le biais d'une extension Chrome qui contrôle les mouvements du curseur et le remplissage des formulaires afin de reproduire les interactions humaines en ligne.

Le projet Mariner a été annoncé lors du lancement par Google de sa nouvelle famille de modèles d'IA Gemini 2.0, que l'entreprise décrit comme son « nouveau modèle d'IA pour l'ère agentique ». Le premier modèle disponible, Gemini 2.0 Flash, est une version expérimentale de référence disposant d'une faible latence et de performances améliorées. Selon Google, Gemini 2.0 Flash surpasse Gemini 1.5 Pro sur des benchmarks clés concernant le code, la factualité, les mathématiques, le raisonnement, et plus encore - avec une vitesse deux fois supérieure.

Le projet Mariner, alimenté par Gemini 2.0, a été développé par la division DeepMind de Google et est initialement disponible pour un groupe restreint de testeurs. Lors des démonstrations, l'agent a effectué des tâches telles que la création de paniers d'achat sur des sites web de vente, mais avec des délais perceptibles de cinq secondes entre les actions. Le système effectue des captures d'écran du navigateur et les traite via Gemini dans le cloud pour générer des commandes de navigation.


L'agent fonctionne uniquement dans l'onglet actif de Chrome, ce qui oblige les utilisateurs à observer ses actions plutôt que de les exécuter en arrière-plan.

Lors de l'évaluation par rapport au benchmark WebVoyager, qui teste les performances pour les tâches basées sur le web, le projet Mariner a obtenu un taux de réussite de 83,5 % en travaillant avec un seul agent. L'agent a des limites intégrées, notamment l'impossibilité d'effectuer des achats, d'accepter des cookies ou d'accepter des conditions de service.

Jaclyn Konzelmann, directrice de Google Labs, a décrit le projet comme un « changement de paradigme UX fondamentalement nouveau » qui pourrait transformer la manière dont les utilisateurs interagissent avec les sites web. L'entreprise a déclaré qu'elle s'engageait avec les parties prenantes de l'écosystème du web au fur et à mesure que le développement se poursuit.

Le projet Mariner est un prototype de recherche précoce construit avec Gemini 2.0 qui explore l'avenir de l'interaction homme-agent, en commençant par le navigateur. En tant que prototype de recherche, il est capable de comprendre et de raisonner à travers les informations de l'écran du navigateur de l'utilisateur, y compris les pixels et les éléments web tels que le texte, le code, les images et les formulaires, puis d'utiliser ces informations via une extension Chrome expérimentale pour effectuer des tâches à la place de l'utilisateur.


Selon l'entreprise, bien qu'il soit encore tôt, le projet Mariner montre qu'il devient techniquement possible de naviguer dans un navigateur, même si ce n'est pas toujours précis et que cela prend actuellement du temps pour effectuer les tâches, mais cela s'améliorera rapidement au fil du temps.

Pour construire ce système de manière sûre et responsable, Google a mené des recherches actives sur de nouveaux types de risques et de mesures d'atténuation, tout en gardant les humains dans le circuit. Par exemple, le projet Mariner ne peut taper, faire défiler ou cliquer que dans l'onglet actif du navigateur, et il demande aux utilisateurs une confirmation finale avant d'entreprendre certaines actions sensibles, comme un achat en ligne.

Et vous ?

Que pensez-vous du projet Mariner et de ses fonctionnalités ?
Trouvez-vous qu'il s'agit d'un outil utile et intéressant ?
Avez-vous déjà utilisé un outil similaire pour votre usage ou le développement d'applications, et si oui, qu'en pensez-vous ?

Voir aussi :

Google est en train de développer l'IA Jarvis, qui prend le contrôle du navigateur web d'une personne pour effectuer des tâches en ligne telles que la recherche, l'achat d'articles ou la réservation de vols

Google a accidentellement divulgué un aperçu de son IA Jarvis, capable de prendre le contrôle d'un ordinateur, le logiciel a été disponible pendant une courte période sur le Chrome Web Store

Anthropic propose en bêta un outil d'IA capable de prendre le contrôle du curseur de la souris de l'utilisateur et d'effectuer des tâches de base sur son ordinateur, une technologie qui suscite des inquiétudes
Vous avez lu gratuitement 6 090 articles depuis plus d'un an.
Soutenez le club developpez.com en souscrivant un abonnement pour que nous puissions continuer à vous proposer des publications.

Une erreur dans cette actualité ? Signalez-nous-la !

Avatar de smarties
Expert confirmé https://www.developpez.com
Le 05/03/2025 à 9:44
60h/semaine (de 5 jours) + 10h/semaine (les trajets aller-retour domicile-travail) ce qui donne 14h à consacrer par jour au travail.

Si on ajoute :
- 1h pour se préparer le matin (voir un peu plus)
- 2h pour le soir pour faire les tâches ménagères (ménager, diner, ...)

Il reste déjà plus que 7h pour dormir, sinon il faut aussi travailler le WE. Qui tiendrait un rythme régulier comme ça ?
De mémoire, une étude avait conclu qu'au delà d'un certain nombre d'heures de travail par semaine la productivité s'effondrait.
6  0 
Avatar de calvaire
Expert éminent https://www.developpez.com
Le 05/03/2025 à 8:30
google, la boite qui a viré 12000 salariés en 2023 et veut recommencer depuis le début de cette années ? ca donne envie aux salariés de s'investir pour l'entreprise
Et quand bine même, je doute que bosser 60h de toute façon ce soit productif mentalement pour un ingénieur. Ca risque même d'avoir l'effet inverse.

Enfin l'ia, c'est que le début, c'est un marché très compétitifs et les clients ne sont pas fidèle donc y'a pas d'urgence a sortir un produit dans le mois.. Si dans 1ans google arrive a offrir un meilleur produit, les clients irons chez google.
C'est d'ailleurs une raison pour laquelle je n'ai jamais investie mon argent dans des compagnies aériennes, les clients sont pas fidèle.
Pour l'ia c'est la même chose, c'est les fabricants de puces qui sont gagnant (nvidia...) pas les vendeurs de modèles.
4  0 
Avatar de Dhafer1
Membre habitué https://www.developpez.com
Le 12/12/2024 à 17:38
J'ai testé Google Colab avec Gemini, c'est très puissant pour coder et déboguer. Mais génère aussi de mauvaises solutions parfois.
3  0 
Avatar de _toma_
Membre éclairé https://www.developpez.com
Le 12/12/2024 à 23:31
Encore une nouvelle annonce d'un nouveau produit révolutionnaire.

La com' qui cache le manque d'innovation d'une techno qui est vendue comme révolutionnaire, ça va finir par se voir. Non ?
1  0 
Avatar de marsupial
Expert éminent https://www.developpez.com
Le 27/02/2025 à 19:20
En général, Visual Studio est utilisé par les pros ou étudiant; et donc un tel public a déjà accès à la version pro de Gemini Code Assist.
Je ne dis pas que VS Code n'est pas aussi utilisé par les pros mais cela se destine à un public plus linux ou amateur. Je ne dis pas que le public linux est une bande d'amateurs mais un champ de clientèle allergique au payant même s'il y a des applis payantes ou des linux payant comme RHEL mais destinés à un public pro.

edit : donc Google ne va pas phagocyter son marché de Gemini Code Assist Enterprise en rendant disponible Gemini Code Assist pour Visual Studio, ça me paraît logique et je ne comprends pas le pouce vers le bas. S'il pouvait m'expliquer pourquoi, je suis tout ouïe.
2  1 
Avatar de Nym4x
Membre confirmé https://www.developpez.com
Le 02/11/2025 à 8:06
Mouai… J’ai testé codex d’openai censé être la révolution : une catastrophe… Après lui avoir fait générer un diagramme de base de données, je lui ai demandé de générer la première migration flyway pour postgresql… Et cela n’avait rien avoir avec le diagramme. Ensuite je lui ai demandé de générer le code pour du CRUD: cinq prompts après j’ai du corriger manuellement le code.

Résultat: de l’esbroufe crédible pour un non professionnel mais qui au final fait moins bien que les générateurs de code présents dans visual studio depuis des années.
1  0 
Avatar de r0d
Expert éminent https://www.developpez.com
Le 03/11/2025 à 9:55
J'utilise Gemini CLi régulièrement. Ce n'est certes pas l'outil magique révolutionnaire qui nous est venté par ses concepteurs, mais j'ai trouvé des façons de l'utiliser qui me font gagner énormément de temps. Pour faire simple, je lui fait faire des petites tâches atomiques et je mets tout ensemble moi-même ensuite.
Donc oui, ces outils ne sont pas encore aboutis, ni fiables (il faut absolument passer derrière), mais bien utilisés, ils peuvent nous faire gagner du temps. Beaucoup de temps parfois.
Et cela dépend du contexte également. Par exemple, pour faire un site web simple c'est l'idéal. Pour une appli mobile qui fait des prouts, c'est parfait. En revanche, pour coder un jeu vidéo un minimum optimisé, là on en est loin.

Ce qui m'tonne le plus dans cette histoire, c'est que tous ces outils soient gratuits.
1  0 
Avatar de floyer
Membre éclairé https://www.developpez.com
Le 03/11/2025 à 22:17
Citation Envoyé par r0d Voir le message
Ce qui m'tonne le plus dans cette histoire, c'est que tous ces outils soient gratuits.
Principe du vendeur de drogue... te rendre accroc avec des première drogues, et monter le prix ensuite.

Là, tant que tu as l'embarras du choix, des prix d'appel, voir la gratuité te seront proposés. Attend l'éclatement de la bulle, et le peu de rescapés remonteront spontanément leurs prix.
1  0 
Avatar de Jules34
Membre émérite https://www.developpez.com
Le 12/12/2024 à 15:36
ça n'augure rien de bon et ça va participer à faire d'internet un lieu ou plus personne ne parle ni n'échange...

Jaclyn Konzelmann, directrice de Google Labs, a décrit le projet comme un « changement de paradigme UX fondamentalement nouveau » qui pourrait transformer la manière dont les utilisateurs interagissent avec les sites web.
Je vois plutôt ça comme une nouvelle possibilité offerte aux bots de se faire passer pour des humains.

Théorie de l'internet mort.

Cette artificialisation des productions numériques s'explique en partie par le changement de modèle économique des plateformes. X et Tiktok rémunèrent désormais les créateurs au nombre de vues, sous certaines conditions (souscription à un compte Premium sur X etc.), ce qui encourage la production à la pelle de contenus engageants, leur partage automatisé et donc le recours à de l'IA. Selon une prépublication de chercheurs de l'université de Stanford et de Georgetown datant de mars 2024 (en attente de relecture par les pairs), l'algorithme de recommandation de Facebook amplifierait même la portée de contenus artificiels, en les faisant figurer dans le fil d'usagers qui ne sont pas abonnés aux faux comptes qui les partagent.
0  0 
Avatar de Jules34
Membre émérite https://www.developpez.com
Le 13/12/2024 à 9:16
Citation Envoyé par Mingolito Voir le message
Je ne sais pas si le nouvel outil de codage IA "Jules" sera utile, par contre je trouve que celui qui a mis en production sur ce forum le bot de troll complotiste "Jule34" a bien réussi son coup, ce bot très efficace arrive à énerver tous le monde contre lui en postant un ramassis de foutaises complotistes
Expérience scientifique pour un papier de recherches ? Bot Chinois ? Russe ?
Nous aussi on t'aime camarade.
0  0