IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)

Vous êtes nouveau sur Developpez.com ? Créez votre compte ou connectez-vous afin de pouvoir participer !

Vous devez avoir un compte Developpez.com et être connecté pour pouvoir participer aux discussions.

Vous n'avez pas encore de compte Developpez.com ? Créez-en un en quelques instants, c'est entièrement gratuit !

Si vous disposez déjà d'un compte et qu'il est bien activé, connectez-vous à l'aide du formulaire ci-dessous.

Identifiez-vous
Identifiant
Mot de passe
Mot de passe oublié ?
Créer un compte

L'inscription est gratuite et ne vous prendra que quelques instants !

Je m'inscris !

Google dévoile le projet Mariner, son premier agent d'IA autonome capable de naviguer sur les navigateurs web, de contrôler le curseur et de remplir des formulaires pour reproduire les interactions en ligne

Le , par Anthony

16PARTAGES

4  0 
Google dévoile le projet Mariner, son premier agent d'IA autonome capable de naviguer sur les navigateurs web, de contrôler le curseur et de remplir des formulaires pour reproduire les interactions en ligne

Google a dévoilé ce 11 décembre 2024 le Project Mariner, son premier agent d'intelligence artificielle (IA) capable de naviguer de manière autonome sur les navigateurs web, par le biais d'une extension Chrome qui contrôle les mouvements du curseur et le remplissage des formulaires afin de reproduire les interactions humaines en ligne.

Le projet Mariner a été annoncé lors du lancement par Google de sa nouvelle famille de modèles d'IA Gemini 2.0, que l'entreprise décrit comme son « nouveau modèle d'IA pour l'ère agentique ». Le premier modèle disponible, Gemini 2.0 Flash, est une version expérimentale de référence disposant d'une faible latence et de performances améliorées. Selon Google, Gemini 2.0 Flash surpasse Gemini 1.5 Pro sur des benchmarks clés concernant le code, la factualité, les mathématiques, le raisonnement, et plus encore - avec une vitesse deux fois supérieure.

Le projet Mariner, alimenté par Gemini 2.0, a été développé par la division DeepMind de Google et est initialement disponible pour un groupe restreint de testeurs. Lors des démonstrations, l'agent a effectué des tâches telles que la création de paniers d'achat sur des sites web de vente, mais avec des délais perceptibles de cinq secondes entre les actions. Le système effectue des captures d'écran du navigateur et les traite via Gemini dans le cloud pour générer des commandes de navigation.


L'agent fonctionne uniquement dans l'onglet actif de Chrome, ce qui oblige les utilisateurs à observer ses actions plutôt que de les exécuter en arrière-plan.

Lors de l'évaluation par rapport au benchmark WebVoyager, qui teste les performances pour les tâches basées sur le web, le projet Mariner a obtenu un taux de réussite de 83,5 % en travaillant avec un seul agent. L'agent a des limites intégrées, notamment l'impossibilité d'effectuer des achats, d'accepter des cookies ou d'accepter des conditions de service.

Jaclyn Konzelmann, directrice de Google Labs, a décrit le projet comme un « changement de paradigme UX fondamentalement nouveau » qui pourrait transformer la manière dont les utilisateurs interagissent avec les sites web. L'entreprise a déclaré qu'elle s'engageait avec les parties prenantes de l'écosystème du web au fur et à mesure que le développement se poursuit.

Le projet Mariner est un prototype de recherche précoce construit avec Gemini 2.0 qui explore l'avenir de l'interaction homme-agent, en commençant par le navigateur. En tant que prototype de recherche, il est capable de comprendre et de raisonner à travers les informations de l'écran du navigateur de l'utilisateur, y compris les pixels et les éléments web tels que le texte, le code, les images et les formulaires, puis d'utiliser ces informations via une extension Chrome expérimentale pour effectuer des tâches à la place de l'utilisateur.


Selon l'entreprise, bien qu'il soit encore tôt, le projet Mariner montre qu'il devient techniquement possible de naviguer dans un navigateur, même si ce n'est pas toujours précis et que cela prend actuellement du temps pour effectuer les tâches, mais cela s'améliorera rapidement au fil du temps.

Pour construire ce système de manière sûre et responsable, Google a mené des recherches actives sur de nouveaux types de risques et de mesures d'atténuation, tout en gardant les humains dans le circuit. Par exemple, le projet Mariner ne peut taper, faire défiler ou cliquer que dans l'onglet actif du navigateur, et il demande aux utilisateurs une confirmation finale avant d'entreprendre certaines actions sensibles, comme un achat en ligne.

Et vous ?

Que pensez-vous du projet Mariner et de ses fonctionnalités ?
Trouvez-vous qu'il s'agit d'un outil utile et intéressant ?
Avez-vous déjà utilisé un outil similaire pour votre usage ou le développement d'applications, et si oui, qu'en pensez-vous ?

Voir aussi :

Google est en train de développer l'IA Jarvis, qui prend le contrôle du navigateur web d'une personne pour effectuer des tâches en ligne telles que la recherche, l'achat d'articles ou la réservation de vols

Google a accidentellement divulgué un aperçu de son IA Jarvis, capable de prendre le contrôle d'un ordinateur, le logiciel a été disponible pendant une courte période sur le Chrome Web Store

Anthropic propose en bêta un outil d'IA capable de prendre le contrôle du curseur de la souris de l'utilisateur et d'effectuer des tâches de base sur son ordinateur, une technologie qui suscite des inquiétudes
Vous avez lu gratuitement 2 articles depuis plus d'un an.
Soutenez le club developpez.com en souscrivant un abonnement pour que nous puissions continuer à vous proposer des publications.

Une erreur dans cette actualité ? Signalez-nous-la !

Avatar de smarties
Expert confirmé https://www.developpez.com
Le 05/03/2025 à 9:44
60h/semaine (de 5 jours) + 10h/semaine (les trajets aller-retour domicile-travail) ce qui donne 14h à consacrer par jour au travail.

Si on ajoute :
- 1h pour se préparer le matin (voir un peu plus)
- 2h pour le soir pour faire les tâches ménagères (ménager, diner, ...)

Il reste déjà plus que 7h pour dormir, sinon il faut aussi travailler le WE. Qui tiendrait un rythme régulier comme ça ?
De mémoire, une étude avait conclu qu'au delà d'un certain nombre d'heures de travail par semaine la productivité s'effondrait.
5  0 
Avatar de Dhafer1
Membre habitué https://www.developpez.com
Le 12/12/2024 à 17:38
J'ai testé Google Colab avec Gemini, c'est très puissant pour coder et déboguer. Mais génère aussi de mauvaises solutions parfois.
3  0 
Avatar de calvaire
Expert éminent https://www.developpez.com
Le 05/03/2025 à 8:30
google, la boite qui a viré 12000 salariés en 2023 et veut recommencer depuis le début de cette années ? ca donne envie aux salariés de s'investir pour l'entreprise
Et quand bine même, je doute que bosser 60h de toute façon ce soit productif mentalement pour un ingénieur. Ca risque même d'avoir l'effet inverse.

Enfin l'ia, c'est que le début, c'est un marché très compétitifs et les clients ne sont pas fidèle donc y'a pas d'urgence a sortir un produit dans le mois.. Si dans 1ans google arrive a offrir un meilleur produit, les clients irons chez google.
C'est d'ailleurs une raison pour laquelle je n'ai jamais investie mon argent dans des compagnies aériennes, les clients sont pas fidèle.
Pour l'ia c'est la même chose, c'est les fabricants de puces qui sont gagnant (nvidia...) pas les vendeurs de modèles.
3  0 
Avatar de _toma_
Membre éclairé https://www.developpez.com
Le 12/12/2024 à 23:31
Encore une nouvelle annonce d'un nouveau produit révolutionnaire.

La com' qui cache le manque d'innovation d'une techno qui est vendue comme révolutionnaire, ça va finir par se voir. Non ?
1  0 
Avatar de Jules34
Membre émérite https://www.developpez.com
Le 12/12/2024 à 15:36
ça n'augure rien de bon et ça va participer à faire d'internet un lieu ou plus personne ne parle ni n'échange...

Jaclyn Konzelmann, directrice de Google Labs, a décrit le projet comme un « changement de paradigme UX fondamentalement nouveau » qui pourrait transformer la manière dont les utilisateurs interagissent avec les sites web.
Je vois plutôt ça comme une nouvelle possibilité offerte aux bots de se faire passer pour des humains.

Théorie de l'internet mort.

Cette artificialisation des productions numériques s'explique en partie par le changement de modèle économique des plateformes. X et Tiktok rémunèrent désormais les créateurs au nombre de vues, sous certaines conditions (souscription à un compte Premium sur X etc.), ce qui encourage la production à la pelle de contenus engageants, leur partage automatisé et donc le recours à de l'IA. Selon une prépublication de chercheurs de l'université de Stanford et de Georgetown datant de mars 2024 (en attente de relecture par les pairs), l'algorithme de recommandation de Facebook amplifierait même la portée de contenus artificiels, en les faisant figurer dans le fil d'usagers qui ne sont pas abonnés aux faux comptes qui les partagent.
0  0 
Avatar de Jules34
Membre émérite https://www.developpez.com
Le 13/12/2024 à 9:16
Citation Envoyé par Mingolito Voir le message
Je ne sais pas si le nouvel outil de codage IA "Jules" sera utile, par contre je trouve que celui qui a mis en production sur ce forum le bot de troll complotiste "Jule34" a bien réussi son coup, ce bot très efficace arrive à énerver tous le monde contre lui en postant un ramassis de foutaises complotistes
Expérience scientifique pour un papier de recherches ? Bot Chinois ? Russe ?
Nous aussi on t'aime camarade.
0  0 
Avatar de jnspunk
Membre habitué https://www.developpez.com
Le 26/02/2025 à 7:27
C'est dommage qu'il ne soit pas disponible pour Visual Studio, je ne vois pas l'interet d'utiliser VS Code ?
0  0 
Avatar de r0d
Expert éminent https://www.developpez.com
Le 26/02/2025 à 10:58
Citation Envoyé par jnspunk Voir le message
C'est dommage qu'il ne soit pas disponible pour Visual Studio, je ne vois pas l'interet d'utiliser VS Code ?
VS Code est l'IDE le plus utilisé (source).
Jetbrains est en train de rebattre les cartes mais ça va prendre un peu de temps.
0  0 
Avatar de marsupial
Expert éminent https://www.developpez.com
Le 27/02/2025 à 19:20
En général, Visual Studio est utilisé par les pros ou étudiant; et donc un tel public a déjà accès à la version pro de Gemini Code Assist.
Je ne dis pas que VS Code n'est pas aussi utilisé par les pros mais cela se destine à un public plus linux ou amateur. Je ne dis pas que le public linux est une bande d'amateurs mais un champ de clientèle allergique au payant même s'il y a des applis payantes ou des linux payant comme RHEL mais destinés à un public pro.

edit : donc Google ne va pas phagocyter son marché de Gemini Code Assist Enterprise en rendant disponible Gemini Code Assist pour Visual Studio, ça me paraît logique et je ne comprends pas le pouce vers le bas. S'il pouvait m'expliquer pourquoi, je suis tout ouïe.
1  1 
Avatar de Camille12
Nouveau Candidat au Club https://www.developpez.com
Le 25/03/2025 à 12:41
Gemini 2.0 marque un bond en avant impressionnant pour l'IA, avec des performances accrues et une vitesse remarquable. La multimodalité et les capacités agentiques ouvrent des perspectives passionnantes, notamment pour les développeurs. La concurrence avec OpenAI s'intensifie, et c'est une excellente nouvelle pour l'innovation. Vivement les retours des testeurs !
0  0