Waymo a lancé un nouveau modèle multimodal de bout en bout pour la conduite autonome (EMMA). Entraîné sur la prédiction de trajectoire du planificateur, la détection d'objets et la compréhension du graphe routier, EMMA a montré des performances améliorées. Waymo déclare pour l'annonce: "en appliquant des technologies d'IA de pointe à des tâches réelles, nous élargissons les capacités de l'IA dans des environnements complexes et dynamiques."
Waymo est une entreprise de technologie de conduite autonome et une filiale d'Alphabet Inc. qui propose un service au public sans conducteur de sécurité dans le véhicule. Selon les rapports de la société, son service de robotaxi autonome, Waymo One, offrait plus de 100 000 trajets payants en robotaxi chaque semaine. Récemment, Waymo a annoncé que ce service est désormais disponible pour tout public dans la ville de Los Angeles, la société ayant supprimé sa liste d'attente dans la ville.
Pour améliorer la conduite autonome de son service, Waymo a lancé un nouveau modèle de recherche en IA. Le modèle multimodal de bout en bout pour la conduite autonome (EMMA) a été spécifiquement formé et affiné pour la conduite autonome, en tirant parti de la connaissance du monde de Gemini pour mieux comprendre les scénarios routiers complexes.
Waymo a publié un document de recherche sur son nouveau modèle, qui, selon l'entreprise, démontre comment les modèles multimodaux peuvent être appliqués à la conduite autonome, tout en explorant les avantages et les inconvénients de l'approche pure de bout en bout. "En nous appuyant sur Gemini et en tirant parti de ses capacités, nous avons créé un modèle adapté aux tâches de conduite autonome telles que la planification des mouvements et la détection d'objets en 3D", a déclaré Waymo dans l'annonce.
Selon l'entreprise, EMMA montre un transfert de tâches efficace pour les principales tâches de conduite autonome. Entraîné sur la prédiction de trajectoire du planificateur, la détection d'objets et la compréhension du graphe routier, EMMA a montré des performances améliorées par rapport à l'entraînement de modèles distincts pour chaque tâche, selon Waymo. Waymo a déclaré que la recherche suggère "une voie prometteuse pour la recherche future, où des tâches de conduite autonome encore plus essentielles pourraient être combinées dans une configuration similaire et à plus grande échelle".
"EMMA est une recherche qui démontre la puissance et la pertinence des modèles multimodaux pour la conduite autonome", a déclaré Drago Anguelov, vice-président de Waymo et responsable de la recherche. "Nous sommes ravis de continuer à explorer la façon dont les méthodes et les composants multimodaux peuvent contribuer à la construction d'une pile de conduite encore plus généralisable et adaptable."
Les recherches de Waymo comprennent la capacité d'EMMA à traiter les entrées brutes des caméras et les données textuelles pour générer divers résultats de conduite, un espace linguistique unifié permettant à EMMA de maximiser la connaissance du monde de Gemini et son raisonnement en chaîne de pensée pour améliorer le processus de prise de décision et améliorer la planification de bout en bout.
Waymo a déclaré que l'importance de la recherche va au-delà des véhicules autonomes. "En appliquant des technologies d'IA de pointe à des tâches réelles, nous élargissons les capacités de l'IA dans des environnements complexes et dynamiques."
Cette annonce montre que Waymo est conscient des limites actuelles de son système de conduite autonome. En effet, depuis le déploiement des voitures autonomes de Waymo en Californie, plusieurs incidents sont survenus. En février 2024, on recense des collisions avec un portail, un cycliste, et une camionnette, ainsi que des actes de vandalisme envers l'un de leurs véhicules. Les autorités californiennes ont même dû reporter leur décision sur l'extension du service de robotaxi de Waymo, soulignant la nécessité d'un examen approfondi de la sécurité.
Source : Waymo
Et vous ?
Pensez-vous que ce modèle d'IA est crédible ou pertinent ?
Quel est votre avis sur la situation ?
Voir aussi :
Le système de sixième génération de Waymo est plus intelligent, plus performant et peut conduire dans la neige, avec un nouvel ensemble de capteurs comportant moins de composants et des capacités améliorées
Un groupe de travail sur la sécurité des véhicules teste 14 systèmes de conduite partiellement automatisée. Aucun n'obtient la note "bon" et Full Self-Driving de Tesla obtient la pire note globale
Mercedes-Benz devient le premier constructeur automobile à vendre des véhicules autonomes de niveau 3 aux États-Unis, sans qu'il soit nécessaire de surveiller la route lorsque le drive pilot est activé
Waymo lance un modèle d'IA pour la conduite autonome : des modèles multimodaux peuvent être appliqués à la conduite autonome tout en explorant une approche de bout en bout
Waymo lance un modèle d'IA pour la conduite autonome : des modèles multimodaux peuvent être appliqués à la conduite autonome tout en explorant une approche de bout en bout
Le , par Jade Emy
Une erreur dans cette actualité ? Signalez-nous-la !