IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)

Vous êtes nouveau sur Developpez.com ? Créez votre compte ou connectez-vous afin de pouvoir participer !

Vous devez avoir un compte Developpez.com et être connecté pour pouvoir participer aux discussions.

Vous n'avez pas encore de compte Developpez.com ? Créez-en un en quelques instants, c'est entièrement gratuit !

Si vous disposez déjà d'un compte et qu'il est bien activé, connectez-vous à l'aide du formulaire ci-dessous.

Identifiez-vous
Identifiant
Mot de passe
Mot de passe oublié ?
Créer un compte

L'inscription est gratuite et ne vous prendra que quelques instants !

Je m'inscris !

Toyota Research annonce une percée dans l'apprentissage de nouveaux comportements aux robots
Avec l'objectif d'enseigner un millier de nouvelles compétences d'ici à la fin de l'année 2024

Le , par Jade Emy

3PARTAGES

4  0 
Aujourd'hui, le Toyota Research Institute (TRI) a annoncé une approche générative de l'IA basée sur la politique de diffusion pour enseigner rapidement et en toute confiance aux robots de nouvelles compétences dextrogyres. Cette avancée améliore considérablement l'utilité des robots et constitue une étape vers la construction de "grands modèles de comportement (LBM)" pour les robots, analogues aux grands modèles de langage (LLM) qui ont récemment révolutionné l'IA conversationnelle.

"Nos recherches en robotique visent à amplifier les personnes plutôt qu'à les remplacer", a déclaré Gill Pratt, PDG de TRI et scientifique en chef de Toyota Motor Corporation. "Cette nouvelle technique d'enseignement est à la fois très efficace et produit des comportements très performants, ce qui permet aux robots d'amplifier les personnes de manière beaucoup plus efficace à bien des égards."

Les techniques de pointe précédentes pour enseigner de nouveaux comportements aux robots étaient lentes, incohérentes, inefficaces et souvent limitées à des tâches étroitement définies réalisées dans des environnements très contraignants. Les roboticiens devaient passer de nombreuses heures à écrire des codes sophistiqués et/ou à utiliser de nombreux cycles d'essais et d'erreurs pour programmer des comportements.


TRI a déjà enseigné aux robots plus de 60 compétences difficiles et dextres en utilisant la nouvelle approche, y compris le versement de liquides, l'utilisation d'outils et la manipulation d'objets déformables. Ces résultats ont été obtenus sans écrire une seule ligne de nouveau code. Le seul changement a consisté à fournir de nouvelles données au robot. Fort de ce succès, TRI s'est fixé l'objectif ambitieux d'enseigner des centaines de nouvelles compétences d'ici à la fin de l'année et un millier d'ici à la fin de l'année 2024.

Les nouvelles d'aujourd'hui soulignent également qu'il est possible d'apprendre aux robots à fonctionner dans de nouveaux scénarios et à adopter un large éventail de comportements. Ces compétences ne se limitent pas au simple "pick and place", c'est-à-dire au simple fait de ramasser des objets et de les déposer à un nouvel endroit. Les robots de TRI peuvent désormais interagir avec le monde de manière variée et riche, ce qui permettra un jour aux robots d'aider les personnes dans des situations quotidiennes et dans des environnements imprévisibles et en constante évolution.

"Les tâches que je vois ces robots accomplir sont tout simplement stupéfiantes. Il y a un an encore, je n'aurais pas pensé que nous serions proches de ce niveau de dextérité", a déclaré Russ Tedrake, vice-président de la recherche en robotique à l'IRT. M. Tedrake, qui est également professeur de génie électrique et d'informatique, d'aéronautique et d'astronautique, et de génie mécanique au MIT, explique : "Ce qui est si passionnant dans cette nouvelle approche, c'est le rythme et la fiabilité avec lesquels nous pouvons ajouter de nouvelles compétences. Comme ces compétences fonctionnent directement à partir des images de la caméra et de la détection tactile, en utilisant uniquement des représentations apprises, elles sont capables de donner de bons résultats même pour des tâches impliquant des objets déformables, des tissus et des liquides, qui ont toujours été extrêmement difficiles pour les robots".

Détails techniques :

Le modèle de comportement du robot de TRI apprend à partir des démonstrations haptiques d'un enseignant, combinées à une description linguistique de l'objectif. Il utilise ensuite une politique de diffusion basée sur l'IA pour apprendre la compétence démontrée. Ce processus permet de déployer un nouveau comportement de manière autonome à partir de dizaines de démonstrations. Non seulement cette approche produit des résultats cohérents, reproductibles et performants, mais elle le fait à une vitesse phénoménale.

Les principales réalisations de la recherche de TRI pour ce nouveau développement sont les suivantes :

  • Politique de diffusion : TRI et ses collaborateurs du groupe du professeur Song à l'université de Columbia ont mis au point une nouvelle et puissante approche générative de l'IA pour l'apprentissage du comportement. Cette approche, appelée politique de diffusion, permet d'enseigner facilement et rapidement un comportement à partir d'une démonstration.
  • Plate-forme robotique personnalisée : La plateforme robotique de TRI est conçue sur mesure pour les tâches de manipulation dextre à deux bras, avec un accent particulier sur le retour d'information haptique et la détection tactile.
  • Pipeline : Les robots de TRI ont déjà acquis 60 compétences dextrogyres, l'objectif étant d'en acquérir des centaines d'ici la fin de l'année et 1 000 d'ici la fin de l'année 2024.
  • Drake : Une partie de notre sauce (pas si) secrète est Drake, une conception basée sur des modèles pour la robotique qui nous fournit une boîte à outils et une plateforme de simulation à la pointe de la technologie. Le haut degré de réalisme de Drake nous permet de développer à la fois en simulation et en réalité à une échelle et à une vitesse considérablement accrues par rapport à ce qu'il serait possible de faire autrement. Notre pile de robots interne est construite à l'aide des cadres d'optimisation et de systèmes de Drake, et nous avons fait de Drake une source ouverte pour catalyser le travail de l'ensemble de la communauté de la robotique.
  • La sécurité : La sécurité est au cœur de nos efforts en matière de robotique au TRI. Nous avons conçu notre système avec des protections solides, alimentées par Drake et notre pile de contrôle de robot personnalisée, pour s'assurer que nos robots respectent les garanties de sécurité, comme le fait de ne pas entrer en collision avec eux-mêmes ou leur environnement.

À propos du Toyota Research Institute

Le Toyota Research Institute (TRI) mène des recherches visant à amplifier les capacités humaines et à rendre nos vies plus sûres et plus durables. Dirigée par le Dr Gill Pratt, l'équipe de chercheurs de TRI développe des technologies pour faire progresser l'énergie et les matériaux, l'intelligence artificielle centrée sur l'homme, la conduite interactive humaine, l'apprentissage automatique et la robotique. Établi en 2015, TRI a des bureaux à Los Altos, en Californie, et à Cambridge, dans le Massachusetts.

Source : Toyota Research Institute

Et vous ?

Quel est votre avis sur cette avancée ?
Pensez-vous que cette approche va révolutionner l'apprentissage automatique ?

Voir aussi :

ARTEMIS, un robot humanoïde joueur de football : il est capable de courir et peut maintenir son équilibre face à des coups de pied et des poussées violentes

La dernière vidéo du robot humanoïde Atlas de Boston Dynamics montre qu'il est capable de courir, sauter, prendre un objet au sol et le lancer à un ouvrier sur un chantier de construction simulé

Les scientifiques utilisent les mathématiques pour calculer les réseaux de neurones et analyser comment ils se comportent au "bord du chaos", cela peut aider l'IA à mieux cerner le comportement humain

Une erreur dans cette actualité ? Signalez-nous-la !