L'IA DeepMind apprend la physique simple comme un bébé, le réseau neuronal pourrait constituer une étape vers des programmes permettant d'étudier la façon dont les nourrissons humains apprennent. S'inspirant de la recherche sur l'apprentissage des nourrissons, des informaticiens ont créé un programme capable de détecter des règles physiques simples concernant le comportement des objets et de s'étonner lorsqu'ils semblent violer ces règles.La « physique intuitive » nous permet de nous engager de manière pragmatique dans le monde physique et constitue un élément clé du « bon sens » de la pensée. Les systèmes d'intelligence artificielle actuels pâlissent dans leur compréhension de la physique intuitive, en comparaison même avec les très jeunes enfants. Les chercheurs de DeepMind abordent la question du fossé entre les humains et les machines en s’appuyant sur le domaine de la psychologie du développement.
Les psychologues du développement testent la façon dont les bébés comprennent le mouvement des objets en suivant leur regard. Lorsqu'on leur montre une vidéo montrant, par exemple, une balle qui disparaît soudainement, les enfants expriment leur surprise, que les chercheurs quantifient en mesurant la durée pendant laquelle les nourrissons fixent une direction particulière.
Luis Piloto, informaticien à la société DeepMind de Londres, propriété de Google, et ses collaborateurs ont voulu mettre au point un test similaire pour l'intelligence artificielle (IA). L'équipe a entraîné un réseau neuronal, un système logiciel qui apprend en repérant des modèles dans de grandes quantités de données, avec des vidéos animées d'objets simples tels que des cubes et des balles.
Le modèle logiciel, appelé PLATO (Physics Learning through Auto-encoding and Tracking Objects), a reçu les images brutes des vidéos, mais aussi des versions mettant en évidence chaque objet de la scène. PLATO a également été conçu pour développer une représentation interne des propriétés physiques des objets, telles que leur position et leur vitesse.
Le domaine de l'intelligence artificielle (IA) a fait des progrès étonnants ces dernières années, maîtrisant un éventail croissant de tâches qui incluent désormais les jeux vidéo Atari, les jeux de société tels que les échecs et le go, des problèmes scientifiques tels que le repliement des protéines et la modélisation du langage. En même temps, le succès dans ces domaines étroits a fait apparaître de plus en plus clairement que quelque chose de fondamental manque encore. En particulier, les systèmes d'IA les plus avancés ont encore du mal à saisir les connaissances de « bon sens » qui guident la prédiction, l'inférence et l'action dans les scénarios humains quotidiens.
Dans le présent travail, les chercheurs de DeepMind se concentrent sur un domaine particulier de connaissances de sens commun : la physique intuitive, le réseau de concepts qui sous-tend le raisonnement sur les propriétés et les interactions des objets macroscopiques. La physique intuitive est fondamentale pour l'intelligence incarnée, de toute évidence parce qu'elle est essentielle à toute action pratique, mais aussi parce qu'elle fournit une base pour la connaissance conceptuelle et la représentation compositionnelle en général.
Cependant, malgré des efforts considérables, les progrès récents de l'IA n'ont pas encore permis de mettre au point un système présentant une compréhension de la physique intuitive comparable à celle des très jeunes enfants.
L'IA DeepMind a été entraîné sur des dizaines d'heures de vidéos montrant des mécanismes simples tels qu'une balle dévalant une pente ou deux balles rebondissant l'une sur l'autre, et a développé la capacité de prédire le comportement de ces objets dans différentes situations.
Il a notamment appris des modèles tels que la continuité, dans laquelle un objet suit une trajectoire ininterrompue plutôt que de se téléporter par magie d'un endroit à un autre ; la solidité, qui empêche deux objets de se pénétrer l'un l'autre ; et la persistance de la forme des objets. « À chaque étape d'un film, il fait une prédiction sur ce qui va se passer ensuite, explique Piloto. Plus on avance dans le film, plus la prédiction devient précise. »
En développant des sondes comportementales pour la recherche sur les enfants, les psychologues du développement ont fondé leur approche sur deux principes. Premièrement, le cœur de la physique intuitive repose sur un ensemble de concepts discrets (par exemple, la permanence de l'objet, la solidité de l'objet, la continuité et ainsi de suite) qui peuvent être différenciés, opérationnalisés et sondés individuellement.
En ciblant spécifiquement des concepts discrets, le travail des chercheurs de DeepMind est très différent des approches standard de l'IA pour l'apprentissage de la physique intuitive, qui mesure les progrès via des métriques de prédiction de vidéos ou d'états, la prédiction de résultats binaires, les performances de réponse aux questions ou les récompenses élevées dans les tâches d'apprentissage par renforcement.
Ces approches alternatives semblent intuitivement exiger une compréhension de certains aspects de la physique intuitive, mais elles n'opérationnalisent pas clairement ou ne sondent pas stratégiquement un ensemble explicite de ces concepts. Le deuxième principe utilisé par les psychologues du développement pour sonder les concepts physiques est que la possession d'un concept physique correspond à la formation d'un ensemble d'attentes sur la façon dont l'avenir peut se dérouler.
Si les observateurs humains possèdent le concept de permanence des objets, ils s'attendent à ce que les objets ne « disparaissent pas de l'existence » lorsqu'ils sont hors de vue. S'ils s'attendent à ce que les objets ne s'interpénètrent pas les uns les autres, ils ont le concept de solidité. S'ils s'attendent à ce que les objets ne se téléportent pas par magie d'un endroit à un autre, mais qu'ils tracent au contraire des chemins continus à travers le temps et l'espace, alors ils ont le concept de continuité.
Avec cet échafaudage conceptuel, une méthode pour mesurer la connaissance d'un concept physique spécifique émerge : le paradigme de la violation des attentes (VoE). En utilisant le paradigme VoE pour sonder un concept spécifique, les chercheurs montrent aux nourrissons des tableaux visuellement similaires (appelés sondes) qui sont soit cohérents (physiquement possibles), soit...
La fin de cet article est réservée aux abonnés. Soutenez le Club Developpez.com en prenant un abonnement pour que nous puissions continuer à vous proposer des publications.