Developpez.com - Rubrique IA

Le Club des Développeurs et IT Pro

DeepMind de Google : son IA a atteint une « performance humaine » dans une version modifiée de Quake III Arena

Un jeu de tir en ligne

Le 2019-05-31 10:10:50, par Stéphane le calme, Chroniqueur Actualités
Des chercheurs de DeepMind, filiale de Alphabet, ont récemment appris à l'intelligence artificielle à jouer à des jeux vidéo tels que StarCraft II, mais ils ne s'étaient pas encore attaqués à un jeu en 3D à la première personne. La firme de recherche en apprentissage automatique affirme que son intelligence artificielle a atteint une « performance humaine » dans une version modifiée de Quake III Arena, le jeu de tir en ligne publié par id Software en 1999.

Les programmes de DeepMind ont montré les progrès dans les recherches en intelligence artificielle. Par exemple, une intelligence artificielle développée par DeepMind appelée AlphaStar a neutralisé deux joueurs professionnels de StarCraft II en janvier, bien que dans des conditions restreintes. Mais DeepMind n’est pas forcément intéressé par cette technologie pour rendre les jeux plus amusants ou plus difficiles. Au lieu de cela, la filiale d’Alphabet utilise le monde numérique de Quake III Arena pour apprendre à l'IA à imiter le comportement humain dans le monde réel.

« Le monde réel contient plusieurs agents, chacun apprenant et agissant indépendamment pour coopérer et rivaliser avec d'autres agents », a écrit DeepMind dans son article publié dans Science.


Un premier tournoi test avec des humains jouant à Capture The Flag avec et contre des agents entraînés et d’autres humains.

L’équipe a choisi une version modifiée du mode « Capturer le drapeau » de Quake III Arena, dans lequel deux équipes doivent s'affronter pour capturer le plus grand nombre de drapeaux en cinq minutes, car ses agents d’IA doivent non seulement lutter contre des adversaires, mais aussi naviguer dans un environnement et marquer des points.

La version de DeepMind de Quake III Arena n’est pas la même que le jeu auquel vous avez joué à l’époque des tamagotchis. La version modifiée du jeu utilise les cartes Quake III Arena. Il n’y a pas d’armes ou de modèles humains. Au lieu de cela, les joueurs IA sont de petites balles qui se déplacent à travers des cartes simplifiées. DeepMind a déclaré dans son blog que « tous les mécanismes de jeu restent les mêmes ». Au lieu de tirer sur des joueurs ennemis, les agents de l'IA se « taguent » pour se renvoyer à la base où ils vont réapparaître.


Il est crucial de noter que les agents IA participant à l’étude de DeepMind dans Quake III Arena n’avaient aucun accès aux informations de jeu qu’un joueur humain n’aurait pas, et n’ont pas appris les uns des autres. Au lieu de cela, ils ont appris indépendamment des données de pixels et d'un score de jeu. Cela a abouti à un « contrôle décentralisé au sein d'une équipe » d'agents IA, selon l’article.

« Ce qui rend ces résultats si intéressants, c'est que ces agents perçoivent leur environnement d'un point de vue personnel, comme le ferait un joueur humain », a déclaré le chercheur de DeepMind, Thore Graepel, dans un communiqué. « Pour apprendre à jouer de manière tactique et à collaborer avec leurs coéquipiers, ces agents doivent s’appuyer sur les informations communiquées par les résultats du jeu - sans qu’un enseignant ou un entraîneur ne leur dise quoi faire ».

Le système a fonctionné. DeepMind a utilisé un système de tournois avec sa version modifiée de Quake III Arena qui opposait 40 joueurs humains à l’IA entraînée de la société pour calculer les niveaux de compétence de l’IA. Certains agents ont été capables de surpasser même le taux de victoire des humains hautement qualifiés. Cela a été documenté à l'aide du système d'évaluation Elo, un système d'évaluation qui classe les joueurs en fonction de la probabilité de victoire.

« Les performances supérieures de nos agents pourraient être le résultat de leur traitement visuel et de leur contrôle moteur plus rapides », a écrit DeepMind sur son blog. « Cependant, en réduisant artificiellement cette précision et ce temps de réaction, nous avons constaté qu'il ne s'agissait que d'un facteur de succès ».

Source : DeepMind, Science
  Discussion forum
5 commentaires
  • pierre-y
    Membre chevronné
    "son IA a atteint une « performance humaine »"
    Elle c'est mit a rager en voyant qu'elle perdait et a insulter tout le monde sur le vocale?^^
  • Matthieu76
    Membre éclairé
    Envoyé par pierre-y
    Elle c'est mit a rager en voyant qu'elle perdait et a insulter tout le monde sur le vocale?^^
    Bonjour l’orthographe
  • abriotde
    Membre chevronné
    une intelligence artificielle soit capable de rivaliser avec l'homme "à heures de jeu égales"
    Ca voudrait rien dire. pour une machine qui est plus forte qu'un humain (une voiture par exemple), est ce que tu la compare avec la consommation (ou le rendement) énergétique d'un humain? Une machine n'a pas les même contraintes qu'un humain, elle à des avantages (elle peux agrégé des informations de plusieurs IA...) et des inconvénients (IA plus limité, pas d'expériences en dehors du jeu, dans la vraie vie...). Voudrais-tu interdire a un humain d'expérimenter la vie (d'expérimenter la gravitation et l'inertie par exemple) pour le confronter a une IA?

    La question n'est pas une question d'intelligence pur. Mais peut-on faire une IA qui puisse rivaliser avec une intelligence humaine dans des domaines ou l'intelligence doit élaborer des stratégie et avoir une compréhension du monde? Il s'agit là de pousser la recherche dans ses retranchements, pas d'organiser un concours avec des lois restrictives. On ajoute de la difficulté pour l'IA au fur et a mesure qu'elle progresse et qu'elle atteint les objectif d' "intelligence".
  • Mumus18
    Nouveau membre du Club
    Envoyé par Stéphane le calme

    Il est crucial de noter que les agents IA participant à l’étude de DeepMind dans Quake III Arena n’avaient aucun accès aux informations de jeu qu’un joueur humain n’aurait pas, et n’ont pas appris les uns des autres. Au lieu de cela, ils ont appris indépendamment des données de pixels et d'un score de jeu. Cela a abouti à un « contrôle décentralisé au sein d'une équipe » d'agents IA, selon l’article.
    Ça me parait évident, sinon ça ne servirait à rien de les comparer à des humains.

    Sur Starcraft II, AlphaStar avait, il me semble, des millions de parties et de cas enregistrées pour atteindre une perfection qu'un humain ne peut pas atteindre dans sa durée de vie. Battre des joueurs professionnels n'était qu'une démonstration. Il serait intéressant qu'un jour, une intelligence artificielle soit capable de rivaliser avec l'homme "à heures de jeu égales" comme dirait Adrien
  • phil995511
    Membre éprouvé
    Ce type d'AI va-t-il aussi bientôt rage-quitter les parties (rires) ??

    A part ça cet article tiens quelque part du ridicule... On sait depuis des lustres que les softs de triche disponibles en ligne font mieux que nous, ils tirent dans la tête des adversaires avec un taux de réussite de 100%.

    Et puis soyez sérieux les gus, cessez de comparer l'incomparable. Une machine ne sera jamais sensible, poétesse, émotionnelle, etc. Un automate aussi perfectionné qu'il soit ne sera jamais un être vivant !!