L'intelligence artificielle au niveau humain est sur le point d'être enfin atteinte, selon un chercheur principal de la division DeepMind AI de Google. Le Dr Nando de Freitas a déclaré que « la partie est terminée » dans la quête de plusieurs décennies pour réaliser l'intelligence artificielle générale (IAG) après que DeepMind a dévoilé un système d'IA capable d'accomplir un large éventail de tâches complexes, de l'empilement de blocs à l'écriture de poésie. Décrit comme un « agent généraliste », le nouveau Gato AI de DeepMind doit simplement être mis à l'échelle afin de créer une IA capable de rivaliser avec l'intelligence humaine, a estimé le Dr de Freitas. Mais son enthousiasme n'est pas partagé par tous.Des chercheurs de DeepMind, une filiale d'Alphabet opérant dans la recherche sur l'IA, ont mis au point un agent généraliste. Voici les notes qu'ils ont écrites sur Gato, le nom donné à cet agent :
« Inspirés par les progrès de la modélisation du langage à grande échelle, nous appliquons une approche similaire à la construction d'un agent généraliste unique au-delà du domaine des sorties de texte. L'agent, que nous appelons Gato, fonctionne comme une police généraliste multimodale, multitâche et multi-incarnation. Le même réseau avec les mêmes poids peut jouer à Atari, sous-titrer des images, discuter, empiler des blocs avec un vrai bras de robot et bien plus encore, en décidant en fonction de son contexte s'il faut sortir du texte, des couples articulaires, des pressions sur des boutons ou d'autres jetons.
« Pendant la phase de formation de Gato, les données de différentes tâches et modalités sont sérialisées en une séquence plate de jetons, regroupées et traitées par un réseau neuronal transformateur similaire à un grand modèle de langage. La perte est masquée de sorte que Gato prédit uniquement les cibles d'action et de texte.
« Lors du déploiement de Gato, une invite, telle qu'une démonstration, est symbolisée, formant la séquence initiale. Ensuite, l'environnement produit la première observation, qui est également symbolisée et ajoutée à la séquence. Gato échantillonne le vecteur d'action de manière autorégressive, un jeton à la fois. Une fois que tous les jetons composant le vecteur d'action ont été échantillonnés (déterminés par la spécification d'action de l'environnement), l'action est décodée et envoyée à l'environnement qui effectue une étape et produit une nouvelle observation. Ensuite, la procédure se répète. Le modèle voit toujours toutes les observations et actions précédentes dans sa fenêtre de contexte de 1024 jetons ».
« Les humains ne développeront pas une intelligence artificielle générale de notre vivant », selon un journaliste
Tristan Greene est journaliste pour le compte de The Next Web. Suite à la présentation de Gato, il a affiché son scepticisme de voir créer une intelligence artificielle générale :
« DeepMind a dévoilé aujourd'hui un nouveau système d'IA multimodal capable d'effectuer plus de 600 tâches différentes. Surnommé Gato, il s'agit sans doute du kit d'apprentissage automatique tout-en-un le plus impressionnant jamais vu au monde. Et bien qu'il reste à voir exactement dans quelle mesure il fonctionnera une fois que les chercheurs et les utilisateurs extérieurs aux laboratoires DeepMind auront mis la main dessus, Gato semble être tout ce que GPT-3 souhaite qu'il soit et plus encore.
« Voici pourquoi cela me rend triste : GPT-3 est un large-language mode (LLM) produit par OpenAI, la société d'intelligence artificielle générale (IAG) la mieux financée au monde. Cependant, avant de pouvoir comparer GPT-3 et Gato, nous devons comprendre d'où viennent OpenAI et DeepMind en tant qu'entreprises.
« OpenAI est une idée originale d'Elon Musk, elle a reçu des milliards en soutien de Microsoft, et le gouvernement américain pourrait fondamentalement se soucier moins de ce qu'il fait en matière de réglementation et de surveillance. Gardant à l'esprit que le seul but d'OpenAI est de développer et de contrôler une IAG (c'est une IA capable de faire et d'apprendre tout ce qu'un humain pourrait, avec le même accès), il est un peu dommage que tout ce que l'entreprise a réussi à produire soit un LLM vraiment fantaisiste.
« Ne vous méprenez pas, GPT-3 est impressionnant. En fait, il est sans doute aussi impressionnant que le Gato de DeepMind, mais cette évaluation...
La fin de cet article est réservée aux abonnés. Soutenez le Club Developpez.com en prenant un abonnement pour que nous puissions continuer à vous proposer des publications.
