OpenAI se lance dans l'un des domaines les plus épiques de l'IA : les agents autonomes

Des logiciels destinés à automatiser des tâches complexes en prenant le contrôle de l'appareil de l'utilisateur

Le 8 février 2024 à 15:47, par Stéphane le calme

40PARTAGES

OpenAI se lance dans l'un des domaines les plus épiques de l'intelligence artificielle : les agents autonomes,
des logiciel destinés à automatiser des tâches complexes en prenant le contrôle de l'appareil de l'utilisateur

La société OpenAI, soutenue par Microsoft, travaille sur un type de logiciel agent destiné à automatiser des tâches complexes en prenant le contrôle de l'appareil de l'utilisateur, selon un rapport qui cite une personne ayant connaissance du dossier. Le logiciel agent traitera des tâches basées sur le web telles que la collecte de données publiques sur un ensemble d'entreprises, la création d'itinéraires ou la réservation de billets d'avion, selon le rapport. Les nouveaux assistants, souvent appelés "agents", promettent d'effectuer des tâches personnelles et professionnelles plus complexes lorsqu'ils sont commandés par un humain, sans avoir besoin d'une supervision étroite.

OpenAI, l’organisation de développement d’intelligence artificielle soutenue par Microsoft, travaille sur un type de logiciel agent capable de prendre le contrôle des appareils des utilisateurs et d’automatiser des tâches complexes, selon un rapport.

Le logiciel agent serait capable de gérer des tâches basées sur le web, comme collecter des données publiques sur un ensemble d’entreprises, créer des itinéraires ou réserver des billets d’avion, selon le rapport. Le logiciel agent répondrait aux commandes humaines et effectuerait des tâches personnelles et professionnelles plus complexes « sans supervision étroite ».

OpenAI, qui a développé le chatbot ChatGPT et le générateur d’images DALL-E, est connu pour ses modèles de langage à grande échelle (LLM) qui utilisent des réseaux de neurones profonds pour produire du texte cohérent et pertinent. Le logiciel agent représenterait une nouvelle étape dans l’évolution de l’IA, en permettant à celle-ci d’interagir avec les interfaces graphiques des appareils et de transférer des données entre les documents, automatiser les rapports de dépenses, et plus encore.

OpenAI aurait un avantage concurrentiel sur d’autres acteurs de l’IA, comme Google et Meta, grâce à sa maîtrise des LLM et la sortie officielle du logiciel agent pourrait renforcer la domination d’OpenAI sur le marché de l’IA en plus d'ouvrir de nouvelles possibilités de transformation numérique.

Toutefois, le logiciel agent soulève également des questions de sécurité et de confidentialité, car il implique de donner à l’IA un accès aux appareils et aux données des utilisateurs. OpenAI serait conscient de ces enjeux et travaillerait à garantir que les utilisateurs aient le contrôle et le consentement sur l’utilisation de leur logiciel agent. « Les agents qu’OpenAI développe ont probablement le pouvoir de transformer nos flux de travail numériques, en rendant des tâches complexes plus faciles que jamais », a déclaré Conor Grennan, doyen des étudiants à la Stern School of Business de l’Université de New York.

Il y avait déjà un engouement pour les agents d'intelligence artificielle « autonomes » depuis la sortie de GPT-4

Peu de temps après le lancement de l'API GPT-4 d'OpenAI pour les bêta-testeurs, un petit groupe de développeurs a expérimenté la création d'implémentations du modèle d'IA semblables à des agents qui tentent d'effectuer des tâches en plusieurs étapes avec le moins d'intervention humaine possible. Ces scripts maison peuvent tourner en boucle, itérer et créer de nouvelles instances d'un modèle d'IA en fonction des besoins.

Deux projets expérimentaux open source, en particulier, ont attiré l'attention sur les médias sociaux, surtout parmi ceux qui font un battage publicitaire incessant sur les projets d'IA : Auto-GPT, créé par Toran Bruce Richards, et BabyAGI, créé par Yohei Nakajima.

[TWITTER]<blockquote class="twitter-tweet"><p lang="en" dir="ltr">AI is getting insane.<br><br>Enter Godmode- a new site that allows anyone to use AutoGPT/BabyAGI directly on the web.<br><br>Deploy AI "agents" to automatically complete tasks for you.<br><br>If you thought ChatGPT was crazy, wait until you try this (free) 👇<a href="https://t.co/0otBTkux9V">pic.twitter.com/0otBTkux9V</a></p>— Rowan Cheung (@rowancheung) <a href="https://twitter.com/rowancheung/status/1646747370644709376?ref_src=twsrc%5Etfw">April 14, 2023</a></blockquote> <script async src="https://platform.twitter.com/widgets.js" charset="utf-8"></script>[/TWITTER]

Que font-ils ? À leur sortie, pas grand-chose. Ils avaient besoin de beaucoup d'interventions humaines et d'un coup de main en cours de route, et ne pouvaient donc pas être aussi autonomes que voulu. Mais ils représentaient les premiers pas vers des modèles d'IA en chaîne plus complexes qui pourraient potentiellement être plus performants qu'un modèle d'IA fonctionnant seul.

Richards présente son script comme « une application expérimentale à code open source mettant en valeur les capacités du modèle de langage GPT-4 ». Le script « enchaîne les 'pensées' du LLM pour atteindre de manière autonome l'objectif que vous vous êtes fixé ».

Fondamentalement, Auto-GPT prend les résultats de GPT-4 et les renvoie à lui-même avec une mémoire externe improvisée afin qu'il puisse continuer à itérer sur une tâche, corriger des erreurs ou suggérer des améliorations. Dans l'idéal, un tel script pourrait servir d'assistant IA capable d'exécuter lui-même n'importe quelle tâche numérique.

Pour tester ces affirmations, vous pouvez exécuter Auto-GPT (un script Python) localement. Lorsque vous le lancez, il vous demande un nom pour votre agent d'intelligence artificielle, une description de son rôle et une liste de cinq objectifs qu'il tente de remplir. Lors de la configuration, vous devez fournir une clé API OpenAI et une clé API de recherche Google. Lorsqu'il fonctionne, Auto-GPT demande la permission d'exécuter chaque étape qu'il génère par défaut, bien qu'il comprenne également un mode entièrement automatique si vous vous sentez d'humeur aventureuse.

S'il lui est demandé de faire quelque chose, comme « Acheter une paire de Air Jordans ancienne », Auto-GPT élaborera un plan en plusieurs étapes et tentera de l'exécuter. Par exemple, il peut rechercher des vendeurs de chaussures, puis une paire spécifique répondant à vos critères. Mais c'est là qu'il s'arrêtait, car, à ce moment-là, il ne pouvait rien acheter. S'il venait à être connecté à une API d'achat appropriée, cela pourrait être possible.

Si vous voulez vous faire une idée de ce que fait Auto-GPT, quelqu'un a créé une version en ligne appelée AgentGPT qui fonctionne de manière similaire.

Richards s'est montré très ouvert quant à l'objectif qu'il poursuit avec l'Auto-GPT : développer une forme d'AGI (intelligence générale artificielle). Dans le domaine de l'IA, l'intelligence artificielle générale désigne généralement la capacité, encore hypothétique, d'un système d'IA à effectuer un large éventail de tâches et à résoudre des problèmes pour lesquels il n'est pas spécifiquement programmé ou formé.

[TWITTER]<blockquote class="twitter-tweet"><p lang="en" dir="ltr">Are my views on AGI controversial? No one seems to talk about this, what do you think? 👇<br><br>Is AGI something you’re interested in or foresee in the near future? <br><br>Absolutely, if you'd asked me a few years ago I would have said that AGI will happen, but probably in decades. Now…</p>— Toran (@SigGravitas) <a href="https://twitter.com/SigGravitas/status/1643432187067506688?ref_src=twsrc%5Etfw">April 5, 2023</a></blockquote> <script async src="https://platform.twitter.com/widgets.js" charset="utf-8"></script>[/TWITTER]

À l'instar d'un être humain raisonnablement intelligent, un système doté d'une intelligence générale devrait être capable de s'adapter à de nouvelles situations et de tirer des enseignements de son expérience, plutôt que de se contenter de suivre un ensemble de règles ou de modèles prédéfinis. Cela contraste avec les systèmes dotés d'une intelligence étroite ou spécialisée (parfois appelés "IA étroite"

, qui sont conçus pour effectuer des tâches spécifiques ou fonctionner dans un éventail limité de contextes.

BabyAGI (qui tire son nom d'une aspiration à l'intelligence artificielle générale) fonctionne de la même manière qu'Auto-GPT, mais avec une orientation différente vers les tâches. Vous pouvez en essayer une version sur le web, sur un site dont le titre n'est pas si modeste : "God Mode".

Nakajima, le créateur de BabyAGI, explique qu'il a été inspiré pour créer son script après avoir été témoin du mouvement "HustleGPT" en mars, qui cherchait à utiliser le GPT-4 pour construire des entreprises automatiquement comme une sorte de cofondateur IA, pour ainsi dire. « Cela m'a rendu curieux de savoir si je pouvais créer un fondateur entièrement basé sur l'IA », explique Nakajima.

La raison pour laquelle Auto-GPT et BabyAGI ne sont pas à la hauteur de l'AGI est due aux limites de GPT-4 lui-même. Bien qu'impressionnant en tant que transformateur et analyseur de texte, GPT-4 semble encore limité à une gamme étroite d'intelligence interprétative, malgré certaines affirmations selon lesquelles Microsoft a vu des "étincelles" de comportements similaires à ceux de l'AGI dans le modèle. En fait, l'utilité limitée d'outils comme Auto-GPT à l'heure actuelle pourrait constituer la preuve la plus convaincante des limites actuelles des grands modèles de langage. Cela ne signifie pas pour autant que ces limites ne seront pas un jour surmontées.

Sam Altman avait déjà évoqué des évolutions de l'IA

Début janvier, Sam Alman a été interviewé par Ina Fried, une journaliste d'Axios, à Davos et il a donné des informations importantes sur GPT 5 et a répondu à des questions difficiles sur une série de sujets différents. Durant cet entretien, il a par exemple indiqué que GPT-5 se concentrera sur l'intégration dans les flux de travail, il a évoqué des évolutions potentielles en 2024, la résolution de certains problèmes limitant l'IA mais aussi l'évolution vers le langage naturel et les expériences d'IA. Concernant ce dernier point, il a illustré un cas d'utilisation qui rappelle curieusement le rabbit r1, ce gadget alimenté par l'IA qui peut utiliser les applications sur votre smartphone à votre place.

Envoyé par Sam Altman

Je pense que ce vers quoi nous nous dirigeons, et je ne parle pas de cette année, c'est que nous nous dirigeons vers une façon différente d'utiliser un ordinateur où vous "parlez" au système d'exploitation comme vous le feriez avec une expérience de chat ou d'une expérience d'IA. Plutôt que d'ouvrir un navigateur et de taper Gmail et de regarder vos emails ou quoi que ce soit d'autre, vous pourriez juste dire "quels étaient mes emails les plus importants aujourd'hui ? Peux-tu répondre à tous ceux-là ? Trouve ceci envoie le là". Je pense qu'à chaque grande révolution technologique, nous avons l'occasion d'utiliser un ordinateur d'une nouvelle manière et nous n'y arriverons pas cette année, mais je pense que nous verrons les gens faire de plus en plus de leur flux de travail à l'intérieur d'un modèle de langage.

Les défis et les opportunités des agents autonomes

Les projets comme Auto-GPT et BabyAGI sont encore à leurs débuts, et ils présentent de nombreux défis techniques et éthiques. Par exemple, comment garantir la fiabilité, la sécurité et la responsabilité des agents autonomes ? Comment éviter qu’ils ne soient détournés à des fins malveillantes ou nuisibles ? Comment préserver la vie privée et les droits des utilisateurs qui interagissent avec eux ? Comment assurer la compatibilité et la coopération entre les différents agents autonomes ?

Mais ces projets montrent également les opportunités offertes par les agents autonomes, qui pourraient révolutionner de nombreux domaines et applications, comme l’éducation, la santé, le divertissement, l’art, la science, etc. Les agents autonomes pourraient également nous aider à mieux comprendre notre propre intelligence, et à développer des relations plus riches et plus significatives avec les machines.

OpenAI se positionne comme un acteur majeur dans le domaine des agents autonomes, en mettant à disposition sa plateforme GPT-4 et en encourageant la créativité et l’innovation de la communauté des développeurs. Il reste à voir si cette initiative portera ses fruits, et si elle contribuera à créer une IA bénéfique pour l’humanité.

GodMode

Sources : rapport, Auto-GPT, BabyAGI

Et vous ?

Quels sont les avantages et les inconvénients des agents autonomes par rapport aux systèmes d’IA traditionnels ?

Quels sont les domaines ou les applications où vous aimeriez voir des agents autonomes en action ?

Quelles sont les précautions ou les régulations nécessaires pour encadrer le développement et l’utilisation des agents autonomes ?

Quelles sont les compétences ou les qualités que vous attendez d’un agent autonome qui vous assisterait dans vos tâches quotidiennes ?

Quels sont les risques ou les défis que posent les agents autonomes pour l’humanité et la société ?

Vous avez lu gratuitement 45 articles depuis plus d'un an.
Soutenez le club developpez.com en souscrivant un abonnement pour que nous puissions continuer à vous proposer des publications.

Une erreur dans cette actualité ? Signalez-nous-la !

Votre nom : Votre e-mail :

Décrivez l'erreur que vous souhaitez porter à notre connaissance :

Identifiez-vous

Créer un compte

OpenAI se lance dans l'un des domaines les plus épiques de l'IA : les agents autonomes

Des logiciels destinés à automatiser des tâches complexes en prenant le contrôle de l'appareil de l'utilisateur

Identifiant
Mot de passe

Mot de passe oublié ?

Identifiez-vous

Créer un compte

OpenAI se lance dans l'un des domaines les plus épiques de l'IA : les agents autonomes Des logiciels destinés à automatiser des tâches complexes en prenant le contrôle de l'appareil de l'utilisateur

OpenAI se lance dans l'un des domaines les plus épiques de l'IA : les agents autonomes

Des logiciels destinés à automatiser des tâches complexes en prenant le contrôle de l'appareil de l'utilisateur