Fin janvier 2025, OpenAI a introduit o3-mini, son nouveau modèle de raisonnement d'intelligence artificielle (IA) conçu pour améliorer la vitesse et la précision par rapport au modèle précédent o1. Il s'agit de la première fois que les utilisateurs gratuits de ChatGPT peuvent accéder à un modèle de raisonnement, même si les limites de vitesse sont semblables à celles de GPT-4o. Annoncé en décembre 2024, o3-mini est optimisé pour les tâches de mathématiques, de codage et de sciences. Il fournit des réponses 24 % plus rapidement qu'o1 tout en maintenant les niveaux de performance.
Puis, le 2 février, OpenAI a présenté son agent de recherche approfondie (Deep research) en affirmant qu'il accomplit en quelques dizaines de minutes ce qui prendrait de nombreuses heures à un humain. "Deep research est le prochain agent d'OpenAI qui peut travailler pour vous de manière indépendante - vous lui donnez un ordre et ChatGPT trouvera, analysera et synthétisera des centaines de sources en ligne pour créer un rapport complet au niveau d'un analyste de recherche", a déclaré l'entreprise technologique.
L'entreprise l'a décrit comme marquant "une étape importante vers notre objectif plus large de développement de l'AGI, que nous envisageons depuis longtemps comme capable de produire de nouvelles recherches scientifiques". Baptisé "deep research", l'agent a été conçu et construit pour les personnes qui effectuent un travail intensif dans des domaines tels que la finance, la science, la politique et l'ingénierie, car il se nourrit de "recherches approfondies, précises et fiables".
L'agent sera alimenté par une version du modèle o3 d'OpenAI, qui sera optimisé pour la navigation sur le web et l'analyse de données. Parmi ses principales caractéristiques, citons le raisonnement permettant de rechercher, d'interpréter et d'analyser de grandes quantités de textes, d'images et de fichiers PDF sur l'internet. Comme cas d'utilisation, l'agent serait utile pour les acheteurs avisés qui recherchent des recommandations hyperpersonnalisées pour des achats qui nécessiteraient habituellement beaucoup de recherches, comme les voitures ou les appareils électroménagers.
Pour utiliser la recherche approfondie, dans ChatGPT, sélectionnez "Deep research" dans le compositeur de messages et entrez votre requête. Dites à ChatGPT ce dont vous avez besoin. Vous pouvez joindre des fichiers ou des feuilles de calcul pour ajouter du contexte à votre question. Une fois la recherche lancée, une barre latérale s'affiche avec un résumé des étapes suivies et des sources utilisées. La recherche approfondie peut prendre de 5 à 30 minutes, le temps de se plonger dans le web. Pendant ce temps, vous pouvez vous éloigner ou travailler sur d'autres tâches : vous recevrez une notification une fois la recherche terminée. Le résultat final se présente sous la forme d'un rapport dans le chat.
La recherche approfondie dans ChatGPT est actuellement très gourmande en calcul. Plus la recherche d'une requête est longue, plus le calcul de l'inférence est nécessaire. OpenAI lance une première version optimisée pour les utilisateurs Pro, avec un maximum de 100 requêtes par mois. Les utilisateurs Plus et Team y auront ensuite accès, suivis par les utilisateurs Enterprise. OpenAI affirme que tous les utilisateurs payants bénéficieront bientôt de limites tarifaires nettement plus élevées lorsqu'une version plus rapide et plus rentable de la recherche approfondie sera disponible.
Voici l'annonce d'OpenAI :
Nous lançons aujourd'hui la recherche approfondie sur ChatGPT, une nouvelle capacité agentique qui effectue des recherches en plusieurs étapes sur l'internet pour des tâches complexes. Elle accomplit en quelques dizaines de minutes ce qui prendrait des heures à un humain.
Deep research est le prochain agent d'OpenAI qui peut faire du travail pour vous de manière autonome - vous lui donnez un ordre, et ChatGPT trouvera, analysera et synthétisera des centaines de sources en ligne pour créer un rapport complet au niveau d'un analyste de recherche. Alimenté par une version du futur modèle OpenAI o3 optimisé pour la navigation sur le web et l'analyse de données, il s'appuie sur le raisonnement pour rechercher, interpréter et analyser des quantités massives de textes, d'images et de PDF sur Internet, en pivotant si nécessaire en réaction aux informations qu'il rencontre.
La capacité à synthétiser les connaissances est une condition préalable à la création de nouvelles connaissances. C'est pourquoi la recherche approfondie constitue une étape importante vers notre objectif plus large de développement de l'intelligence artificielle, que nous envisageons depuis longtemps comme capable de produire de nouvelles recherches scientifiques.
Pourquoi nous avons conçu la recherche approfondie
La recherche approfondie est destinée aux personnes qui effectuent un travail intensif dans des domaines tels que la finance, la science, la politique et l'ingénierie, et qui ont besoin de recherches approfondies, précises et fiables. Elle peut également s'avérer utile pour les acheteurs avisés qui recherchent des recommandations hyperpersonnalisées pour des achats qui nécessitent généralement des recherches approfondies, comme les voitures, les appareils électroménagers et les meubles. Chaque résultat est entièrement documenté, avec des citations claires et un résumé de la réflexion, ce qui facilite la référence et la vérification des informations. Il est particulièrement efficace pour trouver des informations spécialisées et non intuitives qui nécessiteraient de parcourir de nombreux sites web. La recherche approfondie vous fait gagner un temps précieux en vous permettant de vous décharger et d'accélérer des recherches complexes et fastidieuses sur le web à l'aide d'une seule requête.
La recherche approfondie découvre, raisonne et consolide de manière indépendante des informations provenant de l'ensemble du web. Pour ce faire, il a été formé à des tâches réelles nécessitant l'utilisation d'un navigateur et d'outils Python, en utilisant les mêmes méthodes d'apprentissage par renforcement que celles utilisées par OpenAI o1, notre premier modèle de raisonnement. Alors que o1 démontre des capacités impressionnantes dans le codage, les mathématiques et d'autres domaines techniques, de nombreux défis du monde réel exigent un contexte étendu et la collecte d'informations à partir de diverses sources en ligne. Deep research s'appuie sur ces capacités de raisonnement pour combler ce fossé, ce qui lui permet de s'attaquer aux types de problèmes auxquels les gens sont confrontés au travail et dans la vie de tous les jours.
Deep research est le prochain agent d'OpenAI qui peut faire du travail pour vous de manière autonome - vous lui donnez un ordre, et ChatGPT trouvera, analysera et synthétisera des centaines de sources en ligne pour créer un rapport complet au niveau d'un analyste de recherche. Alimenté par une version du futur modèle OpenAI o3 optimisé pour la navigation sur le web et l'analyse de données, il s'appuie sur le raisonnement pour rechercher, interpréter et analyser des quantités massives de textes, d'images et de PDF sur Internet, en pivotant si nécessaire en réaction aux informations qu'il rencontre.
La capacité à synthétiser les connaissances est une condition préalable à la création de nouvelles connaissances. C'est pourquoi la recherche approfondie constitue une étape importante vers notre objectif plus large de développement de l'intelligence artificielle, que nous envisageons depuis longtemps comme capable de produire de nouvelles recherches scientifiques.
Pourquoi nous avons conçu la recherche approfondie
La recherche approfondie est destinée aux personnes qui effectuent un travail intensif dans des domaines tels que la finance, la science, la politique et l'ingénierie, et qui ont besoin de recherches approfondies, précises et fiables. Elle peut également s'avérer utile pour les acheteurs avisés qui recherchent des recommandations hyperpersonnalisées pour des achats qui nécessitent généralement des recherches approfondies, comme les voitures, les appareils électroménagers et les meubles. Chaque résultat est entièrement documenté, avec des citations claires et un résumé de la réflexion, ce qui facilite la référence et la vérification des informations. Il est particulièrement efficace pour trouver des informations spécialisées et non intuitives qui nécessiteraient de parcourir de nombreux sites web. La recherche approfondie vous fait gagner un temps précieux en vous permettant de vous décharger et d'accélérer des recherches complexes et fastidieuses sur le web à l'aide d'une seule requête.
La recherche approfondie découvre, raisonne et consolide de manière indépendante des informations provenant de l'ensemble du web. Pour ce faire, il a été formé à des tâches réelles nécessitant l'utilisation d'un navigateur et d'outils Python, en utilisant les mêmes méthodes d'apprentissage par renforcement que celles utilisées par OpenAI o1, notre premier modèle de raisonnement. Alors que o1 démontre des capacités impressionnantes dans le codage, les mathématiques et d'autres domaines techniques, de nombreux défis du monde réel exigent un contexte étendu et la collecte d'informations à partir de diverses sources en ligne. Deep research s'appuie sur ces capacités de raisonnement pour combler ce fossé, ce qui lui permet de s'attaquer aux types de problèmes auxquels les gens sont confrontés au travail et dans la vie de tous les jours.
Comment Deep Research fonctionne ?Today we are launching our next agent capable of doing work for you independently—deep research.
— OpenAI (@OpenAI) February 3, 2025
Give it a prompt and ChatGPT will find, analyze & synthesize hundreds of online sources to create a comprehensive report in tens of minutes vs what would take a human many hours. pic.twitter.com/03PPi4cdqi
Deep Research a été formé à l'aide de l'apprentissage par renforcement de bout en bout sur des tâches difficiles de navigation et de raisonnement dans un large éventail de domaines. Grâce à cette formation, il a appris à planifier et à exécuter une trajectoire en plusieurs étapes pour trouver les données dont il a besoin, en revenant en arrière et en réagissant aux informations en temps réel si nécessaire.
Le modèle est également capable de parcourir les fichiers téléchargés par les utilisateurs, de tracer et d'itérer sur des graphiques à l'aide de l'outil python, d'intégrer dans ses réponses des graphiques générés et des images provenant de sites web, et de citer des phrases ou des passages spécifiques de ses sources. Grâce à cette formation, il atteint de nouveaux sommets dans un certain nombre d'évaluations publiques axées sur des problèmes réels.
- Humanity's Last Exam
Sur Humanity's Last Exam, une évaluation récemment publiée qui teste l'IA sur un large éventail de sujets et sur des questions de niveau expert, le modèle qui alimente la recherche approfondie atteint un nouveau record avec une précision de 26,6 %. Ce test comprend plus de 3 000 questions à choix multiple et à réponse courte portant sur plus de 100 sujets, de la linguistique à la science des fusées, en passant par les sciences classiques et l'écologie. Par rapport à OpenAI o1, les gains ont été enregistrés en chimie, en sciences humaines et sociales et en mathématiques. - GAIA
Sur GAIA, un benchmark public qui évalue l'IA sur des questions du monde réel, le modèle qui alimente la recherche approfondie atteint un nouvel état de l'art (SOTA), se plaçant en tête du classement externe. Comprenant des questions de trois niveaux de difficulté, la réussite de ces tâches requiert des capacités de raisonnement, de fluidité multimodale, de navigation sur le web et d'utilisation d'outils. - Tâches de niveau expert
Lors d'une évaluation interne des tâches de niveau expert dans une série de domaines, la recherche approfondie a été jugée par les experts du domaine comme ayant automatisé plusieurs heures d'investigations manuelles difficiles.
La recherche approfondie permet de débloquer de nouvelles capacités importantes, mais elle n'en est qu'à ses débuts et présente des limites. Elle peut parfois halluciner des faits dans les réponses ou faire des déductions incorrectes, bien qu'à un taux inférieur à celui des modèles ChatGPT existants, selon des évaluations internes d'OpenAI. Il peut avoir du mal à distinguer les informations faisant autorité des rumeurs et montre actuellement des faiblesses dans l'étalonnage de la confiance, ne parvenant souvent pas à exprimer l'incertitude de manière précise. Au lancement, il peut y avoir des erreurs de formatage dans les rapports et les citations, et les tâches peuvent prendre plus de temps à démarrer.
OpenAI conclut son annonce en énonçant la prochaine étape pour son agent Deep Research :
Deep Research est disponible dès aujourd'hui sur ChatGPT web, et sera étendue aux applications mobiles et de bureau dans le courant du mois. Actuellement, la recherche approfondie peut accéder au web ouvert et à tous les fichiers téléchargés. À l'avenir, vous pourrez vous connecter à des sources de données plus spécialisées - en élargissant son accès à des ressources internes ou sur abonnement - afin de rendre ses résultats encore plus robustes et personnalisés.
À plus long terme, nous envisageons que les expériences agentiques se rejoignent dans ChatGPT pour une recherche et une exécution asynchrones dans le monde réel. La combinaison de la recherche approfondie, qui peut effectuer une investigation en ligne asynchrone, et de l'opérateur, qui peut prendre des mesures dans le monde réel, permettra à ChatGPT d'effectuer des tâches de plus en plus sophistiquées pour vous.
À plus long terme, nous envisageons que les expériences agentiques se rejoignent dans ChatGPT pour une recherche et une exécution asynchrones dans le monde réel. La combinaison de la recherche approfondie, qui peut effectuer une investigation en ligne asynchrone, et de l'opérateur, qui peut prendre des mesures dans le monde réel, permettra à ChatGPT d'effectuer des tâches de plus en plus sophistiquées pour vous.
Pensez-vous que ce nouvel agent de ChatGPT est crédible ou pertinent ?
Quel est votre avis sur cette fonctionnalité ?
Voir aussi :
OpenAI a publié un aperçu de recherche de son nouvel agent d'IA Operator, qui contrôle votre navigateur pour effectuer des tâches à votre place sur le web
OpenAI annonce o3 et o3-mini, ses prochains modèles de raisonnement simulé, o3 correspond aux niveaux humains sur le benchmark ARC-AGI et o3-mini dépasse o1 dans certaines tâches
Un autre chercheur d'OpenAI démissionne et affirme que les laboratoires d'IA prennent un « pari très risqué » avec l'humanité dans la course vers l'AGI, ce qui pourrait avoir « d'énormes inconvénients »