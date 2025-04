Récemment, OpenAI a publié ses modèles de raisonnement o3 et o4-mini . Selon OpenAI, o3 est capable de "penser avec des images", c'est-à-dire de comprendre et d'analyser les croquis et les diagrammes d'un utilisateur, même s'ils sont de mauvaise qualité. Les modèles peuvent également pivoter, zoomer et utiliser d'autres outils d'édition d'images. L'entreprise a qualifié o3 de modèle le plus avancé à ce jour.Plus récemment, un rapport a révélé que des personnes utilisent la puissante perception visuelle de o3 pour identifier des données de localisation à partir de photos sur ChatGPT. Dans la plupart des cas, o3 est capable de reconnaître correctement l'emplacement exact en regardant simplement l'image. Selon le rapport, avec des indices visuels subtils, ChatGPT o3 peut même deviner l'emplacement géographique exact.Étant donné que OpenAI o3 n'est pas seulement un modèle d'IA autonome, mais qu'il utilise également plusieurs outils tels que la recherche sur le web et Python, le système d'IA se comporte davantage comme un agent, et il aide grandement à trouver l'emplacement à partir de photos. Grâce à l'interprète Python, o3 peut zoomer et recadrer des parties d'images pour les analyser avec une plus grande précision.Ethan Mollick a supprimé les métadonnées de localisation d'une image d'une voie express anodine et a demandé à ChatGPT o3 de « géoguider ceci ». Chose étonnante, ChatGPT o3 a généré les coordonnées correctes de l'emplacement.[TWITTER]

The geoguessing power of o3 is a really good sample of its agentic abilities. Between its smart guessing and its ability to zoom into images, to do web searches, and read text, the results can be very freaky.



I stripped location info from the photo & prompted “geoguess this” pic.twitter.com/KaQiXHUvYL — Ethan Mollick (@emollick) April 17, 2025