Google DeepMind a lancé Gemini 2.5 Pro, un modèle d'IA qui raisonne avant de répondre, affirmant qu'il est le meilleur sur plusieurs critères de référence en matière de raisonnement et de codage

Le 26 mars 2025 à 09:54, par Jade Emy

88PARTAGES

Google DeepMind a lancé Gemini 2.5 Pro, un modèle d'IA qui raisonne avant de répondre, affirmant qu'il est le meilleur sur plusieurs critères de référence en matière de raisonnement et de codage

Google DeepMind a lancé Gemini 2.5 Pro, citant des avancées majeures dans les capacités de raisonnement et de codage. Gemini 2.5 est un modèle de raisonnement conçu pour résoudre des problèmes de plus en plus complexes. Google affirme que son premier modèle 2.5, Gemini 2.5 Pro Experimental, est le meilleur dans les critères de référence courants par des marges significatives.

Google DeepMind ou DeepMind est un laboratoire de recherche en intelligence artificielle (IA) américano-britannique qui sert de filiale à Alphabet. Fondé au Royaume-Uni en 2010, il a été acquis par Google en 2014 et a fusionné avec la division Google Brain de Google AI pour devenir Google DeepMind en avril 2023. DeepMind a développé Gemini qui est le produit d'IA phare de Google.

Le 25 mars 2025, Google DeepMind a lancé Gemini 2.5 Pro, son dernier modèle d'IA, qui aurait surpassé ses concurrents dans plusieurs tests de mathématiques, de sciences et de raisonnement, y compris en obtenant le meilleur score sur le tableau de classement LMArena. Affirmant qu'il établit des normes industrielles en matière de raisonnement et de codage, Google DeepMind a présenté Gemini 2.5 Pro étant un nouveau modèle d'IA destiné à la résolution de problèmes complexes.

Google qualifie ce modèle de "plus intelligent" à ce jour. Gemini 2.5 Pro a obtenu les meilleures notes dans les tests de mathématiques et de sciences tels que les ensembles de données Graduate-Level Physics Question Answering (GPQA) et American Invitational Mathematics Examination (AIME) 2025. Google DeepMind affirme que Gemini 2.5 Pro a obtenu un score de 18,8 % au "dernier examen de l'humanité", un test de référence créé par des experts en la matière pour évaluer la capacité de raisonnement de haut niveau des modèles d'IA sans outils externes.

Selon l'entreprise, Gemini 2.5 Pro a surpassé son prédécesseur en termes de performances de codage. En utilisant une configuration d'agent personnalisée, il a atteint 63,8 % sur SWE-Bench Verified, un test de création et de modification de code piloté par l'IA. Selon Google, le modèle peut transformer des requêtes en applications web complètes et opérationnelles, ainsi qu'en code de jeu vidéo entièrement exécutable.

Avec une fenêtre contextuelle d'un million de jetons, le modèle peut traiter des quantités de données textuelles, audio, photographiques, vidéo et même des référentiels de code entiers. Google prévoit une future mise à jour avec une fenêtre contextuelle de 2 millions de jetons. S'appuyant sur l'approche précédente du "modèle de pensée" de l'entreprise, Gemini 2.5 utilise l'incitation à la chaîne de pensée et l'apprentissage par renforcement pour améliorer la capacité de prise de décision. Google a déclaré que le modèle 2.5 Pro combine ces techniques avec un nouveau modèle de base et un post-entraînement amélioré.

Publié en tant que version expérimentale, Gemini 2.5 Pro est accessible via Google AI Studio et l'application Gemini pour les utilisateurs de Gemini Advanced. L'entreprise a déclaré qu'elle divulguerait prochainement les prix pour une utilisation accrue et rendrait disponible l'accès à Vertex AI de Google Cloud. Les développeurs et les utilisateurs professionnels peuvent donc désormais expérimenter Gemini 2.5 Pro.

Voici la présentation de Gemini 2.5 Pro par Google :

Nous présentons aujourd'hui Gemini 2.5, notre modèle d'IA le plus intelligent. Notre première version 2.5 est une version expérimentale de 2.5 Pro, qui est à la pointe de la technologie sur une large gamme de benchmarks et qui débute à la première place sur LMArena avec une marge significative.

Les modèles Gemini 2.5 sont des modèles de raisonnement, capables de raisonner sur leurs pensées avant de répondre, ce qui se traduit par des performances et une précision accrues.

Dans le domaine de l'IA, la capacité de « raisonnement » d'un système ne se limite pas à la classification et à la prédiction. Il s'agit de sa capacité à analyser les informations, à tirer des conclusions logiques, à intégrer le contexte et les nuances, et à prendre des décisions éclairées.

Depuis longtemps, nous explorons les moyens de rendre l'IA plus intelligente et plus capable de raisonner grâce à des techniques telles que l'apprentissage par renforcement et l'incitation à la réflexion en chaîne. Sur cette base, nous avons récemment présenté notre premier modèle de raisonnement, Gemini 2.0 Flash Thinking.

Aujourd'hui, avec Gemini 2.5, nous avons atteint un nouveau niveau de performance en combinant un modèle de base considérablement amélioré avec un post-entraînement plus performant. À l'avenir, nous intégrerons ces capacités de raisonnement directement dans tous nos modèles, afin qu'ils puissent traiter des problèmes plus complexes et prendre en charge des agents encore plus performants et conscients du contexte.

Présentation de Gemini 2.5 Pro

Gemini 2.5 Pro Experimental est notre modèle le plus avancé pour les tâches complexes. Il arrive en tête du classement LMArena - qui mesure les préférences humaines - avec une marge significative, ce qui indique un modèle très performant doté d'un style de haute qualité. 2.5 Pro présente également de solides capacités de raisonnement et de codage, en tête des tests de codage, de mathématiques et de sciences les plus courants.

Gemini 2.5 Pro est disponible dès maintenant dans Google AI Studio et dans l'application Gemini pour les utilisateurs de Gemini Advanced, et sera bientôt disponible dans Vertex AI. Nous introduirons également une tarification dans les semaines à venir, permettant aux utilisateurs d'utiliser 2.5 Pro avec des limites de taux plus élevées pour une utilisation en production à grande échelle.

Raisonnement amélioré

Gemini 2.5 Pro est à la pointe de la technologie pour toute une série de tests nécessitant un raisonnement avancé. Sans les techniques de temps de test qui augmentent les coûts, comme le vote majoritaire, 2.5 Pro est en tête dans les tests de mathématiques et de sciences comme GPQA et AIME 2025.

Il obtient également un score de pointe de 18,8 % sur l'ensemble des modèles sans utilisation d'outils dans Humanity's Last Exam, un ensemble de données conçu par des centaines d'experts en la matière pour capturer la frontière humaine de la connaissance et du raisonnement.

Codage avancé

Nous nous sommes concentrés sur les performances de codage et, avec Gemini 2.5, nous avons fait un grand bond en avant par rapport à la version 2.0 - avec d'autres améliorations à venir. 2.5 Pro excelle dans la création d'applications web visuellement attrayantes et d'applications de code agentique, ainsi que dans la transformation et l'édition de code. Sur SWE-Bench Verified, le standard de l'industrie pour les évaluations de code agentique, Gemini 2.5 Pro obtient un score de 63,8 % avec une configuration d'agent personnalisée.

Voici un exemple de la façon dont 2.5 Pro peut utiliser ses capacités de raisonnement pour créer un jeu vidéo en produisant le code exécutable à partir d'une simple ligne d'invite.

S'appuyer sur le meilleur de Gemini

Gemini 2.5 s'appuie sur ce qui fait la force des modèles Gemini : la multimodalité native et une longue fenêtre contextuelle. La version 2.5 Pro est livrée dès aujourd'hui avec une fenêtre contextuelle de 1 million de jetons (bientôt 2 millions), avec des performances élevées qui s'améliorent par rapport aux générations précédentes. Il peut comprendre de vastes ensembles de données et traiter des problèmes complexes à partir de différentes sources d'information, y compris le texte, l'audio, les images, la vidéo et même des référentiels de code entiers.

Les développeurs et les entreprises peuvent commencer à expérimenter Gemini 2.5 Pro dans Google AI Studio dès maintenant, et les utilisateurs de Gemini Advanced peuvent le sélectionner dans la liste déroulante des modèles sur les ordinateurs de bureau et les téléphones portables. Il sera disponible sur Vertex AI dans les semaines à venir.

Comme toujours, nous apprécions les commentaires afin de pouvoir continuer à améliorer rapidement les nouvelles capacités impressionnantes de Gemini, dans le but de rendre notre IA plus utile.

Et vous ?

Pensez-vous que ce modèle est crédible ou pertinent ?

Quel est votre avis sur l'annonce de Google

Voir aussi :

Google lance son nouveau modèle d'IA Gemini 2.0 pour pratiquement tout, qui promet d'être plus rapide et plus intelligent grâce aux progrès agentiques et offre des capacités avancées de sorties multimodales

Anthropic annonce Claude 3.7 Sonnet, un modèle qui donne un contrôle sur le temps que l'IA passe à "réfléchir" avant de générer une réponse, et Claude Code, un agent IA de codage en ligne de commande

OpenAI riposte à DeepSeek avec o3-mini, son nouveau modèle de raisonnement plus intelligent pour les utilisateurs payants et gratuits de ChatGPT. O3-mini est qualifié de « monstre de codage ultra-rapide »

Vous avez lu gratuitement 20 762 articles depuis plus d'un an.
Soutenez le club developpez.com en souscrivant un abonnement pour que nous puissions continuer à vous proposer des publications.

Une erreur dans cette actualité ? Signalez-nous-la !

Votre nom : Votre e-mail :

Décrivez l'erreur que vous souhaitez porter à notre connaissance :

Identifiez-vous

Créer un compte

Google DeepMind a lancé Gemini 2.5 Pro, un modèle d'IA qui raisonne avant de répondre, affirmant qu'il est le meilleur sur plusieurs critères de référence en matière de raisonnement et de codage

Identifiant
Mot de passe

Mot de passe oublié ?