Google lance son tout dernier modèle d'IA, Gemini 3.1 Flash-Lite, conçu pour être le plus rapide et le plus rentable de la série Gemini 3

Le 6 mars 2026 à 05:50, par Jade Emy

424PARTAGES

Google lance son tout dernier modèle d'IA, Gemini 3.1 Flash-Lite, conçu pour être le plus rapide et le plus rentable de la série Gemini 3

Google a lancé son tout dernier modèle d'IA, Gemini 3.1 Flash-Lite, conçu pour être le plus rapide et le plus rentable de la série Gemini 3. Google affirme que cette nouvelle version est destinée aux développeurs qui ont besoin de traiter d'énormes quantités de données de manière rentable. Google explique que l'objectif principal de ce nouveau modèle est d'équilibrer une vitesse extrême et une intelligence profonde.

Gemini, anciennement Bard, est un assistant conversationnel développé par l'entreprise Google. Pour générer du texte, il se base sur une famille de grands modèles de langage également appelée Gemini, introduite au public le 7 décembre 2023. Gemini est l'acronyme de Generalized Multimodal Intelligence Network. Gemini peut comprendre et interagir avec l'audio et la vidéo, et générer du texte, du code, des traductions. Il peut produire plusieurs types de contenu créatif (images, dessins, sons, musique, vidéos…).

Google a lancé son tout dernier modèle d'IA, Gemini 3.1 Flash-Lite, conçu pour être le plus rapide et le plus rentable de la série Gemini 3. Google affirme que cette nouvelle version est destinée aux développeurs qui ont besoin de traiter d'énormes quantités de données de manière rentable. Le modèle est actuellement en phase de prévisualisation pour les développeurs utilisant Google AI Studio et pour les entreprises via Vertex AI.

Google explique que l'objectif principal de ce nouveau modèle est d'équilibrer une vitesse extrême et une intelligence profonde. Alors que les modèles « Lite » étaient souvent considérés comme des versions « édulcorées » de l'IA, Google affirme que 3.1 Flash-Lite surpasse en réalité ses prédécesseurs dans plusieurs domaines clés. Selon l'entreprise, il est 2,5 fois plus rapide pour donner sa première réponse et offre une augmentation de 45 % de la vitesse de frappe globale par rapport à l'ancien Gemini 2.5 Flash.

De plus, Google a fixé le prix de ce modèle à 0,25 dollar par million de jetons d'entrée, ce qui en fait l'un des modèles haut de gamme les plus rentables du marché. En outre, bien qu'il s'agisse d'un modèle « Lite », il a obtenu un score de 1432 au classement Arena.ai, surpassant même certains des modèles plus importants des générations précédentes en matière de raisonnement et de compréhension.

« Google Gemini 3.1 Flash-Lite obtient un score Elo impressionnant de 1432 dans le classement Arena.ai et surpasse les autres modèles de niveau similaire dans les benchmarks de raisonnement et de compréhension multimodale, avec notamment 86,9 % sur GPQA Diamond et 76,8 % sur MMMU Pro, dépassant même les modèles Gemini plus importants des générations précédentes comme le 2.5 Flash », a déclaré la société.

L'une des fonctionnalités les plus uniques de ce lancement est le niveau de réflexion, qui offre aux développeurs un « curseur » leur permettant de contrôler le niveau de réflexion de l'IA avant qu'elle ne s'exprime. Par exemple, pour des tâches simples telles que la traduction d'un document ou la modération de commentaires, les développeurs peuvent le régler sur « Low Thinking » (faible niveau de réflexion) afin de gagner du temps et de l'argent. Pour les tâches complexes, vous pouvez augmenter le niveau de « réflexion » afin d'obtenir un raisonnement plus approfondi et plus précis.

« Les premiers testeurs ont souligné l'efficacité et les capacités de raisonnement de la version 3.1 Flash-Lite, affirmant qu'elle peut traiter des entrées complexes avec la précision d'un modèle de niveau supérieur, tout en suivant les instructions et en maintenant la conformité », a déclaré Google.

Voici les performances du modèle, selon l'annonce de Google :

Une rentabilité sans compromis

Au prix de seulement 0,25 $/1 million de jetons d'entrée et 1,50 $/1 million de jetons de sortie, 3.1 Flash-Lite offre des performances améliorées à un coût bien inférieur à celui des modèles plus volumineux. Il surpasse 2.5 Flash avec un temps de réponse initial 2,5 fois plus rapide et une vitesse de sortie accrue de 45 %, selon le benchmark Artificial Analysis, tout en conservant une qualité similaire ou supérieure. Cette faible latence est nécessaire pour les workflows à haute fréquence, ce qui en fait un modèle idéal pour les développeurs qui souhaitent créer des expériences réactives en temps réel.

3.1 Flash-Lite obtient un score Elo impressionnant de 1432 sur le classement Arena.ai et surpasse les autres modèles de niveau similaire dans les benchmarks de raisonnement et de compréhension multimodale, avec notamment 86,9 % sur GPQA Diamond et 76,8 % sur MMMU Pro, dépassant même les modèles Gemini plus volumineux des générations précédentes comme 2.5 Flash.

Cette annonce intervient dans un contexte où Gemini semble rattraper son retard par rapport aux autres modèles d'IA. Alors que la compétition autour de l’intelligence artificielle générative est souvent racontée comme une succession de coups médiatiques, de démonstrations spectaculaires et d’annonces parfois précipitées, Google avance à un rythme plus feutré. Avec Gemini, son modèle d’IA unifié, le groupe semble aujourd’hui récolter les fruits d’une stratégie plus structurelle que narrative. Sans déclarer officiellement la victoire, Google apparaît de plus en plus comme un acteur central, voire dominant, dans la phase actuelle de la course à l’IA. C'est en tout cas l'avis de certains spécialistes comme Geoffrey Hinton, le « parrain de l'IA ».

Source : Annonce de Gemini 3.1 Flash-Lite

Et vous ?

Pensez-vous que cette annonce est crédible ou pertinente ?

Quel est votre avis sur le sujet ?

Voir aussi :

Google introduit Gemini 3 Flash comme nouveau modèle par défaut dans l'application Gemini et le mode IA dans Google Search, se positionnant comme un modèle d'IA plus rapide et plus abordable

OpenAI présente son nouveau modèle GPT-5.3 Instant, censé être plus utile en réduisant les refus inutiles et moins enclin à moraliser pour des dialogues plus naturels

Anthropic améliore la mémoire de Claude afin d'attirer les utilisateurs souhaitant changer d'IA, grâce à une instruction générative et à un outil d'importation permettant de copier les données des utilisateurs

Vous avez lu gratuitement 4 562 articles depuis plus d'un an.
Soutenez le club developpez.com en souscrivant un abonnement pour que nous puissions continuer à vous proposer des publications.

Une erreur dans cette actualité ? Signalez-nous-la !

Votre nom : Votre e-mail :

Décrivez l'erreur que vous souhaitez porter à notre connaissance :

Identifiez-vous

Créer un compte

Google lance son tout dernier modèle d'IA, Gemini 3.1 Flash-Lite, conçu pour être le plus rapide et le plus rentable de la série Gemini 3

Identifiant
Mot de passe

Mot de passe oublié ?