Google a lancé son tout dernier modèle d'IA, Gemini 3.1 Flash-Lite, conçu pour être le plus rapide et le plus rentable de la série Gemini 3. Google affirme que cette nouvelle version est destinée aux développeurs qui ont besoin de traiter d'énormes quantités de données de manière rentable. Google explique que l'objectif principal de ce nouveau modèle est d'équilibrer une vitesse extrême et une intelligence profonde.
Gemini, anciennement Bard, est un assistant conversationnel développé par l'entreprise Google. Pour générer du texte, il se base sur une famille de grands modèles de langage également appelée Gemini, introduite au public le 7 décembre 2023. Gemini est l'acronyme de Generalized Multimodal Intelligence Network. Gemini peut comprendre et interagir avec l'audio et la vidéo, et générer du texte, du code, des traductions. Il peut produire plusieurs types de contenu créatif (images, dessins, sons, musique, vidéos ).
Google explique que l'objectif principal de ce nouveau modèle est d'équilibrer une vitesse extrême et une intelligence profonde. Alors que les modèles « Lite » étaient souvent considérés comme des versions « édulcorées » de l'IA, Google affirme que 3.1 Flash-Lite surpasse en réalité ses prédécesseurs dans plusieurs domaines clés. Selon l'entreprise, il est 2,5 fois plus rapide pour donner sa première réponse et offre une augmentation de 45 % de la vitesse de frappe globale par rapport à l'ancien Gemini 2.5 Flash.
De plus, Google a fixé le prix de ce modèle à 0,25 dollar par million de jetons d'entrée, ce qui en fait l'un des modèles haut de gamme les plus rentables du marché. En outre, bien qu'il s'agisse d'un modèle « Lite », il a obtenu un score de 1432 au classement Arena.ai, surpassant même certains des modèles plus importants des générations précédentes en matière de raisonnement et de compréhension.
« Google Gemini 3.1 Flash-Lite obtient un score Elo impressionnant de 1432 dans le classement Arena.ai et surpasse les autres modèles de niveau similaire dans les benchmarks de raisonnement et de compréhension multimodale, avec notamment 86,9 % sur GPQA Diamond et 76,8 % sur MMMU Pro, dépassant même les modèles Gemini plus importants des générations précédentes comme le 2.5 Flash », a déclaré la société.
L'une des fonctionnalités les plus uniques de ce lancement est le niveau de réflexion, qui offre aux développeurs un « curseur » leur permettant de contrôler le niveau de réflexion de l'IA avant qu'elle ne s'exprime. Par exemple, pour des tâches simples telles que la traduction d'un document ou la modération de commentaires, les développeurs peuvent le régler sur « Low Thinking » (faible niveau de réflexion) afin de gagner du temps et de l'argent. Pour les tâches complexes, vous pouvez augmenter le niveau de « réflexion » afin d'obtenir un raisonnement plus approfondi et plus précis.
« Les premiers testeurs ont souligné l'efficacité et les capacités de raisonnement de la version 3.1 Flash-Lite, affirmant qu'elle peut traiter des entrées complexes avec la précision d'un modèle de niveau supérieur, tout en suivant les instructions et en maintenant la conformité », a déclaré Google.
Voici les performances du modèle, selon l'annonce de Google :
Une rentabilité sans compromis
Au prix de seulement 0,25 $/1 million de jetons d'entrée et 1,50 $/1 million de jetons de sortie, 3.1 Flash-Lite offre des performances améliorées à un coût bien inférieur à celui des modèles plus volumineux. Il surpasse 2.5 Flash avec un temps de réponse initial 2,5 fois plus rapide et une vitesse de sortie accrue de 45 %, selon le benchmark Artificial Analysis, tout en conservant une qualité similaire ou supérieure. Cette faible latence est nécessaire pour les workflows à haute fréquence, ce qui en fait un modèle idéal pour les développeurs qui souhaitent créer des expériences réactives en temps réel.
3.1 Flash-Lite obtient un score Elo impressionnant de 1432 sur le classement Arena.ai et surpasse les autres modèles de niveau similaire dans les benchmarks de raisonnement et de compréhension multimodale, avec notamment 86,9 % sur GPQA Diamond et 76,8 % sur MMMU Pro, dépassant même les modèles Gemini plus volumineux des générations précédentes comme 2.5 Flash.
Cette annonce intervient dans un contexte où Gemini semble rattraper son retard par rapport aux autres modèles d'IA. Alors que la compétition autour de lintelligence artificielle générative est souvent racontée comme une succession de coups médiatiques, de démonstrations spectaculaires et dannonces parfois précipitées, Google avance à un rythme plus feutré. Avec Gemini, son modèle dIA unifié, le groupe semble aujourdhui récolter les fruits dune stratégie plus structurelle que narrative. Sans déclarer officiellement la victoire, Google apparaît de plus en plus comme un acteur central, voire dominant, dans la phase actuelle de la course à lIA. C'est en tout cas l'avis de certains spécialistes comme Geoffrey Hinton, le « parrain de l'IA ».
Source : Annonce de Gemini 3.1 Flash-Lite
