Gemini (anciennement Bard) est un chatbot et assistant virtuel génératif basé sur l'intelligence artificielle développé par Google. Basé sur le grand modèle de langage (LLM) du même nom, il a été lancé en mars 2023 en réponse à l'essor du ChatGPT d'OpenAI. En mars, Google DeepMind a lancé Gemini 2.5 Pro, citant des avancées majeures dans les capacités de raisonnement et de codage. Gemini 2.5 est un modèle de raisonnement conçu pour résoudre des problèmes de plus en plus complexes. Google affirme que son premier modèle 2.5, Gemini 2.5 Pro Experimental, est le meilleur dans les critères de référence courants par des marges significatives.
Récemment, Google a lancé son dernier modèle d'intelligence artificielle, Gemini 3, alors que le géant de la recherche s'efforce de suivre le rythme de OpenAI, le créateur de ChatGPT. Le nouveau modèle d'IA permettra aux utilisateurs d'obtenir de meilleures réponses à des questions plus complexes, « afin que vous obteniez ce dont vous avez besoin avec moins de sollicitations », a déclaré Sundar Pichai, PDG d'Alphabet, dans l'un des nombreux articles de blog publiés mardi par Google.
Gemini 3 sera intégré à l'application Gemini, aux produits de recherche IA de Google AI Mode et AI Overviews, ainsi qu'à ses produits destinés aux entreprises. Le déploiement commence mardi pour certains abonnés et sera étendu à plus grande échelle dans les semaines à venir. Cette annonce intervient environ huit mois après le lancement de Gemini 2.5 par Google et 11 mois après celui de Gemini 2.0. OpenAI, qui a lancé le boom de l'IA générative fin 2022 avec le lancement public de ChatGPT, a présenté GPT-5 en août.
« Il est incroyable de penser qu'en seulement deux ans, l'IA est passée de la simple lecture de textes et d'images à la lecture de l'ambiance d'une pièce », a écrit Pichai dans l'un des messages publiés. « À partir d'aujourd'hui, nous déployons Gemini à l'échelle de Google. » L'application Gemini compte désormais 650 millions d'utilisateurs actifs par mois et AI Overviews 2 milliards d'utilisateurs mensuels, a indiqué la société. OpenAI a déclaré en août que ChatGPT avait atteint 700 millions d'utilisateurs hebdomadaires.
Pichai a ajouté que le tout dernier modèle était « conçu pour saisir la profondeur et les nuances » et a déclaré que Gemini 3 était également « beaucoup plus performant pour comprendre le contexte et l'intention derrière votre demande, afin que vous obteniez ce dont vous avez besoin avec moins d'indications ». Les autres modèles d'IA de Google peuvent toujours être utilisés pour des tâches plus simples, a déclaré la société.
Alphabet et ses rivaux à forte capitalisation dépensent des sommes considérables pour mettre en place l'infrastructure nécessaire au développement de l'IA et créer rapidement davantage de services pour les consommateurs et les entreprises. Dans leurs rapports financiers publiés le mois dernier, Alphabet, Meta, Microsoft et Amazon ont chacun revu à la hausse leurs prévisions en matière de dépenses d'investissement et s'attendent collectivement à ce que ce chiffre atteigne plus de 380 milliards de dollars cette année.
Google a déclaré que les réponses de l'IA alimentées par Gemini 3 « troqueront les clichés et les flatteries contre des informations authentiques, vous disant ce que vous avez besoin d'entendre, et non ce que vous voulez entendre », selon une déclaration de Demis Hassabis, PDG de DeepMind, la division IA de Google. Les critiques du secteur ont déclaré que les chatbots IA actuels sont trop flagorneurs.
OpenAI a publié deux mises à jour de GPT-5. L'une est « plus chaleureuse, plus intelligente et plus apte à suivre vos instructions », a déclaré la société, et l'autre est « plus rapide pour les tâches simples, plus persévérante pour les tâches complexes ».
Google a également annoncé une nouvelle plateforme d'agent appelée « Google Antigravity », qui permet aux développeurs de coder « à un niveau supérieur, axé sur les tâches ». Gemini 3 est le « meilleur modèle de codage vibe jamais créé » par l'entreprise, a déclaré Josh Woodward, vice-président de Google Labs et Gemini, lors d'une conférence de presse. Le vibe codage fait référence à un marché en pleine expansion d'outils permettant aux développeurs de logiciels de générer du code à partir d'invites.
Google a déclaré que le nouveau modèle permettra la création d'« interfaces génératives », fournissant certaines réponses d'une manière qui ressemble à un magazine numérique. À titre d'exemple, la société a demandé à Gemini d'« expliquer la galerie Van Gogh en donnant le contexte de chaque uvre ». Le résultat a été une explication colorée et illustrée pour chaque tableau. Dans le mode IA, Gemini 3 sera d'abord disponible pour les abonnés payants. Il sera capable d'analyser une question et de créer une mise en page avec des éléments visuels tels que des images, des tableaux et des grilles. Google a déclaré qu'il pouvait créer un calculateur de prêt interactif sur mesure ou une simulation interactive sur un problème physique complexe.
Les développeurs pourront accéder à l'API Gemini et les entreprises pourront l'intégrer via Vertex AI, le service cloud de Google conçu pour créer, déployer et gérer des modèles d'IA. Pour les entreprises, Gemini 3 peut notamment créer des programmes d'intégration et de formation pour les employés, analyser plus précisément des vidéos et des images d'usine, et gérer les achats, a déclaré la société.
Cette annonce rappelle les déclarations de Mo Gawdat, l'ancien directeur commercial de Google X, qui a dressé un tableau sombre de l'avenir de l'intelligence artificielle. Selon lui, l'IA ne se contentera pas de prendre des emplois, mais provoquera une période de « 15 ans d'enfer » qui débutera plus tôt que nous le pensons. Gawdat a mis en garde contre le déplacement massif d'emplois, touchant même des professions que l'on croyait à l'abri... même des fonctions comme PDG. Il a expliqué que les systèmes d'IA de plus en plus sophistiqués seront en mesure de reproduire les compétences humaines de manière plus efficace et à moindre coût, rendant de nombreux postes superflus.
Voici la note de Sundar Pichai, PDG de Google et d'Alphabet :
Il y a près de deux ans, nous avons lancé l'ère Gemini, l'un des plus grands projets scientifiques et produits jamais entrepris par notre entreprise. Depuis lors, nous avons été impressionnés par l'engouement qu'il a suscité. AI Overviews compte désormais 2 milliards d'utilisateurs chaque mois. L'application Gemini dépasse les 650 millions d'utilisateurs par mois, plus de 70 % de nos clients Cloud utilisent notre IA, 13 millions de développeurs ont créé des applications à l'aide de nos modèles génératifs, et ce n'est qu'un aperçu de l'impact que nous constatons.
Et nous sommes en mesure de mettre à la disposition du monde entier des fonctionnalités avancées plus rapidement que jamais, grâce à notre approche différenciée de l'innovation en matière d'IA, qui couvre l'ensemble de la chaîne, depuis notre infrastructure de pointe jusqu'à nos recherches, modèles et outils de classe mondiale, en passant par des produits qui touchent des milliards de personnes à travers le monde.
Chaque génération de Gemini s'appuie sur la précédente, vous permettant d'en faire toujours plus. Les avancées de Gemini 1 en matière de multimodalité native et de fenêtre contextuelle longue ont élargi les types d'informations pouvant être traitées, ainsi que leur volume. Gemini 2 a jeté les bases des capacités agentives et repoussé les limites du raisonnement et de la réflexion, facilitant les tâches et les idées plus complexes, ce qui a permis à Gemini 2.5 Pro de dominer LMArena pendant plus de six mois.
Nous présentons aujourd'hui Gemini 3, notre modèle le plus intelligent, qui combine toutes les capacités de Gemini pour vous permettre de donner vie à n'importe quelle idée.
Il s'agit d'un modèle de raisonnement de pointe, conçu pour saisir la profondeur et les nuances, qu'il s'agisse de percevoir les indices subtils d'une idée créative ou de démêler les couches superposées d'un problème difficile. Gemini 3 est également beaucoup plus performant pour comprendre le contexte et l'intention derrière votre demande, ce qui vous permet d'obtenir ce dont vous avez besoin avec moins d'indications. Il est étonnant de penser qu'en seulement deux ans, l'IA est passée de la simple lecture de textes et d'images à la lecture de l'atmosphère d'une pièce.
Et à partir d'aujourd'hui, nous déployons Gemini à l'échelle de Google. Cela inclut Gemini 3 en mode IA dans la recherche, avec un raisonnement plus complexe et de nouvelles expériences dynamiques. C'est la première fois que nous déployons Gemini dans la recherche dès le premier jour. Gemini 3 arrive également aujourd'hui dans l'application Gemini, chez les développeurs dans AI Studio et Vertex AI, ainsi que dans notre nouvelle plateforme de développement agentique, Google Antigravity. Plus d'informations ci-dessous.
Comme les générations précédentes, Gemini 3 fait une nouvelle fois progresser l'état de l'art. Dans ce nouveau chapitre, nous continuerons à repousser les limites de l'intelligence, des agents et de la personnalisation afin de rendre l'IA vraiment utile pour tous.
Nous espérons que vous apprécierez Gemini 3. Nous continuerons à l'améliorer et sommes impatients de voir ce que vous créerez avec. Beaucoup d'autres nouveautés sont à venir !
Présentation de Gemini 3 : un raisonnement avec une profondeur et des nuances
Gemini 3 Pro peut donner vie à n'importe quelle idée grâce à son raisonnement de pointe et ses capacités multimodales. Il surpasse largement 2.5 Pro dans tous les principaux benchmarks d'IA. Il arrive en tête du classement LMArena avec un score révolutionnaire de 1501 Elo. Il fait preuve d'un raisonnement de niveau doctoral avec les meilleurs scores au Humanity's Last Exam (37,5 % sans utiliser aucun outil) et au GPQA Diamond (91,9 %). Il établit également une nouvelle norme pour les modèles de pointe en mathématiques, atteignant un nouveau record de 23,4 % sur MathArena Apex.
Au-delà du texte, Gemini 3 Pro redéfinit le raisonnement multimodal avec 81 % sur MMMU-Pro et 87,6 % sur Video-MMMU. Il obtient également un score de pointe de 72,1 % sur SimpleQA Verified, ce qui montre de grands progrès en matière d'exactitude factuelle. Cela signifie que Gemini 3 Pro est très performant pour résoudre des problèmes complexes dans un large éventail de domaines tels que les sciences et les mathématiques, avec un haut degré de fiabilité.
Gemini 3 Pro apporte également un nouveau niveau de profondeur et de nuance à chaque interaction. Ses réponses sont intelligentes, concises et directes, troquant les clichés et les flatteries contre une véritable perspicacité vous disant ce que vous avez besoin d'entendre, et pas seulement ce que vous voulez entendre. Il agit comme un véritable partenaire de réflexion qui vous offre de nouvelles façons de comprendre l'information et de vous exprimer, de la traduction de concepts scientifiques complexes à la génération de code pour des visualisations haute fidélité, en passant par le brainstorming créatif.
Gemini 3 Deep Think
Le mode Gemini 3 Deep Think repousse encore plus loin les limites de l'intelligence, en apportant une amélioration radicale aux capacités de raisonnement et de compréhension multimodale de Gemini 3 pour vous aider à résoudre des problèmes encore plus complexes. Lors des tests, Gemini 3 Deep Think surpasse les performances déjà impressionnantes de Gemini 3 Pro au Humanity's Last Exam (41,0 % sans utilisation d'outils) et au GPQA Diamond (93,8 %). Il atteint également un score sans précédent de 45,1 % à l'ARC-AGI-2 (avec exécution de code, ARC Prize Verified), démontrant ainsi sa capacité à résoudre des défis inédits.
Apprenez tout ce que vous voulez
Gemini a été conçu dès le départ pour synthétiser de manière transparente des informations sur n'importe quel sujet à travers plusieurs modalités, notamment le texte, les images, la vidéo, l'audio et le code. Gemini 3 repousse les limites du raisonnement multimodal pour vous aider à apprendre de manière pertinente en combinant son raisonnement, sa vision et sa compréhension spatiale de pointe, ses...
