Google Gemini, ou Gemini AI, est une suite intégrée de grands modèles de langage (LLM) en cours de développement par Google. Selon Sundar Pichai, PDG de Google, les modèles de base de Gemini ont été conçus dès le départ pour être multimodaux. Cela signifie que les utilisateurs pourront traiter et générer du texte, des images, du code et du contenu audio par le biais d'une interface utilisateur unique. Gemini est actuellement testé en version bêta par un groupe de développeurs sélectionnés au sein d'un petit nombre d'entreprises. Gemini devrait remplacer PaLM 2, le modèle de langage qui équipe actuellement Google Bard, d'ici à la fin de l'année 2023.
Jusque-là, très peu d'informations ont filtré sur Gemini. En août, un rapport a révélé que Gemini devrait combiner les capacités de GPT-4 avec des techniques de formation tirées d'AlphaGo, telles que l'apprentissage par renforcement et la recherche arborescente. Il aurait le potentiel de détrôner ChatGPT en tant que solution d'IA générative la plus dominante de la planète. Gemini semble être la réponse stratégique de Google à ChatGPT. Le lancement de ChatGPT a ébranlé Google dans ses fondements. La menace était telle que le géant de la recherche a dû déclarer un code rouge et commencer à investir pour rattraper son retard sur OpenAI.
Cet effort s'est traduit non seulement par la sortie de Bard, mais aussi de Gemini. Alors que Bard peine à séduire les utilisateurs, Gemini vise à remettre en question la domination de ChatGPT sur le marché de l'IA générative. Zoubin Ghahramani, vice-président de Google DeepMind, a déclaré que Gemini sera disponible dans les quatre mêmes tailles que PaLM 2 : Gecko, Otter, Bison et Unicorn.
- Gecko devrait être léger et idéal pour les appareils mobiles ;
- Otter est conçu pour être plus puissant que Gecko. Il devrait convenir à un large éventail de tâches unimodales ;
- Bison est conçu pour être plus grand et plus polyvalent qu'Otter. Il est susceptible de convenir à un nombre limité de tâches multimodales et devrait concurrencer le modèle GPT-4 en matière de parts de marché ;
- Unicorn est conçue pour être la plus grande, la plus puissante et la plus polyvalente des quatre modèles Gemini. Cette version devrait convenir à un large éventail de tâches multimodales et dépasser largement les capacités du ChatGPT ou de l'un de ses concurrents.
Selon la rumeur, si tout se passe bien, Gemini devrait également être intégré à tous les services cloud qui utilisent l'IA que Google propose aux entreprises et aux particuliers, notamment Google Search, Google Translate et Google Assistant. Une fois Gemini lancé, son évolutivité - ainsi que ses capacités d'intégration d'outils et d'API flexibles - permettra de l'utiliser dans une large gamme d'applications de bureau et mobiles en temps réel. La fuite de données indique que Google devrait publier Gemini directement dans MakerSuite, une sorte de studio qui permet de créer rapidement et facilement des applications basées sur des modèles d'IA générative.
MakerSuite fournit une interface utilisateur efficace pour solliciter certains des derniers modèles de Google et traduit facilement les invites en code prêt à la production que les utilisateurs peuvent intégrer dans leurs applications. Google a annoncé fin septembre avoir supprimé la liste d'attente et que les utilisateurs de 179 pays et territoires peuvent désormais utiliser MakerSuite. En outre, la fuite de données annonce l'arrivée prochaine de Makersuite Autosave pour permettre la sauvegarde automatique des invites. Elle annonce aussi l'arrivée d'un nouvel outil : il s'agit de l'outil de construction d'application piloté par l'IA appelé Stubbs à partir de Makersuite.
Selon l'auteur de la fuite, Stubbs permet de créer des applications fonctionnelles dans un seul site avec une seule invite. Les utilisateurs peuvent créer/générer, déployer et publier des applications à partir de Stubbs. « Pouvoir créer des applications et les lancer à partir d'un seul site avec une interface utilisateur simplifiée, c'est parfait. Vous publiez l'application et vous pouvez ensuite partager le lien. Est-ce un nouveau terrain pour l'IA ? Probablement. Il y aura une galerie communautaire, où vous pourrez publier vos Stubbs pour que tout le monde puisse les voir. Vous pourrez aussi remixer les Stubbs et avoir votre propre version d'une idée », note l'auteur de la fuite.
L'auteur de la suite affirme que Stubbs ne remplacera pas les développeurs d'applications, mais devrait donner un coup de pouce "massif" à l'industrie. D'après ce que l'on peut voir, cela ressemblera à des prototypes Figma générés par l'IA, et ne créera pas de code complet, mais plutôt des prototypes d'applications générées par l'IA qui fonctionneront. La galerie Stubbs (Stubbs Gallery) permet de voir les Stubbs créés par d'autres personnes. Lorsque vous créez une application à partir de Stubbs, elle n'est pas publiée par défaut. La fuite indique que vous devez le publier explicitement, ce qui signifie que le public ne voit pas directement tout ce que vous créez.
La fuite de données donne un aperçu du futur de Gemini et du nouvel outil d'IA Stubbs, mais ces informations ne sont pas précises et il est encore difficile de se faire une idée précise des ambitions réelles de Google avec ces deux technologies d'IA. Stubbs ressemble à un outil no-code basé sur l'IA. Les informations qui ayant fait l'objet de fuite sur ce prétendu outil secret de Google relancent le débat sur l'avènement des outils no-code basés sur l'IA qui pourrait remplacer les développeurs dans un avenir proche.
En attendant que Google se prononce sur Stubbs, l'auteur de la fuite annonce que d'autres fuites de données concernant Gemini et Stubbs pourraient suivre. Il a déclaré : « bien que la première fuite donne un aperçu, les détails techniques de Stubbs seront bientôt publiés pour vous aider à vous faire votre propre opinion sur ce qu'il fait dans une autre fuite ».
Sources : billet de blogue, Google
Et vous ?
Quel est votre avis sur le sujet ?
Que pensez-vous de l'outil d'IA "Stubbs" développé par Google ?
Selon vous, cet outil no-code peut-il prétendre remplacer les développeurs ?
Que pensez-vous des caractéristiques potentielles du modèle d'IA Gemini de Google ?
Avec Gemini, Google pourrait-il surpasser ChatGPT et reprendre la tête de la course à l'IA ?
Voir aussi
Le modèle d'IA Gemini de Google pourrait être cinq fois plus puissant que le modèle de langage GPT-4 d'OpenAI, il devrait combiner les capacités de GPT-4 et des programmes d'IA tels qu'AlphaGo
Sergey Brin, cofondateur de Google, signe son retour pour aider à développer Gemini, le concurrent de ChatGPT. L'ex-président d'Alphabet s'implique dans la stratégie IA et le recrutement
Comment Google DeepMind compte révolutionner l'IA générative et détrôner ChatGPT avec Gemini, son système d'IA qui combine les forces d'AlphaGo aux capacités des grands modèles de langage