Un « quota gratuit » au lancement autorise 60 requêtes par minute, ce qui, selon Google, est « 20 fois plus que les autres offres gratuites ». Google utilisera ces entrées/sorties gratuites pour améliorer le modèle, avec des données anonymisées de votre compte Google et de votre clé API. Il « peut être accessible aux évaluateurs formés ».
Le 13 décembre, Google a annoncé la disponibilité générale de Google AI Studio. Google AI Studio est un environnement de développement basé sur le Web permettant de découvrir les API Gemini Pro, de créer des invites et d'affiner le modèle Gemini. Google appelle cela son « moyen le plus rapide de commencer à développer l’IA », a déclaré Thomas Kurian, PDG de Google Cloud, lors d'un point de presse.
« Gemini est formé et fait partie d'une vaste infrastructure d'hyper-informatique d'IA », a-t-il indiqué, faisant référence à la puce d'IA personnalisée de l'entreprise, la Tensor Processing Unit, ou TPU. « C'est l'infrastructure que nous proposons non seulement en interne mais désormais à nos clients ». Une partie de l'annonce de mercredi concernait la disponibilité générale du TPU v5p, qui multiplie par quatre les performances des TPU par rapport aux puces v4 existantes.
Puis, le lendemain (14 décembre), Google a annoncé que son modèle d'IA générative le plus puissant et le plus performant, Gemini, est désormais disponible pour les entreprises pour leurs besoins de développement d'applications. Annoncé la semaine dernière, Gemini est disponible en trois tailles : Ultra, Pro et Nano. Avec la décision d'aujourd'hui, la société dirigée par Sundar Pichai rend la version Pro du modèle accessible via l'API. Il peut être utilisé gratuitement pour le moment, mais il existe certaines limitations d'utilisation, a expliqué la société dans un article de blog.
Gemini Pro pour les développeurs : à quoi s'attendre ?
Cette première version de Gemini Pro dispose d'une fenêtre contextuelle de 32 Ko (Google prévoit de l'augmenter à l'avenir) et prend en charge la saisie/sortie de texte. Il existe également aujourd'hui un point de terminaison Gemini Pro Vision qui accepte la saisie de texte et d'image pour produire du texte.
Le bouton « Obtenir le code » vous permet de transférer le travail vers votre EDI dans cURL, JavaScript, Python, Android (Kotlin) et Swift.
Dans un publication sur X/Twitter annonçant la disponibilité, Pichai a souligné que l'API Gemini donne aux développeurs l'accès à une gamme complète de fonctionnalités, notamment l'appel de fonctions, l'intégration, la récupération sémantique, la base de connaissances personnalisée et la fonctionnalité de chat. Il prend également en charge 38 langues dans plus de 180 pays. Des SDK sont disponibles pour Gemini Pro pour vous aider à créer des applications qui s'exécutent n'importe où. Python, Android (Kotlin), Node.js, Swift et JavaScript sont tous pris en charge.
[TWITTER]<blockquote class="twitter-tweet"><p lang="en" dir="ltr">Today developers can start building with our first version of Gemini Pro through Google AI Studio at <a href="https://t.co/ozfVwuBpSZ">https://t.co/ozfVwuBpSZ</a>. <br><br>Developers have a free quota and access to a full range of features including function calling, embeddings, semantic retrieval, custom knowledge… <a href="https://t.co/GHzFaoU9cK">pic.twitter.com/GHzFaoU9cK</a></p>— Sundar Pichai (@sundarpichai) <a href="https://twitter.com/sundarpichai/status/1734952757722001626?ref_src=twsrc%5Etfw">December 13, 2023</a></blockquote> <script async src="https://platform.twitter.com/widgets.js" charset="utf-8"></script> [/TWITTER]
Vertex AI
Vertex AI, contrairement à AI Studio, est connecté à de nombreuses sources de données d'entreprise, notamment celles provenant de partenaires tiers de Google Cloud. L'accent est donc mis sur l'utilisation des propres données d'une entreprise.
En fin de compte, la société prévoit de tirer les leçons des commentaires des développeurs pour affiner Gemini Pro et se diriger vers le lancement du plus grand Gemini Ultra l'année prochaine. Il a été conçu pour des tâches plus complexes.
Ci-dessous les commentaires de Google à ce sujet.
Vertex AI permet de personnaliser et de déployer Gemini, permettant ainsi aux développeurs de créer de nouvelles applications différenciées capables de traiter les informations à travers le texte, le code, les images et les vidéos. Avec Vertex AI, les développeurs peuvent :
- Découvrir et utiliser Gemini Pro, ou sélectionner parmi une liste organisée de plus de 130 modèles de Google, open source et tiers qui répondent aux normes strictes de sécurité et de qualité d'entreprise de Google. Les développeurs peuvent accéder aux modèles sous forme d'API faciles à utiliser pour les intégrer rapidement dans des applications.
- Personnaliser le comportement du modèle avec une expertise spécifique dans un domaine ou une entreprise, en utilisant des outils de réglage pour augmenter les connaissances de formation et même ajuster les pondérations du modèle si nécessaire. Vertex AI propose diverses techniques de réglage, notamment la conception rapide, le réglage basé sur des adaptateurs tels que l'adaptation de bas rang (LoRA) et la distillation. Nous offrons également la possibilité d'améliorer un modèle en capturant les commentaires des utilisateurs grâce à notre prise en charge de l'apprentissage par renforcement à partir des commentaires humains (RLHF).
- Améliorer les modèles avec des outils pour vous aider à adapter Gemini Pro à des contextes ou des cas d'utilisation spécifiques. Les extensions et connecteurs Vertex AI permettent aux développeurs de lier Gemini Pro à des API externes pour des transactions et d'autres actions, de récupérer des données à partir de sources externes ou d'appeler des fonctions dans des bases de code. Vertex AI donne également aux organisations la possibilité d'ancrer les résultats du modèle de base dans leurs propres sources de données, contribuant ainsi à améliorer la précision et la pertinence des réponses d'un modèle. Nous offrons aux entreprises la possibilité d'utiliser la mise à la terre sur leurs données structurées et non structurées, ainsi que la technologie de recherche Google.
- Gérer et faire évoluer les modèles en production avec des outils spécialement conçus pour garantir qu'une fois les applications créées, elles peuvent être facilement déployées et entretenues. À cette fin, nous introduisons une nouvelle façon d’évaluer les modèles appelée Automatic Side by Side (Auto SxS), un outil automatisé à la demande pour comparer les modèles. Auto SxS est plus rapide et plus rentable que l'évaluation manuelle de modèles, et personnalisable selon diverses spécifications de tâches pour gérer de nouveaux cas d'utilisation de l'IA générative.
- Créer des agents de recherche et conversationnels dans un environnement low code/no code. Avec Vertex AI, les développeurs de tous niveaux de compétences en machine learning pourront utiliser Gemini Pro pour créer des agents IA attrayants et de qualité production en quelques heures et jours au lieu de semaines et de mois. Bientôt, Gemini Pro sera une option pour optimiser les fonctionnalités de synthèse de recherche et de génération de réponses dans Vertex AI, améliorant ainsi la qualité, la précision et les capacités de base des applications de recherche. Gemini Pro sera également disponible en avant-première en tant que modèle de base pour les agents conversationnels vocaux et de chat, offrant des interactions dynamiques avec les utilisateurs prenant en charge un raisonnement avancé.
- Innover de manière responsable en utilisant les filtres de sécurité, les API de modération de contenu et d'autres outils d'IA responsable de Vertex AI pour aider les développeurs à garantir que leurs modèles ne génèrent pas de contenu inapproprié.
- Contribuer à protéger les données grâce aux contrôles intégrés de gouvernance des données et de confidentialité de Google Cloud. Les clients gardent le contrôle de leurs données et Google n'utilise jamais les données client pour entraîner nos modèles. Vertex AI propose divers mécanismes permettant aux clients de conserver le contrôle exclusif de leurs données, notamment les clés de chiffrement gérées par le client et les contrôles de service VPC.
Gratuit mais avec des limitations
Selon Google, Gemini Pro et Gemini Pro Vision sont désormais accessibles gratuitement avec une limite de débit allant jusqu'à 60 requêtes par minute. Il en va de même pour les développeurs utilisant les modèles sur Vertex AI, mais seulement jusqu'à leur disponibilité générale l'année prochaine. Google affirme que le quota gratuit est 20 fois supérieur à celui des autres offres et devrait convenir à la plupart des besoins de développement.
Cela dit, une fois l'offre disponible, la société prévoit de facturer par 1 000 caractères ou par image sur Google AI Studio et Vertex AI.
Plus précisément, le prix d'entrée de Gemini Pro est maintenu à 0,00025 USD pour 1 000 caractères et à 0,0025 USD par image, tandis que le prix de sortie pour les deux reste le même, à 0,0005 USD pour 1 000 caractères.
Envoyé par Google
[TWITTER]<blockquote class="twitter-tweet"><p lang="en" dir="ltr">Gemini Pro API details, more expensive than gpt-3.5 (hint they use character pricing vs token) <a href="https://t.co/6tFDSftdmv">pic.twitter.com/6tFDSftdmv</a></p>— anton (@abacaj) <a href="https://twitter.com/abacaj/status/1734965635262669174?ref_src=twsrc%5Etfw">December 13, 2023</a></blockquote> <script async src="https://platform.twitter.com/widgets.js" charset="utf-8"></script> [/TWITTER]
Imagen2 : le réseau neuronal de conversion texte-image
Google Cloud a également annoncé une nouvelle version de son réseau neuronal de conversion texte-image, Imagen2, qui, selon lui, offre de plus grandes capacités pour des choses telles que le rendu de texte, pour l'insertion de marques d'entreprise dans des images (le logo de votre entreprise sur un tube de dentifrice dans une image). d'une salle de bain.)
Imagen2 est disponible dans la fonctionnalité Vertex AI appelée Model Garden, qui comprend une collection de différents programmes de réseaux neuronaux.
Le Model Garden comprend pour la première fois plusieurs réseaux de neurones tiers, notamment Mistral, ImageBind et DITO.
Sources : Google (1, 2)
Et vous ?
Que pensez-vous de Gemini ? Que pensez-vous de sa disponibilité sur les différentes plateformes de Google ?
Avez-vous déjà utilisé Google AI Studio et / ou Vertex AI ? Qu'en pensez-vous ? Comment trouvez-vous ces outils par rapports à ceux de la concurrence ?
Quelles sont les applications potentielles de Gemini Pro dans votre domaine d’activité ou d’intérêt ?
Que pensez-vous de l'offre gratuite ? De ses limitations ? Des tarifications comparées à celles de la concurrence ?
Voir aussi :
La meilleure démo de l'IA Gemini de Google a été truquée, Google a déjà admis que sa démo n'était pas réelle. Elle n'a pas été réalisée en temps réel ni en voix. Le modèle a vu des images fixes