Google a présenté Gemma 3 270M, une version compacte de son modèle d'intelligence artificielle (IA) ouvert Gemma, conçu pour fonctionner en local directement sur des appareils tels que les smartphones et les navigateurs web. Avec seulement 270 millions de paramètres, soit bien moins que ses prédécesseurs qui en comptaient un milliard, ce modèle offre un réglage plus rapide, de solides capacités de suivi des instructions et une confidentialité renforcée grâce au traitement local.Gemma est une série de grands modèles de langage (LLM) open source développés par Google DeepMind. Elle repose sur des technologies similaires à celles de Gemini. La première version a été lancée en février 2024, suivie de Gemma 2 en juin de la même année, puis de Gemma 3. Des variantes de Gemma ont également été développées, comme le modèle Gemma 3 QAT, qui offre des performances de pointe pour les accélérateurs cloud et de bureau, Gemma 3n, une architecture axée sur les appareils mobiles qui apporte une IA multimodale puissante et en temps réel directement aux appareils périphériques, ou encore les modèles de vision-langage PaliGemma et DolphinGemma, qui permet de comprendre la communication des dauphins.
Google a lancé ses premiers modèles ouverts Gemma 3 au début de l'année 2025. Selon l'entreprise, il s'agit des modèles ouverts de Google les plus avancés, les plus portables et les plus développés de manière responsable. La famille Gemma 3 est disponible en plusieurs tailles, allant de 1 milliard à 27 milliards de paramètres, ce qui permet aux utilisateurs de choisir le modèle le mieux adapté à leurs besoins spécifiques en termes de matériel et de performances.
Au cours des dernières années, les géants de la technologie ont créé des modèles d'IA toujours plus volumineux, exploitant des racks entiers de GPU coûteux pour fournir une IA générative sous forme de service cloud. Mais les IA de petite taille ont également leur importance. Google a annoncé une version miniature de son modèle ouvert Gemma, conçue pour fonctionner sur des appareils locaux. Selon Google, le nouveau Gemma 3 à 270 millions de paramètres peut être réglé en un clin d'œil et offre des performances robustes malgré son faible encombrement.
Dans le domaine de l'IA générative, les paramètres sont les variables apprises qui contrôlent la manière dont le modèle traite les entrées pour estimer les tokens de sortie. En général, plus un modèle comporte de paramètres, plus il est performant. Avec seulement 270 millions de paramètres, le nouveau Gemma 3 peut fonctionner sur des appareils tels que les smartphones, voire entièrement dans un navigateur web.
L'exécution d'un modèle d'IA en local présente de nombreux avantages, notamment une confidentialité renforcée et une latence réduite. Gemma 3 270M a été conçu en tenant compte de ce type de cas d'utilisation.
Capacités principales de Gemma 3 270M
- Architecture compacte et performante : le nouveau modèle de Google compte au total 270 millions de paramètres : 170 millions de paramètres d'intégration en raison d'un vocabulaire étendu et 100 millions pour ses blocs de transformation. Grâce à son vocabulaire étendu de 256 000 tokens, le modèle peut traiter des tokens spécifiques et rares, ce qui en fait un modèle de base solide pouvant être affiné dans des domaines et des langues spécifiques.
- Efficacité énergétique extrême : l'un des principaux avantages de Gemma 3 270M est sa faible consommation d'énergie. Des tests internes réalisés par Google sur un SoC Pixel 9 Pro montrent que le modèle quantifié INT4 n'a utilisé que 0,75 % de la batterie pour 25 conversations, ce qui en fait le modèle Gemma le plus économe en énergie de Google.
- Suivi des instructions : un modèle adapté aux instructions est publié avec un point de contrôle pré-entraîné. Bien que ce modèle ne soit pas conçu pour des cas d'utilisation conversationnels complexes, il s'agit d'un modèle puissant qui suit les instructions générales dès sa mise en service.
- Quantification prête pour la production : des points de contrôle Quantization-Aware Trained (QAT) sont disponibles, permettant aux utilisateurs d'exécuter les modèles avec une précision INT4 et une dégradation minimale des performances, ce qui est essentiel pour le déploiement sur des appareils aux ressources limitées.
L'outil adapté à la tâche
Selon Google, en ingénierie, le succès se définit par l'efficacité, et non par la puissance brute. « Vous n'utiliseriez pas un marteau pour accrocher un cadre. Le même principe s'applique à la construction avec l'IA. »
Gemma 3 270M incarne cette philosophie de « l'outil adapté à la tâche », selon l'entreprise. Gemma 3 270M est un modèle de fondation de haute qualité qui se conforme parfaitement aux instructions dès sa sortie de l'emballage, et dont la véritable puissance se révèle grâce à un réglage fin. Une fois spécialisé, le modèle peut exécuter des tâches telles que la classification de texte et l'extraction de données avec une précision, une rapidité et...
La fin de cet article est réservée aux abonnés. Soutenez le Club Developpez.com en prenant un abonnement pour que nous puissions continuer à vous proposer des publications.