
xAI a lancé Grok 4 Fast, le dernier modèle d'IA de la société, qui fait progresser le raisonnement rentable pour l'intelligence artificielle. S'appuyant sur les enseignements tirés de Grok 4, Grok 4 Fast offre des performances de pointe pour les domaines de l'entreprise et des consommateurs, tout en mettant l'accent sur une efficacité exceptionnelle des jetons pour les utilisateurs finaux et les développeurs.
Juillet dernier, Elon Musk et son entreprise xAI ont présenté en grande pompe Grok 4, la dernière version de leur intelligence artificielle générative, supposée rivaliser avec les meilleurs modèles du marché, dont GPT‑4o d’OpenAI. La première version du modèle a été lancé en novembre 2023 par Elon Musk dans le cadre d'une initiative basée sur le grand modèle de langage (LLM) du même nom. Grok dispose d'applications pour iOS et Android et est intégré à la plateforme de médias sociaux X (anciennement Twitter) et aux véhicules Tesla.
xAI a lancé deux modèles : Grok 4 et Grok 4 Heavy, ce dernier étant la « version multi-agents » de l'entreprise qui offre des performances accrues. Musk a déclaré que Grok 4 Heavy permettait à plusieurs agents de travailler simultanément sur un problème, puis de comparer leur travail « comme un groupe d'étude » afin de trouver la meilleure réponse. Mais derrière les démonstrations techniques et les effets d’annonce de Grok 4, une autre réalité trouble se dessine : un modèle au prix prohibitif, des fonctionnalités idéologiquement orientées, et surtout, un système accusé de propager des discours antisémites et haineux.
Récemment, xAI a lancé Grok 4 Fast, le dernier modèle d'IA de la société, qui fait progresser le raisonnement rentable pour l'intelligence artificielle. S'appuyant sur les enseignements tirés de Grok 4, Grok 4 Fast offre des performances de pointe pour les domaines de l'entreprise et des consommateurs, tout en mettant l'accent sur une efficacité exceptionnelle des jetons pour les utilisateurs finaux et les développeurs.
Les principales améliorations comprennent une fenêtre contextuelle de 2 millions de jetons, des capacités de recherche Web et X de pointe et une architecture de modèle unifiée. Grok 4 Fast introduit un système qui gère à la fois le raisonnement à longue chaîne de pensée et les réponses rapides au sein du même ensemble de poids de modèle, guidé par des invites système. Cette unification supprime la nécessité de disposer de modèles distincts, ce qui réduit la latence de réponse de bout en bout et l'utilisation des jetons. Ces changements d'architecture profitent particulièrement aux applications en temps réel qui recherchent une latence plus faible et un débit plus élevé.
Par rapport à Grok 3 Mini, Grok 4 Fast obtient de meilleurs scores sur les benchmarks de raisonnement tout en réduisant considérablement les coûts des jetons. Comparé à Grok 4, le modèle maintient des performances comparables sur les benchmarks de pointe, mais y parvient avec 40 % de jetons en moins. La combinaison d'une efficacité améliorée des jetons et d'un prix par jeton plus bas permet une réduction des coûts de 98 % pour les utilisateurs qui ont besoin d'un raisonnement de haut niveau.
De plus, Grok 4 Fast a été entraîné de bout en bout à l'aide d'un apprentissage par renforcement de l'utilisation d'outils, optimisant le moment où il convient d'exploiter l'exécution de code et la navigation sur le web. Le nouveau modèle d'IA est désormais accessible à tous les utilisateurs via le site web et l'application mobile iOS/Android.
Il y a un an, les chercheurs du Center for Countering Digital Hate, une organisation britannique à but non lucratif qui vise à mettre fin aux discours de haine et à la désinformation en ligne, ont constaté que Grok n'avait pas rejeté 60 demandes différentes d'images douteuses liées à l'élection présidentielle de 2024. Le rapport révèle que Grok ne dispose pas de « garde-fous efficaces » qui empêcheraient les utilisateurs de créer des « images potentiellement trompeuses ». Il serait intéressant de voir si Grok 4 Fast souffre de ce même problème.
Source : Grok 4 Fast
Et vous ?


Voir aussi :



Vous avez lu gratuitement 216 articles depuis plus d'un an.
Soutenez le club developpez.com en souscrivant un abonnement pour que nous puissions continuer à vous proposer des publications.
Soutenez le club developpez.com en souscrivant un abonnement pour que nous puissions continuer à vous proposer des publications.