Fondée par Elon Musk en mars 2023, xAI est une startup américaine travaillant dans le domaine de l'intelligence artificielle (IA). xAI a présenté une première version de Grok-2, qu'elle qualifie d'avancée significative par rapport à son modèle précédent Grok-1.5. Ainsi, Grok-2 offre des fonctionnalités inédites en matière de chat, de codage et de raisonnement. xAI a également annoncé Grok-2 mini. D'après xAI, Grok-2 et Grok-2 mini sont disponibles en version bêta pour les utilisateurs de X.
xAI a déclaré lors de l'annonce :
Nous sommes ravis de présenter une première version de Grok-2, qui représente une avancée significative par rapport à notre modèle précédent, Grok-1.5, et qui offre des fonctionnalités inédites en matière de chat, de codage et de raisonnement. Parallèlement, nous présentons Grok-2 mini, un petit frère compétent de Grok-2. Une première version de Grok-2 a été testée sur le leaderboard de LMSYS sous le nom de « sus-column-r ». Au moment de la rédaction de ce billet, elle surpasse à la fois Claude 3.5 Sonnet et GPT-4-Turbo. Grok-2 et Grok-2 mini sont actuellement en version bêta sur 𝕏, et nous rendrons également ces deux modèles disponibles via notre API d'entreprise dans le courant du mois.
Évaluation des modèles Grok-2 et Grok-2 miniGrok 2.0 will do political illustrations and real people, while ChatGPT refuses.
— Benjamin De Kraker 🏴*☠️ (@BenjaminDEKR) August 14, 2024
This instantly makes Grok 10x more fun...... pic.twitter.com/yDBJO0jWba
xAI a introduit une première version de Grok-2 sous le nom de "sus-column-r" dans l'arène des chatbots LMSYS, un benchmark concurrentiel populaire de modèles de langage. Les résultats montrent qu'elle surpasse Claude et GPT-4 dans le classement LMSYS en termes de score Elo global.
En interne, ils ont également utilisé un processus comparable pour évaluer les modèles. Selon xAI, les tuteurs IA s'engagent avec les modèles dans une variété de tâches qui reflètent les interactions réelles avec Grok. Au cours de chaque interaction, les tuteurs IA se voient présenter deux réponses générées par Grok. Ils sélectionnent la meilleure réponse sur la base de critères spécifiques propre à l'entreprise.
xAI annonce s'être concentré sur l'évaluation des capacités du modèle dans deux domaines clés : suivre des instructions et fournir des informations précises et factuelles. Grok-2 a montré des améliorations significatives dans le raisonnement avec le contenu récupéré et dans ses capacités d'utilisation des outils, telles que l'identification correcte des informations manquantes, le raisonnement à travers les séquences d'événements, et l'élimination des messages non pertinents.
Puis, les modèles Grok-2 ont été évalués sur la base d'une série de critères académiques comprenant le raisonnement, la compréhension de la lecture, les mathématiques, les sciences et le codage. Les résultats montrent également que Grok-2 et Grok-2 mini présentent tous deux des améliorations significatives par rapport au précédent modèle Grok-1.5.
Ils atteignent des niveaux de performance compétitifs par rapport à d'autres modèles frontières dans des domaines tels que les connaissances scientifiques de niveau supérieur (GPQA), les connaissances générales (MMLU, MMLU-Pro) et les problèmes de compétition en mathématiques (MATH). En outre, Grok-2 excelle dans les tâches basées sur la vision, offrant des performances de pointe dans le raisonnement mathématique visuel (MathVista) et dans la réponse à des questions basées sur des documents (DocVQA).
Voici la présentation des modèles Grok-2 et Grok-2 mini par xAI :
Découvrez Grok avec des informations en temps réel sur 𝕏
Au cours des derniers mois, nous avons continuellement amélioré Grok sur la plateforme 𝕏 avec une interface redessinée et de nouvelles fonctionnalités. Les utilisateurs de 𝕏 Premium et Premium+ auront accès à deux nouveaux modèles : Grok-2 et Grok-2 mini. Grok-2 est notre assistant IA de pointe, doté de capacités avancées en matière de compréhension du texte et de la vision, intégrant les informations en temps réel de la plateforme 𝕏, accessible via l'onglet Grok dans l'app 𝕏. Grok-2 mini est notre modèle petit mais capable qui offre un équilibre entre la vitesse et la qualité des réponses.
Par rapport à son prédécesseur, Grok-2 est plus intuitif, plus orientable et plus polyvalent dans un large éventail de tâches, qu'il s'agisse de chercher des réponses, de collaborer à la rédaction ou de résoudre des tâches de codage. En collaboration avec Black Forest Labs, nous expérimentons leur modèle FLUX.1 pour étendre les capacités de Grok sur 𝕏. Si vous êtes un abonné Premium ou Premium+, assurez-vous de mettre à jour la dernière version de l'application 𝕏 afin de tester Grok-2.
Construire avec Grok en utilisant l'API d'entreprise
Dans le courant du mois, nous mettrons Grok-2 et Grok-2 mini à la disposition des développeurs par l'intermédiaire de notre nouvelle plateforme API d'entreprise. Notre prochaine API est construite sur une nouvelle pile technologique sur mesure qui permet des déploiements d'inférence multirégionaux pour un accès à faible latence dans le monde entier.
Nous offrons des fonctions de sécurité améliorées telles que l'authentification multi-facteurs obligatoire (par exemple en utilisant un Yubikey, Apple TouchID, ou TOTP), des statistiques de trafic riches, et des analyses de facturation avancées (y compris des exportations de données détaillées). Nous proposons également une API de gestion qui vous permet d'intégrer la gestion des équipes, des utilisateurs et de la facturation dans vos outils et services internes existants. Inscrivez-vous à notre lettre d'information pour être informé de notre lancement dans le courant du mois.
Quelles sont les prochaines étapes ?
Grok-2 et Grok-2 mini sont en cours de déploiement sur 𝕏. Nous sommes très enthousiastes quant à leurs applications à une série de fonctionnalités basées sur l'IA, telles que des capacités de recherche améliorées, l'obtention d'informations plus approfondies sur les messages de 𝕏, et des fonctions de réponse améliorées, toutes alimentées par Grok. Bientôt, nous publierons un aperçu de la compréhension multimodale en tant qu'élément central de l'expérience Grok sur 𝕏 et l'API.
Depuis l'annonce de Grok-1 en novembre 2023, xAI a progressé à un rythme extraordinaire, sous l'impulsion d'une petite équipe dotée de la plus grande densité de talents. Nous avons introduit Grok-2, ce qui nous positionne à l'avant-garde du développement de l'IA. Nous nous concentrons sur l'amélioration des capacités de raisonnement de base grâce à notre nouvelle grappe de calcul. Nous aurons de nombreux autres développements à partager dans les mois à venir.
Au cours des derniers mois, nous avons continuellement amélioré Grok sur la plateforme 𝕏 avec une interface redessinée et de nouvelles fonctionnalités. Les utilisateurs de 𝕏 Premium et Premium+ auront accès à deux nouveaux modèles : Grok-2 et Grok-2 mini. Grok-2 est notre assistant IA de pointe, doté de capacités avancées en matière de compréhension du texte et de la vision, intégrant les informations en temps réel de la plateforme 𝕏, accessible via l'onglet Grok dans l'app 𝕏. Grok-2 mini est notre modèle petit mais capable qui offre un équilibre entre la vitesse et la qualité des réponses.
Par rapport à son prédécesseur, Grok-2 est plus intuitif, plus orientable et plus polyvalent dans un large éventail de tâches, qu'il s'agisse de chercher des réponses, de collaborer à la rédaction ou de résoudre des tâches de codage. En collaboration avec Black Forest Labs, nous expérimentons leur modèle FLUX.1 pour étendre les capacités de Grok sur 𝕏. Si vous êtes un abonné Premium ou Premium+, assurez-vous de mettre à jour la dernière version de l'application 𝕏 afin de tester Grok-2.
Construire avec Grok en utilisant l'API d'entreprise
Dans le courant du mois, nous mettrons Grok-2 et Grok-2 mini à la disposition des développeurs par l'intermédiaire de notre nouvelle plateforme API d'entreprise. Notre prochaine API est construite sur une nouvelle pile technologique sur mesure qui permet des déploiements d'inférence multirégionaux pour un accès à faible latence dans le monde entier.
Nous offrons des fonctions de sécurité améliorées telles que l'authentification multi-facteurs obligatoire (par exemple en utilisant un Yubikey, Apple TouchID, ou TOTP), des statistiques de trafic riches, et des analyses de facturation avancées (y compris des exportations de données détaillées). Nous proposons également une API de gestion qui vous permet d'intégrer la gestion des équipes, des utilisateurs et de la facturation dans vos outils et services internes existants. Inscrivez-vous à notre lettre d'information pour être informé de notre lancement dans le courant du mois.
Quelles sont les prochaines étapes ?
Grok-2 et Grok-2 mini sont en cours de déploiement sur 𝕏. Nous sommes très enthousiastes quant à leurs applications à une série de fonctionnalités basées sur l'IA, telles que des capacités de recherche améliorées, l'obtention d'informations plus approfondies sur les messages de 𝕏, et des fonctions de réponse améliorées, toutes alimentées par Grok. Bientôt, nous publierons un aperçu de la compréhension multimodale en tant qu'élément central de l'expérience Grok sur 𝕏 et l'API.
Depuis l'annonce de Grok-1 en novembre 2023, xAI a progressé à un rythme extraordinaire, sous l'impulsion d'une petite équipe dotée de la plus grande densité de talents. Nous avons introduit Grok-2, ce qui nous positionne à l'avant-garde du développement de l'IA. Nous nous concentrons sur l'amélioration des capacités de raisonnement de base grâce à notre nouvelle grappe de calcul. Nous aurons de nombreux autres développements à partager dans les mois à venir.
Source : xAI
Et vous ?
Quel est votre avis sur cette annonce ?
Avez-vous déjà utilisé le modèle d'IA Grok, et si oui qu'en pensez-vous ?
Selon vous, le fait que Grok-2 ne comporte aucun garde-fou concernant la création d'images est plutôt amusant ou vraiment dangereux ?
Voir aussi :
Elon Musk déclare que Grok 2, le chatbot prétendument "anti-woke" qui s'est avéré surtout créer des infox et des vulgarités, sortira en Août, suivi de Grok 3 d'ici la fin de l'année
La plateforme X d'Elon Musk visée par neuf plaintes de NOYB relatives à la protection de la vie privée, après s'être emparée des données d'utilisateurs de l'UE pour former son IA Grok
GPT-4o arrive en tête du classement des modèles d'IA les plus performants de LMSYS Chatbot Arena avec un score Elo de 1 289, surpassant ainsi Gemini Pro 1.5 de Google et Claude 3 Opus d'Anthropic