IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)

Vous êtes nouveau sur Developpez.com ? Créez votre compte ou connectez-vous afin de pouvoir participer !

Vous devez avoir un compte Developpez.com et être connecté pour pouvoir participer aux discussions.

Vous n'avez pas encore de compte Developpez.com ? Créez-en un en quelques instants, c'est entièrement gratuit !

Si vous disposez déjà d'un compte et qu'il est bien activé, connectez-vous à l'aide du formulaire ci-dessous.

Identifiez-vous
Identifiant
Mot de passe
Mot de passe oublié ?
Créer un compte

L'inscription est gratuite et ne vous prendra que quelques instants !

Je m'inscris !

Google Bard fait un grand bond en avant et devance GPT-4 dans le classement des modèles d'IA les plus performants,
Il est toutefois toujours moins performant que GPT-4 Turbo

Le , par Mathis Lucas

25PARTAGES

6  0 
Google a récemment publié une nouvelle version de Bard basée sur son grand modèle de langage (LLM) Gemini Pro. Les évaluations ont révélé que cette nouvelle mouture a surclassé GPT-4 en matière de performance et occupe désormais la deuxième place du classement HuggingFace Chatbot Arena. Il se classe juste derrière GPT-4 Turbo. Ce résultat important a suscité l'enthousiasme et l'impatience de la communauté technologique pendant que Google se prépare à publier son très attendu Gemini Ultra. De son côté, OpenAI se prépare également à lancer le GPT-5 et s'attend à ce que ce nouveau grand modèle de langage le rapproche un peu plus de l'AGI.

OpenAI mène actuellement la danse dans la course à l'IA avec les différentes variantes de ChatGPT. Google a tenté de gratter des parts de marché à ChatGPT en lançant son propre chatbot d'IA appelé Bard, mais celui-ci a affiché des performances mitigées et est resté à la traîne tout au long de l'année écoulée. Pour corriger ses lacunes, Google a lancé le mois dernier un nouveau modèle d'IA appelé Gemini qui se décline en trois versions : Gemini Nano (de petite taille), Gemini Pro (de taille moyenne) et Gemini Ultra (de très grande taille). Il semble que Google vient de remporter une victoire face à GPT-4 grâce à Gemini Pro.

La plateforme lmsys.org (large model systems organization), qui classe les grands modèles de langage suivant leurs performances, a annoncé cette semaine que la nouvelle version de Bard, basée sur le modèle Gemini Pro, a récemment dépassé le GPT-4 d'OpenAI, décrochant ainsi la deuxième place dans le classement mondial, juste derrière GPT-4 Turbo. Selon les analystes, le saut de Bard par rapport à GPT-4 marque un moment charnière dans la course à l'IA. Il reflète les progrès rapides des capacités de l'IA et la concurrence intense entre les géants de la technologie pour prendre la tête dans ce domaine transformateur.


Jeff Dean, responsable de l'IA chez Google, a annoncé sur X le nouveau modèle Bard, piloté par un Gemini Pro portant le suffixe "scale". « Grâce aux mises à jour de Gemini, Bard est bien meilleur et possède beaucoup plus de capacités par rapport au lancement de mars », a écrit Dean. Il n'explique pas ce que signifie le mot "scale", mais le nom suggère qu'il pourrait s'agir d'une version plus grande (mise à l'échelle) du modèle Pro précédent, qui, d'après les tests, ne bat même pas GPT-3.5 (la version gratuite de ChatGPT). Gemini Pro est le deuxième modèle Gemini de Google, derrière le modèle haut de gamme Gemini Ultra.

La communauté attend avec impatience la sortie de Gemini Ultra, le prochain grand projet de Google dans le domaine de l'IA. Cette version devrait mettre en évidence les capacités de Google en matière d'apprentissage automatique et d'IA, et potentiellement établir de nouvelles références dans l'industrie. Cette progression ne témoigne pas seulement des prouesses de Google, mais signale également un changement plus large dans le paysage de l'IA. Elle pousse OpenAI à travailler plus rapidement à l'élaboration du GPT-5. Cela signifie que nous pourrions bientôt voir une IA plus avancée et plus intelligente.

Le nouveau modèle Bard devance les modèles GPT-4 0314 (publié en mars 2023) et GPT-4 0613 (publié à l'été 2023), mais reste derrière GPT-4 Turbo (publié en novembre 2023). Le nouveau Bard est le premier à pénétrer dans la phalange GPT-4. Le site Chatbot Arena applique le système de notation Elo utilisé aux échecs et dans les sports électroniques pour évaluer et comparer les performances de différents modèles de langage. Dans l'arène, différents modèles s'affrontent dans des duels anonymes, choisis au hasard. Les utilisateurs interagissent avec les modèles et votent pour les réponses qu'ils préfèrent.

Ces votes sont utilisés pour déterminer le classement dans le tableau d'affichage. La plateforme recueille toutes les interactions des utilisateurs, mais ne compte les votes que si les noms des modèles sont inconnus, c'est-à-dire si l'utilisateur n'a pas demandé à utiliser un modèle précis. Comme il s'agit d'évaluations d'utilisateurs ou de qualité perçue, les résultats de Chatbot Arena peuvent différer des résultats d'un benchmark synthétique typique. C'est aussi le problème : le nouveau modèle Bard n'a été évalué qu'environ 3 000 fois jusqu'à présent, alors que les modèles GPT-4 ont été évalués jusqu'à 30 000 fois.


Le résultat peut donc encore changer, et les écarts dans l'analyse comparative sont généralement faibles. Quoi qu'il en soit, les analystes estiment qu'il s'agit d'une prouesse respectable pour Google et cela suscite la curiosité quant à Gemini Ultra, le modèle d'IA le plus performant de Google, qui sera bientôt commercialisé et qui devrait surpasser Gemini Pro-scale. « Je soupçonne depuis un moment que les performances de Bard ont été limitées par le coût. Google ne fait pas payer Bard et ils ne voulaient pas faire tourner gratuitement un modèle de langage pour tout le monde pour toujours », a écrit un critique.

Il a poursuivi : « peut-être qu'ils ont fait une percée dans le coût de l'inférence pour leurs meilleurs modèles. Ou peut-être encore qu'ils en ont eu assez que tout le monde se moque d'eux parce qu'ils étaient en retard et qu'ils ont décidé d'en assumer le coût pendant un certain temps. Je pense toujours qu'ils devraient lancer un abonnement pour que nous puissions voir leur meilleur modèle fonctionner en public ». D'autres remettent en cause le classement de Chatbot Arena et attendent que d'autres benchmarks confirment ces résultats. En attendant, Google semble bien décidé à rattraper son retard sur OpenAI.

Si OpenAI n'introduit pas rapidement un nouveau modèle, il risque de perdre son avance. Les spéculations vont bon train : le modèle d'IA Llama 3 de Meta se profile à l'horizon et a le potentiel de surpasser le GPT-4. D'autre part, Google a intégré des fonctions d'IA générative dans Google Chrome. Google introduit la fonction "Aidez-moi à écrire" sur tous les sites Web. En cliquant avec le bouton droit de la souris sur n'importe quelle zone de texte, les utilisateurs peuvent accéder à cette fonction, qui invite l'IA de Google à s'enquérir de leurs besoins en matière d'écriture et à générer ensuite un premier projet.

Qu'il s'agisse de rédiger une critique de restaurant bien articulée, de créer un RSVP amical pour un événement ou de faire une demande officielle de location d'appartement, cette fonctionnalité est conçue pour aider les utilisateurs. L'intégration de cette fonctionnalité dans Google Chrome pourrait réduire considérablement la nécessité pour les utilisateurs de rédiger des contenus sur ChatGPT. Beaucoup de personnes travaillent directement sur le Web, qu'il s'agisse d'envoyer des courriels, de rédiger un article ou de créer des présentations.

Source : HuggingFace Chatbot Arena

Et vous ?

Que pensez-vous de la position de Google Bard dans ce classement ?
Que pensez-vous de la méthode utilisée par le site pour classer les modèles d'IA ?
Pensez-vous qu'OpenAI pourrait se faire devancer par l'un de ses rivaux cette année ? Pourquoi ?
Avez-vous essayé le nouveau Bard basé sur le modèle Gemini Pro-scale ? Si oui, que pensez-vous de ses performances ?

Voir aussi

Google Bard : une MAJ pour l'extension YouTube de l'outil d'IA permet d'analyser des vidéos pour extraire des points clés, sans nécessiter la lecture de la vidéo

Google lance Gemini, un modèle d'IA puissant qui, selon lui, peut surpasser GPT-4 et dispose de « capacités de raisonnement » avancées pour « réfléchir plus attentivement »

Google veut déployer "l'IA la plus avancée, la plus sûre et la plus responsable au monde" en 2024, mais le chemin à parcourir est encore long et pourrait comporter des défis majeurs

Une erreur dans cette actualité ? Signalez-nous-la !

Avatar de Mingolito
Membre extrêmement actif https://www.developpez.com
Le 22/02/2024 à 17:13
Avant Gemini cette connerie wokiste est déjà dans les films américains depuis des années et sur les films historiques ça choque.

Aussi bien je trouve ça très bien d'avoir des séries avec un casting international comme par exemple on a vu sur Heroes, Lost, etc, d'autant que c'est vu dans le monde entier alors c'est cool pour tous le monde, aussi bien avoir dans les films historiques par exemple des nazis noirs ou je ne sais quelle autre imbécilité Woke c'est pénible, bientôt Hollywood va nous sortir un nouveau Biopic avec Napoléon et le personnage sera joué par un Chinois transsexuel
10  1 
Avatar de OrthodoxWindows
Membre émérite https://www.developpez.com
Le 10/02/2024 à 23:42
Marrant comme les entreprises qui s'inquiète des "risques" des images de nus générés par IA sont aussi celles qui pompent allégrement les données privées pour former leurs modèles.
A l'opposé, l'IA l'open-source ne s'inquiète pas des risques mais respecte plus la vie privée
4  0 
Avatar de Diablo150
Membre régulier https://www.developpez.com
Le 22/02/2024 à 18:49
Ils jouent d'autant plus les wokes car ils ont arrêtés ou au moins diminués les effectifs "diversitaires" parce qu'embaucher des tonnes de gens suivant leur type et non leurs compétences ça va un moment.

Heureusement pour le moment Stable diffusion est à peu près épargné par ces conneries.
4  0 
Avatar de irrmichael
Membre du Club https://www.developpez.com
Le 28/01/2024 à 15:10
Mistral 8B fait presque aussi bien que les modèles propriétaires à 80B et +, le jour où Mistral sortira un 80B, il faudra un gpt 6 pour l'égaler
Quant à Bard, il excelle surtout dans les tours de passe passe , un échec dès le départ et qui ne fait pas mieux un an après
3  0 
Avatar de fatbob
Membre éclairé https://www.developpez.com
Le 31/01/2024 à 15:58
Plus google avance et plus je suis content de ne l'utiliser que comme un moteur de recherche secondaire en cas de réponse insuffisamment pertinente de mon premier choix (actuellement Lilo qui se base sur bing mais sans collecter les données perso tout en reversant une partie de leurs revenus publicitaires à des projets de notre choix).
A vrai dire, je trouve d'ailleurs que les réponses de google, de plus en plus polluées par les pubs et les sites purement commerciaux, sont de moins en moins intéressantes (comprendre : il est de plus en plus rare que google m'apporte une réponse pertinente quand Lilo ne n'a pas fait).

Je trouve démentiel qu'une entreprise puisse s'octroyer le droit d'utiliser des données d'un passé lointain alors que les utilisateurs n'ont jamais donné leur accord.

Le pire, c'est que même si un jour la justice déclare cela illégal, ce sera trop tard. Personne n'ordonnera à google de détruire BARD parce qu'il sera construit sur une base totalement immorale (d'ailleurs, on voit bien que chatGPT peut piller internet sans problème, au contraire des vilains pirates qui veulent simplement mater un film sans se taper en plus de la pub).

Et pour citer le grand George (Abitbol) :
"Monde de merde."
4  1 
Avatar de Aiekick
Membre extrêmement actif https://www.developpez.com
Le 10/02/2024 à 2:55
J'en penses qu'on a pas besoin d'une ia pour faire du code propre, c'est plus un outil pour les script kiddies
3  0 
Avatar de Anselme45
Membre extrêmement actif https://www.developpez.com
Le 12/02/2024 à 11:01
Où est l'Union Européenne et son RGPD?

Où est la CNIL, son bras armé en France?

Ben ils regardent ailleurs... Occupés à emmerder la PME qui aurait l'idée d'enregistrer les activités de ses employés qui posent problèmes (vol, etc...), occupés à emmerder l'éditeur de logiciel qui veut mettre en place des rapports statistiques dans ses progiciels...
2  0 
Avatar de irrmichael
Membre du Club https://www.developpez.com
Le 22/02/2024 à 20:19
Bard Gemini cumule les échecs depuis un an.
ça répond à coté, sinon les présentations publiques sont fake, puis là le générateur de photo fait n'importe quoi.
Croire qu'il n'y a personne chez Google pour tester ces outils avant leur publication ?
Pour moi, Google a perdu la course à l'IA. C'est fini.
2  0 
Avatar de 23JFK
Membre expert https://www.developpez.com
Le 29/02/2024 à 22:47
Citation Envoyé par commandantFred Voir le message
...
N'importe qui peut mettre un casque de martien à un humain d'ethnie anti-martienne sous GIMP et ça n'a jamais fait jaser personne...

Le problème c'est que dans le cas présent, il n'a jamais été demandé à l'IA de faire preuve de fantaisie ou "d'imagination". Les requêtes étaient du genre : Montres-moi un authentique Viking de l'Histoire Norvégienne.
Se retrouver avec un Booba à casque ou un Gengis Khan sur un drakkar, ce n'est clairement pas ce qui était demandé.
2  0 
Avatar de commandantFred
Membre averti https://www.developpez.com
Le 03/02/2024 à 1:26
Je viens de lui demander deux images en rapport avec mon bouquin. Il est allé les chercher sur EpicGames et les a affichées sans la moindre modification. Attention aux droits donc. Je ne doute pas qu'il s'améliore par la suite.
2  1