IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)

Vous êtes nouveau sur Developpez.com ? Créez votre compte ou connectez-vous afin de pouvoir participer !

Vous devez avoir un compte Developpez.com et être connecté pour pouvoir participer aux discussions.

Vous n'avez pas encore de compte Developpez.com ? Créez-en un en quelques instants, c'est entièrement gratuit !

Si vous disposez déjà d'un compte et qu'il est bien activé, connectez-vous à l'aide du formulaire ci-dessous.

Identifiez-vous
Identifiant
Mot de passe
Mot de passe oublié ?
Créer un compte

L'inscription est gratuite et ne vous prendra que quelques instants !

Je m'inscris !

Le modèle d'IA Gemini de Google pourrait être cinq fois plus puissant que le modèle de langage GPT-4 d'OpenAI,
Il devrait combiner les capacités de GPT-4 et des programmes d'IA tels qu'AlphaGo

Le , par Mathis Lucas

80PARTAGES

6  0 
Google travaille sur le projet Gemini qu'il a présenté comme un ensemble de grands modèles de langage (LLM) combinant diverses technologies. Alors que l'entreprise entretient un silence total autour de ce développement, un récent article indique que Gemini devrait être au moins cinq fois plus puissant que GPT-4 (le plus puissant modèle de langage d'OpenAI) grâce à ses capacités multimodales et à l'accès potentiel aux vastes bases de données d'entraînement propriétaires de Google provenant de divers services. Google reprendrait ainsi la tête de la course à l'IA. Cependant, aucune information officielle ne permet pour l'instant de corroborer cette affirmation.

Gemini : la réponse stratégique de Google à ChatGPT et GPT-4 d'OpenAI ?

L'intensification de la course à l'IA a poussé Alphabet, la société mère de Google, à fusionner ses deux équipes de recherche sur l'IA, Google Brain et DeepMind, en une seule entité appelée Google DeepMind. Le but déclaré d'Alphabet est de centraliser ses efforts et d'optimiser ses investissements. En plus, ces deux équipes ont un palmarès impressionnant. DeepMind est le créateur d'AlphaGo, l'IA qui a battu un champion du monde du jeu de Go en 2016, d'AlphaFold qui prédit la structure des protéines, etc. Google Brain a contribué à Google Traduction, et a notamment créé TensorFlow, ainsi que le modèle LaMDA sur lequel est basé le chatbot d'IA Bard.


De cette fusion est né le projet Gemini, une série de grands modèles de langage qui combinent les capacités de GPT-4 avec des techniques de formation tirées d'AlphaGo, telles que l'apprentissage par renforcement et la recherche arborescente. Il aurait le potentiel de détrôner ChatGPT en tant que solution d'IA générative la plus dominante de la planète. Gemini semble être la réponse stratégique de Google à ChatGPT. Le lancement de ChatGPT a ébranlé Google dans ses fondements. La menace était telle que le géant de la recherche a dû déclarer un code rouge et commencer à investir pour rattraper son retard sur OpenAI dans le domaine de l'IA générative.

Cet effort s'est traduit non seulement par la sortie de Bard, mais aussi de Gemini. Alors que Bard peine à séduire les utilisateurs, Gemini vise à remettre en question la domination de ChatGPT sur le marché très concurrentiel de l'IA générative. Pour ce faire, Gemini devrait s'appuyer sur ses capacités multimodales et à l'accès potentiel aux vastes données d'entraînement propriétaires de Google provenant de divers services. Les analystes estiment que le marché de l'IA générative pourrait valoir 1 300 milliards de dollars d'ici 2032. Il est donc clair que Google investit à fond dans cet espace pour maintenir sa position de leader dans le développement de l'IA.

Si beaucoup s'attendent à ce que Gemini soit commercialisé à l'automne 2023, on ne sait pas grand-chose sur les capacités du modèle. En mai dernier, Sundar Pichai, PDG de Google et d'Alphabet, a publié un billet de blogue présentant une vue d'ensemble du modèle, en insistant sur ses capacités multimodales : « Gemini a été créé dès le départ pour être multimodal, très efficace en matière d'intégration d'outils et d'API et construit pour permettre de futures innovations, comme la mémoire et la planification. Bien qu'il soit encore tôt, nous voyons déjà des capacités multimodales impressionnantes qui n'ont pas été vues dans les modèles précédents ».

« Une fois affiné et rigoureusement testé pour la sécurité, Gemini sera disponible en différentes tailles et capacités, tout comme PaLM 2 », a-t-il ajouté. Depuis, peu de choses ont filtré sur la sortie officielle, à part l'interview de Demis Hassabis, PDG de Google DeepMind, avec Wired, notant que "Gemini combinera certaines des forces des systèmes de type AlphaGo avec les capacités linguistiques étonnantes des grands modèles". D'autres sources ont également rapporté que Gemini sera capable de générer du texte et des images contextuelles et sera entraîné sur des sources telles que les transcriptions de vidéos YouTube. Mais Google n'a rien confirmé.

Selon les analystes, la fusion des équipes de DeepMind et de Google Brain ne doit pas être sous-estimée, car elle met OpenAI face à une équipe de chercheurs en IA de classe mondiale, dont le cofondateur de Google Sergey Brin et le scientifique principal en IA de DeepMind et expert en apprentissage automatique Paul Barham. Ensemble, ces chercheurs forment une équipe expérimentée qui sait parfaitement comment appliquer des techniques telles que l'apprentissage par renforcement et la recherche arborescente pour créer des programmes d'IA capables de recueillir des commentaires et d'améliorer leur résolution de problèmes au fil du temps.

Gemini a-t-il les capacités nécessaires pour surpasser ChatGPT et GPT-4 ?

L'une des plus grandes conversations autour de la sortie de Gemini est de savoir si le modèle mystérieux de Google a ce qu'il faut pour détrôner ChatGPT, qui a atteint cette année plus de 100 millions d'utilisateurs actifs mensuels. À première vue, la capacité de Gemini à générer du texte et des images lui confère un sérieux avantage sur GPT4 en ce qui concerne la gamme de contenus qu'il peut produire. Toutefois, le facteur de différenciation le plus menaçant entre les deux est sans doute le vaste éventail de données d'entraînement exclusives de Google. Selon plusieurs sources, Gemini peut traiter des données provenant de différents services.

Il s'agit, entre autres, de Google Search, YouTube, Google Books et Google Scholar. (L'on ignore si Google a le droit d'utiliser ces données pour entraîner ses systèmes d'IA) Des analystes suggèrent que l'utilisation de ces données exclusives pour l'entraînement des modèles Gemini pourrait se traduire par un net avantage en matière de sophistication des informations et des déductions qu'ils peuvent tirer d'un ensemble de données. Cela est particulièrement vrai si les premiers rapports indiquant que le modèle Gemini est entraîné sur deux fois plus de jetons que GPT4 sont corrects. D'autres sources parlent de cinq à vingt fois plus de données.

Dans un article publié lundi, les journalistes technologiques Dylan Patel et Daniel Nishball ont affirmé que Google itère à un rythme qui permettra de multiplier par cinq le nombre total de FLOPS (floating-point operations per second - le nombre d'opérations en virgule flottante par seconde) de pré-entraînement de GPT-4 avant la fin de l'année. « La voie est toute tracée pour atteindre 20x d'ici la fin de l'année prochaine, compte tenu de la construction actuelle de l'infrastructure. La question de savoir si Google a le courage de rendre ces modèles publics sans nuire à sa créativité ou à son modèle d'entreprise existant est une autre question », indique l'article.

La raison d'être de Gemini pour Google est d'am...
La fin de cet article est réservée aux abonnés. Soutenez le Club Developpez.com en prenant un abonnement pour que nous puissions continuer à vous proposer des publications.

Une erreur dans cette actualité ? Signalez-nous-la !

Avatar de _toma_
Membre éclairé https://www.developpez.com
Le 16/04/2024 à 20:59
1  0