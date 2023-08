Gemini : la réponse stratégique de Google à ChatGPT et GPT-4 d'OpenAI ?

Gemini a-t-il les capacités nécessaires pour surpasser ChatGPT et GPT-4 ?

L'intensification de la course à l'IA a poussé Alphabet, la société mère de Google, à fusionner ses deux équipes de recherche sur l'IA, Google Brain et DeepMind, en une seule entité appelée Google DeepMind. Le but déclaré d'Alphabet est de centraliser ses efforts et d'optimiser ses investissements. En plus, ces deux équipes ont un palmarès impressionnant. DeepMind est le créateur d'AlphaGo, l'IA qui a battu un champion du monde du jeu de Go en 2016, d'AlphaFold qui prédit la structure des protéines, etc. Google Brain a contribué à Google Traduction, et a notamment créé TensorFlow, ainsi que le modèle LaMDA sur lequel est basé le chatbot d'IA Bard.De cette fusion est né le projet Gemini, une série de grands modèles de langage qui combinent les capacités de GPT-4 avec des techniques de formation tirées d'AlphaGo, telles que l'apprentissage par renforcement et la recherche arborescente. Il aurait le potentiel de détrôner ChatGPT en tant que solution d'IA générative la plus dominante de la planète. Gemini semble être la réponse stratégique de Google à ChatGPT. Le lancement de ChatGPT a ébranlé Google dans ses fondements. La menace était telle que le géant de la recherche a dû déclarer un code rouge et commencer à investir pour rattraper son retard sur OpenAI dans le domaine de l'IA générative.Cet effort s'est traduit non seulement par la sortie de Bard, mais aussi de Gemini. Alors que Bard peine à séduire les utilisateurs, Gemini vise à remettre en question la domination de ChatGPT sur le marché très concurrentiel de l'IA générative. Pour ce faire, Gemini devrait s'appuyer sur ses capacités multimodales et à l'accès potentiel aux vastes données d'entraînement propriétaires de Google provenant de divers services. Les analystes estiment que le marché de l'IA générative pourrait valoir 1 300 milliards de dollars d'ici 2032. Il est donc clair que Google investit à fond dans cet espace pour maintenir sa position de leader dans le développement de l'IA.Si beaucoup s'attendent à ce que Gemini soit commercialisé à l'automne 2023, on ne sait pas grand-chose sur les capacités du modèle. En mai dernier, Sundar Pichai, PDG de Google et d'Alphabet, a publié un billet de blogue présentant une vue d'ensemble du modèle, en insistant sur ses capacités multimodales : « Gemini a été créé dès le départ pour être multimodal, très efficace en matière d'intégration d'outils et d'API et construit pour permettre de futures innovations, comme la mémoire et la planification. Bien qu'il soit encore tôt, nous voyons déjà des capacités multimodales impressionnantes qui n'ont pas été vues dans les modèles précédents ».« Une fois affiné et rigoureusement testé pour la sécurité, Gemini sera disponible en différentes tailles et capacités, tout comme PaLM 2 », a-t-il ajouté. Depuis, peu de choses ont filtré sur la sortie officielle, à part l'interview de Demis Hassabis, PDG de Google DeepMind, avec Wired, notant que "Gemini combinera certaines des forces des systèmes de type AlphaGo avec les capacités linguistiques étonnantes des grands modèles". D'autres sources ont également rapporté que Gemini sera capable de générer du texte et des images contextuelles et sera entraîné sur des sources telles que les transcriptions de vidéos YouTube. Mais Google n'a rien confirmé.Selon les analystes, la fusion des équipes de DeepMind et de Google Brain ne doit pas être sous-estimée, car elle met OpenAI face à une équipe de chercheurs en IA de classe mondiale, dont le cofondateur de Google Sergey Brin et le scientifique principal en IA de DeepMind et expert en apprentissage automatique Paul Barham. Ensemble, ces chercheurs forment une équipe expérimentée qui sait parfaitement comment appliquer des techniques telles que l'apprentissage par renforcement et la recherche arborescente pour créer des programmes d'IA capables de recueillir des commentaires et d'améliorer leur résolution de problèmes au fil du temps.L'une des plus grandes conversations autour de la sortie de Gemini est de savoir si le modèle mystérieux de Google a ce qu'il faut pour détrôner ChatGPT, qui a atteint cette année plus de 100 millions d'utilisateurs actifs mensuels. À première vue, la capacité de Gemini à générer du texte et des images lui confère un sérieux avantage sur GPT4 en ce qui concerne la gamme de contenus qu'il peut produire. Toutefois, le facteur de différenciation le plus menaçant entre les deux est sans doute le vaste éventail de données d'entraînement exclusives de Google. Selon plusieurs sources, Gemini peut traiter des données provenant de différents services.Il s'agit, entre autres, de Google Search, YouTube, Google Books et Google Scholar. (L'on ignore si Google a le droit d'utiliser ces données pour entraîner ses systèmes d'IA) Des analystes suggèrent que l'utilisation de ces données exclusives pour l'entraînement des modèles Gemini pourrait se traduire par un net avantage en matière de sophistication des informations et des déductions qu'ils peuvent tirer d'un ensemble de données. Cela est particulièrement vrai si les premiers rapports indiquant que le modèle Gemini est entraîné sur deux fois plus de jetons que GPT4 sont corrects. D'autres sources parlent de cinq à vingt fois plus de données.Dans un article publié lundi, les journalistes technologiques Dylan Patel et Daniel Nishball ont affirmé que Google itère à un rythme qui permettra de multiplier par cinq le nombre total de FLOPS (floating-point operations per second - le nombre d'opérations en virgule flottante par seconde) de pré-entraînement de GPT-4 avant la fin de l'année. « La voie est toute tracée pour atteindre 20x d'ici la fin de l'année prochaine, compte tenu de la construction actuelle de l'infrastructure. La question de savoir si Google a le courage de rendre ces modèles publics sans nuire à sa créativité ou à son modèle d'entreprise existant est une autre question », indique l'article.La raison d'être de Gemini pour Google est d'améliorer ses propres produits, défier Microsoft et, éventuellement, faire progresser la science médicale. La date de sortie et les capacités finales de Gemini sont encore inconnues. L'article indique également que Google dispose de la puissance de calcul nécessaire pour faire face à l'enjeu. Selon l'article, Google ferait partie d'un groupe d'entreprises disposant de plus de 20 000 GPU A100/H100 pour le développement. OpenAI, Anthropic, Inflection, X et Meta seraient les autres entités appartenant au groupe restreint d'entreprises disposant de la puissance de calcul nécessaire pour participer à la course à l'IA.Les auteurs de l'article affirment également que quelques-unes des entreprises susmentionnées ainsi que de nombreuses entreprises chinoises disposeront de plus de 100 000 unités de ces GPU d'ici la fin de l'année prochaine. Cependant, aucune source officielle ne permet pour l'instant de corroborer ces déclarations ni ces chiffres. Aucune de ces entreprises ne communique sur la puissance de calcul dont elle dispose pour le développement de ses systèmes d'IA. Lors de l'annonce de ces résultats la semaine dernière, Nvidia a reconnu avoir des difficultés à faire face à la demande des accélérateurs GPU H100, mais n'a pas communiqué sur ses clients.En somme, les capacités multimodales de Gemini, l'utilisation de l'apprentissage par renforcement, les capacités de génération de textes et d'images et les données propriétaires de Google sont tous les ingrédients dont Gemini a besoin pour surpasser GPT-4. Les données d'entraînement sont le principal facteur de différenciation. Après tout, l'organisation qui remportera la course aux grands modèles de langage sera en grande partie déterminée par celle qui entraînera ses modèles sur l'ensemble de données le plus vaste et le plus riche. La question est maintenant de savoir ce que fera OpenAI pour répondre à cette concurrence.Quel est votre avis sur le sujet ?Que pensez-vous du projet Gemini de Google ?Selon vous, à quoi pourrait-on s'attendre avec ce projet ?Google peut-il faire face au partenariat entre Microsoft et OpenAI ?Google est-il en mesure de reprendre la tête de la course à l'IA ? Pourquoi ?