La rivalité dans la course à l'IA a poussé Alphabet, la société mère de Google, à fusionner ses deux équipes clés de recherche sur l'IA, Google Brain et DeepMind, en une seule entité appelée Google DeepMind. Le but déclaré d'Alphabet est de centraliser ses efforts et d'optimiser ses investissements. En plus, ces deux équipes ont un palmarès impressionnant. DeepMind est le créateur d'AlphaGo, l'IA qui a battu un champion du monde du jeu de Go en 2016, d'AlphaFold qui prédit la structure des protéines, etc. Google Brain a contribué à Google Traduction, et a notamment créé TensorFlow, ainsi que le modèle LaMDA sur lequel est basé le chatbot d'IA Bard.
De cette fusion est né le projet Gemini, une série de modèles de langage combinant les capacités de GPT-4 avec des techniques de formation tirées d'AlphaGo, telles que l'apprentissage par renforcement et la recherche arborescente. Il aurait le potentiel de détrôner ChatGPT en tant que solution d'IA générative la plus dominante de la planète. Gemini semble être la réponse stratégique de Google à ChatGPT. Le lancement de ChatGPT a ébranlé Google dans ses fondements. La menace était telle que le géant de la recherche a dû déclarer un code rouge et commencer à investir pour rattraper son retard sur OpenAI dans le domaine de l'IA générative.
Le PDG Sundar Pichai a mentionné que Google vise à publier Gemini dès que possible et à s'assurer qu'il est compétitif et à la pointe de la technologie. Lors d'un appel avec des investisseurs, Pichai a souligné que le prochain modèle d'IA de l'entreprise jettera les bases d'une série de modèles de nouvelle génération qui sortiront tout au long de l'année 2024. En septembre dernier, il a été rapporté que Google a donné à un petit groupe d'entreprises l'accès à une première version de Gemini et l'entreprise pourrait publier le nouveau modèle d'IA avant la fin de cette année. Cependant, un rapport publié cette semaine indique que ce ne sera pas le cas.
Le rapport, publié par The Information, indique que Gemini ne devrait pas arriver avant le premier trimestre de l'année prochaine. Pour Google, ce retard est un revers dans la course qui l'oppose à Microsoft et à OpenAI. Alors que Microsoft commercialise avec succès les technologies d'OpenAI auprès des entreprises par l'intermédiaire de son cloud, Google peine à atteindre les consommateurs avec sa solution concurrente, Bard. De récentes analyses indiquent que la croissance des ventes de Google dans le domaine du cloud s'est ralentie, tandis que celle de son rival Microsoft s'est accélérée. En effet, Microsoft et OpenAI pourraient creuser davantage l'écart.
« Je suis assez réticent à l'idée de dire que Google a du mal à suivre, mais le fait que Google soit passé en alerte rouge à la fin de l'année dernière et n'ait toujours pas respecté sa date de sortie est assez inquiétant », analyse un critique. Un autre se montre plus optimiste : « c'est triste de voir Google comme ça. Il n'y a pas de raison que les entreprises deviennent trop grandes et n'arrivent pas à innover assez vite. J'espère que le produit final Gemini vaudra la peine d'attendre. Il serait peu utile s'il n'était pas au moins de niveau GPT 4.5. Mais si Gemini est intégré à la recherche Google, de nombreuses personnes pourraient être séduites par son utilité ».
Pour d'autres, Google hésite de peur d'empiéter sur son activité lucrative de recherche. « Selon moi, il s'agit du dilemme de l'innovateur classique : Google gagne trop d'argent avec son modèle commercial actuel basé sur la recherche. Il est donc réticent à se perturber lui-même en prenant des risques importants dans le domaine de l'IA, qui pourrait changer le statu quo. En revanche, OpenAI et Microsoft n'ont aucun problème à prendre des risques, parce qu'ils ne sont pas confrontés au même dilemme, à savoir perturber un modèle commercial rentable grâce à l'IA ». Selon ce critique, il est possible que Google reste dans cette phase pendant encore longtemps.
« Cette situation ressemble à celle de Microsoft lorsqu'Apple a commencé à fabriquer l'iPhone. Ils ont été pris au dépourvu alors qu'Apple dominait déjà les téléphones dès le départ », a écrit un autre critique. Il rappelle qu'à sa sortie, l'iPhone a été considéré comme une innovation de rupture, mettant hors jeu des entreprises comme Microsoft, Nokia et Sony Mobile (anciennement Sony Ericsson). Depuis lors, ces acteurs peinent à remonter la pente. Microsoft a finalement enterré Windows Phone et a décidé d'adopter le système d'exploitation Android sur ses récents smartphones. Son système d’exploitation Windows 10 Mobile n'a pas non plus été à la hauteur.
Avec peu d'utilisateurs de Bard, il n'y a pas non plus de grande base de données de retour d'information permettant d'améliorer continuellement le modèle. En matière de qualité, la suite exclusive de modèles PaLM de Google, disponible dans le cloud, est à la traîne par rapport au GPT-4 d'OpenAI. Selon le rapport, qui cite des sources au fait du projet Gemini, l'intégration des différentes équipes (de Google Brain et DeepMind) et des différents modèles s'avère complexe. Rappelé de la retraite, Sergey Brin, cofondateur de Google, passerait quatre à cinq jours par semaine avec les développeurs et leur donne des conseils, bien qu'il ne prenne aucune décision.
L'on ignore encore si Gemini sera en mesure de rivaliser avec le GPT-4. Les dernières mises à jour de GPT-4 et l'arrivée de GPT-4 Turbo ont renforcé la position de leader d'OpenAI dans la course à l'IA. GPT-4 Turbo est une version améliorée de GPT-4 qui serait à la fois plus puissante et moins coûteuse, même si des analyses indépendantes montrent que le modèle affiche des performances mitigées. GPT-4 Turbo dispose d'une fenêtre contextuelle plus élargie et OpenAI a annoncé que le modèle se décline en deux versions : une version qui analyse strictement le texte et une seconde version qui comprend le contexte du texte et des images.
Le fait que Google ait eu par le passé une longueur d'avance en matière de puissance de calcul n'a plus guère d'importance maintenant qu'OpenAI a trouvé en Microsoft un partenaire majeur dans le domaine du cloud computing. Microsoft a investi un milliard de dollars dans OpenAI en 2019 et a fait un ajout de plusieurs milliards de dollars au début de l'année. Avec le succès de ChatGPT, OpenAI s'attend que Microsoft lui apporte encore plus de puissance de calcul et ses propres puces d'IA l'année prochaine. Les deux parties manquent également de personnel. Et OpenAI aurait dépensé des millions pour attirer les meilleurs experts en IA de Google.
Le scepticisme est grand parmi les commentateurs. Beaucoup ne croient pas en la capacité de Google de rivaliser avec GPT-4 ou l'IA d'OpenAI qui sera sur le marché à la sortie de Gemini. « Je ne pense pas que Google Gemini sera supérieur au modèle GPT disponible sur le marché lorsqu'il sortira. Il suffit de regarder n'importe quelle conférence Google I/O. Ils ne font que du battage médiatique alors qu'ils n'ont pas la technologie. Google est devenu comme IBM lorsqu'il était à son apogée dans les années 80. Et la comparaison avec IBM est peut-être encore meilleure que vous ne le pensez », a écrit un critique. En gros, l'enjeu est de taille pour Google.
Retarder le lancement de Gemini désavantagerait Google par rapport à Microsoft dans le domaine de l'informatique dématérialisée. En plus, les fonctionnalités d'IA sur YouTube et les améliorations apportées à Google Assistant devraient attendre, car ChatGPT continue de gagner du terrain. En dépit du scepticisme, le rapport souligne que le pilier financier le plus important de Google, son activité publicitaire, pourrait aussi bénéficier de Gemini. Avec une mémoire plus longue pour les interactions des utilisateurs, les annonceurs pourraient utiliser Gemini pour créer de nouvelles variations sur la campagne la plus réussie des derniers mois.
Pour rappel, Google DeepMind a annoncé que Gemini sera capable de tout piloter, des chatbots aux fonctions qui résument un texte ou génèrent un texte original basé sur ce que les utilisateurs veulent lire, comme des brouillons de courriels, des paroles de musique ou des articles d'actualité. Le prochain modèle d'IA de Google devrait également être capable d'aider les ingénieurs logiciels à écrire du code et à générer des images originales à partir d'invites.
Et vous ?
Quel est votre avis sur le sujet ?
Que pensez-vous du report de la date de lancement de Gemini ?
Est-ce un aveu de faiblesse de la part du géant de Mountain View ? Pourquoi ?
Selon vous, Gemini sera-t-il en mesure de rivaliser avec le modèle GPT de son époque ?
Qu'est-ce qui explique ce retard ? Google est-il victime du dilemme de l'innovateur ?
OpenAI, soutenu par Microsoft, est-il bien parti pour gagner la course à l'IA ? Pourquoi ?
Google DeepMind fait-il réellement le poids face au duo Microsoft/OpenAI ? Pourquoi ?
Voir aussi
Google s'apprête à lancer le logiciel d'IA Gemini, un ensemble de LLM pouvant résumer ou générer des textes originaux en fonction de ce que les utilisateurs veulent lire
OpenAI lance un nouveau modèle de langage appelé GPT-4 Turbo qui serait plus puissant et moins cher que GPT-4, avec une fenêtre contextuelle plus grande que celle du modèle d'IA Claude 2 d'Anthropic
Une fuite de données révèle des informations sur le modèle d'IA Gemini de Google et sur son outil d'IA secret appelé Stubbs, qui permet de générer une application fonctionnelle à partir d'une invite