Google serait en train de perdre la course à l'IA au profit de la communauté open source
Ce serait actuellement la confusion au sein des équipes spécialisées dans l'IA chez Google. Après que le PDG Sundar Pichai a lancé une alerte rouge en décembre afin de développer rapidement un concurrent à ChatGPT pour éviter que le chatbot d'IA d'OpenAI concentre toute l'attention du public, la réponse de Google - Bard - n'a pas répondu aux attentes de Wall Street et n'a pas suscité un grand enthousiasme comme son rival. Mais encore, certains ingénieurs affirment désormais que les produits d'IA de l'entreprise manquent de plus en plus d'une "sauce secrète" qui ferait la différence et conforterait sa position de leader dans la course à l'IA.
Sur la base de ce constat, un ingénieur sénior de Google a écrit dans un document ayant récemment fait l'objet de fuite que la firme de Redmond n'est tout simplement pas en mesure de gagner la course mondiale à l'IA. Le document a été publié anonymement par le soc SemiAnalysis, mais Bloomberg a ensuite identifié Luke Sernau, ingénieur chez Google, comme étant l'auteur du mémo. Le profil LinkedIn de Sernau montre qu'il est diplômé en mathématiques et qu'il travaille chez Google en tant qu'ingénieur principal depuis mars 2019. Il a auparavant passé quatre ans chez Meta sur les insights automatisés et l'infrastructure d'apprentissage automatique.
Leaked Google document: “We Have No Moat, And Neither Does OpenAI”
— Simon Willison (@simonw) May 4, 2023
The most interesting thing I've read recently about LLMs - a purportedly leaked document from a researcher at Google talking about the huge strategic impact open source models are havinghttps://t.co/q2lsjTHKGS
Selon l'ingénieur, l'IA open source pourrait finir par surpasser les modèles de langages propriétaires de Google, Meta et OpenAI. Le mémo met en cause la stratégie de Google pour freiner la montée en puissance du laboratoire d'IA OpenAI. Selon l'analyse de l'ingénieur, cette rivalité a aveuglé Google et a empêché l'entreprise de voir le travail qui s'abattait du côté de la communauté open source. Cette dernière aurait progressé rapidement, formant des modèles d'IA qui s'avèrent parfois plus intéressants que les modèles propriétaires de Google OpenAI. Le document suggère que Google et OpenAI pourraient payer très cher cette ignorance à l'avenir.
« Nous avons beaucoup regardé par-dessus nos épaules à OpenAI. Qui franchira la prochaine étape ? Quel sera le prochain mouvement ? Mais la vérité désagréable est que nous ne sommes pas en position de gagner cette course aux armements et qu'OpenAI non plus. Pendant que nous nous chamaillions, une troisième faction a tranquillement mangé notre déjeuner. Je parle, bien sûr, de l'open source », peut-on lire dans le document rédigé par l'ingénieur Sernau. Selon ce dernier, le géant de la recherche en ligne n'en fait pas assez pour maintenir son avance, ce qui lui fait prendre un retard considérable par rapport à la communauté des logiciels libres.
Le mémo indique que la poursuite du développement de modèles d'IA propriétaires pourrait rendre Google et OpenAI inutiles, car les modèles open source progressent rapidement. Il cite des exemples de progrès récents, tels que des modèles d'IA fonctionnant sur des téléphones, des modèles multimodaux s'entraînant en moins d'une heure et des réglages personnalisés de l'IA sur des ordinateurs portables. Il s'agirait des premiers signes de l'évolution rapide de l'aspect open source de l'IA générative. Ce paradigme de développement rapide et abordable est à l'opposé du système fermé dans lequel OpenAI et Google ont développé leurs modèles de langage.
La construction d'un modèle d'IA open source coûterait moins cher qu'un modèle propriétaire
OpenAI a dépensé 540 millions de dollars en 2022 pour développer et lancer ChatGPT. À tire de comparaison, des chercheurs de Stanford ont mis au point leur propre modèle d'IA, Alpaca, qui est semblable à ChatGPT avec seulement 600 dollars. L'expérience montre que les nouveaux systèmes d'IA avancés peuvent être facilement reproduits, et que cela ne nécessite même pas des coûts énormes. Bien que les chercheurs aient des difficultés à affiner leurs modèles pour les rendre moins toxiques, ils ont trouvé le moyen de les construire à moindres coûts, ce qui est un avantage majeur par rapport aux centaines de millions que coûtent les modèles propriétaires.
Selon l'analyse de Sernau, la genèse de cette innovation open source remonte à la fuite du grand modèle de de langage LLaMA de Meta. La version de LLaMA divulgué était relativement peu sophistiquée et manquait de fonctionnalités clés, mais un mois après sa publication, de nombreuses améliorations avaient été apportées. L'effort collectif d'"une planète entière de travail gratuit" consacré à l'innovation sur LLaMA a permis des progrès incroyables. Par exemple, le modèle Alpaca des chercheurs de Stanford a été conçu sur la base de la plateforme open source LLaMA de Meta. D'autres modèles open source, comme AutoGPT, sont également disponible.
Un autre modèle appelé Vicuna-13B a été entraîné pour seulement 300 dollars en utilisant un mécanisme de réglage fin très peu coûteux appelé "Low Rank Adaptation" (LoRA). Cette méthode, que Google et OpenAI n'utilisent pas pour l'instant, permet un réglage fin empilable plutôt qu'un réentraînement coûteux. Selon Sernau, ce qui est intéressant, c'est que Vicuna-13B a été publié trois semaines seulement après la fuite de LLaMA-13B. L'ingénieur juge le délai "extraordinairement" court et ajoute que cela met en évidence la vitesse de l'innovation dans le monde open source. Il aurait observé la même chose en ce qui concerne les IA de génération d'images.
Sernau affirme que les racines open source de Stable Diffusion lui ont permis de devancer Dall-E d'OpenAI. « Le modèle ouvert a permis des intégrations de produits, des places de marché, des interfaces utilisateur et des innovations qui n'ont pas eu lieu pour Dall-E », note-t-il. Le mémo de Sernau semble vouloir servir de rappel à l'ordre pour la stratégie de Google en matière d'IA. Il affirme que la concurrence directe avec la communauté open source est une proposition perdante et que Google devrait s'orienter vers une offre open source, un peu comme sa stratégie derrière le navigateur Chrome et le système d'exploitation Android.
« Plus nous contrôlons étroitement nos modèles de langage, plus nous rendons les alternatives ouvertes attrayantes. Google devrait s'imposer en tant que leader de la communauté open source, en prenant les devants et en coopérant avec le plus grand nombre, plutôt qu'en l'ignorant », a-t-il écrit. L'argument central du mémo rédigé par l'ingénieur de Google a divisé la communauté technologique. Certains se sont réjouis de son analyse et d'autres non. « Il serait inattendu et glorieux que Google soit le premier des grandes entreprises technologiques à être totalement décimé par la concurrence technologique », a tweeté un observateur.
Les défis auxquels la communauté open source pourrait faire face dans la course à l'IA
Si certains pensent que Google et ses rivaux Meta et OpenAI pourraient perdre la course à l'IA, d'autres sont sceptiques. Le PDG de Stability AI, Emad Mostaque, a réagi : « bien que cet article corresponde en grande partie à notre thèse, je pense qu'il ne comprend pas bien ce que sont réellement les fossés. Il est [très] difficile de construire une entreprise avec l'innovation comme douve, l'exigence de base est trop élevée. Les données, la distribution, les bons produits sont des douves. Microsoft et OpenAI peuvent très bien prospérer en raison de leur partenariat, car l'écosystème qui se construit autour des plug-ins OpenAI est fantastique ».
Elad Gil, investisseur et conseiller en startups, a partagé des idées similaires, se souvenant de ses jours chez Google lorsque les réseaux sociaux prenaient le monde d'assaut. « Je me souviens toujours de l'époque où j'étais chez Google, au milieu des années 2000, et où les réseaux sociaux étaient en plein essor. J'étais à une réunion où de nombreuses personnes (aujourd'hui connues sous le nom d'"experts" sociaux) tapaient du poing sur la table en disant que les produits sociaux n'avaient pas un avantage concurrentiel durable et qu'ils ne seraient jamais durables. En fin de compte, ce point de vue s'est avéré erroné », a-t-il déclaré.Google “We Have No Moat, And Neither Does OpenAI”
— hardmaru (@hardmaru) May 4, 2023
Leaked Internal Google Document Claims Open Source AI Will Outcompete Google & OpenAI
The leaked article is a good analysis of the current landscape of open-source models from a researcher within Google.https://t.co/V0CiaiByNx pic.twitter.com/GeIn5AFUbq
Raj Singh, de Mozilla, n'est pas non plus d'accord avec la thèse de l'ingénieur de Google. « Posséder la relation avec la plateforme de développement de l'IA, comme le fait OpenAI, c'est la douve. C'est la même douve que MS avait avec les développeurs Windows. C'est le même fossé qu'AWS a avec les développeurs de cloud », a-t-il déclaré. Google est sous les feux de la rampe depuis un certain temps en raison de cette pression et de la popularité de ChatGPT, qui est très difficile à gérer. Ainsi, pour Sernau, Google a perdu son avantage dans la course à l'IA. Il note que cela constitue une préoccupation majeure sur lequel les dirigeants doivent travailler.
« Nous n'avons pas de recette secrète. Notre meilleur espoir est d'apprendre et de collaborer avec ce que d'autres font en dehors de Google », a-t-il déclaré. Google n'a pas commenté l'analyse de Sernau, mais la firme de Mountain View a déclaré précédemment qu'elle en bonne position sur le marché de l'IA. Lors d'une récente conférence téléphonique sur les résultats, Pichai a déclaré : « nos investissements et nos percées dans le domaine de l'IA au cours de la dernière décennie nous ont mis en bonne position », soulignant les progrès réalisés dans le développement de modèles et la collaboration avec des développeurs et d'autres partenaires.
Le mémo de Sernau a déclenché un débat intense sur l'avantage concurrentiel de l'IA, en mettant en évidence les innovations rapides en matière de logiciels libres et les alternatives rentables par rapport aux modèles fermés de Google et d'OpenAI. En outre, l'essor de l'IA libre suscite des inquiétudes quant à la diffusion responsable de l'IA et à son utilisation potentiellement abusive à des fins criminelles, ce qui remet en question les engagements pris par les entreprises d'IA en matière de sécurité.
Et vous ?
Quel est votre avis sur le sujet ?
Que pensez-vous de l'analyse de l'ingénieur de Google ?
Pensez-vous que Google et OpenAI sont en train de perdre la course à l'IA ?
Selon vous, les modèles d'OpenAI et de Google seraient-ils plus performants s'ils étaient open source ?
La communauté open source est-elle en mesure de devancer les grandes entreprises d'IA dans la course à l'IA ?
Voir aussi
Le génie est sorti de la bouteille : des chercheurs de Stanford ont répliqué le chatbot d'IA ChatGPT pour moins de 600 dollars, mais l'ont rapidement mis hors ligne en raison de ses "hallucinations"
Qu'est-ce que Auto-GPT, le nouvel outil d'IA "à tout faire", et comment fonctionne-t-il ? Voici ce qu'il faut savoir sur ce chatbot d'IA basé sur le modèle GPT-4 d'OpenAI
Meta dévoile son propre modèle de langage appelé LLaMA, fonctionnant comme un chatbot d'IA ordinaire, et indique qu'il est plus puissant et moins gourmand en ressources que ses concurrents