L'e-mail signale l'urgence de Google à gagner la prochaine génération de recherche basée sur l'IA. La société a été repoussée dans les cordes alors que Microsoft a pris la vedette pour son investissement dans OpenAI. OpenAI a créé le populaire ChatGPT, un chatbot sorti fin 2022 qui peut répondre à des questions larges et ouvertes avec des réponses humaines. Il y a quelques jours, Microsoft a dévoilé une version remaniée de son moteur de recherche Bing avec ChatGPT, et Satya Nadella, le PDG de Microsoft, l'a qualifié de « nouveau jour » pour la recherche.
La capacité de ChatGPT à proposer une réponse concise et fidèle à une question pourrait faire gagner aux utilisateurs le temps qu'ils passent généralement à parcourir les liens sur Google pour trouver la même information. D'ailleurs, Microsoft a intégré une version améliorée de ChatGPT à certains de ses produits à l'instar de Teams ou de Bing, pour avoir une plus-value sur la concurrence.
Pour ne pas être en reste, Google a accéléré son travail sur Apprentice Bard, l'une de ses réponses à ChatGPT.
Bard utilise LaMDA (ou Language Model for Dialogue Applications), le modèle de langage de Google pour l'application de dialogue.
LaMDA est le système de Google pour créer des chatbots basés sur ses grands modèles de langage les plus avancés, ainsi appelés parce qu'ils imitent la parole en ingérant des milliards de mots provenant d'Internet. La grande enseigne de la recherche a présenté publiquement LaMDA à l'édition 2021 de la Google I/O, sa conférence dédiée aux développeurs, avec l'objectif d'améliorer ses assistants d'intelligence artificielle conversationnelle et de rendre les conversations plus naturelles. La société utilise déjà une technologie de modèle de langage similaire pour la fonctionnalité Smart Compose de Gmail ou pour les requêtes des moteurs de recherche.
Pour être les premiers à présenter un outil de recherche qui s'appuie sur l'intelligence artificielle, Google a précipité l'annonce de Bard, publiant une démo un jour avant l'évènement de Microsoft.
Mais le bot n'a pas pris un bon départ, les experts notant que Bard a fait une erreur factuelle dans sa toute première démo.
Un GIF partagé par Google montre Bard répondant à la question : « De quelles nouvelles découvertes du télescope spatial James Webb puis-je parler à mon enfant de 9 ans ? » Bard propose une liste à puces de trois éléments, parmi lesquels un élément indiquant que le télescope « a pris les toutes premières images d'une planète en dehors de notre propre système solaire ».
La toute première réponse de Bard contenait une erreur factuelle
Cependant, un certain nombre d'astronomes sur Twitter ont souligné que c'était incorrect et que la première image d'une exoplanète avait été prise en 2004 - comme indiqué sur le site Web de la NASA (voir en source) : « Ce n'est pas pour faire mon connard (en fait, si finalement) et je suis sûr que Bard sera impressionnant, mais pour mémoire : JWST n'a pas pris 'la toute première image d'une planète en dehors de notre système solaire' », a tweeté l'astrophysicien Grant Tremblay.
Bruce Macintosh, directeur des observatoires de l'Université de Californie à l'UC Santa Cruz, a également souligné l'erreur. « Parlant en tant que quelqu'un qui a pris en photo une exoplanète 14 ans avant le lancement de JWST, j'ai l'impression que vous devriez trouver un meilleur exemple ? ».
Une décision qui a provoqué la colère des employés
Les employés ont exprimé leur mécontentement contre la direction de l'entreprise, en particulier le PDG, pour s'être précipitée et ne pas avoir réfléchi avant de communiquer sur la sortie du chatbot rival de ChatGPT. Ils ont estimé que cela n'avait pas été bien géré et que cela pourrait s'avérer une erreur coûteuse à long terme.
Sur Memegen, un forum interne populaire, ils ont qualifié de « précipitée », « bâclée » et « non Googley » cette stratégie de communication alors que des mèmes concernant la situation commençaient à apparaître en ligne.
Alors que les employés de Google se tournent souvent vers Memegen pour se moquer avec humour des bizarreries et des faux pas de l'entreprise, les messages après l'annonce de Bard ont pris un ton plus sérieux et sont même allés directement après Pichai.
« Cher Sundar, le lancement de Bard et les licenciements ont été précipités, bâclés et myopes », indiquait un mème qui comprenait une photo de Pichai. « Veuillez revenir à une perspective à long terme ». Le message a reçu de nombreux votes positifs de la part des employés.
« Sundar et le leadership méritent un Perf NI », était-il indiqué un autre mème très apprécié, faisant référence à la catégorie la plus basse du système d'évaluation des performances des employés de l'entreprise. « Ils sont comiquement myopes et non-Googlely dans leur quête d'accentuation de la netteté ».
Certaines personnes pensent que c'était une mauvaise tentative du PDG d'essayer de dire au monde qu'il était toujours dans la course avec les autres en termes de sa propre offre. N'oubliez pas que Microsoft a déjà rendu public son chatbot Bing et maintenant, tous les regards sont tournés vers la sortie de Google.
Le PDG d'Alphabet demande la contribution de tous ses employés
« Je sais que ce moment est inconfortablement excitant, et il fallait s'y attendre*: la technologie sous-jacente évolue rapidement avec un tel potentiel », a écrit Pichai dans sa note aux employés de Google. « La chose la plus importante que nous puissions faire en ce moment est de nous concentrer sur la création d'un excellent produit et de le développer de manière responsable ».
Mardi, Google a lancé le « dogfooding » (qui pourrait se traduire par autoéquipement en français) sur Bard. Le dogfooding est en fait une expression utilisée en entreprise (particulièrement sur les projets informatiques), qui désigne l'utilisation de ses propres produits et services afin de se confronter directement à leurs qualités et défauts. Des milliers de testeurs externes et internes l'utilisent déjà, soumettant des commentaires sur la qualité, la sécurité et le « fondement » des réponses de Bard, indique la note de Pichai.
« Les tests et les commentaires des Googleurs et des testeurs externes de confiance sont des aspects importants de l'amélioration de Bard pour s'assurer qu'il est prêt pour nos utilisateurs », a déclaré un porte-parole de Google dans un communiqué. « Nous sollicitons souvent l'avis des Googleurs pour nous aider à améliorer nos produits, et c'est une partie importante de notre culture interne ».
Google a fait face à des troubles internes au cours des dernières années au sujet de ses initiatives d'IA, car certains employés craignaient que la technologie ne soit pas prête et puisse entraîner des dommages, comme la propagation de préjugés ou de désinformation. Dans le même temps, les données et les commentaires des utilisateurs sont un avantage pour Google, car ils contribuent à améliorer encore les réponses dans ses systèmes d'IA.
« L'IA a traversé de nombreux hivers et printemps », a déclaré Pichai. « Et maintenant, il refleurit. En tant qu'entreprise axée sur l'IA, nous y travaillons depuis de nombreuses années et nous y sommes prêts ».
La note interne aux employés
Salut les Googleurs,
Ravi de nous voir ouvrir Bard pour un dogfooding interne afin de nous aider à le préparer pour le lancement. Il s'agit d'une étape importante alors que nous travaillons à développer la technologie de manière responsable - un grand merci à l'équipe Bard et à tous ceux qui passent du temps à la tester. Si vous ne l'avez pas encore testé, vous pouvez trouver des instructions sur la façon de participer à go/bard-dogfood.
Je sais que ce moment est inconfortablement excitant, et c'est à prévoir : la technologie sous-jacente évolue rapidement avec tellement de potentiel. Ce sera un long voyage – pour tout le monde, à travers le terrain. La chose la plus importante que nous puissions faire en ce moment est de nous concentrer sur la création d'un excellent produit et de le développer de manière responsable. C'est pourquoi nous avons des milliers de testeurs externes et internes qui testent les réponses de Bard pour la qualité, la sécurité et l'ancrage des informations du monde réel. Relevons le défi et continuons à itérer, y compris avec les utilisateurs et les développeurs.
Et n'oubliez pas que certains de nos produits les plus performants n'étaient pas les premiers à être commercialisés. Ils ont pris de l'ampleur parce qu'ils répondaient à d'importants besoins des utilisateurs et s'appuyaient sur des connaissances techniques approfondies. Au fil du temps, nous avons gagné la confiance des utilisateurs et de plus en plus de personnes ont commencé à compter sur eux.
Voici où nous pouvons utiliser votre aide : canalisez l'énergie et l'excitation du moment dans nos produits. Testez la pression Bard et améliorez le produit. J'apprécierais que chacun d'entre vous contribue de manière plus approfondie avec 2 à 4 heures de votre temps. Voir ci-dessous pour plus de détails.
L'IA a traversé de nombreux hivers et printemps. Et maintenant, il refleurit. En tant qu'entreprise axée sur l'IA, nous y travaillons depuis de nombreuses années et nous y sommes prêts. Restons concentrés sur la fourniture d'expériences incroyables à nos utilisateurs et lançons des choses dont nous pouvons tous être fiers.
-Sundar
La course à l'outil de recherche s'appuyant sur l'IA entre Google et Microsoft aura un impact sur l'environnement
Il a été rapporté que les ressources nécessaires pour instruire un seul système d'IA peuvent entraîner l'émission de 1 000 livres de carbone. Jusqu'à présent, la consommation d'Internet représentait près de 4 % de l'effet de serre total.
Dans un article, des chercheurs examinent spécifiquement le processus de formation du modèle pour le traitement du langage naturel (PNL), le sous-domaine de l'IA qui se concentre sur l'enseignement des machines à gérer le langage humain. Au cours des deux dernières années, la communauté PNL a atteint plusieurs jalons de performance remarquables dans la traduction automatique, la complétion de phrases et d'autres tâches d'analyse comparative standard. Le tristement célèbre modèle GPT-2 d'OpenAI, par exemple, excellait dans la rédaction de fake news convaincantes.
Mais de telles avancées ont nécessité la formation de modèles toujours plus grands sur des ensembles de données tentaculaires de phrases récupérées sur Internet. L'approche est coûteuse en calcul et très gourmande en énergie.
Les chercheurs ont examiné quatre modèles sur le terrain qui ont été à l'origine des plus grandes avancées en matière de performances : Transformer, ELMo, BERT et GPT-2. Ils se sont entraînés chacun sur un seul GPU, parfois pendant une journée, pour mesurer sa consommation d'énergie. Ils ont ensuite utilisé le nombre d'heures d'entraînement indiqué dans les documents originaux du modèle pour calculer l'énergie totale consommée au cours du processus d'entraînement complet. Ce nombre a été converti en livres de dioxyde de carbone équivalent sur la base du mix énergétique moyen aux États-Unis, qui correspond étroitement au mix énergétique utilisé par AWS d'Amazon, le plus grand fournisseur de services cloud.
Le mix énergétique, ou bouquet énergétique, est la répartition des différentes sources d'énergies primaires consommées dans une zone géographique donnée. La part des énergies primaires dans la consommation mondiale, d'un pays, d'une collectivité, d'une industrie est généralement exprimée en pourcentages.
Ils ont constaté que les coûts informatiques et environnementaux de la formation augmentaient proportionnellement à la taille du modèle, puis explosaient lorsque des étapes de réglage supplémentaires étaient utilisées pour augmenter la précision finale du modèle. En particulier, ils ont découvert qu'un processus de réglage connu sous le nom de recherche d'architecture neuronale, qui tente d'optimiser un modèle en modifiant progressivement la conception d'un réseau neuronal par des essais et des erreurs exhaustifs, avait des coûts associés extraordinairement élevés pour un faible avantage en termes de performances. Sans cela, le modèle le plus coûteux, BERT, avait une empreinte carbone d'environ 1 400 livres de dioxyde de carbone, proche d'un vol aller-retour transaméricain pour une personne.
Source : note interne aux Googleurs
Et vous ?
Comprenez-vous la démarche de Sundar Pichai ?
« Et n'oubliez pas que certains de nos produits les plus performants n'étaient pas les premiers à être commercialisés. Ils ont pris de l'ampleur parce qu'ils répondaient à d'importants besoins des utilisateurs et s'appuyaient sur des connaissances techniques approfondies. Au fil du temps, nous avons gagné la confiance des utilisateurs et de plus en plus de personnes ont commencé à compter sur eux ». Qu'en pensez-vous ?
Avec le coût énergétique associé, le jeu en vaut-il la chandelle selon vous ? Pourquoi ?