Ces fonctionnalités comprennent de nouvelles façons de générer, de résumer et de réfléchir à un texte avec l'IA dans Google Docs (de la même manière que de nombreuses personnes utilisent ChatGPT d'OpenAI), l'option de générer des courriels complets dans Gmail sur la base de brèves listes de points, et la possibilité de produire des images, du son et des vidéos d'IA pour illustrer des présentations dans Slides (de la même manière que dans Microsoft Designer, alimenté par DALL-E d'OpenAI, et Canva, alimenté par Stable Diffusion).
Cette annonce montre l'empressement de Google à rattraper ses concurrents dans la nouvelle course à l'IA. Depuis l'arrivée de ChatGPT l'année dernière et le lancement par Microsoft de son chatbot Bing en février, le géant de la recherche s'est efforcé de lancer des fonctionnalités d'IA similaires. L'entreprise aurait déclaré un "code rouge" en décembre, la direction générale demandant à son personnel d'ajouter des outils d'IA à tous ses produits, qui sont utilisés par des milliards de personnes, en l'espace de quelques mois.
« Nous nous trouvons actuellement à un moment charnière de notre parcours dans le domaine de l'IA. Les percées réalisées dans le domaine de l'IA générative modifient radicalement la manière dont les gens interagissent avec la technologie », déclare Thomas Kurian. « Chez Google, nous avons développé de manière responsable de vastes modèles de langage afin de pouvoir les intégrer en toute sécurité dans nos produits. Aujourd'hui, nous sommes ravis de partager nos premiers progrès », poursuit-il.
Google investit dans l'IA depuis de nombreuses années et fait profiter les particuliers, les entreprises et les communautés de ses avantages. Qu'il s'agisse de publier des travaux de recherche de pointe, de concevoir des produits utiles ou de développer des outils et des ressources pour aider les autres, nous nous engageons à rendre l'IA accessible à tous.
ChatGPT a été créé par OpenAI, une société d'intelligence artificielle basée à San Francisco, connue pour son célèbre DALL-E, un modèle d'apprentissage profond qui génère des images à partir d'instructions textuelles appelées "prompts".
Google rivalise Microsoft pour l’avenir de l’IA
Google semble également préoccupé par le maintien de sa domination dans le domaine de la recherche. Le moteur de recherche de Google représentait plus de 91 % du marché mondial de la recherche au cours des 12 derniers mois, tandis que Bing représentait environ 3 %, selon les données de SimilarWeb.
En réponse à Microsoft qui serait fermement lié à OpenAI, Google a dévoilé Bard, une alternative à ChatGPT qui a pour objectif d’améliorer son moteur de recherche et surtout de rattraper son retard par rapport à OpenAI. Google pourrait s'être par ailleurs tourné vers une entreprise moins connue du nom d'Anthropic et fondée par d'anciens employés d'OpenAI.
Le géant de Mountain View a investi environ 300 millions de dollars dans la startup d'IA Anthropic, ce qui en fait le dernier géant de la technologie à mettre son argent et sa puissance de calcul au service d'une nouvelle génération d'entreprises qui tentent de se faire une place dans le domaine en plein essor de l' « IA générative ».
« L'IA est la technologie la plus profonde sur laquelle nous travaillons aujourd'hui. Qu'il s'agisse d'aider les médecins à détecter les maladies plus tôt ou de permettre aux gens d'accéder aux informations dans leur propre langue, l'IA aide les personnes, les entreprises et les communautés à libérer leur potentiel. Et elle ouvre de nouvelles possibilités qui pourraient améliorer considérablement la vie de milliards de personnes. C'est pourquoi nous avons réorienté l'entreprise autour de l'IA il y a six ans, et pourquoi nous la considérons comme le moyen le plus important de remplir notre mission : organiser les informations du monde et les rendre universellement accessibles et utiles.
Depuis lors, nous avons continué à investir dans l'IA dans tous les domaines, et Google AI et DeepMind font progresser l'état de l'art. Aujourd'hui, l'échelle des plus grands calculs d'IA double tous les six mois, dépassant de loin la loi de Moore. Dans le même temps, l'IA générative avancée et les grands modèles de langage captent l'imagination des gens dans le monde entier. En fait, notre projet de recherche Transformer et notre article définissant le domaine en 2017, ainsi que nos avancées importantes dans les modèles de diffusion, sont désormais à la base de nombreuses applications d'IA générative que vous commencez à voir aujourd'hui.
Un jour après l’annonce de Google, Microsoft présente son nouveau Bing mais qui lui repose sur la technologie de ChatGPT. L’objectif : lancer une nouvelle expérience de recherche qui pourrait permettre à la firme de faire sortir son moteur de recherche de l’ombre de Google. La nouvelle expérience Bing est l'aboutissement de quatre percées techniques :
- un modèle OpenAI de nouvelle génération : Microsoft annonce que le nouveau Bing fonctionne avec un nouveau modèle OpenAI de nouvelle génération, plus puissant que ChatGPT et spécialement conçu pour la recherche. Il reprend les principaux enseignements et avancées de ChatGPT et GPT-3.5 et il est encore plus rapide, plus précis et plus performant ;
- le modèle Prometheus de Microsoft : Microsoft développe une méthode de travail propriétaire avec le modèle OpenAI qui permet d'exploiter au mieux sa puissance. Elle appelle cet ensemble de capacités et de techniques le modèle Prometheus. Cette combinaison donne des résultats plus pertinents, opportuns et ciblés, avec une sécurité accrue ;
- application de l'IA à l'algorithme de recherche principal : Microsoft a également appliqué le modèle d'IA à notre principal moteur de classement des recherches Bing, ce qui a entraîné le plus grand bond en avant de la pertinence en vingt ans. Grâce à ce modèle d'IA, même les requêtes de recherche de base sont plus précises et plus pertinentes ;
- nouvelle expérience utilisateur : Microsoft repense la façon dont les utilisateurs interagissent avec la recherche, le navigateur et le chat en les regroupant en une expérience unifiée. Cela pourrait débloquer une toute nouvelle manière d'interagir avec le web.
Microsoft en profite également pour intégrer de nouvelles fonctions d’IA à Edge, son navigateur web. Elle a mis à jour le navigateur Edge avec de nouvelles capacités d'IA et un nouveau look, et a ajouté deux nouvelles fonctionnalités : Chat et compose. Grâce à la barre latérale Edge, il est possible de demander un résumé d'un long rapport financier pour en obtenir les principaux éléments, puis utiliser la fonction de chat pour demander une comparaison avec les données financières d'une entreprise concurrente et les placer automatiquement dans un tableau. Il est de plus possible de demander à Edge de l’aide à composer du contenu, comme un post LinkedIn, en lui donnant quelques invites pour commencer.
La nouvelle génération d'IA pour les développeurs et Google Workspace
API PaLM et MakerSuite : une manière accessible d'explorer et de prototyper avec des applications d'IA générative. De nombreux changements de technologie et de plateforme - du mobile au cloud computing - ont inspiré des écosystèmes entiers de développeurs à lancer de nouvelles entreprises, à imaginer de nouveaux produits et à transformer leur façon de créer. Nous sommes au milieu d'un autre changement avec l'IA qui a un effet profond sur toutes les industries.
Pour les développeurs qui expérimentent l'IA, Google introduit l'API PaLM, un moyen « simple » de construire à partir de ses meilleurs modèles de langage. « Aujourd'hui, nous mettons à disposition un modèle efficace, en termes de taille et de capacités, et nous ajouterons bientôt d'autres tailles », a écrit Google. L'API s'accompagne également d'un outil intuitif appelé MakerSuite, qui vous permet de prototyper rapidement des idées et qui, au fil du temps, offrira des fonctions d'ingénierie rapide, de génération de données synthétiques et de réglage de modèles personnalisés, le tout soutenu par des outils de sécurité robustes.
Apporter des capacités d'IA générative à Google Cloud
Les développeurs qui souhaitent créer et personnaliser leurs propres modèles et applications à l'aide de l'IA générative peuvent accéder aux modèles d'IA de Google, y compris PaLM, sur Google Cloud. Google apporte de nouvelles capacités d'IA générative à son portefeuille Google Cloud AI afin d'aider les développeurs et les organisations à accéder à la sûreté, à la sécurité et à la confidentialité au niveau de l'entreprise, ainsi qu'à s'intégrer à leurs solutions Cloud existantes :
- Prise en charge de l'IA générative dans Vertex AI : les développeurs et les entreprises utilisent déjà la plateforme Vertex AI de Google Cloud pour créer et déployer des modèles d'apprentissage automatique et des applications d'IA à grande échelle. Google propose désormais des modèles de base, d'abord pour générer du texte et des images, puis, au fil du temps, de l'audio et de la vidéo. Les clients de Google Cloud auront la possibilité de découvrir des modèles, de créer et de modifier des invites, de les affiner avec leurs propres données et de déployer des applications qui utilisent ces nouvelles technologies puissantes ;
- Constructeur d'applications d'IA générative : les entreprises et les gouvernements souhaitent également créer leurs propres interfaces de chat et assistants numériques alimentés par l'IA. Pour ce faire, Google introduit Generative AI App Builder, qui connecte les flux d'IA conversationnelle avec des expériences de recherche prêtes à l'emploi et des modèles de base - aidant les entreprises à créer des applications d'IA générative en quelques minutes ou quelques heures ;
- Nouveaux partenariats et programmes d'IA : outre l'annonce de nouveaux produits Google Cloud AI, Google s’est également engagée à être le fournisseur de cloud le plus ouvert. « Nous développons notre écosystème d'IA et des programmes spécialisés pour les partenaires technologiques, les fournisseurs de logiciels axés sur l'IA et les startups », précise Thomas Kurian.
« Les développeurs et les entreprises peuvent désormais essayer de nouvelles API et de nouveaux produits qui facilitent, sécurisent et rendent évolutive l'utilisation des meilleurs modèles d'IA de Google par le biais de Google Cloud et d'un nouvel environnement de prototypage appelé MakerSuite. Dans Google Workspace, nous introduisons de nouvelles fonctionnalités qui aident les utilisateurs à exploiter la puissance de l'IA générative pour créer, se connecter et collaborer », a-t-il ajouté.
Nouvelles fonctionnalités d'IA générative dans Google Workspace
Plus de 3 milliards de personnes bénéficient déjà de fonctionnalités basées sur l'IA dans Google Workspace, qu'il s'agisse de Smart Compose dans Gmail ou de résumés générés automatiquement dans Google Docs. Aujourd'hui, nous sommes ravis de passer à l'étape suivante et de proposer à un nombre limité de testeurs de confiance un nouvel ensemble de fonctionnalités qui facilitent encore davantage le processus de rédaction.
Envoyé par Johanna Voolich Wright, Vice-présidente, Produits, chez Google Workspace
La mission de Workspace est de connecter les gens de manière significative afin qu'ils puissent créer, construire et se développer ensemble. Selon les progrès de l'IA générative nous permettent de remplir cette mission d'une nouvelle manière. Aujourd'hui, nous partageons notre vision élargie de l'évolution de Workspace pour intégrer l'IA en tant que partenaire collaboratif toujours présent pour vous aider à atteindre vos objectifs, dans Gmail, Docs, Slides, Sheets, Meet et Chat.
Entraînement d'un modèle de langage de 540 milliards de paramètres avec Pathways
PaLM démontre la première utilisation à grande échelle du système Pathways pour adapter l'entraînement à 6144 puces, la plus grande configuration de système basée sur TPU utilisée pour l'entraînement à ce jour. La formation est mise à l'échelle en utilisant le parallélisme de données au niveau du Pod sur deux Pods Cloud TPU v4, tout en utilisant le parallélisme de données et de modèles standard au sein de chaque Pod.
Il s'agit d'une augmentation significative de l'échelle par rapport à la plupart des LLM précédents, qui ont été entraînés sur un seul Pod TPU v3 (par exemple, GLaM, LaMDA), ont utilisé le parallélisme de pipeline pour s'étendre à 2240 GPU A100 à travers les clusters GPU (Megatron-Turing NLG) ou ont utilisé plusieurs Pods TPU v3 (Gopher) avec une échelle maximale de 4096 puces TPU v3.
PaLM atteint une efficacité de formation de 57,8 % d'utilisation de matériels FLOPs, la plus élevée jamais atteinte pour les LLM à cette échelle. Ce résultat est dû à la combinaison de la stratégie de parallélisme et d'une reformulation du bloc Transformer qui permet de calculer en parallèle les couches d'attention et d'anticipation, ce qui permet d'obtenir des accélérations grâce aux optimisations du compilateur de la TPU.
Le PaLM a été entraîné à l'aide d'une combinaison d'ensembles de données anglaises et multilingues comprenant des documents web de haute qualité, des livres, Wikipedia, des conversations et du code GitHub. Nous avons également créé un vocabulaire "sans perte" qui préserve tous les espaces blancs (particulièrement importants pour le code), divise les caractères Unicode hors vocabulaire en octets et divise les nombres en jetons individuels, un pour chaque chiffre.
Des capacités révolutionnaires pour les tâches de langage, de raisonnement et de codage. Le PaLM présente des capacités révolutionnaires pour de nombreuses tâches très difficiles. Nous présentons ci-dessous quelques exemples de compréhension et de génération de langage, de raisonnement et de tâches liées au code.
Compréhension et génération de langage
PaLM a été évalué sur 29 tâches de traitement du langage naturel (NLP) largement utilisées en anglais. Le PaLM 540B a surpassé les performances des grands modèles précédents, tels que GLaM, GPT-3, Megatron-Turing NLG, Gopher, Chinchilla et LaMDA, sur 28 des 29 tâches qui couvrent les tâches de réponse aux questions (variante ouverte-domaine à livre fermé), les tâches de cloze et de complétion de phrases, les tâches de style Winograd, les tâches de compréhension de la lecture en contexte, les tâches de raisonnement de sens commun, les tâches SuperGLUE et les tâches d'inférence du langage naturel.
Un groupe de chercheurs en intelligence artificielle de Google et de l'université technique de Berlin a dévoilé le 6 mars le PaLM-E, un modèle multimodal de langage visuel incarné (VLM) avec 562 milliards de paramètres qui intègre la vision et le langage pour le contrôle robotique. Ils affirment qu'il s'agit du plus grand VLM jamais développé et qu'il peut effectuer une variété de tâches sans avoir besoin d'être réentraîné.
Selon Google, lorsqu'il reçoit une commande de haut niveau, telle que « apporte-moi les chips de riz du tiroir », le PaLM-E peut générer un plan d'action pour une plateforme robotique mobile dotée d'un bras (développée par Google Robotics) et exécuter les actions par lui-même. Pour ce faire, PaLM-E analyse les données de la caméra du robot sans avoir besoin d'une représentation prétraitée de la scène. Il n'est donc pas nécessaire qu'un humain prétraite ou annote les données, ce qui permet un contrôle robotique plus autonome.
Il est également résistant et peut réagir à son environnement. Par exemple, le modèle PaLM-E peut guider un robot pour qu'il aille chercher un sac de chips dans une cuisine - et avec PaLM-E intégré dans la boucle de contrôle, il devient résistant aux interruptions qui peuvent survenir pendant la tâche. Dans un exemple vidéo, un chercheur saisit les chips du robot et les déplace, mais le robot localise les chips et les saisit à nouveau.
« Notre plus grand modèle, PaLM-E-562B avec 562B paramètres, en plus d'être entraîné sur des tâches robotiques, est un généraliste du langage visuel avec des performances de pointe sur OK-VQA, et conserve des capacités de langage généraliste avec l'augmentation de l'échelle », Google.
Source : Google
Et vous ?
Quel est votre avis sur le sujet ?
Dans Gmail et Google Documents, il suffit de saisir un sujet sur lequel vous souhaitez écrire pour qu'un brouillon soit instantanément généré. Quelle appréciation faites vous de cette nouvelle possibilité qu'offre l'IA dans Gmail, Docs ?
Voir aussi :
Google dévoile PaLM-E, un modèle d'IA de type ChatGPT, qui prend en compte les besoins de l'utilisateur, une similitude est dégagée dans le récent article de Microsoft intitulé "ChatGPT for Robotic"
Google investit 300 M$ dans la start-up d'IA Anthropic, fondée par d'anciens chercheurs d'OpenAI, la société a construit son propre chatbot généraliste, un rival de ChatGPT nommé Claude