Meta de Mark Zuckerberg a publié cette semaine une version open-source d'un modèle d'intelligence artificielle, Llama 2, à usage public. Le modèle de grande langage (LLM), qui peut être utilisé pour créer un chatbot de type ChatGPT, est disponible pour les startups, les entreprises établies et les opérateurs isolés. Mais pourquoi Meta fait-il cela et quels sont les risques potentiels impliqués ?Meta, en partenariat avec Microsoft, a annoncé la mise en open-source de son grand modèle de langage LLaMA 2. Le modèle sera disponible pour une utilisation commerciale et de recherche, le mettant en concurrence directe avec le GPT-4 d'OpenAI, qui alimente des outils comme ChatGPT et Microsoft Bing.
La décision d'ouvrir LLaMA 2 a été révélée lors de l'événement Inspire de Microsoft, soulignant le partenariat croissant entre Meta et Microsoft. Meta a également exprimé son soutien à Azure et Windows. De plus, Qualcomm a dévoilé sa collaboration avec Meta pour apporter LLaMa aux ordinateurs portables, téléphones et casques d'ici 2024. Ce partenariat vise à développer des applications alimentées par l'IA qui fonctionnent sans dépendre des services cloud.
Meta a déclaré qu'il s'engage à le « construire de manière responsable » à mesure qu'il progresse avec son système d'IA. La société a déclaré que la sécurité de ses modèles avait été testée en « générant des invites contradictoires pour faciliter le réglage fin du modèle », à la fois en interne et en externe. Meta révèle également comment les modèles sont évalués et modifiés.
Le communiqué de presse de Meta indique que la décision de fournir LLaMA en open source vise à fournir aux entreprises, aux startups et aux chercheurs un accès à davantage d'outils d'IA. L'objectif est d'encourager l'expérimentation au sein de la communauté d'IA.
Qu'est-ce que LLaMA 2 et en quoi est-il important ?
LLaMA 2 (pour Large Language Model with Attention 2) est un modèle d'IA génératif qui peut produire des textes en langage naturel en fonction d'une entrée ou d'une invite donnée. Il peut être utilisé pour diverses applications telles que les chatbots, la création de contenu, la synthèse, la traduction, etc. LLaMA 2 est la deuxième version du LLM de Meta, qui a été publié pour la première fois en février 2023. Selon Meta, LLaMA 2 a été formé sur 40 % de données en plus que LLaMA 1, qui comprend des informations provenant de « sources de données en ligne accessibles au public ». Il affirme également qu'il « surclasse » d'autres LLM comme Falcon et MPT en ce qui concerne les tests de raisonnement, de codage, de compétence et de connaissances.
Meta a décidé de rendre LLaMA 2 disponible gratuitement via la plate-forme Azure de Microsoft, ainsi que d'autres fournisseurs tels qu'AWS, Hugging Face et le téléchargement direct. Meta a déclaré qu'il souhaitait donner aux entreprises, aux startups et aux chercheurs un accès à davantage d'outils d'IA, permettant l'expérimentation et l'innovation en tant que communauté.
Que fait un LLM open source ?
Les LLM sous-tendent les outils d'IA tels que les chatbots. Ils sont formés sur de vastes ensembles de données qui leur permettent d'imiter le langage humain et même le codage informatique. Si un LLM est rendu open-source, cela signifie que son contenu est mis gratuitement à la disposition des personnes pour qu'elles puissent y accéder, l'utiliser et l'adapter à leurs propres fins.
Llama 2 est disponible en trois versions, dont une qui peut être intégrée à un chatbot IA. L'idée est que les startups ou les entreprises établies peuvent accéder aux modèles Llama 2 et les bricoler pour créer leurs propres produits, y compris, potentiellement, des rivaux de ChatGPT ou du chatbot Bard de Google - bien que de l'aveu même de Meta, Llama 2 ne soit pas tout à fait au niveau de GPT- 4, le LLM derrière ChatGPT d'OpenAI.
Pourquoi Meta le publie-t-il pour un usage public ?
Nick Clegg, président des affaires mondiales de Meta, a déclaré mercredi à l'émission Today de BBC Radio 4 que rendre les LLM open source les rendrait « plus sûrs et meilleurs » en invitant à un examen extérieur.
« Avec la… sagesse des foules, vous rendez ces systèmes plus sûrs et meilleurs et, surtout, vous les sortez des… mains moites des grandes entreprises technologiques qui sont actuellement les seules entreprises à disposer soit de la puissance de calcul, soit des vastes réservoirs de données pour construire ces modèles en premier lieu ».
Il est également possible qu'en donnant à tous les arrivants la possibilité de lancer un rival pour ChatGPT, Bard ou...
La fin de cet article est réservée aux abonnés. Soutenez le Club Developpez.com en prenant un abonnement pour que nous puissions continuer à vous proposer des publications.
