Meta de Mark Zuckerberg a publié cette semaine une version open-source d'un modèle d'intelligence artificielle, Llama 2, à usage public. Le modèle de grande langage (LLM), qui peut être utilisé pour créer un chatbot de type ChatGPT, est disponible pour les startups, les entreprises établies et les opérateurs isolés. Mais pourquoi Meta fait-il cela et quels sont les risques potentiels impliqués ?
Meta, en partenariat avec Microsoft, a annoncé la mise en open-source de son grand modèle de langage LLaMA 2. Le modèle sera disponible pour une utilisation commerciale et de recherche, le mettant en concurrence directe avec le GPT-4 d'OpenAI, qui alimente des outils comme ChatGPT et Microsoft Bing.
La décision d'ouvrir LLaMA 2 a été révélée lors de l'événement Inspire de Microsoft, soulignant le partenariat croissant entre Meta et Microsoft. Meta a également exprimé son soutien à Azure et Windows. De plus, Qualcomm a dévoilé sa collaboration avec Meta pour apporter LLaMa aux ordinateurs portables, téléphones et casques d'ici 2024. Ce partenariat vise à développer des applications alimentées par l'IA qui fonctionnent sans dépendre des services cloud.
Meta a déclaré qu'il s'engage à le « construire de manière responsable » à mesure qu'il progresse avec son système d'IA. La société a déclaré que la sécurité de ses modèles avait été testée en « générant des invites contradictoires pour faciliter le réglage fin du modèle », à la fois en interne et en externe. Meta révèle également comment les modèles sont évalués et modifiés.
Le communiqué de presse de Meta indique que la décision de fournir LLaMA en open source vise à fournir aux entreprises, aux startups et aux chercheurs un accès à davantage d'outils d'IA. L'objectif est d'encourager l'expérimentation au sein de la communauté d'IA.
Qu'est-ce que LLaMA 2 et en quoi est-il important ?
LLaMA 2 (pour Large Language Model with Attention 2) est un modèle d'IA génératif qui peut produire des textes en langage naturel en fonction d'une entrée ou d'une invite donnée. Il peut être utilisé pour diverses applications telles que les chatbots, la création de contenu, la synthèse, la traduction, etc. LLaMA 2 est la deuxième version du LLM de Meta, qui a été publié pour la première fois en février 2023. Selon Meta, LLaMA 2 a été formé sur 40 % de données en plus que LLaMA 1, qui comprend des informations provenant de « sources de données en ligne accessibles au public ». Il affirme également qu'il « surclasse » d'autres LLM comme Falcon et MPT en ce qui concerne les tests de raisonnement, de codage, de compétence et de connaissances.
Meta a décidé de rendre LLaMA 2 disponible gratuitement via la plate-forme Azure de Microsoft, ainsi que d'autres fournisseurs tels qu'AWS, Hugging Face et le téléchargement direct. Meta a déclaré qu'il souhaitait donner aux entreprises, aux startups et aux chercheurs un accès à davantage d'outils d'IA, permettant l'expérimentation et l'innovation en tant que communauté.
Que fait un LLM open source ?
Les LLM sous-tendent les outils d'IA tels que les chatbots. Ils sont formés sur de vastes ensembles de données qui leur permettent d'imiter le langage humain et même le codage informatique. Si un LLM est rendu open-source, cela signifie que son contenu est mis gratuitement à la disposition des personnes pour qu'elles puissent y accéder, l'utiliser et l'adapter à leurs propres fins.
Llama 2 est disponible en trois versions, dont une qui peut être intégrée à un chatbot IA. L'idée est que les startups ou les entreprises établies peuvent accéder aux modèles Llama 2 et les bricoler pour créer leurs propres produits, y compris, potentiellement, des rivaux de ChatGPT ou du chatbot Bard de Google - bien que de l'aveu même de Meta, Llama 2 ne soit pas tout à fait au niveau de GPT- 4, le LLM derrière ChatGPT d'OpenAI.
Pourquoi Meta le publie-t-il pour un usage public ?
Nick Clegg, président des affaires mondiales de Meta, a déclaré mercredi à l'émission Today de BBC Radio 4 que rendre les LLM open source les rendrait « plus sûrs et meilleurs » en invitant à un examen extérieur.
« Avec la… sagesse des foules, vous rendez ces systèmes plus sûrs et meilleurs et, surtout, vous les sortez des… mains moites des grandes entreprises technologiques qui sont actuellement les seules entreprises à disposer soit de la puissance de calcul, soit des vastes réservoirs de données pour construire ces modèles en premier lieu ».
Il est également possible qu'en donnant à tous les arrivants la possibilité de lancer un rival pour ChatGPT, Bard ou le chatbot Bing de Microsoft, Meta dilue potentiellement l'avantage concurrentiel de pairs technologiques tels que Google.
Meta a admis que Llama 2 « est en retard » sur GPT-4, mais c'est néanmoins un concurrent libre d'OpenAI.
Bien que Microsoft est l'un des principaux bailleurs de fonds d'OpenAI, il soutient tout de même le lancement de Llama 2. Le LLM est disponible en téléchargement via les plateformes Microsoft Azure, Amazon Web Services et Hugging Face.
La parole est à Meta
Les récentes percées dans le domaine de l'IA, et de l'IA générative en particulier, ont captivé l'imagination du public et démontré ce que ceux qui développent ces technologies savaient depuis longtemps*: elles ont le potentiel d'aider les gens à faire des choses incroyables, de créer une nouvelle ère d'opportunités économiques et sociales et de donner les particuliers, les créateurs et les entreprises de nouvelles façons de s'exprimer et de se connecter avec les gens.
Nous pensons qu'une approche open source est la bonne pour le développement des modèles d'IA d'aujourd'hui, en particulier ceux de l'espace génératif où la technologie progresse rapidement. En rendant les modèles d'IA disponibles ouvertement, ils peuvent profiter à tout le monde. Donner aux entreprises, aux startups, aux entrepreneurs et aux chercheurs l'accès à des outils développés à une échelle qu'il serait difficile de construire eux-mêmes, soutenus par une puissance de calcul à laquelle ils n'auraient peut-être pas accès autrement, leur ouvrira un monde d'opportunités pour expérimenter et innover de manière passionnante et en fin de compte bénéficier économiquement et socialement.
Et nous pensons que c'est plus sûr. L'ouverture de l'accès aux modèles d'IA d'aujourd'hui signifie qu'une génération de développeurs et de chercheurs peut les tester, identifier et résoudre rapidement les problèmes, en tant que communauté. En voyant comment ces outils sont utilisés par d'autres, nos propres équipes peuvent en tirer des enseignements, améliorer ces outils et corriger les vulnérabilités.
Meta a placé la recherche exploratoire, l'open source et la collaboration avec des partenaires universitaires et industriels au cœur de nos efforts en matière d'IA depuis plus d'une décennie. Nous avons vu de première main comment l'innovation open source peut conduire à des technologies qui profitent à plus de gens. Des dizaines de grands modèles de langage ont déjà été publiés et font progresser les développeurs et les chercheurs. Ils sont utilisés par les entreprises comme ingrédients de base pour de nouvelles expériences génératives basées sur l'IA. Nous avons été époustouflés par l'énorme demande de Llama 1 de la part des chercheurs - avec plus de 100 000 demandes d'accès au grand modèle de langage - et les choses incroyables qu'ils ont réalisées en s'appuyant sur celui-ci.
Nous sommes maintenant prêts à ouvrir la prochaine version de Llama 2 et la rendons disponible gratuitement pour la recherche et l'utilisation commerciale. Nous incluons également les poids du modèle et le code de démarrage pour le modèle pré-entraîné et les versions conversationnelles affinées. Comme Satya Nadella l'a annoncé sur scène à Microsoft Inspire, nous portons notre partenariat au niveau supérieur avec Microsoft en tant que partenaire privilégié pour Llama 2 et élargissons nos efforts dans l'IA générative. À partir d'aujourd'hui, Llama 2 est disponible dans le catalogue de modèles Azure AI, permettant aux développeurs utilisant Microsoft Azure de créer avec lui et d'exploiter leurs outils cloud natifs pour le filtrage de contenu et les fonctionnalités de sécurité. Il est également optimisé pour s'exécuter localement sur Windows, offrant aux développeurs un flux de travail transparent car ils offrent des expériences d'IA génératives aux clients sur différentes plates-formes. Llama 2 est également disponible via Amazon Web Services (AWS), Hugging Face et d'autres fournisseurs.
Les particuliers et les entreprises ont bénéficié du partenariat de longue date entre Microsoft et Meta. Ensemble, nous avons introduit un écosystème ouvert pour les cadres d'IA interchangeables, et nous avons co-écrit des articles de recherche pour faire progresser l'état de l'art en matière d'IA. Nous avons collaboré pour étendre l'adoption de PyTorch - le principal framework d'IA d'aujourd'hui créé par Meta et la communauté de l'IA - sur Azure, et nous sommes parmi les membres fondateurs de la Fondation PyTorch. Microsoft et Meta ont récemment rejoint une cohorte de partisans qui approuvent le cadre du Partenariat sur l'IA pour une action collective dans la création et le partage de médias synthétiques. Notre partenariat s'étend en dehors de l'IA et dans le métavers également pour offrir des expériences immersives pour l'avenir du travail et des loisirs.
Désormais, avec ce partenariat élargi, Microsoft et Meta soutiennent une approche open source pour fournir un accès accru aux technologies d'IA fondamentales au profit des entreprises du monde entier. Il n'y a pas que Meta et Microsoft qui croient en la démocratisation de l'accès aux modèles d'IA d'aujourd'hui. Nous avons un large éventail de partisans divers à travers le monde qui croient également en cette approche - y compris des entreprises qui nous ont fait part de leurs premiers commentaires et qui sont ravies de créer de nouveaux produits avec Llama 2, des fournisseurs de cloud qui incluront Llama 2 dans leurs offres pour les clients, les institutions de recherche qui collaborent avec nous sur le déploiement sûr et responsable de grands modèles génératifs, et les personnes de la technologie, du milieu universitaire et de la politique qui voient les avantages comme nous.
Sources : Meta (1, 2)
Et vous ?
Que pensez-vous de la décision de Meta de rendre open source son modèle de langage LLaMA 2 ?
Avez-vous déjà utilisé ou testé LLaMA 2 ou un autre modèle de langage comme GPT-4 ou ChatGPT ? Si oui, quelle a été votre expérience ?
Quelles sont les applications potentielles de LLaMA 2 qui vous intéressent le plus ? Quels sont les domaines ou les problèmes que vous aimeriez résoudre avec LLaMA 2 ?
Quels sont les risques ou les défis liés à l’utilisation de modèles de langage comme LLaMA 2 ? Comment peut-on assurer la sécurité, l’éthique et la responsabilité de ces modèles ?
Quelle est votre opinion sur le rôle des grandes entreprises technologiques comme Meta, OpenAI et Microsoft dans le développement et la diffusion de l’IA ? Pensez-vous qu’elles devraient collaborer ou se concurrencer ?
Meta s'associe à Microsoft et lance en open-source LLaMA 2 pour faire concurrence à chatGPT d'OpenAI
L'entreprise pourrait vouloir diluer l'avantage concurrentiel de ses rivaux
Meta s'associe à Microsoft et lance en open-source LLaMA 2 pour faire concurrence à chatGPT d'OpenAI
L'entreprise pourrait vouloir diluer l'avantage concurrentiel de ses rivaux
Le , par Stéphane le calme
Une erreur dans cette actualité ? Signalez-nous-la !