Dans un long message publié dimanche sur X (anciennement Twitter), Yann LeCun - prix Turing 2018 et reconnu comme l'un des inventeurs de l'apprentissage profond - s'en est pris aux leaders de la recherche sur l'IA qui militent pour une réglementation de l'IA, répandent des théories dystopiques sur l'avenir de l'IA et s'opposent aux modèles d'IA open source. Son message visait particulièrement les pionniers de l'IA Geoff Hinton et Yoshua Bengio, avec qui LeCun a partagé le prix Turing 2018, ainsi que Sam Altman et Stuart Russell. Ces derniers ont exprimé publiquement et à plusieurs reprises leurs inquiétudes quant aux effets négatifs potentiels de l'IA.
[tweet]<blockquote class="twitter-tweet"><p lang="en" dir="ltr">Altman, Hassabis, and Amodei are the ones doing massive corporate lobbying at the moment.<br>They are the ones who are attempting to perform a regulatory capture of the AI industry.<br>You, Geoff, and Yoshua are giving ammunition to those who are lobbying for a ban on open AI R&D.<br><br>If…</p>— Yann LeCun (@ylecun) <a href="https://twitter.com/ylecun/status/1718670073391378694?ref_src=twsrc%5Etfw">October 29, 2023</a></blockquote> <script async src="https://platform.twitter.com/widgets.js" charset="utf-8"></script>[/tweet]
Selon LeCun, la majorité de la communauté universitaire soutient la recherche et le développement ouverts en matière d'IA, à l'exception notable des pionniers de l'IA que sont Hinton, Bengio et Russell. Il affirme que leur "alarmisme" fournit des munitions aux groupes de défense des entreprises. Il accuse Sam Altman, PDG d'OpenAI, Demis Hassabis, PDG de Google Deepmind, et Ilya Sutskever, directeur scientifique d'OpenAI, de tenter de réglementer le secteur de l'IA en leur faveur sous prétexte de sécurité. « Le véritable désastre de l'IA serait que quelques entreprises prennent le contrôle de l'IA », affirme LeCun. Voici l'intégralité de son message sur X :
Envoyé par Yann LeCun
LeCun défend les modèles d'IA open source, mais les critiques affirment que les modèles d'IA publiés par Meta ne sont pas open source comme l'entreprise tente de le faire croire. En effet, en juillet, Meta a publié son grand modèle de langage Llama 2 de manière relativement ouverte et gratuite, ce qui contraste fortement avec ses principaux concurrents. Mais dans le monde des logiciels libres, certains considèrent toujours l'ouverture de l'entreprise avec un astérisque. Bien que la licence de Meta rende le modèle d'IA Llama 2 gratuit pour beaucoup, il s'agit toujours d'une licence limitée ne répondant pas à toutes les exigences de l'Open Source Initiative (OSI).
Comme l'explique la définition de l'OSI, l'open source est plus qu'un simple partage de code ou de recherche. Pour qu'un projet soit véritablement open source, il faut offrir une redistribution gratuite, un accès au code source, autoriser les modifications et ne pas être lié à un produit spécifique. Les limites fixées par Meta incluent l'obligation de payer une licence pour tout développeur ayant plus de 700 millions d'utilisateurs quotidiens et l'interdiction pour d'autres modèles de s'entraîner sur Llama 2. Selon les critiques, l'affirmation de Meta selon laquelle Llama 2 est open source "est trompeuse". Meta défend les limites de la licence de Llama 2 et donne ses raisons.
Joelle Pineau, vice-présidente de Meta chargée de la recherche en IA et responsable du centre FAIR (Fundamental AI Research) de la société, est consciente des limites de l'ouverture de Meta. Mais elle affirme qu'il s'agit d'un équilibre nécessaire entre les avantages du partage d'informations et les coûts potentiels pour les activités de Meta. L'une des plus grandes initiatives open source de Meta est PyTorch, un langage de codage d'apprentissage automatique utilisé pour développer des modèles d'IA génératifs. L'entreprise a mis PyTorch à la disposition de la communauté open source en 2016, et des développeurs externes l'ont beaucoup amélioré depuis.
Pineau espère susciter le même engouement autour des modèles d'IA de Meta. Toutefois, le groupe de recherche de Meta sur l'IA semble avoir l'intention de modifier les licences open source. Pineau affirme que Meta participe à des groupes industriels tels que le Partnership on AI et MLCommons afin de contribuer à l'élaboration de critères de référence pour les modèles d'IA de base et de lignes directrices pour le déploiement de modèles d'IA sûrs. Selon Pineau, Meta travaille avec des groupes industriels, car il estime qu'aucune entreprise ne peut à elle seule mener la conversation sur l'IA sûre et responsable au sein de la communauté open source.
Dans un article publié en août, des chercheurs de l'université Carnegie Mellon et de l'AI Now Institute, ainsi que Meredith Whittaker, présidente de la Fondation Signal, se sont penchés sur le problème des modèles d'IA actuels dits "ouverts". Les auteurs soutiennent que nombre de ces modèles ne sont pas vraiment ouverts et que le terme est utilisé de manière confuse et variée, plus en rapport avec les aspirations et le marketing qu'en tant que descripteurs techniques. Dans le cas de Llama 2, l'article qualifie de "contestées, superficielles et à la limite de la malhonnêteté" les affirmations de Meta selon lesquelles le modèle de langage est open source.
« Plus important encore, ces modèles permettent à Meta et à ceux qui dirigent le développement du framework de normaliser la construction de l'IA de manière à ce qu'elle soit compatible avec leurs propres plateformes d'entreprise (en veillant à ce que leur framework conduise les développeurs à créer des systèmes d'IA qui, à la manière d'un Lego, s'emboîtent dans les systèmes de leur propre entreprise) », peut-on lire dans l'article. Les auteurs de l'article poursuivent en disant également que cela permet à ces entreprises de créer des rampes d'accès pour des offres de calcul rentables et de façonner le travail des chercheurs et des développeurs.
L'approche de Meta en matière d'ouverture est une nouveauté dans le monde des grandes entreprises d'IA. En décembre 2015, OpenAI a été lancé comme une startup de recherche en IA axée sur la communauté open source, mais les cofondateurs ont abandonné le statut d'organisation à but non lucratif en 2019. OpenAI a alors reçu un financement d'un milliard de dollars de la part de Microsoft. OpenAI estime que c'était une erreur de partager ses recherches et invoque des problèmes de sécurité et de concurrence. Si Google partage parfois ses travaux de recherche, il est également resté très discret sur le développement de certains de ses modèles d'IA.
Les acteurs de l'open source sont généralement de petits développeurs, comme Stability AI et EleutherAI, qui ont rencontré un certain succès dans l'espace commercial. Les développeurs de logiciels libres publient régulièrement de nouveaux modèles d'IA sur les dépôts de code de Hugging Face et GitHub. Falcon 180B, un modèle d'IA open source de l'Institut d'innovation technologique basé à Dubaï, a également gagné en popularité et rivalise avec Llama 2 et GPT-4. Il convient toutefois de noter que la plupart des entreprises d'IA fermées ne partagent pas les détails de la collecte des données pour créer les ensembles de données d'entraînement de leurs modèles d'IA.
Les acteurs de l'industrie ont commencé à examiner les limites potentielles de certaines licences open source pour les modèles d'IA dans l'espace commercial. Stefano Maffulli, directeur général de l'OSI, explique que le groupe comprend que les licences actuelles approuvées par l'OSI peuvent ne pas répondre à certains besoins des modèles d'IA. Il a ajouté que l'OSI examine comment travailler avec les développeurs d'IA pour fournir un accès transparent, sans permission, mais sûr aux modèles d'IA.
« Nous devons absolument repenser les licences de manière à tenir compte des limites réelles des droits d'auteur et des autorisations dans les modèles d'IA, tout en conservant les principes de la communauté des logiciels libres », explique Maffulli. L'OSI serait également en train d'élaborer une définition de l'open source dans le domaine de l'IA.
Et vous ?
Quel est votre avis sur le sujet ?
Que pensez-vous de la prise de position de Yann LeCun en faveur de l'IA open source ?
Que pensez-vous des limites imposées par Meta concernant l'utilisation de modèles d'IA Llama 2 ?
Que pensez-vous des critiques visant Meta sur le fait qu'il ait déclaré Llama comme étant open source ?
Meta l'a-t-il fait dans un but de marketing ? Est-ce une tentative détournée de contrôler le secteur de l'IA ?
Que pensez-vous de la mise en place de nouvelles licences open source pour répondre aux besoins des modèles d'IA ?
L'open source est-il l'avenir de l'IA ? Que pensez-vous de la position d'OpenAI concernant les modèles d'IA open source ?
Voir aussi
Ilya Sutskever, directeur scientifique d'OpenAI, sur l'avenir de l'IA : « ce sera monumental, bouleversant. Il y aura un avant et un après », il prédit l'arrivée d'une "superintelligence numérique"
« L'open source aura un impact plus important sur l'avenir des modèles de langage que le grand public ne le pense », selon un ingénieur logiciel qui affirme que l'IA open source est plus sûre
Google investit 300 M$ dans la start-up d'IA Anthropic, fondée par d'anciens chercheurs d'OpenAI, la société a construit son propre chatbot généraliste, un rival de ChatGPT nommé Claude