
Mark Elliot Zuckerberg est un homme d'affaires américain. Il a cofondé le service de médias sociaux Facebook et sa société mère Meta Platforms (anciennement Facebook, Inc.), dont il est le président, le directeur général et l'actionnaire majoritaire.
L'intelligence artificielle (IA), dans son sens le plus large, est l'intelligence dont font preuve les machines, en particulier les systèmes informatiques. Il s'agit d'un domaine de recherche en informatique qui développe et étudie des méthodes et des logiciels permettant aux machines de percevoir leur environnement et d'utiliser l'apprentissage et l'intelligence pour prendre des mesures qui maximisent leurs chances d'atteindre des objectifs définis. Ces machines peuvent être appelées des IA.
L'open source est un code source qui est mis à disposition gratuitement pour être éventuellement modifié et redistribué. Les produits comprennent l'autorisation d'utiliser le code source, les documents de conception ou le contenu du produit. Le modèle open source est un modèle de développement logiciel décentralisé qui encourage la collaboration ouverte. L'un des grands principes du développement de logiciels open source est la production par les pairs, avec des produits tels que le code source, les plans et la documentation librement accessibles au public. Le mouvement de l'open source dans le domaine des logiciels est né en réponse aux limites du code propriétaire. Le modèle est utilisé pour des projets tels que la technologie appropriée à source ouverte et la découverte de médicaments à source ouverte.
Dans une lettre publiée par Mark Zuckerberg, le fondateur et PDG de Meta explique pourquoi l’IA open source est bénéfique pour les développeurs, pour Meta et pour le monde.
[QUOTE=Mark Zuckerberg]
Dans les premiers temps de l'informatique de haute performance, les principales entreprises technologiques de l'époque ont toutes investi massivement dans le développement de leurs propres versions d'Unix à code source fermé. À l'époque, il était difficile d'imaginer qu'une autre approche puisse permettre de développer des logiciels aussi avancés. Cependant, Linux a fini par gagner en popularité, d'abord parce qu'il permettait aux développeurs de modifier son code à leur guise et qu'il était plus abordable, puis parce qu'il est devenu plus avancé, plus sûr et qu'il disposait d'un écosystème plus large prenant en charge davantage de fonctionnalités que n'importe quel Unix fermé. Aujourd'hui, Linux est la base standard de l'industrie pour le cloud computing et les systèmes d'exploitation qui font fonctionner la plupart des appareils mobiles - et nous bénéficions tous de produits de qualité supérieure grâce à lui.
Je pense que l'IA se développera de la même manière. Aujourd'hui, plusieurs entreprises technologiques développent des modèles fermés de pointe. Mais l'open source comble rapidement le fossé. L'année dernière, Llama 2 n'était comparable qu'à une ancienne génération de modèles derrière la frontière. Cette année, Llama 3 est compétitif avec les modèles les plus avancés et en avance dans certains domaines. À partir de l'année prochaine, nous prévoyons que les futurs modèles Llama deviendront les plus avancés de l'industrie. Mais même avant cela, Llama est déjà en tête pour ce qui est de l'ouverture, de la modifiabilité et de la rentabilité.
Aujourd'hui, nous franchissons une nouvelle étape pour que l'IA open source devienne le standard de l'industrie. Nous sortons le Llama 3.1 405B, le premier modèle d'IA open source de niveau frontière, ainsi que les nouveaux modèles améliorés Llama 3.1 70B et 8B. Outre un rapport coût/performance nettement meilleur que celui des modèles fermés, le fait que le modèle 405B soit ouvert en fait le meilleur choix pour affiner et distiller des modèles plus petits.
Au-delà de la sortie de ces modèles, nous travaillons avec une série d'entreprises pour développer l'écosystème au sens large. Amazon, Databricks et NVIDIA lancent des suites complètes de services pour aider les développeurs à affiner et distiller leurs propres modèles. Des innovateurs comme Groq ont construit des services d'inférence à faible latence et à faible coût pour tous les nouveaux modèles. Les modèles seront disponibles sur tous les principaux clouds, y compris AWS, Azure, Google, Oracle, etc. Des entreprises comme Scale.AI, Dell, Deloitte et d'autres sont prêtes à aider les entreprises à adopter Llama et à former des modèles personnalisés avec leurs propres données. À mesure que la communauté s'agrandit et que d'autres entreprises développent de nouveaux services, nous pouvons collectivement faire de Llama la norme de l'industrie et mettre les avantages de l'IA à la portée de tous.
Meta s'engage en faveur de l'IA open source. J'expliquerai pourquoi je pense que l'open source est la meilleure pile de développement pour vous, pourquoi l'open source de Llama est bon pour Meta, et pourquoi l'IA open source est bon pour le monde et donc une plateforme qui existera à long terme.
Pourquoi l'IA open source est une bonne chose pour les développeurs
Lorsque je discute avec des développeurs, des PDG et des responsables gouvernementaux du monde entier, j'entends généralement plusieurs thèmes :
- Nous devons former, affiner et distiller nos propres modèles. Chaque organisation a des besoins différents qui sont mieux satisfaits par des modèles de différentes tailles qui sont entraînés ou affinés avec leurs données spécifiques. Les tâches sur appareil et les tâches de classification nécessitent de petits modèles, tandis que les tâches plus complexes requièrent des modèles plus importants. Désormais, vous pourrez prendre les modèles Llama les plus avancés, continuer à les entraîner avec vos propres données, puis les distiller jusqu'à obtenir un modèle de votre taille optimale - sans que ni nous ni personne d'autre ne puisse voir vos données.
- Nous devons contrôler notre propre destin et ne pas nous laisser enfermer dans un fournisseur fermé. De nombreuses organisations ne veulent pas dépendre de modèles qu'elles ne peuvent pas gérer et contrôler elles-mêmes. Elles ne veulent pas que les fournisseurs de modèles fermés puissent changer de modèle, modifier leurs conditions d'utilisation, voire cesser complètement de les servir. Ils ne veulent pas non plus être enfermés dans un cloud unique qui détient des droits exclusifs sur un modèle. L'open source permet à un large écosystème d'entreprises disposant de chaînes d'outils compatibles de passer facilement d'un modèle à l'autre.
- Nous devons protéger nos données. De nombreuses organisations manipulent des données sensibles qu'elles doivent sécuriser et qu'elles ne peuvent pas envoyer à des modèles fermés via des API dans le cloud. D'autres organisations ne font tout simplement pas confiance aux fournisseurs de modèles fermés pour leurs données. L'open source résout ces problèmes en vous permettant d'exécuter les modèles où vous le souhaitez. Il est communément admis que les logiciels open source sont généralement plus sûrs, car ils sont développés de manière plus transparente.
- Nous avons besoin d'un modèle efficace et abordable. Les développeurs peuvent exécuter l'inférence sur Llama 3.1 405B sur leur propre infrastructure à environ 50 % du coût de l'utilisation de modèles fermés comme GPT-4o, à la fois pour les tâches d'inférence en ligne et hors ligne.
- Nous voulons investir dans l'écosystème qui sera la norme à long terme. Beaucoup de gens voient que l'open source progresse plus rapidement que les modèles fermés, et ils veulent construire leurs systèmes sur l'architecture qui leur donnera le plus d'avantages à long terme.
Pourquoi l'IA open source est une bonne chose pour Meta
Le modèle commercial de Meta consiste à créer les meilleures expériences et les meilleurs services pour les gens. Pour ce faire, nous devons nous assurer que nous avons toujours accès à la meilleure technologie et que nous ne sommes pas enfermés dans l'écosystème fermé d'un concurrent qui pourrait restreindre ce que nous construisons.
L'une de mes expériences formatrices a été la construction de nos services limités par ce qu'Apple nous permet de construire sur ses plateformes. Entre la façon dont ils taxent les développeurs, les règles arbitraires qu'ils appliquent et toutes les innovations de produits qu'ils empêchent de livrer, il est clair que Meta et beaucoup d'autres entreprises seraient libérées pour construire de bien meilleurs services pour les gens si nous pouvions construire les meilleures versions de nos produits et si les concurrents n'étaient pas en mesure de restreindre ce que nous pouvons construire. D'un point de vue philosophique, c'est l'une des principales raisons pour lesquelles je crois fermement à la construction d'écosystèmes ouverts dans les domaines de l'IA et de l'AR/VR pour la prochaine génération d'ordinateurs.
Les gens me demandent souvent si je crains d'abandonner un avantage technique en mettant Llama en open source, mais je pense que cela passe a coté du tableau d'ensemble pour plusieurs raisons :
Premièrement, pour garantir que nous ayons accès à la meilleure technologie et que nous ne soyons pas enfermés dans un écosystème fermé à long terme, Llama doit se développer en un écosystème complet d'outils, d'améliorations de l'efficacité, d'optimisations du silicium et d'autres intégrations. Si nous étions la seule entreprise à utiliser Llama, cet écosystème ne se développerait pas et nous ne ferions pas mieux que les variantes fermées d'Unix.
Deuxièmement, je m'attends à ce que le développement de l'IA reste très compétitif, ce qui signifie que l'ouverture d'un modèle donné ne donne pas un avantage massif par rapport aux meilleurs modèles suivants à ce moment-là. Pour que Llama devienne la norme de l'industrie, il faut qu'elle soit constamment compétitive, efficace et ouverte, génération après génération.
Troisièmement, une différence essentielle entre Meta et les fournisseurs de modèles fermés est que la vente d'accès aux modèles d'IA n'est pas notre modèle commercial. Cela signifie que la publication de Llama n'affecte pas nos revenus, notre viabilité ou notre capacité à investir dans la recherche, comme c'est le cas pour les fournisseurs de modèles fermés. (C'est l'une des raisons pour lesquelles plusieurs fournisseurs fermés exercent une pression constante sur les gouvernements pour qu'ils s'opposent à l'open source).
Enfin, Meta a une longue histoire de projets et de succès dans le domaine de l'open source. Nous avons économisé des milliards de dollars en publiant nos conceptions de serveurs, de réseaux et de centres de données dans le cadre de l'Open Compute Project et en faisant en sorte que les chaînes d'approvisionnement normalisent nos conceptions. Nous avons bénéficié des innovations de l'écosystème en mettant en open source des outils de premier plan comme PyTorch, React et bien d'autres encore. Cette approche a toujours fonctionné pour nous lorsque nous nous y tenons sur le long terme.
Pourquoi l'IA open source est une bonne chose pour le monde
Je pense que l'open source est nécessaire pour un avenir positif de l'IA. Plus que toute autre technologie moderne, l'IA a le potentiel d'accroître la productivité humaine, la créativité et la qualité de vie, et d'accélérer la croissance économique tout en débloquant les progrès de la recherche médicale et scientifique. L'open source permettra à un plus grand nombre de personnes dans le monde d'accéder aux avantages et aux possibilités de l'IA, de ne pas concentrer le pouvoir entre les mains d'un petit nombre d'entreprises et de déployer la technologie de manière plus uniforme et plus sûre dans l'ensemble de la société.
Un débat est en cours sur la sécurité des modèles d'IA open source, et je pense que l'IA open source sera plus sûre que les autres solutions. Je pense que les gouvernements concluront qu'il est dans leur intérêt de soutenir l'open source parce qu'elle rendra le monde plus prospère et plus sûr.
Pour comprendre la sécurité, j'estime qu'il faut se protéger contre deux catégories de dommages : les dommages involontaires et les dommages intentionnels. On parle de dommages involontaires lorsqu'un système d'IA peut causer des dommages même si ce n'était pas l'intention de ceux qui l'utilisent. Par exemple, les modèles d'IA modernes peuvent, par inadvertance, donner de mauvais conseils en matière de santé. Ou, dans des scénarios plus futuristes, certains craignent que les modèles ne s'autoreproduisent involontairement ou n'optimisent leurs objectifs au détriment de l'humanité. Il y a préjudice intentionnel lorsqu'un mauvais acteur utilise un modèle d'IA dans le but de causer un préjudice.
Il convient de noter que les dommages involontaires couvrent la majorité des préoccupations des gens à l'égard de l'IA, qu'il s'agisse de l'influence des systèmes d'IA sur les milliards de personnes qui les utiliseront ou de la plupart des scénarios de science-fiction véritablement catastrophiques pour l'humanité. À cet égard, les logiciels open source devraient être nettement plus sûrs, car les systèmes sont plus transparents et peuvent être largement examinés. Historiquement, les logiciels open source ont été plus sûrs pour cette raison. De même, l'utilisation de Llama avec ses systèmes de sécurité tels que Llama Guard sera probablement plus sûre que les modèles fermés. C'est pourquoi la plupart des discussions sur la sécurité de l'IA open source se concentrent sur les dommages intentionnels.
Notre processus de sécurité comprend des tests rigoureux et une équipe d'experts pour évaluer si nos modèles sont capables de causer des dommages significatifs, dans le but d'atténuer les risques avant leur diffusion. Étant donné que les modèles sont ouverts, tout le monde est en mesure de les tester. Nous devons garder à l'esprit que ces modèles sont formés à partir d'informations qui se trouvent déjà sur l'internet, de sorte que le point de départ de l'examen des dommages devrait être de savoir si un modèle peut faciliter des dommages plus importants que des informations qui peuvent être rapidement récupérées sur Google ou d'autres résultats de recherche.
Lorsque l'on raisonne sur les dommages intentionnels, il est utile de faire la distinction entre ce que des acteurs individuels ou à petite échelle peuvent faire...
La fin de cet article est réservée aux abonnés. Soutenez le Club Developpez.com en prenant un abonnement pour que nous puissions continuer à vous proposer des publications.