Nous annonçons aujourd'hui la première version de llamafile et invitons la communauté open source à participer à ce nouveau projet.llamafile vous permet de transformer les poids des grands modèles de langage (LLM) en exécutables.Supposons que vous disposiez d'un ensemble de poids LLM sous la forme d'un fichier de 4 Go (au format GGUF couramment utilisé). Avec llamafile, vous pouvez transformer ce fichier de 4 Go en un binaire qui fonctionne sur six systèmes d'exploitation sans avoir besoin d'être installé.Cela facilite considérablement la distribution et l'exécution des LLM. Cela signifie également qu'au fur et à mesure que les modèles et leurs formats de poids continuent d'évoluer dans le temps, llamafile vous donne un moyen de vous assurer qu'un ensemble donné de poids restera utilisable et performant de manière cohérente et reproductible, pour toujours.Nous avons réalisé tout cela en combinant deux projets que nous aimons : llama.cpp (un framework de chatbot LLM open source de premier plan) avec Cosmopolitan Libc (un projet open source qui permet aux programmes C d'être compilés et exécutés sur un grand nombre de plateformes et d'architectures). Il a également fallu résoudre plusieurs problèmes intéressants et juteux en cours de route, comme l'ajout du support du GPU et de dlopen() à Cosmopolitan ; vous pouvez en lire plus à ce sujet dans le README du projet.Cette première version de llamafile est un produit du groupe d'innovation de Mozilla et a été développée par Justine Tunney, la créatrice de Cosmopolitan. Justine a récemment collaboré avec Mozilla via MIECO, et grâce à ce programme, Mozilla a financé son travail sur la version 3.0 de Cosmopolitan. Avec llamafile, Justine est enthousiaste à l'idée de contribuer plus directement aux projets Mozilla, et nous sommes heureux de l'avoir impliquée.llamafile est sous licence Apache 2.0, et nous encourageons les contributions. Nos modifications de llama.cpp lui-même sont sous licence MIT (la même licence que celle utilisée par llama.cpp lui-même) afin de faciliter toute remontée potentielle dans le futur. Nous sommes tous de grands fans de llama.cpp ici ; llamafile n'aurait pas été possible sans lui et sans Cosmopolitan.Nous espérons que llamafile vous sera utile et attendons avec impatience vos commentaires.