IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)

Vous êtes nouveau sur Developpez.com ? Créez votre compte ou connectez-vous afin de pouvoir participer !

Vous devez avoir un compte Developpez.com et être connecté pour pouvoir participer aux discussions.

Vous n'avez pas encore de compte Developpez.com ? Créez-en un en quelques instants, c'est entièrement gratuit !

Si vous disposez déjà d'un compte et qu'il est bien activé, connectez-vous à l'aide du formulaire ci-dessous.

Identifiez-vous
Identifiant
Mot de passe
Mot de passe oublié ?
Créer un compte

L'inscription est gratuite et ne vous prendra que quelques instants !

Je m'inscris !

Llama.ttf : une police de caractères qui est également un grand modèle de langage (LLM)
Ainsi qu'un moteur d'inférence complet pour le modèle d'IA Llama de Meta AI

Le , par Anthony

29PARTAGES

2  0 
Llama.ttf est un fichier de police qui est également un grand modèle de langage et un moteur d'inférence complet pour le modèle Llama. Llama.ttf fonctionne entièrement localement, offrant une solution unique et pratique pour l'exécution du LLM dans n'importe quelle application (éditeur de texte, client de messagerie, etc.) basée sur HarfBuzz et compatible avec Wasm.

Un grand modèle de langage (LLM) est un modèle informatique qui se distingue par sa capacité à générer du langage à des fins générales et à réaliser d'autres tâches de traitement du langage naturel, telles que la classification. Basés sur des modèles de langage, les LLM acquièrent ces capacités en apprenant des relations statistiques à partir de grandes quantités de texte au cours d'un processus d'apprentissage auto-supervisé et semi-supervisé à forte intensité de calcul. Les LLM peuvent être utilisés pour la génération de textes, une forme d'IA générative, en prenant un texte en entrée et en prédisant de manière répétée le prochain mot ou token. Les LLM sont en réalité des réseaux neuronaux artificiels qui utilisent l'architecture de transformateur, inventée en 2017. Les LLM les plus grands et les plus performants, à partir de juin 2024, sont construits avec une architecture basée sur un transformateur décodeur uniquement, ce qui permet un traitement et une génération efficaces de données textuelles à grande échelle.

Dans la composition au métal pour l'impression et la typographie, une police de caractères est une taille, un poids et un style particuliers d'un caractère. Chaque police est un ensemble de caractères appariés, avec une pièce (une "sorte" pour chaque glyphe. Une police de caractères se compose de plusieurs polices qui partagent une même conception générale. Au XXIe siècle, avec l'avènement des polices de caractères informatiques, les termes "police" et "caractère" sont souvent utilisés de manière interchangeable, bien que le terme "caractère" fasse référence à la conception du lettrage typographique, tandis que le terme "police" fait référence au style spécifique d'un caractère, tel que sa taille et son poids.


Comment ?

Le moteur de mise en forme des polices HarfBuzz, utilisé dans des applications telles que Firefox et Chrome, est accompagné d'un outil de mise en forme Wasm qui permet d'utiliser un code arbitraire pour "mettre en forme" le texte.

En particulier, ce code "arbitraire" pourrait en principe être un moteur d'inférence LLM complet avec des paramètres entraînés intégrés, s'appuyant sur le traitement d'un texte contenant des symboles magiques pour de fausses "ligatures" afin d'initialiser le LLM et de l'utiliser pour générer du texte.

Il pourrait aussi en principe être un moteur d'inférence LLM complet (Llama dans notre cas, d'où le nom) sauf qu'au lieu de l'être seulement en principe, c'est ce qu'il est réellement.

En fin de compte, cela signifie que vous pouvez simplement utiliser la police pour exécuter le LLM et, par exemple, obtenir la génération de texte dans n'importe quelle application basée sur HarfBuzz et compatible avec Wasm ; votre éditeur de texte/client de messagerie/quoi que ce soit d'autre sans avoir à attendre que le vendeur inclue les fonctionnalités de type "Copilot" que tout le monde s'empresse d'implémenter ces jours-ci. Et tout s'exécute entièrement localement. Alors peut-être que ce stupide hack est en fait une idée d'un milliard de dollars ?

Cela signifie également que vous pouvez utiliser votre police pour discuter avec votre police.

Utilisation

Téléchargez simplement llama.ttf (60 MB de téléchargement, puisqu'il est basé sur le modèle de 15M de paramètres basé sur TinyStories montré ci-dessus) et utilisez-le comme vous le feriez avec n'importe quelle autre police.

Utilisez-la là où HarfBuzz est utilisé et construit avec le support Wasm. La manière la plus simple d'expérimenter est probablement de compiler HarfBuzz avec -Dwasm=enabled et de compiler wasm-micro-runtime avec -DWAMR_BUILD_REF_TYPES=1, puis d'ajouter les bibliothèques partagées résultantes, libharfbuzz.so.0.60811.0 et libiwasm.so à la variable d'environnement LD_PRELOAD avant d'exécuter une application basée sur HarfBuzz telle que gedit ou GIMP ; aucune recompilation des applications n'est nécessaire.

Télécharger llama.ttf

Source : Llama.ttf

Et vous ?

Que pensez-vous de llama.ttf et de ses capacités ?
Est-ce que c'est du sérieux ou plutôt in trolldi ?

Voir aussi :

Intel rend Open Source une nouvelle police de caractères "One Mono" pour les besoins des développeurs, la police a été conçue pour réduire la fatigue et les erreurs de codage

MonoLisa, une police de caractères conçue pour améliorer la productivité des développeurs et réduire la fatigue. Quelle est votre police de caractères préférée pour le développement en 2022 ?

La nouvelle police de caractères d'Intel pour les développeurs malvoyants est à l'origine d'un drame de conception pour les codeurs, d'après Fast Company

Une erreur dans cette actualité ? Signalez-nous-la !