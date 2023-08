Rémi Louf :Outlines est une bibliothèque Python qui se concentre sur la génération de texte avec de grands modèles de langage. Brandon et moi ne sommes pas des experts en LLM et avons commencé le projet il y a quelques mois parce que nous voulions mieux comprendre comment le processus de génération fonctionne. Notre formation initiale est la programmation probabiliste, relationnelle et symbolique.Récemment, nous avons trouvé un moyen rapide de générer du texte qui correspond à une expression régulière ( https://blog.normalcomputing.ai/post...27-regex-guide ...). L'idée de base est simple : les expressions régulières ont une représentation équivalente en Automate Déterministe-Fini (DFA). Nous pouvons transformer ce DFA en un modèle génératif : dans chaque état, nous obtenons une liste de symboles qui correspondent à des complétions qui correspondent partiellement à l'expression régulière. Nous masquons les autres symboles dans les logits renvoyés par un grand modèle de langage, nous échantillonnons un nouveau symbole et nous passons à l'état suivant. La subtilité est que les modèles de langage travaillent avec des jetons, et non des symboles, de sorte que nous dérivons un nouveau FSM dont l'alphabet est le vocabulaire du modèle. Nous pouvons le faire en un seul passage sur le vocabulaire.La génération des masques de jetons ne nécessite donc qu'une consultation du dictionnaire à chaque état. Notre méthode fait pâlir d'envie d'autres bibliothèques comme Microsoft guidance.À partir de là, il n'y avait qu'un petit pas à franchir pour pouvoir générer du texte qui suit un schéma JSON ( https://json-schema.org/ ), ou qui peut être analysé dans un modèle pydantique ( https://docs.pydantic.dev/latest/usage/models/ ). La méthode fonctionne avec les types union, les types optionnels, les schémas imbriqués, les tableaux, tout. Il est garanti que la sortie est analysable.Je pense que c'est cool, et j'ai passé beaucoup de temps à regarder des modèles même minuscules sortir du JSON valide pendant le week-end. J'espère que vous en ferez autant.J'attends avec impatience les commentaires, les rapports de bogues, les demandes de fonctionnalités et les discussions !Edit : Lien vers notre pré-impression expliquant la méthode et comment elle peut être étendue pour générer du texte qui suit une Grammaire Contextuelle Libre https://arxiv.org/abs/2307.09702