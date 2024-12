Comparaison entre la chaîne de pensée continue (Coconut) et la chaîne de pensée (CoT)



Analyse comparative de différentes méthodes de raisonnement



Procédure de formation de la chaîne de pensée continue (Cocoonut)

Nous avons présenté Coconut, un nouveau paradigme pour le raisonnement dans un espace latent continu. Grâce à des expériences approfondies, nous avons démontré que Coconut améliore de manière significative les capacités de raisonnement LLM. Notamment, notre analyse détaillée a mis en évidence comment un espace latent non contraint permet au modèle de développer un modèle de raisonnement efficace similaire à BFS. Des travaux futurs sont nécessaires pour affiner et mettre à l'échelle les méthodes de raisonnement latent. Une direction prometteuse est le pré-entraînement des LLM avec des pensées continues, ce qui pourrait permettre aux modèles de se généraliser plus efficacement à travers un plus large éventail de scénarios de raisonnement. Nous prévoyons que nos résultats inspireront d'autres recherches sur les méthodes de raisonnement latent, contribuant finalement au développement de systèmes de raisonnement machine plus avancés.

Les récentes avancées dans le domaine des modèles de langage (LLM) ont montré un grand potentiel dans la résolution de tâches de raisonnement complexes. Toutefois, l'approche traditionnelle consistant à utiliser une méthodologie de chaîne de pensée (CoT) n'est pas toujours optimale pour ces tâches. Une nouvelle étude montre que de nombreux mots-clés dans cet espace linguistique servent davantage à la cohérence textuelle qu'à des composantes essentielles du raisonnement. En outre, certains tokens critiques posent des défis importants aux LLM pendant les phases de planification.Pour remédier à ces limitations et libérer tout le potentiel des capacités de raisonnement des LLM, des chercheurs introduisent un nouveau paradigme appelé Coconut (Chain of Continuous Thought). Contrairement aux méthodes CoT traditionnelles qui décodent les représentations en mots clés, Coconut les renvoie au LLM en tant qu'entrée subséquente, en les intégrant directement dans un espace latent continu.Les résultats expérimentaux démontrent que Coconut améliore efficacement les performances du LLM dans diverses tâches de raisonnement. L'un des principaux avantages de Coconut est sa capacité à encoder plusieurs étapes alternatives de raisonnement dans la représentation continue de la pensée. Cette caractéristique permet au modèle d'adopter une stratégie de recherche en largeur (BFS) lors de la résolution de problèmes, ce qui permet une plus grande flexibilité et adaptabilité par rapport à l'engagement prématuré dans un chemin déterministe unique, comme on le voit dans les approches CoT.En particulier, Coconut surpasse CoT dans les tâches de raisonnement logique qui nécessitent un retour en arrière important pendant les étapes de planification, tout en réduisant le nombre de jetons de réflexion nécessaires pendant l'inférence. Dans l'ensemble, cette étude met en lumière les promesses des paradigmes de raisonnement latent tels que Coconut et fournit des indications précieuses pour les futurs efforts de recherche visant à améliorer les capacités LLM dans des scénarios de raisonnement complexes.