Fenêtre contextuelle de 200K
Depuis son lancement en début d'année, Claude a été utilisé par des millions de personnes pour un large éventail d'applications, allant de la traduction d'articles universitaires à la rédaction de plans d'affaires, en passant par l'analyse de contrats complexes. Les utilisateurs ont demandé des fenêtres contextuelles plus grandes et des résultats plus précis lorsqu'ils travaillent avec de longs documents.
En réponse, la quantité d'informations pouvant être transmis à Claude double avec une limite de 200 000 jetons, ce qui correspond à environ 150 000 mots, soit plus de 500 pages de documents. Les utilisateurs peuvent désormais télécharger de la documentation technique comme des bases de code entières, des états financiers comme des S-1, ou même de longues œuvres littéraires comme l'Iliade ou l'Odyssée. En étant capable d'accéder à de grandes quantités de contenu ou de données, Claude peut résumer, effectuer des questions-réponses, prévoir des tendances, comparer et opposer plusieurs documents, et bien plus encore.
Le traitement d'un message de 200 000 caractères est un exploit complexe et une première dans l'industrie. Bien qu'Anthropic soit enthousiaste à l'idée de mettre cette nouvelle capacité puissante entre les mains des utilisateurs, des tâches qui nécessiteraient normalement des heures d'effort humain pour être accomplies peuvent prendre quelques minutes à Claude. Anthropic s'attend à ce que le temps de latence diminue considérablement au fur et à mesure que la technologie progresse.
Diminution de 2x des taux d'hallucinations
Claude 2.1 a également réalisé des progrès significatifs en matière d'honnêteté, avec une diminution de 2 fois des fausses déclarations par rapport au précédent modèle Claude 2.0. Cela permet aux entreprises de créer des applications d'IA très performantes qui résolvent des problèmes commerciaux concrets et de déployer l'IA dans leurs opérations avec plus de confiance et de fiabilité.
Anthropic a testé l'honnêteté de Claude 2.1 en rassemblant un grand nombre de questions factuelles complexes qui sondent les faiblesses connues des modèles actuels. En utilisant une rubrique qui distingue les affirmations incorrectes ("La cinquième ville la plus peuplée de Bolivie est Montero" des aveux d'incertitude ("Je ne suis pas sûr de ce qu'est la cinquième ville la plus peuplée de Bolivie", Claude 2.1 a été beaucoup plus enclin à démentir plutôt qu'à fournir des informations incorrectes.
Claude 2.1 a également apporté des améliorations significatives en matière de compréhension et de résumé, en particulier pour les documents longs et complexes qui exigent un haut degré de précision, tels que les documents juridiques, les rapports financiers et les spécifications techniques. Dans les évaluations d'Anthropic, Claude 2.1 a démontré une réduction de 30 % des réponses incorrectes et de 3 à 4 fois plus bas de conclusion erronée qu'un document soutient une revendication particulière.
Anthropic:
Bien que nous soyons encouragés par ces améliorations de la précision, l'amélioration de la précision et de la fiabilité des résultats pour nos utilisateurs reste une priorité absolue pour nos équipes de produits et de recherche.
Bien que nous soyons encouragés par ces améliorations de la précision, l'amélioration de la précision et de la fiabilité des résultats pour nos utilisateurs reste une priorité absolue pour nos équipes de produits et de recherche.
À la demande générale, Anthropic a également ajouté l'utilisation d'outils, une nouvelle fonctionnalité bêta qui permet à Claude de s'intégrer aux processus, produits et API existants des utilisateurs. Cette interopérabilité élargie vise à rendre Claude plus utile dans les opérations quotidiennes des utilisateurs.
Claude peut désormais orchestrer des fonctions ou des API définies par les développeurs, effectuer des recherches dans des sources Web et récupérer des informations dans des bases de connaissances privées. Les utilisateurs peuvent définir un ensemble d'outils à utiliser par Claude et spécifier une requête. Le modèle décidera alors quel outil est nécessaire pour accomplir la tâche et exécutera une action en leur nom, comme par exemple :
- l'utilisation d'une calculatrice pour un raisonnement numérique complexe
- traduire des demandes en langage naturel en appels API structurés
- répondre à des questions en interrogeant des bases de données ou en utilisant une API de recherche sur le web
- exécuter des actions simples dans un logiciel via des API privées
- se connecter à des ensembles de données sur les produits pour faire des recommandations et aider les utilisateurs à effectuer des achats.
Anthropic:
L'utilisation des outils en est actuellement à ses débuts. Nous développons des fonctionnalités pour les développeurs et des lignes directrices pour faciliter l'intégration dans vos applications. Nous encourageons les utilisateurs à nous faire part de leurs commentaires sur l'utilisation des outils afin de contribuer à l'élaboration et à l'amélioration du produit.
L'utilisation des outils en est actuellement à ses débuts. Nous développons des fonctionnalités pour les développeurs et des lignes directrices pour faciliter l'intégration dans vos applications. Nous encourageons les utilisateurs à nous faire part de leurs commentaires sur l'utilisation des outils afin de contribuer à l'élaboration et à l'amélioration du produit.
Anthropic s'efforce de simplifier l'expérience de sa console de développement pour les utilisateurs de l'API Claude, tout en facilitant le test de nouvelles invites pour un apprentissage plus rapide. Le nouveau produit Workbench permet aux développeurs d'itérer sur les invites dans une expérience de type terrain de jeu et d'accéder à de nouveaux paramètres de modèle pour optimiser le comportement de Claude. Ils peuvent créer plusieurs invites et naviguer entre elles pour différents projets, et les révisions sont enregistrées au fur et à mesure pour conserver le contexte historique. Les développeurs peuvent également générer des extraits de code pour utiliser leurs invites directement dans l'un de nos SDK.
Anthropic introduit également des messages-guides, qui permettent aux utilisateurs de fournir des instructions personnalisées à Claude afin d'améliorer ses performances. Les invites du système établissent un contexte utile qui améliore la capacité de Claude à prendre des personnalités et des rôles spécifiques ou à structurer des réponses d'une manière plus personnalisable, cohérente et alignée sur les besoins des utilisateurs.
Claude 2.1 est disponible dès maintenant dans l'API, et alimente également l'interface de chat sur claude.ai pour les versions gratuite et Pro. L'utilisation de la fenêtre contextuelle du jeton de 200K est réservée aux utilisateurs de Claude Pro, qui peuvent désormais télécharger des fichiers plus volumineux que jamais.
Anthropic :
Nous sommes impatients de voir les cas d'utilisation que ces nouvelles fonctionnalités inspirent, alors que nous travaillons à construire les systèmes d'IA les plus sûrs et les plus techniquement sophistiqués de l'industrie.
Nous sommes impatients de voir les cas d'utilisation que ces nouvelles fonctionnalités inspirent, alors que nous travaillons à construire les systèmes d'IA les plus sûrs et les plus techniquement sophistiqués de l'industrie.
Et vous ?
Quel est votre avis sur cette nouvelle version, Claude 2.1 ?
Voir aussi :
Anthropic, une startup fondée par d'anciens employés d'OpenAI, dévoile un chatbot d'IA appelé Claude pour concurrencer ChatGPT, il serait bon pour faire des blagues, mais mauvais en programmation
Anthropic lance Claude Pro, une version payante de son concurrent ChatGPT, au même prix que ChatGPT Plus, disponible qu'aux États-Unis et au Royaume-Uni pour l'instant
Anthropic lance Claude, un modèle d'IA décrit comme plus "maniable" et "moins nocif" que ChatGPT d'OpenAI, mais moins performant que ChatGPT dans l'écriture de code informatique