Anthropic PBC est une startup américaine d'intelligence artificielle (IA) d'intérêt public, fondée en 2021. Elle recherche et développe l'IA pour "étudier ses propriétés de sécurité à la frontière technologique" et utiliser cette recherche pour déployer des modèles sûrs et fiables pour le public. Anthropic a développé une famille de grands modèles de langage (LLM) nommée Claude pour concurrencer ChatGPT d'OpenAI et Gemini de Google.
La famille de grands modèles de langage Claude 3, développée par Anthropic, a été publiée le 14 mars 2024 et le selon communiqué de presse de l'entreprise, Claude 3 a établi de nouvelles références industrielles dans un large éventail de tâches cognitives, y compris l'analyse des images. La famille Claude 3 comprend trois modèles de pointe par ordre croissant de capacité : Haiku, Sonnet et Opus. La version par défaut de Claude 3, Opus, dispose d'une fenêtre contextuelle de 200 000 tokens, mais celle-ci est étendue à 1 million pour des cas d'utilisation spécifiques.
Cette version Sonnet, qui fait partie de la famille Claude 3.5, arrive trois mois après Claude 3. Claude 3.5 Sonnet est disponible gratuitement sur Claude.ai et l'application Claude iOS, tandis que les abonnés aux plans Claude Pro et Team peuvent y accéder avec des limites tarifaires nettement plus élevées. Par ailleurs, Anthropic prévoit de lancer les versions 3.5 de Haiku et Opus dans le courant de l'année, et d'explorer des fonctionnalités telles que la recherche sur le web et la mémoire pour les versions futures.
Anthropic a également présenté Artifacts sur Claude.ai, une nouvelle fonctionnalité qui élargit la façon dont les utilisateurs peuvent interagir avec Claude. Lorsqu'un utilisateur demande à Claude de générer du contenu comme des extraits de code, des documents textuels ou des designs de sites web, ces artefacts apparaissent dans une fenêtre dédiée, parallèlement à leur conversation. Cela crée un espace de travail dynamique où les utilisateurs peuvent voir, modifier et développer les créations de Claude en temps réel, en intégrant de manière transparente le contenu généré par l'IA dans leurs projets et leurs flux de travail, a déclaré la startup.
Claude 3.5 Sonnet, la première version de la future famille de modèles Claude 3.5 d'Anthropic, relève la barre de l'intelligence dans l'industrie, surpassant les modèles concurrents et Claude 3 Opus sur une large gamme d'évaluations, avec la vitesse et le coût de leur modèle de milieu de gamme, Claude 3 Sonnet.
Claude 3.5 Sonnet est maintenant disponible gratuitement sur Claude.ai et l'application Claude iOS, tandis que les abonnés aux plans Claude Pro et Team peuvent y accéder avec des limites tarifaires nettement plus élevées. Il est également disponible via l'API Anthropic, Amazon Bedrock et Vertex AI de Google Cloud. Le modèle coûte 3 dollars par million de jetons d'entrée et 15 dollars par million de jetons de sortie, avec une fenêtre contextuelle de 200 000 jetons.
Une intelligence de frontière avec une vitesse multipliée par deux
Claude 3.5 Sonnet établit de nouvelles références dans l'industrie pour le raisonnement de niveau avancé (GPQA), les connaissances du monde (MMLU) et la compétence de codage (HumanEval). Il montre une nette amélioration dans la compréhension des nuances, de l'humour et des instructions complexes, et il est exceptionnel dans la rédaction de contenu de haute qualité avec un ton naturel et compréhensible.
Claude 3.5 Sonnet fonctionne deux fois plus vite que Claude 3 Opus. Cette augmentation des performances, combinée à un prix avantageux, fait de Claude 3.5 Sonnet la solution idéale pour les tâches complexes telles que le support client contextuel et l'orchestration de flux de travail à plusieurs étapes.
Dans une évaluation interne de codage agentique, Claude 3.5 Sonnet a résolu 64 % des problèmes, surpassant Claude 3 Opus qui en a résolu 38 %. L'évaluation teste la capacité du modèle à corriger un bogue ou à ajouter une fonctionnalité à un code source ouvert, à partir d'une description en langage naturel de l'amélioration souhaitée. Lorsqu'il reçoit des instructions et les outils appropriés, Claude 3.5 Sonnet peut écrire, éditer et exécuter du code de manière autonome avec des capacités de raisonnement et de dépannage sophistiquées. Il gère les traductions de code avec facilité, ce qui le rend particulièrement efficace pour la mise à jour d'applications existantes et la migration de bases de code.
Une vision de pointe
Claude 3.5 Sonnet est le modèle de vision d'Anthropic le plus puissant à ce jour, surpassant Claude 3 Opus dans les tests de vision standard. Ces améliorations sont particulièrement remarquables pour les tâches qui requièrent un raisonnement visuel, comme l'interprétation de tableaux et de graphiques. Claude 3.5 Sonnet peut également transcrire avec précision du texte à partir d'images imparfaites - une capacité essentielle pour la vente au détail, la logistique et les services financiers, où l'IA peut tirer davantage d'informations d'une image, d'un graphique ou d'une illustration que d'un texte seul.
Artifacts - une nouvelle façon d'utiliser Claude
Anthropic introduit également les Artifacts sur Claude.ai, une nouvelle fonctionnalité qui élargit la façon dont les utilisateurs peuvent interagir avec Claude. Lorsqu'un utilisateur demande à Claude de générer du contenu comme des extraits de code, des documents textuels ou des conceptions de sites Web, ces artefacts apparaissent dans une fenêtre dédiée, parallèlement à leur conversation. Cela crée un espace de travail dynamique où les utilisateurs peuvent voir, modifier et développer les créations de Claude en temps réel, en intégrant de manière transparente le contenu généré par l'IA dans leurs projets et leurs flux de travail.
Cette fonction en avant première marque l'évolution de Claude d'une IA conversationnelle vers un environnement de travail collaboratif. Ce n'est que le début d'une vision plus large pour Claude.ai, qui s'étendra bientôt à la collaboration en équipe. Dans un avenir proche, les équipes - et éventuellement des organisations entières - pourront centraliser en toute sécurité leurs connaissances, documents et travaux en cours dans un espace partagé, Claude servant de coéquipier à la demande.
Engagement en matière de sécurité et de respect de la vie privée
Les modèles d'Anthropic sont soumis à des tests rigoureux et ont été formés pour réduire les abus. Malgré le saut d'intelligence de Claude 3.5 Sonnet, les évaluations de l'équipe rouge ont conclu que Claude 3.5 Sonnet reste à l'ASL-2.
Dans le cadre de son engagement en faveur de la sécurité et de la transparence, Anthropic a fait appel à des experts externes pour tester et affiner les mécanismes de sécurité de ce dernier modèle. Claude 3.5 Sonnet a récemment été fourni à l'Institut britannique de sécurité de l'intelligence artificielle (UK AISI) pour une évaluation de la sécurité avant le déploiement. L'AISI britannique a terminé les tests de Sonnet 3.5 et a partagé ses résultats avec l'US AI Safety Institute (US AISI) dans le cadre d'un protocole d'accord, rendu possible par le partenariat entre les AISI américain et britannique annoncé au début de l'année.
Anthropic a intégré les commentaires d'experts externes en la matière pour s'assurer que ses évaluations sont robustes et prennent en compte les nouvelles tendances en matière d'abus. Cet engagement a aidé ses équipes à augmenter leur capacité à évaluer Sonnet 3.5 par rapport à différents types d'abus. Par exemple, Anthropic a utilisé le retour d'information des experts en sécurité des enfants de Thorn pour mettre à jour ses classificateurs et affiner ses modèles.
L'un des principes constitutionnels fondamentaux qui guident Anthropic dans le développement de ses modèles d'IA est la protection de la vie privée. L'entreprise n'entraîne pas ses modèles génératifs sur des données transmises par les utilisateurs, sauf si ces derniers l'autorisent explicitement à le faire. À ce jour, aucune donnée de client ou d'utilisateur n'a été utilisée pour l'entraînement des modèles génératifs d'Anthropic.
À venir
L'objectif d'Anthropic est d'améliorer substantiellement la courbe de compromis entre l'intelligence, la vitesse et le coût tous les deux mois. Pour compléter la famille de modèles Claude 3.5, Anthropic publiera Claude 3.5 Haiku et Claude 3.5 Opus dans le courant de l'année.
En plus de travailler sur sa famille de modèles de nouvelle génération, Anthropic développe de nouvelles modalités et fonctionnalités pour prendre en charge davantage de cas d'utilisation pour les entreprises, y compris des intégrations avec des applications d'entreprise. L'équipe d'Anthropic explore également des fonctionnalités telles que la mémoire, qui permettra à Claude de se souvenir des préférences de l'utilisateur et de l'historique de ses interactions, afin de rendre son expérience encore plus personnalisée et efficace.
Source : Anthropic
Et vous ?
Quel est votre avis sur le sujet ?
Que pensez-vous de Claude 3.5 Sonnet et de ses performances ?
Voir aussi :
Claude 3 Opus a stupéfié les chercheurs en IA par son intelligence et sa « conscience de soi », cela signifie-t-il qu'il peut penser par lui-même ? Anthropic surpasse GPT-4 sur des métriques clés
Le chatbot IA Claude 3 est désormais disponible en Europe, a annoncé Anthropic, la société d'IA dans laquelle Amazon et Google ont investi des milliards
Claude 3 Opus écrase les autres modèles IA pour les résumés, livrant le plus fidèle des résumés de livres, suivi par GPT-4 Turbo, selon une étude sur les capacités des LLM