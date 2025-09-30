Anthropic, une start-up américaine spécialisée dans l'intelligence artificielle (IA), a récemment annoncé son dernier modèle d'IA : Claude Sonnet 4.5. Selon Anthropic, Claude Sonnet 4.5 est plus performant en matière de codage, d'utilisation des ordinateurs et de réponse aux besoins pratiques des entreprises, et il excelle dans des domaines spécialisés tels que la cybersécurité, la finance et la recherche. Claude Sonnet 4.5 est plus petit que Claude Opus 4.1, mais plus intelligent que lui « à presque tous les égards ».
Anthropic, une start-up américaine spécialisée dans l'intelligence artificielle (IA), a récemment annoncé son dernier modèle d'IA : Claude Sonnet 4.5. Fondée en 2021, Anthropic a développé la famille de grands modèles de langage (LLM) baptisée Claude. Selon l'entreprise, elle mène des recherches et développe des IA afin « d'étudier leurs propriétés de sécurité à la frontière technologique » et utilise ces recherches pour déployer des modèles sûrs pour le public.
Selon Anthropic, Claude Sonnet 4.5 est plus performant en matière de codage, d'utilisation des ordinateurs et de réponse aux besoins pratiques des entreprises, et il excelle dans des domaines spécialisés tels que la cybersécurité, la finance et la recherche. La start-up soutenue par Amazon, évaluée à 183 milliards de dollars, met Claude Sonnet 4.5 à la disposition de tous les utilisateurs.
Anthropic a déclaré que Claude Sonnet 4.5 est le « meilleur modèle de codage au monde » selon les benchmarks du secteur tels que SWE-bench Verified, un ensemble de tests qui mesure les capacités de codage logiciel d'un système d'IA. « Les gens remarquent simplement avec ce modèle, parce qu'il est plus intelligent et plus proche d'un collègue, qu'il est assez agréable de travailler avec lui lorsqu'on rencontre des problèmes et qu'on les résout », a déclaré Jared Kaplan, cofondateur et directeur scientifique d'Anthropic. Selon l'entreprise, ce modèle génère un code de meilleure qualité, identifie plus facilement les améliorations à apporter au code et suit les instructions de manière plus fiable.
Claude Sonnet 4.5 fait suite au lancement de Claude Opus 4.1 en août et de Claude Sonnet 4 en mai par Anthropic. Il s'agit du dernier exemple en date du rythme effréné de l'innovation dans le secteur de l'IA. Anthropic a été fondée en 2021 par un groupe d'anciens chercheurs d'OpenAI, et les deux entreprises sont depuis lors des concurrentes acharnées. OpenAI a lancé le boom de l'intelligence artificielle générative après la sortie de son chatbot ChatGPT en 2022. La start-up, dont la valorisation a atteint 500 milliards de dollars, a annoncé en août son dernier modèle, GPT-5. Le lancement a été difficile, certains utilisateurs se plaignant de ne plus avoir accès aux modèles précédents de l'entreprise.
Mike Krieger, directeur produit chez Anthropic, a déclaré que Claude Sonnet 4.5 serait le modèle par défaut pour les utilisateurs et qu'Anthropic le recommandait pour « pratiquement tous les cas d'utilisation ». Les utilisateurs auront toutefois le choix. Les abonnés payants pourront toujours choisir d'utiliser Opus, et les utilisateurs ayant des flux de travail spécifiques pourront sélectionner une ancienne génération de Sonnet s'ils ne sont pas prêts à migrer du jour au lendemain, a-t-il déclaré.
Claude Sonnet 4.5 est plus petit que Claude Opus 4.1, mais plus intelligent que lui « à presque tous les égards », a ajouté Krieger. « Nous l'avons trouvé, et nos clients le trouvent, très utile pour le travail réel et concret », a déclaré Krieger. Claude Sonnet 4.5 peut fonctionner de manière autonome pendant 30 heures, et Anthropic a déclaré qu'il était capable de rester concentré sur des tâches complexes en plusieurs étapes pendant toute cette période. Claude Opus 4, lancé par la société en mai, ne pouvait fonctionner de manière autonome que pendant sept heures.
Anthropic a également pu améliorer le comportement du modèle grâce à une formation approfondie en matière de sécurité, a déclaré la société. Elle a réduit les « comportements préoccupants » tels que la tromperie, la recherche de pouvoir et la flagornerie, qui consiste pour un modèle à dire à un utilisateur ce qu'il veut entendre. Claude Sonnet 4.5 est également plus résistant aux attaques par injection de prompt, dans lesquelles un modèle peut être amené à faire quelque chose de malveillant, comme exposer des données sensibles. « Il s'agit de la plus grande avancée en matière de sécurité que nous ayons connue depuis probablement un an, un an et demi », a déclaré Kaplan.
D'autres lancements de modèles sont déjà prévus pour Anthropic. Kaplan a déclaré que de meilleurs modèles étaient en préparation, notamment « très probablement Opus ». « Je ne promets rien », a-t-il déclaré. « Mais je pense que nous aurons probablement un ou deux autres lancements avant la fin de l'année. »
Ce lancement intervient alors qu'Anthropic a révisé ses Conditions générales et sa Politique de confidentialité en août. Désormais, les données issues des conversations des utilisateurs de Claude pourront être utilisées pour entraîner les modèles sauf en cas de refus explicite. Une décision qui marque une rupture par rapport à la politique originelle dAnthropic, qui affirmait vouloir limiter au maximum la collecte et lusage des données, se différenciant ainsi de certains concurrents comme OpenAI. Pour beaucoup dobservateurs, il sagissait dun tournant stratégique, dicté à la fois par la nécessité de rester compétitif et par les exigences financières colossales que représente lentraînement des modèles de nouvelle génération.
Pourtant, Anthropic fait face à un recours collectif intenté par des auteurs qui affirmaient que l'entreprise avait volé leurs uvres pour entraîner ses modèles d'IA. La société d'IA a alors accepté de verser 1,5 milliard de dollars pour régler le conflit. Selon les avocats des auteurs, cet accord serait le plus important recouvrement de droits d'auteur jamais rendu public. Anthropic a déclaré que l'accord « résoudrait les réclamations restantes des plaignants ». Cependant, le juge fédéral américain William Alsup a rejetté l'accord.
Voici un extrait de l'annonce d'Anthropic :
Claude Sonnet 4.5 est le meilleur modèle de codage au monde. C'est le modèle le plus puissant pour créer des agents complexes. C'est le meilleur modèle pour utiliser des ordinateurs. Et il affiche des gains substantiels en matière de raisonnement et de mathématiques.
Nous fournissons également aux développeurs les éléments de base que nous utilisons nous-mêmes pour créer Claude Code. Nous l'appelons le SDK Claude Agent. L'infrastructure qui alimente nos produits de pointe et leur permet d'atteindre leur plein potentiel est désormais à votre disposition pour que vous puissiez la développer.
Il s'agit du modèle de pointe le plus aligné que nous ayons jamais publié, présentant d'importantes améliorations dans plusieurs domaines d'alignement par rapport aux modèles Claude précédents.
Claude Sonnet 4.5 est disponible partout dès aujourd'hui. Si vous êtes développeur, il vous suffit d'utiliser claude-sonnet-4-5 via l'API Claude. Le prix reste le même que celui de Claude Sonnet 4, soit 3 $/15 $ par million de jetons.
Claude Sonnet 4.5 est à la pointe de la technologie selon l'évaluation SWE-bench Verified, qui mesure les capacités de codage logiciel dans le monde réel. Selon les testes, il restait concentré pendant plus de 30 heures sur des tâches complexes en plusieurs étapes.
Claude Sonnet 4.5 représente une avancée significative dans l'utilisation des ordinateurs. Sur OSWorld, un benchmark qui teste les modèles d'IA sur des tâches informatiques réelles, Sonnet 4.5 est désormais en tête avec 61,4 %. Il y a seulement quatre mois, Sonnet 4 était en tête avec 42,2 %. Le modèle montre également des capacités améliorées dans un large éventail d'évaluations, notamment en matière de raisonnement et de mathématiques :
Le modèle le plus aligné à ce jour d'Anthropic
En plus d'être le modèle le plus performant, Claude Sonnet 4.5 est le modèle de pointe le plus aligné à ce jour d'Anthropic. Les capacités améliorées de Claude et sa formation approfondie en matière de sécurité ont permis d'améliorer le comportement du modèle, en réduisant les comportements préoccupants tels que la flagornerie, la tromperie, la recherche du pouvoir et la tendance à encourager les pensées délirantes. En ce qui concerne les capacités d'agent et d'utilisation informatique du modèle, le modèle a également fait des progrès dans la défense contre les attaques par injection de prompt, l'un des risques les plus graves pour les utilisateurs de ces capacités.
Claude Sonnet 4.5 est commercialisé sous la protection AI Safety Level 3 (ASL-3). Ces mesures de sécurité comprennent des filtres appelés classificateurs qui visent à détecter les entrées et sorties potentiellement dangereuses, en particulier celles liées aux armes chimiques, biologiques, radiologiques et nucléaires (CBRN).
Le SDK Claude Agent
Des mises à jour de Claude Code sont désormais disponible. Ces mises à jour comprennent : comment les agents doivent gérer la mémoire dans le cadre de tâches de longue durée, comment gérer les systèmes d'autorisation qui équilibrent l'autonomie et le contrôle de l'utilisateur, et comment coordonner les sous-agents travaillant vers un objectif commun.
Le SDK Claude Agent repose sur la même infrastructure que Claude Code, mais il offre des avantages pour une grande variété de tâches, et pas seulement pour le codage. À partir d'aujourd'hui, vous pouvez l'utiliser pour créer vos propres agents.
Aperçu bonus de la recherche
Anthropic publie un aperçu temporaire de la recherche parallèlement à Claude Sonnet 4.5, intitulé « Imagine with Claude ».
Dans cette expérience, Claude génère des logiciels à la volée. Aucune fonctionnalité n'est prédéterminée, aucun code n'est pré-écrit. Ce que vous voyez, c'est Claude qui crée en temps réel, répondant et s'adaptant à vos demandes au fur et à mesure que vous interagissez.
Il s'agit d'une démonstration amusante qui montre ce que Claude Sonnet 4.5 peut faire, une façon de voir ce qui est possible lorsque vous combinez un modèle performant avec la bonne infrastructure.
Source : Anthropic
