IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)

Vous êtes nouveau sur Developpez.com ? Créez votre compte ou connectez-vous afin de pouvoir participer !

Vous devez avoir un compte Developpez.com et être connecté pour pouvoir participer aux discussions.

Vous n'avez pas encore de compte Developpez.com ? Créez-en un en quelques instants, c'est entièrement gratuit !

Si vous disposez déjà d'un compte et qu'il est bien activé, connectez-vous à l'aide du formulaire ci-dessous.

Identifiez-vous
Identifiant
Mot de passe
Mot de passe oublié ?
Créer un compte

L'inscription est gratuite et ne vous prendra que quelques instants !

Je m'inscris !

Anthropic lance Claude Sonnet 4.5, son dernier modèle d'IA qui « s'apparente davantage à un collègue »
Claude Sonnet 4.5 est plus petit que Claude Opus 4.1, mais serait plus intelligent

Le , par Jade Emy

4PARTAGES

5  0 
Anthropic lance Claude Sonnet 4.5, son dernier modèle d'IA qui « s'apparente davantage à un collègue », Claude Sonnet 4.5 est plus petit que Claude Opus 4.1, mais serait plus intelligent

Anthropic, une start-up américaine spécialisée dans l'intelligence artificielle (IA), a récemment annoncé son dernier modèle d'IA : Claude Sonnet 4.5. Selon Anthropic, Claude Sonnet 4.5 est plus performant en matière de codage, d'utilisation des ordinateurs et de réponse aux besoins pratiques des entreprises, et il excelle dans des domaines spécialisés tels que la cybersécurité, la finance et la recherche. Claude Sonnet 4.5 est plus petit que Claude Opus 4.1, mais plus intelligent que lui « à presque tous les égards ».

Anthropic, une start-up américaine spécialisée dans l'intelligence artificielle (IA), a récemment annoncé son dernier modèle d'IA : Claude Sonnet 4.5. Fondée en 2021, Anthropic a développé la famille de grands modèles de langage (LLM) baptisée Claude. Selon l'entreprise, elle mène des recherches et développe des IA afin « d'étudier leurs propriétés de sécurité à la frontière technologique » et utilise ces recherches pour déployer des modèles sûrs pour le public.

Selon Anthropic, Claude Sonnet 4.5 est plus performant en matière de codage, d'utilisation des ordinateurs et de réponse aux besoins pratiques des entreprises, et il excelle dans des domaines spécialisés tels que la cybersécurité, la finance et la recherche. La start-up soutenue par Amazon, évaluée à 183 milliards de dollars, met Claude Sonnet 4.5 à la disposition de tous les utilisateurs.

Anthropic a déclaré que Claude Sonnet 4.5 est le « meilleur modèle de codage au monde » selon les benchmarks du secteur tels que SWE-bench Verified, un ensemble de tests qui mesure les capacités de codage logiciel d'un système d'IA. « Les gens remarquent simplement avec ce modèle, parce qu'il est plus intelligent et plus proche d'un collègue, qu'il est assez agréable de travailler avec lui lorsqu'on rencontre des problèmes et qu'on les résout », a déclaré Jared Kaplan, cofondateur et directeur scientifique d'Anthropic. Selon l'entreprise, ce modèle génère un code de meilleure qualité, identifie plus facilement les améliorations à apporter au code et suit les instructions de manière plus fiable.


Claude Sonnet 4.5 fait suite au lancement de Claude Opus 4.1 en août et de Claude Sonnet 4 en mai par Anthropic. Il s'agit du dernier exemple en date du rythme effréné de l'innovation dans le secteur de l'IA. Anthropic a été fondée en 2021 par un groupe d'anciens chercheurs d'OpenAI, et les deux entreprises sont depuis lors des concurrentes acharnées. OpenAI a lancé le boom de l'intelligence artificielle générative après la sortie de son chatbot ChatGPT en 2022. La start-up, dont la valorisation a atteint 500 milliards de dollars, a annoncé en août son dernier modèle, GPT-5. Le lancement a été difficile, certains utilisateurs se plaignant de ne plus avoir accès aux modèles précédents de l'entreprise.

Mike Krieger, directeur produit chez Anthropic, a déclaré que Claude Sonnet 4.5 serait le modèle par défaut pour les utilisateurs et qu'Anthropic le recommandait pour « pratiquement tous les cas d'utilisation ». Les utilisateurs auront toutefois le choix. Les abonnés payants pourront toujours choisir d'utiliser Opus, et les utilisateurs ayant des flux de travail spécifiques pourront sélectionner une ancienne génération de Sonnet s'ils ne sont pas prêts à migrer du jour au lendemain, a-t-il déclaré.

Claude Sonnet 4.5 est plus petit que Claude Opus 4.1, mais plus intelligent que lui « à presque tous les égards », a ajouté Krieger. « Nous l'avons trouvé, et nos clients le trouvent, très utile pour le travail réel et concret », a déclaré Krieger. Claude Sonnet 4.5 peut fonctionner de manière autonome pendant 30 heures, et Anthropic a déclaré qu'il était capable de rester concentré sur des tâches complexes en plusieurs étapes pendant toute cette période. Claude Opus 4, lancé par la société en mai, ne pouvait fonctionner de manière autonome que pendant sept heures.

Anthropic a également pu améliorer le comportement du modèle grâce à une formation approfondie en matière de sécurité, a déclaré la société. Elle a réduit les « comportements préoccupants » tels que la tromperie, la recherche de pouvoir et la flagornerie, qui consiste pour un modèle à dire à un utilisateur ce qu'il veut entendre. Claude Sonnet 4.5 est également plus résistant aux attaques par injection de prompt, dans lesquelles un modèle peut être amené à faire quelque chose de malveillant, comme exposer des données sensibles. « Il s'agit de la plus grande avancée en matière de sécurité que nous ayons connue depuis probablement un an, un an et demi », a déclaré Kaplan.

D'autres lancements de modèles sont déjà prévus pour Anthropic. Kaplan a déclaré que de meilleurs modèles étaient en préparation, notamment « très probablement Opus ». « Je ne promets rien », a-t-il déclaré. « Mais je pense que nous aurons probablement un ou deux autres lancements avant la fin de l'année. »

Ce lancement intervient alors qu'Anthropic a révisé ses Conditions générales et sa Politique de confidentialité en août. Désormais, les données issues des conversations des utilisateurs de Claude pourront être utilisées pour entraîner les modèles — sauf en cas de refus explicite. Une décision qui marque une rupture par rapport à la politique originelle d’Anthropic, qui affirmait vouloir limiter au maximum la collecte et l’usage des données, se différenciant ainsi de certains concurrents comme OpenAI. Pour beaucoup d’observateurs, il s’agissait d’un tournant stratégique, dicté à la fois par la nécessité de rester compétitif et par les exigences financières colossales que représente l’entraînement des modèles de nouvelle génération.

Pourtant, Anthropic fait face à un recours collectif intenté par des auteurs qui affirmaient que l'entreprise avait volé leurs œuvres pour entraîner ses modèles d'IA. La société d'IA a alors accepté de verser 1,5 milliard de dollars pour régler le conflit. Selon les avocats des auteurs, cet accord serait le plus important recouvrement de droits d'auteur jamais rendu public. Anthropic a déclaré que l'accord « résoudrait les réclamations restantes des plaignants ». Cependant, le juge fédéral américain William Alsup a rejetté l'accord.


Voici un extrait de l'annonce d'Anthropic :

Claude Sonnet 4.5 est le meilleur modèle de codage au monde. C'est le modèle le plus puissant pour créer des agents complexes. C'est le meilleur modèle pour utiliser des ordinateurs. Et il affiche des gains substantiels en matière de raisonnement et de mathématiques.

Le code est partout. Il fait fonctionner toutes les applications, feuilles de calcul et outils logiciels que vous utilisez. Être capable d'utiliser ces outils et de résoudre des problèmes complexes, c'est ainsi que le travail moderne est accompli.

Claude Sonnet 4.5 rend cela possible. Nous le lançons en même temps qu'une série de mises à jour majeures de nos produits. Dans Claude Code, nous avons ajouté des points de contrôle, l'une des fonctionnalités les plus demandées, qui enregistrent votre progression et vous permettent de revenir instantanément à un état précédent. Nous avons actualisé l'interface du terminal et livré une extension VS Code native. Nous avons ajouté une nouvelle fonctionnalité d'édition de contexte et un outil de mémoire à l'API Claude qui permettent aux agents de fonctionner encore plus longtemps et de gérer des tâches encore plus complexes. Dans les applications Claude, nous avons intégré l'exécution de code et la création de fichiers (feuilles de calcul, diapositives et documents) directement dans la conversation. Et nous avons mis l'extension Claude pour Chrome à la disposition des utilisateurs Max qui se sont inscrits sur la liste d'attente le mois dernier.

Nous fournissons également aux développeurs les éléments de base que nous utilisons nous-mêmes pour créer Claude Code. Nous l'appelons le SDK Claude Agent. L'infrastructure qui alimente nos produits de pointe et leur permet d'atteindre leur plein potentiel est désormais à votre disposition pour que vous puissiez la développer.

Il s'agit du modèle de pointe le plus aligné que nous ayons jamais publié, présentant d'importantes améliorations dans plusieurs domaines d'alignement par rapport aux modèles Claude précédents.

Claude Sonnet 4.5 est disponible partout dès aujourd'hui. Si vous êtes développeur, il vous suffit d'utiliser claude-sonnet-4-5 via l'API Claude. Le prix reste le même que celui de Claude Sonnet 4, soit 3 $/15 $ par million de jetons.
Intelligence de pointe

Claude Sonnet 4.5 est à la pointe de la technologie selon l'évaluation SWE-bench Verified, qui mesure les capacités de codage logiciel dans le monde réel. Selon les testes, il restait concentré pendant plus de 30 heures sur des tâches complexes en plusieurs étapes.


Claude Sonnet 4.5 représente une avancée significative dans l'utilisation des ordinateurs. Sur OSWorld, un benchmark qui teste les modèles d'IA sur des tâches informatiques réelles, Sonnet 4.5 est désormais en tête avec 61,4 %. Il y a seulement quatre mois, Sonnet 4 était en tête avec 42,2 %. Le modèle montre également des capacités améliorées dans un large éventail d'évaluations, notamment en matière de raisonnement et de mathématiques :


Le modèle le plus aligné à ce jour d'Anthropic

En plus d'être le modèle le plus performant, Claude Sonnet 4.5 est le modèle de pointe le plus aligné à ce jour d'Anthropic. Les capacités améliorées de Claude et sa formation approfondie en matière de sécurité ont permis d'améliorer le comportement du modèle, en réduisant les comportements préoccupants tels que la flagornerie, la tromperie, la recherche du pouvoir et la tendance à encourager les pensées délirantes. En ce qui concerne les capacités d'agent et d'utilisation informatique du modèle, le modèle a également fait des progrès dans la défense contre les attaques par injection de prompt, l'un des risques les plus graves pour les utilisateurs de ces capacités.


Claude Sonnet 4.5 est commercialisé sous la protection AI Safety Level 3 (ASL-3). Ces mesures de sécurité comprennent des filtres appelés classificateurs qui visent à détecter les entrées et sorties potentiellement dangereuses, en particulier celles liées aux armes chimiques, biologiques, radiologiques et nucléaires (CBRN).

Le SDK Claude Agent

Des mises à jour de Claude Code sont désormais disponible. Ces mises à jour comprennent : comment les agents doivent gérer la mémoire dans le cadre de tâches de longue durée, comment gérer les systèmes d'autorisation qui équilibrent l'autonomie et le contrôle de l'utilisateur, et comment coordonner les sous-agents travaillant vers un objectif commun.


Le SDK Claude Agent repose sur la même infrastructure que Claude Code, mais il offre des avantages pour une grande variété de tâches, et pas seulement pour le codage. À partir d'aujourd'hui, vous pouvez l'utiliser pour créer vos propres agents.

Aperçu bonus de la recherche

Anthropic publie un aperçu temporaire de la recherche parallèlement à Claude Sonnet 4.5, intitulé « Imagine with Claude ».


Dans cette expérience, Claude génère des logiciels à la volée. Aucune fonctionnalité n'est prédéterminée, aucun code n'est pré-écrit. Ce que vous voyez, c'est Claude qui crée en temps réel, répondant et s'adaptant à vos demandes au fur et à mesure que vous interagissez.

Il s'agit d'une démonstration amusante qui montre ce que Claude Sonnet 4.5 peut faire, une façon de voir ce qui est possible lorsque vous combinez un modèle performant avec la bonne infrastructure.

Source : Anthropic

Et vous ?

Pensez-vous que cette annonce est crédible ou pertinente ?
Quel est votre avis sur le sujet ?

Voir aussi :

Anthropic lance Claude Opus 4.1 avec des améliorations en matière de codage, de raisonnement et de débogage pour répondre aux besoins en manipulation précise du code et en recherches avancées des utilisateurs

Anthropic a clôturé une nouvelle levée de fonds 13 milliards de $, portant la valorisation de l'entreprise à 183 milliards de $. Une somme colossale qui gonfle encore plus la bulle IA

Un juge rejette l'accord à 1,5 milliard de dollars conclu par Anthropic concernant un recours collectif sur les droits d'auteur de près d'un demi-million de livres piratés pour former des chatbots
Vous avez lu gratuitement 379 articles depuis plus d'un an.
Soutenez le club developpez.com en souscrivant un abonnement pour que nous puissions continuer à vous proposer des publications.

Une erreur dans cette actualité ? Signalez-nous-la !