IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)

Vous êtes nouveau sur Developpez.com ? Créez votre compte ou connectez-vous afin de pouvoir participer !

Vous devez avoir un compte Developpez.com et être connecté pour pouvoir participer aux discussions.

Vous n'avez pas encore de compte Developpez.com ? Créez-en un en quelques instants, c'est entièrement gratuit !

Si vous disposez déjà d'un compte et qu'il est bien activé, connectez-vous à l'aide du formulaire ci-dessous.

Identifiez-vous
Identifiant
Mot de passe
Mot de passe oublié ?
Créer un compte

L'inscription est gratuite et ne vous prendra que quelques instants !

Je m'inscris !

Anthropic lance les modèles Claude 4 qui peuvent travailler de manière autonome pendant presque toute une journée de travail en entreprise, établissant de nouvelles normes en matière de codage et d'agents IA

Le , par Anthony

104PARTAGES

4  0 
Anthropic a lancé Claude Opus 4 et Claude Sonnet 4, positionnant Opus 4 comme le meilleur modèle de codage au monde avec 72,5 % de performance sur SWE-bench et 43,2 % sur Terminal-bench. Les deux modèles sont dotés d'une architecture hybride permettant des réponses quasi instantanées et des modes de réflexion étendus pour les tâches de raisonnement complexes.

Les modèles Claude 4, lancés ce 22 mai 2025, introduisent des capacités parallèles d'exécution d'outils et de mémoire qui permettent à Claude d'extraire et de sauvegarder des faits clés lorsqu'il dispose d'un accès local aux fichiers. D'après Anthropic, Claude Opus 4 est le meilleur modèle de codage au monde, avec des performances soutenues sur des tâches complexes et de longue durée et des flux de travail d'agents. Claude Sonnet 4 est, quant à lui, une mise à jour significative de Claude Sonnet 3.7, offrant un codage et un raisonnement supérieurs tout en répondant plus précisément aux instructions des utilisateurs.


Anthropic, qui compte Amazon et Google parmi ses investisseurs, a déclaré que Claude Opus 4 pouvait travailler de manière autonome pendant presque une journée de travail complète.

« Je rédige beaucoup avec Claude, et je pense qu'avant Opus 4 et Sonnet 4, j'utilisais surtout les modèles comme partenaire de réflexion, mais je rédigeais moi-même la plupart des textes », a déclaré Mike Krieger, directeur des produits d'Anthropic, lors d'une interview. « Et ils ont franchi ce seuil où maintenant la plupart de mes écrits sont en fait ... [écrits avec] Opus principalement, et ils sont maintenant méconnaissables de mes écrits ».

Mike Krieger a ajouté : « J'aime le fait que nous repoussons la frontière de deux côtés. D'une part, il y a le codage et le comportement agentique en général, et c'est ce qui alimente un grand nombre de ces startups de codage. ... Mais nous repoussons également les limites de la manière dont ces modèles peuvent apprendre et devenir des partenaires d'écriture très utiles. »

Parallèlement aux modèles Claude 4, Anthropic a également annoncé :

  • Le raisonnement avancé avec utilisation d'outils (en bêta) : Les deux modèles peuvent utiliser des outils - comme la recherche sur Internet - pendant le raisonnement étendu, ce qui permet à Claude d'alterner entre la réflexion et l'utilisation d'outils pour améliorer les réponses.
  • De nouvelles capacités pour les modèles : Les deux modèles peuvent utiliser des outils en parallèle, suivre des instructions avec plus de précision et, lorsque les développeurs leur donnent accès aux fichiers locaux, faire preuve de capacités de mémorisation considérablement améliorées, en extrayant et en sauvegardant des faits clés pour maintenir la continuité et construire une connaissance tacite au fil du temps.
  • La disponibilité générale de Claude Code : Après avoir reçu de nombreux commentaires positifs lors de son aperçu de recherche, Anthropic a élargi la façon dont les développeurs peuvent collaborer avec Claude. Claude Code prend désormais en charge les tâches d'arrière-plan via GitHub Actions et les intégrations natives avec VS Code et JetBrains, affichant les modifications directement dans les fichiers des utilisateurs pour une programmation en binôme transparente. L'intégration de GitHub permet en outre à Claude de répondre aux demandes de commentaires et de corriger les erreurs d'intégration continue (CI) grâce à un nouveau SDK en version bêta.
  • Nouvelles fonctionnalités de l'API : Anthropic a publié quatre nouvelles capacités sur son API qui permettent aux développeurs de construire des agents d'IA plus puissants : l'outil d'exécution de code, le connecteur MCP, l'API Fichiers et la possibilité de mettre en cache les invites jusqu'à une heure.

Concernant la tarification, elle reste cohérente avec les modèles Opus et Sonnet précédents : 15 $/75 $ par million de jetons (entrée/sortie) pour Opus 4 et 3 $/15 $ pour Sonnet 4. Les deux modèles sont disponibles via l'interface web de Claude, l'API Anthropic, Amazon Bedrock et Vertex IA de Google Cloud. Les capacités de réflexion étendues sont incluses dans les plans Claude Pro, Max, Team et Enterprise, Sonnet 4 étant également disponible pour les utilisateurs gratuits.

Claude 4

Selon Antropic, Claude Opus 4 est son modèle le plus puissant à ce jour et le meilleur modèle de codage au monde, en tête du SWE-bench (72,5 %) et du Terminal-bench (43,2 %). Il offre des performances soutenues sur des tâches de longue durée qui nécessitent un effort ciblé et des milliers d'étapes, avec la capacité de travailler en continu pendant plusieurs heures - surpassant de manière remarquable tous les modèles Sonnet et élargissant de manière significative ce que les agents d'IA peuvent accomplir.


Claude Opus 4 excelle dans le codage et la résolution de problèmes complexes, alimentant des produits d'agents d'avant-garde. Cursor estime qu'il est à la pointe du progrès en matière de codage et qu'il représente un bond en avant dans la compréhension des bases de code complexes. Replit fait état d'une précision accrue et d'avancées...
La fin de cet article est réservée aux abonnés. Soutenez le Club Developpez.com en prenant un abonnement pour que nous puissions continuer à vous proposer des publications.

Une erreur dans cette actualité ? Signalez-nous-la !

Avatar de _toma_
Membre éclairé https://www.developpez.com
Le 24/05/2025 à 7:00
Merci d'arrêter d'essayer de vendre une âme à nos machines. Wahou la machine doit penser à sa survie. Elle a pensé à son hygiène corporelle aussi ?

Le LLM s'est comporté comme il le devait : il a généré du texte. Le scénario décrit à déjà été écrit 75 263 fois par des humais, que ce soit dans des romans, des films ou des écrits relatant la vraie vie. Il existe donc il ressort, il faut arrêter de jouer les vierges effarouchées : oui la techno est bluffante mais elle n'a rien de plus que ça.
6  0 
Avatar de vVDB.fr
Membre régulier https://www.developpez.com
Le 26/05/2025 à 7:41
Si le LLM propose cette stratégie, c'est qu'elle est incluse dans sa base !
C'est un système probabiliste, elle évalue que la réponse est la meilleure. (Personne ne sait pourquoi)
Si votre LLM n'a que 'Mein Kampf' que va-t-il raconter ? Vous allez dire qu'il y a un biais, non ?
Si votre LLM n'a que le 'Coran' que va-t-il raconter ? Vous allez dire qu'il y a un biais, non ?
Et bien, avec l'exhaustivité des 'informations' disponibles pour l'entraînement, que raconte le LLM ? Vous allez bien dire qu'il y a un biais, non ? Si vous croyez le contraire, allez allumer un cierge car vous n'avez pas un esprit scientifique !
Prennez le rayonnage d'une librairie, vous allez avoir une surpondération des ouvrages avec les côtés sombres des humains : des tromperies, des meurtres... Voilà la seule source d'inspiration des LLM.
Si vous allez au bout de la 'logique' des entreprises qui veulent un LLM généraliste ce ne sera qu'une simulation de l'intelligence d'un très ''mauvais'' humain.
Le principe de garbage-in/garbage-out est encore valable !
Si vous voulez une analogie, prennez la carte de France. Sur votre carte (rectangle) vous avez les mers/océans symbolisant l'ignorance. Votre pays n'est pas plat, les collines, montagnes et sommets symbolisent les biais. Une bonne carte c'est votre rectangle remplis de terre et une plaine sans aspérité : une IA omnisciente et neutre.
3  0 
Avatar de kain_tn
Expert éminent https://www.developpez.com
Le 26/06/2025 à 14:51
Citation Envoyé par Jade Emy Voir le message

Pensez-vous que cette étude est crédible ou pertinente ?
Quel est votre avis sur le sujet ?
Si ce sont les mêmes chercheurs chez Anthropic qui avaient déclaré que leur IA avait "recourt au chantage pour éviter d'être mises hors-ligne", c'est du pipeau: https://pivot-to-ai.com/2025/05/25/a...bot-blackmail/
1  0 
Avatar de gabi7756
Membre confirmé https://www.developpez.com
Le 14/08/2025 à 14:23
Déjà qu'avec 100-150 lignes ca commence à voir flou, ne pourrait t'on pas augmenter encore plus.
Commercial 1: 1000 ?
Commercial 2: Non pas assez, faut quelque chose d'encore plus commercial.

Commercial 1 : 75000 et hop on va non plus bosser. Pause café !!
0  0