Anthropic annonce Claude 3.7 Sonnet, un modèle qui donne un contrôle sur le temps que l'IA passe à "réfléchir" avant de générer une réponse, et Claude Code, un agent IA de codage en ligne de commande

Le 25 février 2025 à 09:07, par Jade Emy

175PARTAGES

Anthropic annonce Claude 3.7 Sonnet, un modèle qui donne un contrôle sur le temps que l'IA passe à "réfléchir" avant de générer une réponse, et Claude Code, un agent IA de codage en ligne de commande.

Anthropic a dévoilé son dernier modèle frontière, Claude 3.7 Sonnet, et affirme qu'il s'agit de la version la plus "intelligente" de l'entreprise à ce jour. Ce modèle hybride combine une capacité de raisonnement, c'est-à-dire le fait de s'arrêter pour réfléchir à des réponses complexes, avec un modèle traditionnel qui produit des réponses en temps réel. "Nous voulons une IA cohérente qui puisse nous aider dans tous les domaines", a déclaré Jared Kaplan, cofondateur et directeur scientifique d'Anthropic.

À l'heure où les startups et les géants de la technologie, qui bénéficient d'un financement important, s'efforcent d'obtenir la plus grande avance possible en matière d'intelligence artificielle, Anthropic affirme avoir mis au point le modèle d'IA "le plus intelligent" de l'entreprise. Pour rappel, Anthropic est la dernière startup d'IA en date à discuter d'une levée de fonds de 2 milliards de dollars dans le cadre d'une opération qui la valoriserait à 60 milliards de dollars.

Anthropic a récemment dévoilé Claude 3.7 Sonnet. Ce qui le rend unique, c'est son modèle dit hybride, qui combine une capacité à raisonner ou à s'arrêter pour réfléchir à des réponses complexes avec un modèle traditionnel qui donne des réponses en temps réel. "Ce modèle regroupe toutes les capacités - nous voulons une IA cohérente qui puisse nous aider dans tous les domaines", a déclaré Jared Kaplan, cofondateur et responsable scientifique d'Anthropic. "Il y a un avantage à la simplicité pour nos clients."

Anthropic affirme qu'il s'agit du seul modèle "hybride" de ce type disponible sur le marché, et qu'il sera mis en service immédiatement. Kaplan compare ce modèle au fonctionnement du cerveau humain. Certaines questions nécessitent une réflexion approfondie, d'autres des réponses rapides. Anthropic cherche à intégrer les deux capacités, plutôt que d'avoir un modèle entièrement distinct pour chacune d'entre elles.

Cette initiative pourrait donner à Anthropic une longueur d'avance sur son rival OpenAI et sur les grandes entreprises technologiques qui investissent toutes massivement dans des modèles d'IA. Le chatbot Claude d'Anthropic est un concurrent de ChatGPT d'OpenAI et de Gemini de Google.

Le chef de produit d'Anthropic, Mike Krieger, qui a cofondé Instagram, a déclaré que l'approche hybride est un moyen de simplifier le processus de chatbot pour les clients. Ils peuvent utiliser plusieurs capacités sans avoir à se demander quelle est la meilleure option. "Les modèles ont tous des personnalités, ils sont tous un peu différents", a déclaré Krieger, ajoutant que c'est "beaucoup" d'avoir des consommateurs qui choisissent le modèle, ou combien de temps ils veulent qu'il raisonne. "J'aimerais que les gens, les utilisateurs finaux, n'aient pas à réfléchir à cela".

Krieger estime que les utilisateurs devraient pouvoir activer ou désactiver l'option hybride pour plus de simplicité. Ils peuvent lui attribuer un "budget" de temps en fonction de ce sur quoi ils travaillent. Anthropic lancera également un outil de codage utilisant des agents.

La startup a remporté quelques victoires en lançant des produits avant ses concurrents. Elle a également été la première à dévoiler une capacité d'"agent" largement disponible à la fin de l'année dernière, suivie peu après par OpenAI. Krieger et Kaplan ont tous deux déclaré qu'ils s'attendaient à ce que les concurrents s'orientent dans cette direction avec des modèles hybrides.

Le PDG d'OpenAI, Sam Altman, a laissé entendre qu'il s'engagerait dans une voie similaire plus tôt en février. Dans un billet publié sur X, Altman a déclaré que son entreprise d'IA prévoyait de "mieux partager notre feuille de route et de simplifier davantage nos offres de produits". "Nous détestons le sélecteur de modèles autant que vous et nous voulons revenir à une intelligence unifiée magique", a écrit Altman.

Fait ironique, même si Anthropic produit des solutions d'IA de pointe, la startup a mis en place une "politique de l'IA" à l'intention des candidats à l'emploi, qui décourage l'utilisation de la technologie au cours du processus de candidature. L'entreprise explique qu'elle souhaite mettre en valeur les compétences en communication humaine des candidats. Anthropic est connue pour ses innovations en matière d'IA, mais l'entreprise ne veut pas que les candidats utilisent cette technologie.

Voici l'annonce d'Anthropic :

Aujourd'hui, nous annonçons Claude 3.7 Sonnet, notre modèle le plus intelligent à ce jour et le premier modèle de raisonnement hybride sur le marché. Claude 3.7 Sonnet peut produire des réponses quasi-instantanées ou des raisonnements détaillés, étape par étape, qui sont rendus visibles à l'utilisateur. Les utilisateurs de l'API peuvent également contrôler finement la durée de réflexion du modèle.

Claude 3.7 Sonnet présente des améliorations particulièrement importantes en matière de codage et de développement web frontal. Avec le modèle, nous introduisons également un outil de ligne de commande pour le codage agentique, Claude Code. Claude Code est disponible en avant-première de recherche limitée, et permet aux développeurs de déléguer des tâches d'ingénierie substantielles à Claude directement à partir de leur terminal.

Claude 3.7 Sonnet est maintenant disponible sur tous les plans Claude - y compris Free, Pro, Team, et Enterprise - ainsi que l'API Anthropic, Amazon Bedrock, et Google Cloud's Vertex AI. Le mode de réflexion étendu est disponible sur toutes les surfaces à l'exception du niveau Claude gratuit.

En mode de réflexion standard et étendu, Claude 3.7 Sonnet a le même prix que ses prédécesseurs : 3 $ par million de jetons d'entrée et 15 $ par million de jetons de sortie, ce qui inclut les jetons de réflexion.

Présentation de Claude 3.7 Sonnet

Selon Anthropic, Claude 3.7 Sonnet a été développé avec une philosophie différente des autres modèles de raisonnement sur le marché : "tout comme les humains utilisent un seul cerveau pour les réponses rapides et la réflexion profonde, nous pensons que le raisonnement devrait être une capacité intégrée des modèles de frontière plutôt qu'un modèle entièrement séparé." Claude 3.7 Sonnet résulterait donc d'une approche unifiée pour une expérience plus transparente pour les utilisateurs.

Claude 3.7 Sonnet est à la fois un LLM ordinaire et un modèle de raisonnement : il est possible de choisir quand vous voulez que le modèle réponde normalement et quand vous voulez qu'il réfléchisse plus longtemps avant de répondre. En mode standard, Claude 3.7 Sonnet représente une version améliorée de Claude 3.5 Sonnet. En mode de réflexion étendue, il réfléchit avant de répondre, ce qui améliore ses performances en mathématiques, physique, suivi d'instructions, codage et bien d'autres tâches. L'incitation au modèle fonctionnerait de la même manière dans les deux modes.

Puis à travers l'API, les utilisateurs peuvent également contrôler le budget de réflexion de Claude 3.7 Sonnet : vous pourrez dire à Claude de réfléchir pendant un maximum de N jetons, pour n'importe quelle valeur de N jusqu'à sa limite de 128 000 jetons. Cela permet d'arbitrer entre la vitesse (et le coût) et la qualité de la réponse.

En outre, Anthropic a optimisé un peu moins pour les problèmes de concours de mathématiques et d'informatique ses modèles de raisonnement, et s'est concentrés sur des tâches du monde réel qui reflètent mieux la façon dont les entreprises utilisent réellement les LLM.

Les premiers tests ont démontré la supériorité de Claude en matière de capacités de codage : Cursor a noté que "Claude est une fois de plus le meilleur de sa catégorie pour les tâches de codage dans le monde réel, avec des améliorations significatives dans des domaines allant de la gestion de bases de code complexes à l'utilisation d'outils avancés." Cognition l'a trouvé "bien meilleur que n'importe quel autre modèle pour planifier les changements de code et gérer les mises à jour de l'ensemble de la pile." Vercel a souligné "la précision exceptionnelle de Claude pour les flux de travail complexes des agents", tandis que Replit a déployé Claude avec succès "pour construire des applications web et des tableaux de bord sophistiqués à partir de zéro, là où d'autres modèles achoppent." Dans les évaluations de Canva, Claude a toujours produit du code prêt à la production "avec un goût du design supérieur et une réduction drastique des erreurs."

Présentation de Claude Code et d'autre améliorations pour le codage avec Claude

Anthropic annonce Claude Code, son premier outil de codage agentique, dans un aperçu de recherche limité. Claude Code est un collaborateur actif qui peut rechercher et lire du code, éditer des fichiers, écrire et exécuter des tests, livrer et déposer du code sur GitHub, et utiliser des outils de ligne de commande, tout en gardant l'utilisateur dans la boucle à chaque étape.

Claude Code est un produit précoce mais Anthropic affirme que son équipe le trouve indispensable, "en particulier pour le développement piloté par les tests, le débogage de problèmes complexes et le remaniement à grande échelle." Ils rapportent notamment : "Lors des premiers tests, Claude Code a accompli en une seule fois des tâches qui auraient normalement nécessité plus de 45 minutes de travail manuel, réduisant ainsi le temps de développement et les coûts indirects."

Anthropic continue d'améliorer les fonctionnalités de Claude Code : amélioration de la fiabilité des appels d'outils, ajout d'un support pour les commandes de longue durée, amélioration du rendu dans l'application, et développement de la compréhension de ses propres capacités par Claude. Ce programme d'accès anticitpé permettra à Anthropic d'obtenir les suggéstions des utilisateurs.

En outre, Anthropic a également amélioré l'expérience de codage sur Claude.ai. L'intégration GitHub est maintenant disponible sur tous les plans de Claude - permettant aux développeurs de connecter leurs dépôts de code directement à Claude. Claude 3.7 Sonnet est le meilleur modèle de codage d'Anthropic à ce jour, et la startup affirme : "Avec une meilleure compréhension de vos projets personnels, professionnels et open source, il devient un partenaire plus puissant pour corriger les bugs, développer des fonctionnalités et construire de la documentation sur vos projets GitHub les plus importants."

Lors de l'annonce de Claude 3.7 Sonnet et de Claude Code, Anthropiic a également rappellé sa politique de développement responsable et ses plans pour le futur :

Construire de manière responsable

Nous avons mené des tests et des évaluations approfondis de Claude 3.7 Sonnet, en travaillant avec des experts externes pour nous assurer qu'il répond à nos normes de sécurité, de sûreté et de fiabilité. Claude 3.7 Sonnet fait également des distinctions plus nuancées entre les requêtes nuisibles et bénignes, réduisant les refus inutiles de 45% par rapport à son prédécesseur.

La carte système de cette version couvre les nouveaux résultats de sécurité dans plusieurs catégories, fournissant une ventilation détaillée de nos évaluations de la politique de mise à l'échelle responsable que d'autres laboratoires d'IA et chercheurs peuvent appliquer à leur travail. La fiche aborde également les risques émergents liés à l'utilisation des ordinateurs, en particulier les attaques par injection rapide, et explique comment nous évaluons ces vulnérabilités et formons Claude à y résister et à les atténuer. En outre, elle examine les avantages potentiels des modèles de raisonnement en matière de sécurité : la capacité de comprendre comment les modèles prennent des décisions, et si le raisonnement du modèle est véritablement digne de confiance et fiable. Pour en savoir plus, lisez la fiche complète du système.

Perspectives d'avenir

Claude 3.7 Sonnet et Claude Code marquent une étape importante vers des systèmes d'IA qui peuvent réellement augmenter les capacités humaines. Avec leur capacité à raisonner en profondeur, à travailler de manière autonome et à collaborer efficacement, ils nous rapprochent d'un avenir où l'IA enrichira et élargira ce que l'homme peut accomplir.

Nous sommes impatients de vous voir explorer ces nouvelles possibilités et de voir ce que vous allez créer avec elles. Comme toujours, vos commentaires sont les bienvenus, car nous continuons à améliorer et à faire évoluer nos modèles.

Source : Anthropic

Et vous ?

Pensez-vous que cette annonce est crédible ou pertinente ?

Quel est votre avis sur le sujet ?

Voir aussi :

Claude, le chatbot IA d'Anthropic, peut désormais écrire et exécuter du code JavaScript. L'entreprise a lancé un nouvel outil d'analyse qui permet à Claude d'analyser des ensembles de données divers

Anthropic affirme que son IA Claude peut s'adapter à votre style d'écriture unique en ajoutant des styles personnalisés qui permettront aux utilisateurs de mieux contrôler le chatbot

Les leaders de l'industrie technologique restent réticents à adopter les agents d'IA malgré la pression des fournisseurs, selon une enquête réalisée par le Wall Street Journal CIO Network Summit

Vous avez lu gratuitement 1 478 articles depuis plus d'un an.
Soutenez le club developpez.com en souscrivant un abonnement pour que nous puissions continuer à vous proposer des publications.

Une erreur dans cette actualité ? Signalez-nous-la !

Votre nom : Votre e-mail :

Décrivez l'erreur que vous souhaitez porter à notre connaissance :

Identifiez-vous

Créer un compte

Anthropic annonce Claude 3.7 Sonnet, un modèle qui donne un contrôle sur le temps que l'IA passe à "réfléchir" avant de générer une réponse, et Claude Code, un agent IA de codage en ligne de commande

Identifiant
Mot de passe

Mot de passe oublié ?