IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)

Vous êtes nouveau sur Developpez.com ? Créez votre compte ou connectez-vous afin de pouvoir participer !

Vous devez avoir un compte Developpez.com et être connecté pour pouvoir participer aux discussions.

Vous n'avez pas encore de compte Developpez.com ? Créez-en un en quelques instants, c'est entièrement gratuit !

Si vous disposez déjà d'un compte et qu'il est bien activé, connectez-vous à l'aide du formulaire ci-dessous.

Identifiez-vous
Identifiant
Mot de passe
Mot de passe oublié ?
Créer un compte

L'inscription est gratuite et ne vous prendra que quelques instants !

Je m'inscris !

Anthropic annonce Claude 3.7 Sonnet, un modèle qui donne un contrôle sur le temps que l'IA passe à "réfléchir" avant de générer une réponse, et Claude Code, un agent IA de codage en ligne de commande

Le , par Jade Emy

2PARTAGES

5  0 
Anthropic annonce Claude 3.7 Sonnet, un modèle qui donne un contrôle sur le temps que l'IA passe à "réfléchir" avant de générer une réponse, et Claude Code, un agent IA de codage en ligne de commande.

Anthropic a dévoilé son dernier modèle frontière, Claude 3.7 Sonnet, et affirme qu'il s'agit de la version la plus "intelligente" de l'entreprise à ce jour. Ce modèle hybride combine une capacité de raisonnement, c'est-à-dire le fait de s'arrêter pour réfléchir à des réponses complexes, avec un modèle traditionnel qui produit des réponses en temps réel. "Nous voulons une IA cohérente qui puisse nous aider dans tous les domaines", a déclaré Jared Kaplan, cofondateur et directeur scientifique d'Anthropic.

À l'heure où les startups et les géants de la technologie, qui bénéficient d'un financement important, s'efforcent d'obtenir la plus grande avance possible en matière d'intelligence artificielle, Anthropic affirme avoir mis au point le modèle d'IA "le plus intelligent" de l'entreprise. Pour rappel, Anthropic est la dernière startup d'IA en date à discuter d'une levée de fonds de 2 milliards de dollars dans le cadre d'une opération qui la valoriserait à 60 milliards de dollars.

Anthropic a récemment dévoilé Claude 3.7 Sonnet. Ce qui le rend unique, c'est son modèle dit hybride, qui combine une capacité à raisonner ou à s'arrêter pour réfléchir à des réponses complexes avec un modèle traditionnel qui donne des réponses en temps réel. "Ce modèle regroupe toutes les capacités - nous voulons une IA cohérente qui puisse nous aider dans tous les domaines", a déclaré Jared Kaplan, cofondateur et responsable scientifique d'Anthropic. "Il y a un avantage à la simplicité pour nos clients."

Anthropic affirme qu'il s'agit du seul modèle "hybride" de ce type disponible sur le marché, et qu'il sera mis en service immédiatement. Kaplan compare ce modèle au fonctionnement du cerveau humain. Certaines questions nécessitent une réflexion approfondie, d'autres des réponses rapides. Anthropic cherche à intégrer les deux capacités, plutôt que d'avoir un modèle entièrement distinct pour chacune d'entre elles.


Cette initiative pourrait donner à Anthropic une longueur d'avance sur son rival OpenAI et sur les grandes entreprises technologiques qui investissent toutes massivement dans des modèles d'IA. Le chatbot Claude d'Anthropic est un concurrent de ChatGPT d'OpenAI et de Gemini de Google.

Le chef de produit d'Anthropic, Mike Krieger, qui a cofondé Instagram, a déclaré que l'approche hybride est un moyen de simplifier le processus de chatbot pour les clients. Ils peuvent utiliser plusieurs capacités sans avoir à se demander quelle est la meilleure option. "Les modèles ont tous des personnalités, ils sont tous un peu différents", a déclaré Krieger, ajoutant que c'est "beaucoup" d'avoir des consommateurs qui choisissent le modèle, ou combien de temps ils veulent qu'il raisonne. "J'aimerais que les gens, les utilisateurs finaux, n'aient pas à réfléchir à cela".

Krieger estime que les utilisateurs devraient pouvoir activer ou désactiver l'option hybride pour plus de simplicité. Ils peuvent lui attribuer un "budget" de temps en fonction de ce sur quoi ils travaillent. Anthropic lancera également un outil de codage utilisant des agents.

La startup a remporté quelques victoires en lançant des produits avant ses concurrents. Elle a également été la première à dévoiler une capacité d'"agent" largement disponible à la fin de l'année dernière, suivie peu après par OpenAI. Krieger et Kaplan ont tous deux déclaré qu'ils s'attendaient à ce que les concurrents s'orientent dans cette direction avec des modèles hybrides.

Le PDG d'OpenAI, Sam Altman, a laissé entendre qu'il s'engagerait dans une voie similaire plus tôt en février. Dans un billet publié sur X, Altman a déclaré que son entreprise d'IA prévoyait de "mieux partager notre feuille de route et de simplifier davantage nos offres de produits". "Nous détestons le sélecteur de modèles autant que vous et nous voulons revenir à une intelligence unifiée magique", a écrit Altman.

Fait ironique, même si Anthropic produit des solutions d'IA de pointe, la startup a mis en place une "politique de l'IA" à l'intention des candidats à l'emploi, qui décourage l'utilisation de la technologie au cours du processus de candidature. L'entreprise explique qu'elle souhaite mettre en valeur les compétences en communication humaine des candidats. Anthropic est connue pour ses innovations en matière d'IA, mais l'entreprise ne veut pas que les candidats utilisent cette technologie.

Voici l'annonce d'Anthropic :

Aujourd'hui, nous annonçons Claude 3.7 Sonnet, notre modèle le plus intelligent à ce jour et le premier modèle de raisonnement hybride sur le marché. Claude 3.7 Sonnet peut produire des réponses quasi-instantanées ou des raisonnements détaillés, étape par étape, qui sont rendus visibles à l'utilisateur. Les utilisateurs de l'API peuvent également contrôler finement la durée de réflexion du modèle.

Claude 3.7 Sonnet présente des améliorations particulièrement importantes en matière de codage et de développement web frontal. Avec le modèle, nous introduisons également un outil de ligne de commande pour le codage agentique, Claude Code. Claude Code est disponible en avant-première de recherche limitée, et permet aux développeurs de déléguer des tâches d'ingénierie substantielles à Claude directement à partir de leur terminal.

Claude 3.7 Sonnet est maintenant disponible sur tous les plans Claude - y compris Free, Pro, Team, et Enterprise - ainsi que l'API Anthropic, Amazon Bedrock, et Google Cloud's Vertex AI. Le mode de réflexion étendu est disponible sur toutes les surfaces à l'exception du niveau Claude gratuit.

En mode de réflexion standard et étendu, Claude 3.7 Sonnet a le même prix que ses prédécesseurs : 3 $ par million de jetons d'entrée et 15 $ par million de jetons de sortie, ce qui inclut les jetons de réflexion.

Présentation de Claude 3.7 Sonnet

Selon Anthropic, Claude 3.7 Sonnet a été développé avec une philosophie différente des autres modèles de raisonnement sur le marché : "tout comme les humains utilisent un seul cerveau pour les réponses rapides et la réflexion profonde, nous pensons que le raisonnement devrait être une capacité intégrée des modèles de frontière plutôt qu'un modèle entièrement séparé." Claude 3.7 Sonnet résulterait donc d'une approche unifiée pour une expérience plus transparente pour les utilisateurs.

Claude 3.7 Sonnet est à la fois un LLM ordinaire et un modèle de raisonnement : il est possible de choisir quand vous voulez que le modèle réponde normalement et quand vous voulez qu'il réfléchisse plus longtemps avant de répondre. En mode standard, Claude 3.7 Sonnet représente une version améliorée de Claude 3.5 Sonnet. En mode de réflexion étendue, il réfléchit avant de répondre, ce qui améliore ses performances en mathématiques, physique, suivi d'instructions, codage et bien d'autres tâches. L'incitation au modèle fonctionnerait de la même manière dans les deux modes.

Puis à travers l'API, les utilisateurs peuvent également contrôler le budget de réflexion de Claude 3.7 Sonnet : vous pourrez dire à Claude de réfléchir pendant un maximum de N jetons, pour n'importe quelle valeur de N jusqu'à sa limite de 128 000 jetons. Cela permet d'arbitrer entre la vitesse (et le coût) et la qualité de la réponse.

En outre, Anthropic a optimisé un peu moins pour les problèmes de concours de mathématiques et d'informatique ses modèles de raisonnement, et s'est concentrés sur des tâches du monde réel qui reflètent mieux la façon dont les entreprises utilisent réellement les LLM.



Les premiers tests ont démontré la supériorité de Claude en matière de capacités de codage : Cursor a noté que "Claude est une fois de plus le meilleur de sa catégorie pour les tâches de codage dans le monde réel, avec des améliorations significatives dans des domaines allant de la gestion de bases de code complexes à l'utilisation d'outils avancés." Cognition l'a trouvé "bien meilleur que n'importe quel autre modèle pour planifier les changements de code et gérer les mises à jour de l'ensemble de la pile." Vercel a souligné "la précision exceptionnelle de Claude pour les flux de travail complexes des agents", tandis que Replit a déployé Claude avec succès "pour construire des applications web et des tableaux de bord sophistiqués à partir de zéro, là où d'autres modèles achoppent." Dans les évaluations de Canva, Claude a toujours produit du code prêt à la production "avec un goût du design supérieur et une réduction drastique des erreurs."


Présentation de Claude Code et d'autre améliorations pour le codage avec Claude

Anthropic annonce Claude Code, son premier outil de codage agentique, dans un aperçu de recherche limité. Claude Code est un collaborateur actif qui peut rechercher et lire du code, éditer des fichiers, écrire et exécuter des tests, livrer et déposer du code sur GitHub, et utiliser des outils de ligne de commande, tout en gardant l'utilisateur dans la boucle à chaque étape.

Claude Code est un produit précoce mais Anthropic affirme que son équipe le trouve indispensable, "en particulier pour le développement piloté par les tests, le débogage de problèmes complexes et le remaniement à grande échelle." Ils rapportent notamment : "Lors des premiers tests, Claude Code a accompli en une seule fois des tâches qui auraient normalement nécessité plus de 45 minutes de travail manuel, réduisant ainsi le temps de développement et les coûts indirects."

Anthropic continue d'améliorer les fonctionnalités de Claude Code : amélioration de la fiabilité des appels d'outils, ajout d'un support pour les commandes de longue durée, amélioration...
La fin de cet article est réservée aux abonnés. Soutenez le Club Developpez.com en prenant un abonnement pour que nous puissions continuer à vous proposer des publications.

Une erreur dans cette actualité ? Signalez-nous-la !