IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)

Vous êtes nouveau sur Developpez.com ? Créez votre compte ou connectez-vous afin de pouvoir participer !

Vous devez avoir un compte Developpez.com et être connecté pour pouvoir participer aux discussions.

Vous n'avez pas encore de compte Developpez.com ? Créez-en un en quelques instants, c'est entièrement gratuit !

Si vous disposez déjà d'un compte et qu'il est bien activé, connectez-vous à l'aide du formulaire ci-dessous.

Identifiez-vous
Identifiant
Mot de passe
Mot de passe oublié ?
Créer un compte

L'inscription est gratuite et ne vous prendra que quelques instants !

Je m'inscris !

Anthropic a publié une version améliorée de son modèle d'IA Claude 3.5 Sonnet et a annoncé Claude 3.5 Haiku, ainsi qu'une version bêta publique de la fonctionnalité "utilisation de l'ordinateur"

Le , par Jade Emy

10PARTAGES

6  0 
Anthropic introduit l'"utilisation de l'ordinateur", une fonctionnalité où l'IA a été formée avec des compétences informatiques générales. La société présente la version améliorée de Claude 3.5 Sonnet qui offrirait de meilleures performances au même prix et à la même vitesse que son prédécesseur. Anthropic présente également le nouveau modèle Claude 3.5 Haiku, une version entre l'accessibilité et la rapidité.

Anthropic a lancé Claude 3.5 Sonnet en juin 2024, affirmant qu'il est plus performant que les modèles précédents et que le GPT-4 Omni d'OpenAI. Claude 3.5 Sonnet fonctionne deux fois plus vite que Claude 3 Opus. Cette augmentation des performances, combinée à un prix avantageux, ferait de Claude 3.5 Sonnet la solution idéale pour les tâches complexes telles que le support client contextuel et l'orchestration de flux de travail à plusieurs étapes, d'après Anthropic.

Le 22 octobre 2024, Anthropic a publié une version améliorée de son modèle d'IA Claude 3.5 Sonnet et a annoncé un nouveau modèle, Claude 3.5 Haiku, ainsi qu'une fonction bêta publique permettant à l'IA d'utiliser les ordinateurs comme des humains. Le modèle Sonnet amélioré offrirait de meilleures capacités de codage, obtenant un score de 49 % sur le benchmark SWEbench Verified. Le modèle Haiku atteint les mêmes performances que le modèle phare d'Anthropic, le Claude 3 Opus, tout en restant moins cher et plus rapide.

La fonction d'utilisation de l'ordinateur, disponible via l'API d'Anthropic et les partenaires cloud, permet à Claude d'effectuer des tâches telles que naviguer sur des navigateurs web, remplir des formulaires et manipuler des données. Parmi les premiers utilisateurs figurent Asana, DoorDash et Replit, bien qu'Anthropic - soutenu par des investisseurs tels que Google et Amazon - reconnaisse que cette fonctionnalité reste expérimentale et sujette aux erreurs. Claude 3.5 Haiku sera lancé dans le courant du mois, prenant en charge dans un premier temps les saisies de texte uniquement, et dans un second temps les saisies d'images.


Voici les déclarations d'Anthropic pour l'annonce :

Aujourd'hui, nous annonçons une version améliorée de Claude 3.5 Sonnet et un nouveau modèle, Claude 3.5 Haiku. La version améliorée de Claude 3.5 Sonnet apporte des améliorations générales par rapport à son prédécesseur, avec des gains particulièrement significatifs en matière de codage - un domaine dans lequel il était déjà en tête. Claude 3.5 Haiku égale les performances de Claude 3 Opus, notre plus grand modèle précédent, sur de nombreuses évaluations pour le même coût et une vitesse similaire à la génération précédente de Haiku.

Nous introduisons également une nouvelle fonctionnalité révolutionnaire dans la version bêta publique : l'utilisation de l'ordinateur. Disponible dès aujourd'hui sur l'API, les développeurs peuvent demander à Claude d'utiliser les ordinateurs comme le font les gens, en regardant un écran, en déplaçant un curseur, en cliquant sur des boutons et en tapant du texte. Claude 3.5 Sonnet est le premier modèle d'IA d'avant-garde à proposer l'utilisation d'un ordinateur en version bêta publique. À ce stade, il s'agit encore d'une méthode expérimentale, parfois lourde et sujette aux erreurs. Nous publions l'utilisation de l'ordinateur de manière anticipée afin de recueillir les commentaires des développeurs, et nous nous attendons à ce que cette fonctionnalité s'améliore rapidement au fil du temps.

Asana, Canva, Cognition, DoorDash, Replit et The Browser Company ont déjà commencé à explorer ces possibilités, en effectuant des tâches qui nécessitent des dizaines, voire des centaines d'étapes. Par exemple, Replit utilise les capacités de Claude 3.5 Sonnet en matière d'utilisation de l'ordinateur et de navigation dans l'interface utilisateur pour développer une fonctionnalité clé qui évalue les applications au fur et à mesure de leur création pour leur produit Replit Agent.

La version améliorée de Claude 3.5 Sonnet est maintenant disponible pour tous les utilisateurs. A partir d'aujourd'hui, les développeurs peuvent construire avec la version bêta de l'utilisation de l'ordinateur sur l'API Anthropic, Amazon Bedrock, et Google Cloud's Vertex AI. La nouvelle version Claude 3.5 Haiku sera disponible dans le courant du mois.

Présentation de la version améliorée de Claude 3.5 Sonnet

La mise à jour de Claude 3.5 Sonnet montre de nombreuses améliorations sur les benchmarks de l'industrie, avec des gains particulièrement importants dans les tâches de codage agentique et d'utilisation d'outils. En ce qui concerne le codage, il améliore les performances sur le banc SWE Verified de 33,4 % à 49,0 %, obtenant un score plus élevé. Il améliore également les performances sur TAU-bench, une tâche d'utilisation d'outils agentiques, de 62,6 % à 69,2 % dans le domaine de la vente au détail, et de 36,0 % à 46,0 % dans le domaine plus difficile des compagnies aériennes. Le nouveau Claude 3.5 Sonnet offre ces avancées au même prix et à la même vitesse que son prédécesseur.

Les premiers retours des clients suggèrent que la version améliorée de Claude 3.5 Sonnet représente une avancée significative pour le codage alimenté par l'IA. GitLab, qui a testé le modèle pour des tâches DevSecOps, a constaté qu'il offrait un raisonnement plus fort (jusqu'à 10 % selon les cas d'utilisation) sans latence supplémentaire, ce qui en fait un choix idéal pour alimenter les processus de développement de logiciels en plusieurs étapes. Cognition utilise le nouveau Claude 3.5 Sonnet pour les évaluations d'IA autonomes, et a constaté des améliorations substantielles dans le codage, la planification et la résolution de problèmes par rapport à la version précédente. The Browser Company, en utilisant le modèle pour automatiser les flux de travail basés sur le web, a noté que Claude 3.5 Sonnet surpassait tous les modèles qu'ils avaient testés auparavant.

Concernant la sécurité du modèle, Anthropic annonce avoir mené des tests conjoints de pré-déploiement du nouveau modèle Claude 3.5 Sonnet en partenariat avec l'US AI Safety Institute (US AISI) et l'UK Safety Institute (UK AISI). Anthropic aurait également évalué les risques catastrophiques de la version améliorée de Claude 3.5 Sonnet et avons constaté que la norme ASL-2, dans sa politique de mise à l'échelle responsable, reste appropriée pour le modèle.

Claude 3.5 Haiku : une modèle entre l'accessibilité et la rapidité

Claude 3.5 Haiku est la nouvelle génération de Claude 3 Haiku, qu'Anthropic qualifie de modèle "le plus rapide". Pour le même coût et une vitesse similaire, Claude 3.5 Haiku s'améliore dans tous les domaines de compétences et surpasse même Claude 3 Opus, le plus grand modèle de la génération précédente, sur de nombreux benchmarks d'intelligence. Claude 3.5 Haiku serait particulièrement performant dans les tâches de codage. Par exemple, il obtient un score de 40,6 % sur le banc d'essai SWE Verified, surpassant de nombreux agents utilisant des modèles de pointe publiquement disponibles, y compris le Claude 3.5 Sonnet original et le GPT-4o.

Avec une faible latence, un meilleur suivi des instructions et une utilisation plus précise des outils, Claude 3.5 Haiku serait bien adapté aux produits destinés aux utilisateurs, aux tâches spécialisées des sous-agents et à la génération d'expériences personnalisées à partir d'énormes volumes de données, comme l'historique des achats, les prix ou les registres d'inventaire. Claude 3.5 Haiku sera disponible dans le courant du mois d'octobre 2024 à travers les API Amazon Bedrock et Vertex AI de Google Cloud - initialement en tant que modèle texte uniquement et avec une entrée d'image à suivre.


Apprendre à Claude à naviguer sur les ordinateurs de manière responsable

En ce qui concerne l'utilisation des ordinateurs, Anthropic souhaite présenter quelque chose de fondamentalement nouveau. Au lieu de créer des outils spécifiques pour aider Claude à accomplir des tâches individuelles, Anthropic aurait enseigner des compétences informatiques générales, pour permettre au modèle d'utiliser une large gamme d'outils et de logiciels standard conçus pour les humains. Les développeurs peuvent utiliser cette capacité naissante pour automatiser des processus répétitifs, construire et tester des logiciels, et mener des tâches ouvertes comme la recherche....
La fin de cet article est réservée aux abonnés. Soutenez le Club Developpez.com en prenant un abonnement pour que nous puissions continuer à vous proposer des publications.

Une erreur dans cette actualité ? Signalez-nous-la !

Avatar de rsuinux
Membre actif https://www.developpez.com
Le 25/10/2024 à 20:13
J'attend la prise en main de cet ia pas un utilisateur non désiré, qui ira faire cliquer pour virer de l'argent a l'étranger. Et on dira: ah, mais c'est vous qui avez cliqué, c'est votre ordinateur.
Quasi un piratage par l'IA.
2  0 
Avatar de _toma_
Membre éclairé https://www.developpez.com
Le 25/10/2024 à 12:45
sudo apt install xdotool (82.7 ko)
1  0