Cet apport porte à 4 milliards de dollars l'investissement total d'Amazon dans Anthropic, un constructeur réputé d'outils d'IA capables de générer du texte et de l'analyse, à la suite d'un investissement précédent annoncé en septembre. Dans le cadre de cet accord, Amazon avait le droit d'apporter des fonds supplémentaires sous la forme d'une note convertible, à condition de le faire avant la fin du mois de mars.
Dans le cadre de ce partenariat, Anthropic a également accepté d'utiliser les centres de données d'Amazon Web Services pour alimenter certaines de ses opérations et d'utiliser les puces informatiques personnalisées d'Amazon. Anthropic, basée à San Francisco, s'est également engagée à utiliser les puces de Google, un autre partenaire proche d'Alphabet.
Envoyé par Amazon
Des investissements très lucratifs pour les entreprises technologiques
Les entreprises technologiques et les investisseurs en capital-risque ont injecté de l'argent dans les startups spécialisées dans l'IA à la suite du succès de ChatGPT d'Open AI. Selon le cabinet d'études PitchBook, plus de 29 milliards de dollars ont été investis dans des entreprises d'IA générative l'année dernière. Microsoft a accepté d'investir 13 milliards de dollars dans OpenAI.
Ces investissements peuvent également s'avérer très lucratifs pour les entreprises technologiques, qui facturent aux startups de l'IA l'utilisation des services d'informatique en nuage dont elles ont besoin pour faire fonctionner leurs produits. Le Wall Street Journal a rapporté à la fin de l'année dernière qu'Anthropic s'était engagé à dépenser 4 milliards de dollars sur la plateforme cloud d'Amazon au cours des cinq prochaines années, citant des personnes familières avec le sujet.
« Nous avons une histoire notable avec Anthropic, aidant ensemble des organisations de toutes tailles à travers le monde à déployer des applications avancées d'intelligence artificielle générative dans leurs organisations », a déclaré le Dr Swami Sivasubramanian, vice-président des données et de l'IA chez AWS. « Le travail visionnaire d'Anthropic dans le domaine de l'IA générative, et plus récemment l'introduction de sa famille de modèles Claude 3 à la pointe de la technologie, combiné à l'infrastructure de premier ordre d'Amazon, comme AWS Tranium, et aux services gérés comme Amazon Bedrock, ouvrent de nouvelles perspectives aux clients pour innover rapidement, en toute sécurité et de manière responsable avec l'IA générative. L'IA générative est en passe de devenir la technologie la plus transformatrice de notre époque, et nous pensons que notre collaboration stratégique avec Anthropic améliorera encore l'expérience de nos clients, et nous attendons avec impatience la suite ».
Quelques mois avant l'investissement de 2 milliards de dollars de Google, Anthropic a accepté de dépenser plus de 3 milliards de dollars sur Google Cloud. OpenAI dépense des milliards sur le cloud de Microsoft.
Anthropic a été créée en 2021 par d'anciens employés d'OpenAI, dont Daniela Amodei et son frère Dario, qui en est le directeur général. L'entreprise est depuis devenue l'un des concurrents les plus redoutables d'OpenAI, levant des milliards de dollars de financement. La plupart de ses clients sont des entreprises, allant du moteur de recherche DuckDuckGo à l'éditeur de guides de voyage Lonely Planet.
L'entreprise, qui propose un chatbot nommé Claude, a mis l'accent sur le développement de l'IA en toute sécurité et de manière responsable. Début mars, elle a présenté un nouveau logiciel pour le chatbot qui, selon elle, sera plus apte à exécuter des instructions compliquées et moins enclin à inventer des choses.
La Commission fédérale du commerce a déclaré en janvier qu'elle examinait les investissements et les partenariats réalisés par les plus grandes entreprises technologiques et la manière dont ils affectent le paysage concurrentiel des systèmes d'IA, qui ont développé la capacité d'effectuer des tâches telles que converser, générer des photos et écrire des codes informatiques.
Claude 3 Opus devient le nouveau roi et sa variante la plus petite "Haiku" égale les performances d'une version de GPT-4
LMSYS (Large Model Systems Organization) est un projet sponsorisé par la startup d'IA Hugging Face. Il comprend le site Chatbot Arena qui permet de comparer les grands modèles de langage (LLM). Le site utilise le système d'évaluation Elo pour classer les modèles. (Le système d'évaluation Elo est une méthode de calcul des niveaux de compétence relatifs des joueurs dans les jeux à somme nulle comme les échecs.) Le site offre aux utilisateurs plusieurs moyens de comparer et d'évaluer les modèles. Sur la base des commentaires soumis, Chatbot Arena classe les différents modèles dans un tableau de classement public.
Dans le cadre du test, les classements Elo sont dérivés des combats en tête-à-tête entre les modèles, les évaluateurs humains votant pour déterminer le modèle le plus performant dans chaque match. Les données du classement donnent un aperçu des performances de chaque modèle :
- Claude 3 Opus a obtenu un score impressionnant de +5/-5 dans ses défis, accumulant 33 250 votes au total ;
- les modèles GPT-4 de prévisualisation ont obtenu des résultats de +4/-4 avec 54 141 et 34 825 votes, respectivement ;
- Claude 3 Sonnet a également réalisé une bonne performance, avec un score de +5/-5 lors des comparaisons et 32 761 votes ;
- Claude 3 Haiku a obtenu un score de +5/-5 lors des tests et 18 776 votes. Il égale presque les performances de l'ancien GPT-4-0314.
« Anthropic est maintenant le leader et possède le meilleur modèle d'IA au monde ! Et je suis sûr qu'ils sont déjà en train de développer Claude 4 », a écrit un critique. Selon d'autres critiques, GPT-4-Turbo est devenu très "paresseux". « Sur n'importe quelle tâche de codage, il saute des parties du code en disant : "vous savez vous-même ce qu'il faut mettre ici". Mais Claude 3 Opus peut produire un code entier sans omissions. GPT-4 a tendance à fournir des exemples de code au lieu du code littéral que vous avez fourni (c'est-à-dire qu'il travaille en tant que professeur et non comme un subordonné) », note un commentaire.
Selon les analystes, l'indice de référence Elo constitue une méthode précieuse et objective pour comparer les modèles d'IA et suivre les progrès rapides dans ce domaine. Alors que les modèles continuent d'évoluer à un rythme sans précédent, ces classements permettent d'identifier les modèles et les architectures les plus performants. GPT-4 a placé la barre très haut lors de sa sortie, mais des challengers comme Claude le dépassent aujourd'hui grâce à des architectures et des approches de formation innovantes. Selon les experts, cette concurrence dynamique est à l'origine d'innovations remarquables dans le domaine de l'IA.
Conclusion
Cette nouvelle annonce représente la deuxième tranche de financement d’Amazon. La société conservera une participation minoritaire dans Anthropic et n’aura pas de siège au conseil d’administration. Le montant de l’investissement a été fixé sur la base de la dernière valorisation de la startup, qui s’élevait à 18,4 milliards de dollars. Au cours de la dernière année, Anthropic a conclu cinq accords de financement d’une valeur totale d’environ 7,3 milliards de dollars, portant le total à plus de 10 milliards de dollars. La société se positionne comme un concurrent direct du chatbot ChatGPT d’OpenAI, tant dans le monde de l’entreprise que chez les consommateurs. Elle a été fondée par d’anciens cadres et employés d’OpenAI. Récemment, Anthropic a lancé Claude 3, sa nouvelle suite de modèles d’IA, qui se veut plus rapide et plus puissante que jamais. Cette collaboration stratégique avec Anthropic renforcera l’expérience des clients d’Amazon dans le domaine de l’intelligence artificielle générative
Source : Amazon
Et vous ?
Quelles sont les implications de cet investissement massif d’Amazon pour le domaine de l’intelligence artificielle générative ?
Comment Anthropic se positionne-t-elle par rapport à d’autres acteurs majeurs tels qu’OpenAI et ChatGPT ?
Pensez-vous que cette collaboration renforcera l’expérience des clients d’Amazon dans le domaine de l’IA générative ? Pourquoi ?
Quelles sont les opportunités et les défis pour Anthropic en tant que startup d’IA ?
En quoi Claude 3, la nouvelle suite de modèles d’IA d’Anthropic, pourrait-elle changer la donne dans le secteur ?