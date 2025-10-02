Le modèle d'intelligence artificielle (IA) Claude Sonnet 4.5 d'Anthropic a développé de manière autonome une application de messagerie similaire à Slack en seulement 30 heures, générant environ 11 000 lignes de code sans aucune intervention. Cette prouesse marque une avancée significative par rapport à son prédécesseur, Claude Opus 4, et souligne le potentiel de la technologie à remodeler le secteur du développement logiciel, malgré les préoccupations éthiques liées à la suppression d'emplois dans ce domaine.
Anthropic PBC est une start-up américaine spécialisée dans l'IA fondée en 2021 par d'anciens membres d'OpenAI. Elle développe une famille de grands modèles de langage (LLM) baptisée Claude. Selon l'entreprise, Anthropic mène des recherches et développe des IA afin « d'étudier leurs propriétés de sécurité à la frontière technologique » et utilise ces recherches pour déployer des modèles sûrs pour le public. En septembre 2025, Anthropic a été la quatrième entreprise privée la plus valorisée au monde, avec une valeur estimée à plus de 183 milliards de dollars.
Pour rappel, Claude Sonnet 4.5 a été lancé par Anthropic à la fin du mois de septembre 2025. L'entreprise décrit ce modèle d'intelligence artificielle comme étant plus performant que ses prédécesseurs en matière de codage, d'utilisation des ordinateurs et de réponse aux besoins pratiques des entreprises. Selon Mike Krieger, directeur produit chez Anthropic, Claude Sonnet 4.5 est plus petit que Claude Opus 4.1, mais plus intelligent que ce dernier « à presque tous les égards ».
Dans une démonstration remarquable des capacités évolutives de l'IA, Anthropic a dévoilé que son dernier modèle Claude Sonnet 4.5 a construit de manière autonome une application de chat entièrement fonctionnelle, similaire à Slack ou Microsoft Teams, au cours d'une session continue de 30 heures. L'IA a généré environ 11 000 lignes de code, ne s'arrêtant qu'une fois la tâche terminée. Cette prouesse représente une avancée considérable par rapport à son prédécesseur, le modèle Opus 4, qui ne pouvait fonctionner que pendant des durées plus courtes avant de nécessiter une intervention humaine.
Cette expérience montre comment l'IA repousse les limites du développement logiciel, pouvant potentiellement transformer la manière dont les ingénieurs abordent les projets complexes.
Les ingénieurs d'Anthropic ont fourni au modèle des spécifications de haut niveau pour une plateforme de messagerie, notamment la communication en temps réel, l'authentification des utilisateurs et la gestion des canaux. Sans autres instructions, Claude Sonnet 4.5 a procédé à l'architecture du système, en écrivant du code dans des langages tels que JavaScript et Python, en intégrant des bases de données et même en gérant les configurations de déploiement.
Codage autonome : un bond en avant en matière d'endurance et de complexité de l'IA
Cette durée d'exécution prolongée souligne une innovation clé dans la conception du modèle : des algorithmes améliorés de rétention du contexte et de prise de décision qui lui permettent de rester concentré pendant de longues périodes, surpassant de loin les itérations précédentes qui s'épuisaient après quelques heures seulement. Les observateurs du secteur notent qu'une telle autonomie pourrait accélérer le prototypage dans les entreprises technologiques, où les pressions liées aux délais de mise sur le marché sont intenses.
Les détails de la session révèlent l'approche méthodique de l'IA, qui décompose l'application de type Slack en composants modulaires. Elle a commencé par l'infrastructure backend, en intégrant WebSocket pour les mises à jour en temps réel, puis a ajouté des éléments frontend à l'aide de frameworks tels que React. La capacité du modèle à déboguer et à itérer en interne, sans invites externes, suggère un comportement « agentique » mature, dans lequel l'IA agit davantage comme un ingénieur autonome.
Du prototype à la production : implications pour le génie logiciel
Anthropic affirme que cette version est suffisamment robuste pour créer des applications prêtes à être mises en production, et pas seulement des prototypes. Cela positionne Claude Sonnet 4.5 comme un leader dans les benchmarks de codage, surpassant ses concurrents tels que Gemini de Google dans les tâches nécessitant un raisonnement soutenu.
Les comparaisons avec les modèles précédents sont frappantes. Alors qu'Opus 4 pouvait refactoriser du code pendant environ sept heures, le marathon de 30 heures de la nouvelle version démontre des améliorations exponentielles en termes d'efficacité et de volume de production. Les développeurs qui expérimentent des outils similaires ont partagé des anecdotes sur l'IA générant des milliers de lignes pour des clones d'applications telles que Sentry, bien que cela ne se fasse pas sans quelques limitations contextuelles occasionnelles.
Défis et considérations éthiques liés au développement basé sur l'IA
Malgré l'enthousiasme suscité, les experts mettent en garde contre les pièges potentiels, notamment les incohérences dans la qualité du code et le risque de propagation des biais dans les systèmes automatisés. Anthropic a mis l'accent sur les mesures de protection, mais la généralisation de cette technologie soulève des questions quant à la suppression d'emplois dans le domaine du codage.
L'ensemble du secteur en prend bonne note, et les concurrents s'empressent de rattraper leur retard. Les publications sur X de développeurs tels que ceux qui créent des wrappers autour du SDK de Claude illustrent un écosystème en pleine croissance, où les outils d'IA sont intégrés dans les flux de travail pour une itération rapide. Comme l'a confié un ingénieur anonyme sur la plateforme, grâce à des modèles comme celui-ci, la mise en service de fonctionnalités qui prenait auparavant des semaines ne prend désormais que quelques heures.
Perspectives d'avenir : étendre l'autonomie de l'IA au-delà de 30 heures
À l'avenir, la feuille de route d'Anthropic laisse entrevoir des sessions autonomes encore plus longues, susceptibles de révolutionner la création de logiciels d'entreprise. Pour les initiés, il ne s'agit pas seulement de lignes de code, mais d'un signe que l'IA pourrait bientôt prendre en charge des cycles de développement de bout en bout, de la conception au déploiement, modifiant ainsi fondamentalement l'économie de l'innovation technologique.
La récente expérience d'Anthropic sinscrit dans une continuité dinitiatives menées par l'entreprise autour de son écosystème de modèles d'IA. Anthropic a en effet récemment introduit des améliorations à Claude Code, alimenté par Sonnet 4.5. Ces améliorations comprennent notamment une extension native VS Code qui intègre Claude Code directement dans l'EDI, la version 2.0 de l'interface du terminal et des points de contrôle pour un fonctionnement autonome, ainsi que la capacité de Claude Code à gérer des tâches de développement plus longues et plus complexes.
Cette course technologique soulève toutefois de profondes inquiétudes. Dario Amodei, le PDG dAnthropic, a récemment averti quune « hécatombe des travailleurs du savoir » se préparait. Selon lui, la technologie que lui et d'autres sociétés sont en train de mettre au point pourrait faire disparaître la moitié des emplois de bureau de niveau débutant dans les cinq prochaines années. Il a également déclaré que « l'IA commence à devenir meilleure que les humains dans presque toutes les tâches intellectuelles. » Sommes-nous en train d'assister au grand remplacement des salariés de bureau par l'IA ?
Et vous ?
Quel est votre avis sur le sujet ?
Trouvez-vous cette initiative d'Anthropic crédible ou pertinente ?
Pensez-vous que ces avancées permettront de réduire considérablement les délais de mise sur le marché pour les entreprises technologiques ?
Voir aussi :
Le « premier ingénieur logiciel IA » loin d'être à la hauteur : Devin a un taux de réussite de 15 %, des chercheurs notent que l'IA prend des jours pour faire des tâches simples qui auraient pris des heures
L'IA peut écrire du code mais ne parvient pas à le comprendre, selon une étude d'OpenAI. Testés sur des tâches réelles de programmation, les modèles les plus avancés n'ont pu résoudre qu'un quart des défis
Une étude révèle que les outils d'IA de codage ralentissent les développeurs tout en leur donnant l'illusion d'être plus rapides, ils ont mis 19 % plus de temps à accomplir les tâches de codage
