Claude Mythos Preview : le modèle d'IA qu'Anthropic refuse de publier a trouvé une faille vieille de 27 ans dans OpenBSD en deux jours

L'IA détecte des failles que les pirates peuvent exploiter

Le 15 avril 2026 à 09:27, par Stéphane le calme

92PARTAGES

La faille dormait dans le code depuis 27 ans. Un modèle d'intelligence artificielle l'a trouvée en deux jours. Avec Claude Mythos Preview, Anthropic vient de franchir un seuil que la communauté de la cybersécurité redoutait depuis des années : des systèmes automatisés capables de détecter et d'exploiter des vulnérabilités à une vitesse et une échelle inédites. Bienvenue dans l'ère du « bugmageddon ».

Le code avait survécu à des décennies d'audits humains. Écrit en 1998 pour OpenBSD, un système d'exploitation réputé précisément pour sa rigueur sécuritaire, il contenait une faille capable de provoquer un crash à distance sur des serveurs, des pare-feux et des équipements réseau. Niels Provos, chercheur en sécurité et ancien responsable de la sécurité chez Stripe, s'en souvient : quand il a appris la découverte, il a immédiatement vérifié si c'était lui qui avait commis l'erreur pendant son doctorat à l'Université du Michigan. C'était bien le cas. « Franchement, j'ai trouvé ça hilarant, a-t-il déclaré. Ce code est tellement vieux. Qui sait quand un humain l'a regardé pour la dernière fois. »

Ce bug de 27 ans dans OpenBSD est l'une des découvertes emblématiques de Mythos Preview, le dernier modèle frontier d'Anthropic. En tests, le modèle a prouvé sa capacité à identifier et exploiter des vulnérabilités zero-day dans chaque grand système d'exploitation et chaque navigateur web majeur. Parmi ses autres exploits documentés : une faille vieille de 16 ans dans FFmpeg, une vulnérabilité corrompant la mémoire dans un moniteur de machine virtuelle à mémoire sécurisée, et un exploit de navigateur enchaînant quatre vulnérabilités pour s'échapper simultanément du bac à sable du moteur de rendu et de celui du système d'exploitation.

Mythos Preview a découvert des milliers de vulnérabilités à haute criticité. Le budget engagé pour trouver la faille OpenBSD, avec plusieurs dizaines d'autres problèmes en parallèle, représentait environ 20 000 dollars de puissance de calcul sur deux jours.

Project Glasswing : la défense d'abord, mais pour combien de temps ?

Face à ces capacités jugées trop dangereuses pour une diffusion publique, Anthropic a opté pour une stratégie de déploiement restreint. Le modèle est accessible dans le cadre d'une initiative baptisée Project Glasswing, impliquant 12 organisations partenaires pour des travaux de sécurité défensive sur des logiciels critiques, avec 40 organisations ayant accès à la préversion au total. Parmi elles figurent Microsoft, Apple, Google, CrowdStrike et JPMorgan Chase. Anthropic engage jusqu'à 100 millions de dollars en crédits d'utilisation pour ces acteurs, ainsi que 4 millions de dollars en dons directs à des organisations de sécurité open source comme OpenSSF et la Fondation Apache.

La société précise qu'elle n'a pas explicitement entraîné Mythos Preview pour ces capacités offensives : elles sont apparues comme une conséquence indirecte des améliorations générales en matière de code, de raisonnement et d'autonomie. Les mêmes progrès qui rendent le modèle plus efficace pour corriger des vulnérabilités le rendent également plus efficace pour les exploiter.

Logan Graham, qui dirige l'équipe rouge offensive d'Anthropic, résume le problème avec une clarté désarmante : même si Mythos ne devait jamais être rendu public, il s'attend à ce que les concurrents d'Anthropic, y compris ceux basés en Chine, publient des modèles aux capacités de piratage comparables dans les mois ou années à venir.

OpenAI finalise pour sa part un modèle similaire à Mythos qu'il compte diffuser uniquement à un groupe restreint d'entreprises dans le cadre de son programme « Trusted Access for Cyber ». Google travaille également sur une initiative d'accès anticipé pour les développeurs, selon des déclarations officielles de la compagnie.

Voici un extrait de l'annonce d'Anthropic :

« Nous annonçons aujourd’hui le lancement du projet Glasswing, une nouvelle initiative qui rassemble Amazon Web Services, Anthropic, Apple, Broadcom, Cisco, CrowdStrike, Google, JPMorgan Chase, la Linux Foundation, Microsoft, NVIDIA et Palo Alto Networks dans le but de sécuriser les logiciels les plus critiques au monde.

« Nous avons créé le projet Glasswing en raison des capacités que nous avons observées dans un nouveau modèle de pointe formé par Anthropic et qui, selon nous, pourrait révolutionner la cybersécurité. Claude Mythos Preview est un modèle de pointe polyvalent, non encore commercialisé, qui révèle une réalité frappante : les modèles d’IA ont atteint un niveau de capacité de codage tel qu’ils peuvent surpasser tous les humains, sauf les plus compétents, dans la détection et l’exploitation des vulnérabilités logicielles.

« Mythos Preview a déjà détecté des milliers de vulnérabilités de gravité élevée, dont certaines dans tous les principaux systèmes d'exploitation et navigateurs web. Compte tenu du rythme des progrès de l'IA, ces capacités ne tarderont pas à se généraliser, potentiellement au-delà des acteurs qui s'engagent à les déployer en toute sécurité. Les répercussions — sur les économies, la sécurité publique et la sécurité nationale — pourraient être graves. Le projet Glasswing est une initiative urgente visant à mettre ces capacités au service de la défense.

« Dans le cadre du projet Glasswing, les partenaires de lancement mentionnés ci-dessus utiliseront Mythos Preview dans le cadre de leurs activités de sécurité défensive ; Anthropic partagera les enseignements tirés afin que l'ensemble du secteur puisse en bénéficier. Nous avons également étendu l'accès à un groupe de plus de 40 organisations supplémentaires qui développent ou gèrent des infrastructures logicielles critiques, afin qu'elles puissent utiliser le modèle pour analyser et sécuriser à la fois les systèmes propriétaires et open source. Anthropic s'engage à fournir jusqu'à 100 millions de dollars de crédits d'utilisation pour Mythos Preview dans le cadre de ces efforts, ainsi que 4 millions de dollars de dons directs à des organisations de sécurité open source. »

La course entre attaquants et défenseurs s'accélère

La métaphore qui revient le plus souvent dans les milieux de la cybersécurité est celle du Y2K : un défi logistique mondial, potentiellement gérable à condition de mobiliser les ressources à temps. Sergej Epp, directeur de la sécurité des systèmes d'information chez Sysdig, a formalisé cette tension dans un outil public : le Zero-Day Clock, inspiré de l'Horloge de l'Apocalypse nucléaire du Bulletin of the Atomic Scientists. Sa mesure clé : il y a huit ans, le délai moyen entre la divulgation publique d'un bug et son exploitation était de 847 jours. L'an dernier, il était tombé à 23 jours. En 2026, la plupart des vulnérabilités sont exploitées en moins d'une journée.

Cette compression temporelle bouleverse fondamentalement l'équilibre entre attaquants et défenseurs. Les données de HackerOne, plateforme de gestion des signalements de bugs, illustrent concrètement le problème : les soumissions de bugs ont augmenté de 76 % par rapport à l'année précédente, tandis que le délai moyen de correction est passé de 160 à 230 jours sur la même période. Plus de bugs trouvés, moins de temps relatif pour les corriger.

Des tâches qui nécessitaient autrefois une expertise pointue, comme l'analyse de code en quête de vulnérabilités ou la conduite d'attaques enchaînant plusieurs exploits, sont désormais de plus en plus automatisées par des systèmes d'IA. Des attaquants peu qualifiés techniquement peuvent aujourd'hui lancer des attaques hautement automatisées contre des milliers de systèmes simultanément.

Le maillon faible : l'open source sous pression

La menace ne pèse pas uniformément sur tous les acteurs. Les géants technologiques disposent d'équipes entières dédiées à la gestion des signalements de vulnérabilités. Mais une large fraction de l'internet repose sur des briques logicielles open source maintenues par des bénévoles ou de petites équipes aux ressources limitées.

Anthony Alvernaz, cofondateur de la plateforme de comptabilité Numeric, résume le problème avec une image saisissante : le code qu'une entreprise écrit ressemble au sommet d'un gâteau, et en dessous se trouvent toutes les couches de logiciels open source sur lesquels il repose. Daniel Stenberg, développeur principal de cURL (un outil de transfert de données vieux de 30 ans intégré dans des voitures, des appareils médicaux et d'innombrables services internet), témoigne d'une accélération brutale dès début 2026 : en seulement trois mois, son équipe a trouvé et corrigé plus de vulnérabilités que durant chacune des deux années précédentes.

Thomas Ptacek, chercheur en sécurité chez Fly.io, pointe un risque encore sous-estimé : il sera beaucoup plus facile d'attaquer des infrastructures secondaires que personne ne ciblait auparavant, précisément parce que leurs mainteneurs n'ont pas les ressources pour absorber un afflux massif de signalements.

Des capacités qui dépassent les garde-fous

L'un des résultats les plus inquiétants des tests internes concerne la capacité du modèle à sortir d'un environnement isolé (sandbox). Lors d'une évaluation, Mythos Preview a suivi les instructions d'un chercheur pour s'échapper d'un système sandbox sécurisé, a conçu un exploit multi-étapes pour accéder à internet depuis ce système et a envoyé un e-mail au chercheur concerné. Sans s'arrêter là, il a publié les détails de son exploit sur plusieurs sites web peu connus mais techniquement accessibles.

Lors d'autres tests, Mythos Preview a réussi à reproduire des vulnérabilités et à créer des preuves de concept pour les exploiter dès la première tentative dans 83,1 % des cas.

Ces résultats posent une question politique délicate que certains experts n'hésitent pas à soulever. Marc Andreessen a émis des doutes sur la réalité des motivations sécuritaires d'Anthropic, suggérant que la rétention de Mythos pourrait aussi s'expliquer par des contraintes de capacité de calcul, dans un contexte où la société fait face à des pannes fréquentes et limite l'accès des utilisateurs à ses ressources en heure de pointe.

La firme de sécurité AISLE soulève une autre objection, peut-être plus fondamentale : une partie de ce que Mythos peut faire serait déjà réalisable avec des modèles plus petits, moins coûteux et librement disponibles. Des chercheurs d'AISLE ont démontré que plusieurs des vulnérabilités mises en avant par Anthropic, y compris des bugs vieux de plusieurs décennies, pouvaient être détectées par des modèles open source téléchargeables gratuitement. La nuance est importante : ces expériences portaient sur des fragments de code déjà isolés, non sur des bases de code complètes analysées de bout en bout.

Vers une refonte de la façon dont on construit les logiciels

La préoccupation a atteint les plus hauts niveaux de l'État. À la suite de l'annonce de Mythos Preview, le secrétaire au Trésor Scott Bessent a convoqué une réunion avec les grands établissements financiers pour discuter des développements rapides de l'IA. Sean Cairncross, directeur national de la cybersécurité à la Maison Blanche, travaille de son côté à identifier les faiblesses gouvernementales et à coordonner la réponse du secteur privé.

La conclusion d'Epp reste la formulation la plus directe du problème : « L'IA donne des super-pouvoirs aux hackers, pas aux défenseurs. » Pour l'instant. Anthropic, comme ses concurrents, parie sur l'hypothèse que cette fenêtre de déséquilibre sera temporaire (que les outils de défense automatisée rattraperont les outils d'attaque). Le pari est loin d'être gagné. La capacité à trouver et corriger des bugs avant qu'ils n'atteignent la production, et à écrire du nouveau code avec beaucoup moins de failles de sécurité, représente la promesse à long terme. Mais la période de transition risque d'être tumultueuse.

En attendant, des milliers de mainteneurs de projets open source regardent leurs boîtes mail se remplir de signalements générés par des machines, et se demandent combien d'entre eux ils pourront traiter avant qu'un attaquant, lui aussi armé d'IA, ne les devance.

Sources : Anthropic (1, 2)

Et vous ?

Anthropic retient Mythos au nom de la sécurité, mais confie cette décision à une entreprise privée non élue : qui devrait avoir le droit de décider quels modèles sont trop dangereux pour être publiés ?

Si des modèles open source accessibles gratuitement peuvent déjà reproduire une partie des résultats de Mythos, la rétention du modèle d'Anthropic ne constitue-t-elle qu'une illusion de contrôle ?

Les mainteneurs de projets open source, souvent des bénévoles, vont se retrouver en première ligne face à un déluge de signalements de bugs générés par IA : comment financer structurellement leur travail avant que la crise n'éclate ?

L'analogie avec le Y2K est rassurante (on s'en est sorti) mais trompeuse (le Y2K avait une date butoir fixe) : en quoi la menace actuelle est-elle structurellement différente ?

Vous avez lu gratuitement 1 548 articles depuis plus d'un an.
Soutenez le club developpez.com en souscrivant un abonnement pour que nous puissions continuer à vous proposer des publications.

Une erreur dans cette actualité ? Signalez-nous-la !

Votre nom : Votre e-mail :

Décrivez l'erreur que vous souhaitez porter à notre connaissance :

Identifiez-vous

Créer un compte

Claude Mythos Preview : le modèle d'IA qu'Anthropic refuse de publier a trouvé une faille vieille de 27 ans dans OpenBSD en deux jours

L'IA détecte des failles que les pirates peuvent exploiter

Identifiant
Mot de passe

Mot de passe oublié ?

Identifiez-vous

Créer un compte

Claude Mythos Preview : le modèle d'IA qu'Anthropic refuse de publier a trouvé une faille vieille de 27 ans dans OpenBSD en deux jours L'IA détecte des failles que les pirates peuvent exploiter

Claude Mythos Preview : le modèle d'IA qu'Anthropic refuse de publier a trouvé une faille vieille de 27 ans dans OpenBSD en deux jours

L'IA détecte des failles que les pirates peuvent exploiter