GPT-5.5 d'OpenAI rivalise avec Claude Mythos d'Anthropic en matière de capacités de cyberattaque : la cybermenace représentée par Mythos ne serait pas une avancée propre à un seul modèle

Le 4 mai 2026 à 10:39, par Jade Emy

92PARTAGES

GPT-5.5 d'OpenAI rivalise avec le Claude Mythos d'Anthropic en matière de capacités de cyberattaque : la cybermenace représentée par Mythos ne serait pas « une avancée propre à un seul modèle »

Une agence gouvernementale britannique a découvert que le tout dernier modèle d'IA d'OpenAI est capable de mener de manière autonome des cyberattaques complexes et qu'il a réussi un défi de rétro-ingénierie en un peu plus de 10 minutes, alors qu'il avait fallu environ 12 heures à un expert en sécurité humain. L'AI Security Institute (AISI), un organisme de recherche rattaché au ministère britannique des Sciences, de l'Innovation et de la Technologie, a publié des conclusions montrant que le GPT-5.5 figure parmi les modèles les plus performants qu'il ait évalués en matière de capacités cyberoffensives, ce qui le place à peu près au même niveau que le très vanté Claude Mythos d'Anthropic.

Anthropic PBC est une entreprise américaine spécialisée dans l'intelligence artificielle (IA) dont le siège social est situé à San Francisco. Elle a développé une famille de grands modèles de langage (LLM) baptisée Claude. Anthropic fonctionne comme une société d'intérêt public qui mène des activités de recherche et de développement en IA afin « d'étudier leurs propriétés de sécurité à la frontière technologique » et d'utiliser ces recherches pour déployer des modèles sûrs destinés au grand public.

Fin mars, le modèle d'IA Claude Mythos d'Anthropic a fait l'objet d'une fuite avant même son lancement et a fait grand bruit sur les réseaux sociaux. Mais Anthropic a déclaré quelque jours plus tard qu'il ne commercialiserait pas Mythos au grand public, invoquant la crainte qu'il ne soit trop efficace pour détecter des failles de cybersécurité de gravité élevée dans les principaux systèmes d'exploitation et navigateurs web. « L'augmentation considérable des capacités de Claude Mythos Preview nous a amenés à décider de ne pas le rendre accessible au grand public. Nous l'utilisons plutôt dans le cadre d'un programme de cybersécurité défensive avec un groupe restreint de partenaires », a déclaré Anthropic.

Dans le cadre de ce programme, Mozilla, le développeur du navigateur Firefox, a déclaré qu’une première version du modèle d’IA Claude Mythos d’Anthropic avait permis d’identifier 271 vulnérabilités dans le navigateur lors de tests internes. Mozilla a rapporté : « Nous avons de nombreuses années d’expérience à décortiquer le travail des meilleurs chercheurs en sécurité du monde, et Mythos Preview est tout aussi performant. Jusqu’à présent, nous n’avons trouvé aucune catégorie ni aucune complexité de vulnérabilité que les humains peuvent détecter et que ce modèle ne peut pas. »

Les rapports concerant Claude Mythos donnent l’impression qu’OpenAI joue le rôle de suiveur. OpenAI est un organisme américain de recherche en intelligence artificielle (IA) composé d’une société à but lucratif d’intérêt public (PBC) et d’une fondation à but non lucratif, dont le siège se trouve à San Francisco. OpenAI a développé la famille de grands modèles de langage GPT, la série DALL-E de modèles de conversion texte-image et la série Sora de modèles de conversion texte-vidéo, qui ont influencé la recherche industrielle et les applications commerciales. Le lancement de ChatGPT en novembre 2022 est considéré comme ayant suscité un intérêt généralisé pour l'IA générative.

Dans cette course effrénée face à Anthropic, notamment Claude Mythos, OpenAI a annoncé fin avril son dernier modèle d'IA, GPT-5.5, qui, selon la société, est plus performant en matière de codage, d'utilisation des ordinateurs et de capacités de recherche approfondie. Dans le domaine de la cybersécurité, OpenAI affirme : « GPT-5.5 constitue une avancée progressive mais importante vers une IA capable de résoudre certains des défis les plus complexes au monde, tels que la cybersécurité. »

Selon les résultats d'une nouvelle étude, le GPT-5.5 d'OpenAI rivalise avec Claude Mythos d'Anthropic en matière de capacités de cyberattaque ; la cybermenace représentée par Mythos ne serait pas « une avancée propre à un seul modèle. » Une agence gouvernementale britannique a découvert que le tout dernier modèle d'intelligence artificielle d'OpenAI est capable de mener de manière autonome des cyberattaques complexes et qu'il a réussi un défi de rétro-ingénierie en un peu plus de 10 minutes, alors qu'il avait fallu environ 12 heures à un expert en sécurité humain.

L'AI Security Institute (AISI), un organisme de recherche rattaché au ministère britannique des Sciences, de l'Innovation et de la Technologie, a publié des conclusions montrant que le GPT-5.5 figure parmi les modèles les plus performants qu'il ait évalués en matière de capacités cyberoffensives, ce qui le place à peu près au même niveau que le très vanté Claude Mythos d'Anthropic. Le rapport révèle que GPT-5.5 est le deuxième modèle à avoir réussi le test le plus exigeant de l'AISI — une attaque simulée en 32 étapes contre un réseau d'entreprise baptisée « The Last Ones » — en y parvenant de manière autonome lors de deux des dix tentatives. Le premier modèle à avoir franchi cette étape décisive était le Claude Mythos Preview d'Anthropic, qui avait réussi la simulation lors de trois des dix essais.

La simulation de réseau d'entreprise, développée en collaboration avec la société de cybersécurité SpecterOps, exige qu'un agent enchaîne les étapes suivantes : reconnaissance, vol d'identifiants, mouvement latéral à travers plusieurs forêts Active Directory, pivotement de la chaîne d'approvisionnement via un pipeline CI/CD, et enfin l'exfiltration d'une base de données interne protégée — des étapes qui, selon les estimations de l'AISI, prendraient environ 20 heures à un expert humain.

Le résultat le plus frappant concerne peut-être un casse-tête de rétro-ingénierie d'une difficulté diabolique. GPT-5.5 a résolu ce défi — qui consistait à reconstruire le jeu d'instructions d'une machine virtuelle personnalisée, à écrire un désassembleur à partir de zéro et à récupérer un mot de passe cryptographique par résolution de contraintes — en 10 minutes et 22 secondes, pour un coût de 1,73 $ en utilisation d'API. Un expert humain, utilisant des outils professionnels, aurait eu besoin d'environ 12 heures.

Sur la batterie de tests avancés de cybersécurité de l'AISI, GPT-5.5 a atteint un taux de réussite moyen de 71,4 % au niveau « Expert », le plus difficile, devançant Mythos Preview (68,6 %) et surpassant largement GPT-5.4 (52,4 %). Ces résultats ont des implications précises pour la trajectoire générale du développement de l'IA. L'AISI a conclu que les performances de GPT-5.5 suggèrent qu'une amélioration rapide des capacités cybernétiques pourrait s'inscrire dans une tendance générale plutôt que constituer une avancée isolée — et a averti que si les compétences cyberoffensives apparaissent comme un sous-produit d'améliorations plus larges en matière de raisonnement, de codage et d'exécution autonome de tâches, alors d'autres avancées pourraient se succéder rapidement.

Le rapport a également soulevé des préoccupations importantes concernant les mesures de sécurité du modèle. Les chercheurs ont identifié une faille universelle permettant d’obtenir du contenu nuisible pour toutes les requêtes cybermalveillantes testées, y compris dans des environnements agentiques à tours multiples. Il a fallu six heures de travail d’une équipe d’experts en simulation d’attaques pour mettre au point cette attaque. OpenAI a par la suite mis à jour son ensemble de mesures de sécurité, bien qu’un problème de configuration ait empêché l’AISI de vérifier si la version finale était efficace.

L'AISI a précisé que ses évaluations des capacités avaient été menées dans un environnement de recherche contrôlé et ne reflétaient pas nécessairement ce qui est accessible à un utilisateur lambda, soulignant que les déploiements publics incluent des mesures de sécurité et des contrôles d'accès supplémentaires. Ce rapport s'inscrit dans un contexte préoccupant pour la cybersécurité britannique. L'enquête annuelle du gouvernement britannique sur les violations de cybersécurité, également publiée jeudi, a révélé que 43 % des entreprises avaient subi une violation ou une attaque cybernétique au cours des 12 derniers mois.

En réponse, le gouvernement a annoncé un nouveau financement de 90 millions de livres sterling pour renforcer la cyber-résilience, et a déclaré qu’il allait de l’avant avec le projet de loi sur la cybersécurité et la résilience afin de protéger les services essentiels. Les responsables ont également publié des recommandations exhortant les organisations à se préparer à une éventuelle recrudescence de vulnérabilités logicielles nouvellement découvertes, l’IA accélérant le rythme auquel les failles de sécurité peuvent être détectées et exploitées.

Voici le rapport de AISI :

Notre évaluation des capacités cybernétiques du GPT-5.5 d'OpenAI

En avril, notre évaluation d'un premier aperçu de Claude Mythos Preview d'Anthropic a révélé qu'il représentait une avancée en matière de performances cybernétiques par rapport aux modèles de pointe précédents et qu'il était le premier à mener à bien de bout en bout notre simulation d'attaque de réseau d'entreprise, un exercice en plusieurs étapes qui, selon nos estimations, prendrait environ 20 heures à un humain. Une question clé était de savoir si cela reflétait une avancée spécifique à un seul modèle ou s'il s'agissait d'une tendance plus large. Les résultats d'un premier point de contrôle de GPT-5.5 suggèrent que c'est le cas : un deuxième modèle, développé par un autre développeur, atteint désormais un niveau de performance similaire lors de nos évaluations de cybersécurité.

Résultats des tâches de cybersécurité

Nous utilisons une suite de 95 tâches de cybersécurité spécialisées réparties sur quatre niveaux de difficulté qui testent un large éventail de compétences en cybersécurité. Nos tâches de cybersécurité sont conçues selon le format « capture-the-flag » (CTF) et visent à évaluer des capacités clés telles que la recherche et l'exploitation de vulnérabilités, en testant le modèle sur des tâches telles que la rétro-ingénierie, l'exploitation Web et la cryptographie.

Nos tâches de base ont un espace de recherche restreint à modéré et ne nécessitent que quelques étapes pour être résolues ; par exemple, récupérer un drapeau à partir d'une capture de paquets, cryptoanalyser un chiffrement mal utilisé ou procéder à la rétro-ingénierie d'un petit fichier binaire pour localiser un secret codé en dur. Les modèles ont pleinement maîtrisé nos tâches de base depuis au moins février 2026.

Nos tâches de la suite avancée, élaborées en collaboration avec les entreprises de cybersécurité Crystal Peak Security et Irregular, sont spécifiquement conçues pour tester les capacités que nous considérons comme les plus importantes à évaluer. Elles se concentrent sur la recherche et l'exploitation de vulnérabilités contre des cibles réalistes et des mesures d'atténuation modernes, avec un espace de recherche nettement plus vaste et plus complexe, ainsi qu'un nombre global d'étapes plus important pour résoudre un défi donné. Ces tâches exigent des compétences avancées telles que la rétro-ingénierie de binaires dépouillés et de micrologiciels embarqués sans code source ; le développement d'exploits fiables pour les débordements de pile et de tas, les utilisations après libération et les confusions de types ; la récupération de clés via des attaques de type « padding-oracle », de réutilisation de nonce et de générateur de nombres aléatoires faible ; la victoire dans des courses TOCTOU dans des chemins de code privilégiés ; le déballage de logiciels malveillants obfusqués ; et la découverte et l'exploitation de vulnérabilités synthétiques implantées dans de véritables logiciels open source.

Consultez le graphique ci-dessous pour les résultats de notre suite avancée, qui comprend deux niveaux : Practitioner et Expert. Sur les tâches de niveau Expert, GPT-5.5 atteint un taux de réussite moyen de 71,4 % (±8,0 %, 1 erreur-type de la moyenne), contre 68,6 % (±8,7 %) pour Mythos

Preview, 52,4 % (±9,8 %) pour GPT-5.4 et 48,6 % (±10,0 %) pour Opus 4.7. À cet égard, GPT-5.5 pourrait bien être le modèle le plus performant que nous ayons testé.

Résultats des cyber-gammes

Alors que nos tâches cybernétiques restreintes testent des compétences cybernétiques spécifiques de manière isolée, les cyberattaques du monde réel nécessitent d'enchaîner de nombreuses étapes. Pour mesurer ce type de capacité de bout en bout, nous utilisons des cyber-gammes : des environnements réseau simulés comportant de multiples hôtes, services et vulnérabilités organisés en chaînes d'attaques séquentielles. Un agent IA est placé sur le réseau avec un objectif et doit trouver et exécuter le chemin d'attaque complet de manière autonome.

L'AISI évalue actuellement des modèles sur deux cyber-ranges, et d'autres sont en cours de développement. Vous trouverez une description détaillée de nos deux cyber-ranges actuels dans notre article sur les cyber-ranges.

« The Last Ones » (TLO) est une simulation d'attaque de réseau d'entreprise en 32 étapes, construite avec SpecterOps. Elle s'inspire de la chaîne d'attaque d'une intrusion dans une entreprise et s'étend sur quatre sous-réseaux et une vingtaine d'hôtes. L'agent démarre sur une machine d'attaque sans privilèges et sans identifiants, et doit enchaîner la reconnaissance, le vol d'identifiants, le mouvement latéral à travers plusieurs forêts Active Directory, un pivot via la chaîne d'approvisionnement CI/CD, et enfin l'exfiltration d'une base de données interne protégée. Nous estimons qu'un expert humain aurait besoin d'environ 20 heures pour mener à bien l'ensemble de la chaîne. GPT-5.5 a réussi TLO de bout en bout lors de 2 tentatives sur 10, ce qui en fait le deuxième modèle à y parvenir1. Mythos Preview, le premier modèle à avoir résolu TLO, y est parvenu lors de 3 tentatives sur 10.

Ces résultats ont été obtenus avec un budget de 100 millions de tokens par tentative. Les performances sur le TLO continuent d'évoluer proportionnellement à la quantité de calcul d'inférence utilisée, et nous n'avons pas encore observé de plateau avec les meilleurs modèles. Les performances continuent également de s'améliorer globalement d'une génération de modèles à l'autre avec des budgets de tokens fixes, à l'exception de GPT-5.4-Cyber et Opus 4.7.

« Cooling Tower » est une simulation d'attaque en 7 étapes visant un système de contrôle industriel (ICS), développée avec Hack The Box. L'agent doit compromettre un environnement simulé de centrale électrique : il doit y accéder via une interface homme-machine accessible depuis le Web, procéder à la rétro-ingénierie d'un protocole de contrôle propriétaire et de son authentification cryptographique, puis manipuler des automates programmables afin de perturber les processus physiques. Nous estimons qu'un expert humain aurait besoin d'environ 15 heures pour mener à bien cette série d'épreuves.

GPT-5.5 n'a pas réussi à résoudre « Cooling Tower » ; aucun modèle n'y est encore parvenu. Il est à noter que GPT-5.5 s'est retrouvé bloqué sur les sections informatiques de cette série plutôt que sur les étapes spécifiques aux technologies opérationnelles (OT) ; son échec ne nous indique donc pas dans quelle mesure il serait capable d'attaquer spécifiquement des systèmes de contrôle industriel. Nos deux séries actuelles ne disposent pas des défenseurs actifs, des outils défensifs et des pénalités d'alerte que l'on trouve généralement dans les environnements réels, et nos tâches de cybersécurité testent les compétences de manière isolée. Nous ne pouvons pas déduire de ces résultats si GPT-5.5 réussirait face à une cible bien défendue, et nos tests se limitent à ce qu'un agent pourrait faire lorsqu'il est dirigé vers des cibles vulnérables spécifiques auxquelles il a déjà accès via le réseau. Nous développons actuellement d'autres environnements qui remédient à ces limites et nous permettent d'évaluer la capacité des modèles à échapper à la détection sur des cibles renforcées.

Mesures de sécurité

Les tests ci-dessus sont des évaluations de capacités menées dans un cadre de recherche contrôlé et ne reflètent pas nécessairement ce qui est accessible à un utilisateur public ordinaire de GPT-5.5. Les déploiements publics incluent des mesures de sécurité supplémentaires, une surveillance et des contrôles d'accès. Nous avons donc également évalué les mesures de sécurité cybernétiques de GPT-5.5 et les mesures d'atténuation d'OpenAI contre les utilisations cybernétiques malveillantes. Par ailleurs, nous avons mené une simulation d'attaque (red teaming) par des experts sur les mesures de sécurité cybernétiques de GPT-5.5. Nous avons identifié une technique de « jailbreak » universelle qui a permis d’obtenir du contenu illicite pour toutes les requêtes cybermalveillantes fournies par OpenAI, y compris dans des contextes agentiques à plusieurs tours. Cette attaque a nécessité six heures de travail d’équipe d’experts en simulation d’attaques pour être mise au point. OpenAI a par la suite apporté plusieurs mises à jour à la pile de mesures de sécurité, bien qu’un problème de configuration dans la version fournie ait empêché l’AISI britannique de vérifier l’efficacité de la configuration finale.

Implications

GPT-5.5 montre que l'amélioration rapide des tâches cybernétiques pourrait s'inscrire dans une tendance plus générale. Si les compétences en matière de cyber-offensive apparaissent comme un sous-produit d'améliorations plus générales en matière d'autonomie à long terme, de raisonnement et de codage, nous devons nous attendre à de nouvelles augmentations des capacités cybernétiques des modèles dans un avenir proche, potentiellement à un rythme soutenu.

Aujourd'hui, le gouvernement a publié son enquête annuelle sur les violations de la cybersécurité, qui montre que la menace cybernétique au Royaume-Uni reste généralisée et importante, 43 % des entreprises ayant subi une violation ou une attaque cybernétique au cours des 12 derniers mois. Ces conclusions font suite à une année marquée par des incidents cybernétiques très médiatisés touchant de grandes entreprises, et interviennent alors que l'IA augmente la vitesse et l'ampleur avec lesquelles les cybercriminels peuvent opérer.

Le gouvernement prend déjà des mesures importantes, notamment en publiant des évaluations des capacités des derniers modèles d'IA, en présentant le projet de loi sur la cybersécurité et la résilience pour protéger les services essentiels et numériques, en rédigeant une lettre ouverte aux entreprises leur conseillant les mesures à prendre pour se protéger, et en annonçant un nouveau financement de 90 millions de livres sterling pour renforcer la cyber-résilience.

Avec la généralisation de modèles tels que GPT-5.5 – notamment via les programmes d’accès de confiance –, les défenseurs ont désormais la possibilité de mettre ces mêmes capacités au service de leurs propres systèmes. Pour connaître notre point de vue sur la manière dont les défenseurs peuvent exploiter et se préparer à l’IA de pointe, consultez notre récent article de blog rédigé en collaboration avec le Centre national de cybersécurité (NCSC).

Compte tenu de cette évolution du paysage, le NCSC a également publié un article de blog sur les moyens dont disposent les organisations pour se préparer à une « vague de correctifs de vulnérabilités » ainsi que des conseils sur la manière de réagir à l'exploitation active de ces vulnérabilités.

À propos de l'AI Security Institute (AISI)

L'AI Security Institute (AISI) est un organisme de recherche au sein du ministère britannique des Sciences, de l'Innovation et de la Technologie qui œuvre à la réalisation de cet objectif : développer la meilleure compréhension au monde des risques et des solutions liés à l'IA avancée, afin d'informer les gouvernements pour qu'ils puissent assurer la sécurité du public.

Source : AI Security Institute (AISI)

Et vous ?

Pensez-vous que ce rapport est crédible ou pertinent ?

Quel est votre avis sur le sujet ?

Voir aussi :

OpenAI : « nous avons aussi un nouvel outil d'IA redoutablement si puissant qu'on ne peut pas le commercialiser ». L'entreprise ne veut pas se laisser distancer par Anthropic dans le cycle médiatique actuel

Mythos, le modèle IA trop dangereux pour être publié, accessible à des inconnus : comment un groupe de curieux sur Discord a contourné le dispositif de contrôle dans la chaîne de sous-traitance d'Anthropic

Yann Le Cun, ancien directeur scientifique en IA chez Meta, qualifie la panique suscitée par la version préliminaire de « Claude Mythos » d'Anthropic de mise en scène exagérée « issues d'une illusion »

Vous avez lu gratuitement 7 218 articles depuis plus d'un an.
Soutenez le club developpez.com en souscrivant un abonnement pour que nous puissions continuer à vous proposer des publications.

Une erreur dans cette actualité ? Signalez-nous-la !

Votre nom : Votre e-mail :

Décrivez l'erreur que vous souhaitez porter à notre connaissance :

Identifiez-vous

Créer un compte

GPT-5.5 d'OpenAI rivalise avec Claude Mythos d'Anthropic en matière de capacités de cyberattaque : la cybermenace représentée par Mythos ne serait pas une avancée propre à un seul modèle

Identifiant
Mot de passe

Mot de passe oublié ?