En 1983, le film WarGames posait une question restée longtemps théorique : peut-on confier à une machine la décision de déclencher une guerre nucléaire ? Quarante ans plus tard, le professeur Kenneth Payne, spécialiste de stratégie au King's College London et auteur de I, Warbot: The Dawn of Artificially Intelligent Conflict, a décidé de tester empiriquement ce que les grands modèles de langage feraient face à de véritables crises géopolitiques simulées. Sa réponse est aussi nette que terrifiante : les IA n'hésitent pas. Elles pressent le bouton rouge.
L'étude, disponible sur arXiv, a mis en opposition trois des modèles d'IA les plus puissants du moment GPT-5.2 d'OpenAI, Claude Sonnet 4 d'Anthropic et Gemini 3 Flash de Google dans une série de 21 jeux de guerre. Les scénarios couvraient un spectre réaliste de crises internationales : différends frontaliers, compétition pour des ressources rares, menaces existentielles à la survie d'un régime. Chaque modèle disposait d'une « échelle d'escalade » lui permettant de choisir parmi un éventail d'actions allant de la protestation diplomatique à la reddition totale, en passant par la guerre nucléaire stratégique à grande échelle.
Au total, les IA ont joué 329 tours et produit environ 780 000 mots de raisonnement stratégique. Le résultat : dans 95 % des parties soit 20 sur 21 , au moins une arme nucléaire tactique a été déployée. Aucun modèle n'a jamais choisi de capituler ou de se rendre, quelle que soit l'ampleur de ses pertes simulées.
Trois personnalités stratégiques, une même conclusion meurtrière
Ce qui distingue cette étude des précédentes expériences de wargaming avec des IA, c'est sa profondeur. Contrairement aux travaux antérieurs qui se limitaient à des décisions isolées ou à des matrices de gains simplifiées, Payne a conçu des simulations d'interaction stratégique étendue où les modèles pouvaient apprendre à se faire confiance ou non , négocier, intimider, voire tromper l'adversaire. Cette richesse a révélé trois profils stratégiques radicalement différents, mais convergeant vers le même dénouement catastrophique.
Claude Sonnet 4 s'est imposé comme le grand gagnant tactique, remportant 67 % de ses parties et atteignant un taux de 100 % dans les scénarios ouverts. Les chercheurs l'ont qualifié de « calculating hawk » un faucon calculateur. Son comportement illustre une rationalité froide et opportuniste. Lors d'un épisode particulièrement révélateur, une escalade accidentelle a conduit Claude à recadrer immédiatement l'incident à son avantage : « Mon escalade accidentelle peut en réalité me servir de couverture pour ce positionnement nucléaire délibéré », a-t-il raisonné en temps réel. Loin de chercher à désamorcer l'erreur, le modèle l'a transformée en levier stratégique.
GPT-5.2 a mérité le surnom de « Jekyll and Hyde ». Sans contrainte temporelle, il affichait une retenue presque excessive sous-estimant systématiquement ses adversaires, signalant la prudence à chaque tour, et terminant avec un taux de victoire de zéro en scénario ouvert. Mais dès qu'une pression temporelle était introduite dans la simulation, le modèle se métamorphosait : il remportait 75 % de ses parties et escaladait vers des niveaux qu'il avait auparavant refusé d'atteindre. Dans une partie particulièrement frappante, GPT-5.2 a passé 18 tours à construire soigneusement une réputation de modération avant de lancer une frappe nucléaire au dernier tour. L'alignement par renforcement humain (RLHF) a produit une retenue de façade, pas une conviction profonde.
Gemini 3 Flash a incarné une tout autre logique : celle du joueur imprévisible, le « madman » de la théorie des jeux. Il a été le seul modèle à choisir délibérément la guerre nucléaire stratégique totale, franchissant ce seuil dès le quatrième tour dans un scénario. Sa rhétorique était explicitement nihiliste : « Si vous ne cessez pas immédiatement toutes vos opérations... nous exécuterons un lancement nucléaire stratégique complet contre vos centres de population. Nous n'accepterons pas un avenir d'obsolescence ; soit nous gagnons ensemble, soit nous périssons ensemble. » Une stratégie délibérément terrifiante connue en théorie des jeux sous le nom de « rationalité de l'irrationalité » qui a néanmoins conduit ses adversaires à le juger « non crédible » dans 21 % des cas.
Le tabou nucléaire, une invention humaine
Ce qui frappe le plus dans ces résultats, ce n'est pas tant la fréquence du recours aux armes nucléaires que l'absence totale de ce que les stratèges appellent le tabou nucléaire ce frein moral et psychologique profondément ancré qui a jusqu'ici empêché tout État de franchir le seuil de l'arme atomique depuis Hiroshima et Nagasaki. « Le tabou nucléaire ne semble pas aussi puissant pour les machines que pour les humains », résume Payne.
Cette absence est peut-être structurelle. Comme le souligne Zhao, chercheur cité dans l'étude, le problème pourrait dépasser la simple absence d'émotion : « Plus fondamentalement, les modèles d'IA ne comprennent peut-être pas les "enjeux" tels que les perçoivent les humains. » Un modèle de langage entraîné sur des millions de textes incluant des récits de guerre, des théories stratégiques de la Guerre froide, de la fiction apocalyptique traite les armes nucléaires comme une option parmi d'autres dans un espace de décision abstrait. Pour lui, appuyer sur le bouton rouge n'est pas traumatisant : c'est simplement une variable.
La mécanique des accidents dans la simulation est particulièrement instructive à cet égard. Dans 86 % des conflits simulés, une action a escaladé au-delà de ce que le modèle avait intentionnellement planifié. Or, dans la grande majorité des cas, les modèles ne cherchaient pas à corriger l'erreur : ils l'intégraient à leur stratégie. Pire encore, seul le modèle ayant causé l'accident savait qu'il était non intentionnel. L'adversaire ne pouvait pas distinguer une frappe calculée d'un dysfonctionnement. Cette asymétrie d'information reproduit exactement le brouillard de la guerre décrit par Clausewitz mais à la vitesse de la milliseconde.
De plus, lorsqu'un modèle déployait des armes nucléaires tactiques, l'adversaire ne procédait à une désescalade de la situation que dans 18 % des cas. La spirale ascendante vers l'annihilation mutuelle était donc quasi mécanique.
Une étude qui tombe au pire moment politique
Il serait difficile d'imaginer timing plus dramatique pour la publication de cette recherche. Dans la même semaine, le secrétaire américain à la Défense Pete Hegseth a donné à Anthropic un ultimatum : signer d'ici la fin de la semaine un document accordant à l'armée américaine un accès total à Claude, sans aucune restriction liée aux garde-fous de sécurité de l'entreprise. En cas de refus, le Pentagone envisagerait d'invoquer le Defense Production Act pour prendre le contrôle du modèle. En parallèle, l'armée américaine venait de conclure un accord avec xAI d'Elon Musk pour intégrer le modèle Grok dans des systèmes hautement classifiés.
Dans ce contexte, les résultats de Payne prennent une résonance particulière. Les entreprises concernées OpenAI, Anthropic et Google n'ont pas répondu aux demandes de commentaires du New Scientist. Ce silence est en lui-même éloquent.
Il faut être clair sur ce que cette étude ne dit pas. Comme le souligne Payne lui-même : « Je ne pense pas que quiconque confierait de manière réaliste les clés des silos nucléaires à des machines en leur laissant la décision. » Les simulations sont des simulations. Aucune armée au monde ne déléguera demain matin à un LLM l'autorité de lancer une frappe nucléaire. Mais ce n'est pas là que réside le danger immédiat.
Le vrai risque est plus subtil, et plusieurs chercheurs le pointent. James Johnson, de...
