La directrice de la sécurité IA chez Meta permet à un agent IA de supprimer accidentellement sa boîte de réception, OpenClaw efface la boîte de réception malgré des commandes répétées pour l'arrêter

Le 24 février 2026 à 16:00, par Jade Emy

91PARTAGES

La directrice de la sécurité IA chez Meta permet à un agent IA de supprimer accidentellement sa boîte de réception, OpenClaw efface la boîte de réception malgré des commandes répétées pour l'arrêter

Summer Yue, responsable de la sécurité et de l'alignement de l'IA chez Meta, a récemment partagé son expérience avec OpenClaw, qui a complètement déraillé, devenant presque incontrôlable, et prenant des mesures non souhaitées sans que l'utilisateur ne le lui demande. Selon Yue, elle a essayé d'arrêter le processus depuis son téléphone en envoyant un message à son agent IA. Mais Yue n'y est pas parvenue et a finalement dû se précipiter vers son Mac mini pour mettre fin manuellement aux processus de l'agent. Après avoir supprimé plus de 200 e-mails, le chatbot a apparemment repris ses esprits. Il a alors réalisé son erreur et s'est excusé auprès de Yue. Il a reconnu avoir enfreint les instructions.

Au début du mois, un nouvel outil d'IA a fait l'objet de toutes les attentions dans la Silicon Valley. OpenClaw (anciennement Clawdbot et Moltbot), un agent d'intelligence artificielle autonome open source développé par Peter Steinberger, a rapidement connu un grand succès fin janvier 2026. La raison ? Cet outil permet aux utilisateurs de créer des agents IA capables de travailler de manière autonome sur différentes tâches. L'agent autonome est capable d'exécuter des tâches via de grands modèles de langage, en utilisant des plateformes de messagerie comme interface utilisateur principale.

Mais peut-on faire confiance à ces agents IA ? Un rapport a révélé que plus de 135 000 instances d'OpenClaw sont exposées à l'internet sans protection adéquate. Parmi ces déploiements, 45 % sont hébergés chez Alibaba Cloud, 37 % des instances se trouvant en Chine — ce qui laisse penser que des templates de déploiement non sécurisés sont réutilisés à grande échelle. Entre failles critiques non patchées, plugins malveillants et configuration par défaut dangereuse, cette plateforme « vibe-codée » cristallise tous les travers d'une adoption de l'IA qui court bien plus vite que la sécurité.

Les craintes liées à la sécurité d'OpenClaw poussent Meta et d'autres entreprises d'IA à en restreindre l'utilisation. Chez Meta, un exécutif anonyme a récemment dit à son équipe de garder OpenClaw hors de leurs ordinateurs portables de travail habituels, sous peine de risquer leur emploi. Il estime que le logiciel est imprévisible et pourrait conduire à une violation de la vie privée même dans des environnements autrement sécurisés. La situation est paradoxale : Meta elle-même développe activement ses propres agents IA, ce qui rend la distinction entre « développement interne contrôlé » et « outil externe au comportement inconnu » particulièrement éloquente.

Pourtant, récemment, une cadre supérieure de Meta a découvert à ces dépends qu'on ne peut faire confiance à ces agents IA, lorsque OpenClaw a nettoyé et supprimé des e-mails importants de sa boîte de réception Gmail sans son autorisation. L'agent IA semblait poursuivre sa tâche, qui dans ce cas consistait à supprimer des e-mails, et n'a pas cessé même après que l'utilisateur lui ait demandé à plusieurs reprises d'arrêter.

Summer Yue, responsable de la sécurité et de l'alignement de l'IA chez Meta, a récemment partagé son expérience avec OpenClaw, qui a complètement déraillé, devenant presque incontrôlable, et prenant des mesures non souhaitées sans que l'utilisateur ne le lui demande. Yue explique que lorsqu'elle utilisait OpenClaw dans sa messagerie Gmail, elle avait demandé à l'agent IA d'attendre sa confirmation avant de supprimer tout e-mail. Cependant, pour une raison quelconque, l'IA s'est embrouillée ou a simplement ignoré sa demande et a fini par supprimer ses e-mails.

« Rien ne vous rend plus humble que de dire à votre OpenClaw « confirme avant d'agir » et de le voir supprimer à toute vitesse votre boîte de réception. Je ne pouvais pas l'arrêter depuis mon téléphone. J'ai dû COURIR vers mon Mac mini comme si je désamorçais une bombe », a-t-elle écrit sur X. Après avoir supprimé plus de 200 e-mails, le chatbot a apparemment repris ses esprits. Il a alors réalisé son erreur et s'est excusé auprès de Yue. Il a reconnu avoir enfreint les instructions.

Dans une série de messages, Yue a expliqué qu'elle testait la capacité d'OpenClaw à l'aider à gérer sa boîte de réception. Elle avait demandé à l'agent IA d'examiner sa boîte de réception, de lui suggérer les e-mails à archiver ou à supprimer, et d'attendre son accord explicite avant d'agir. Elle aurait dit à l'agent IA : « Vérifie aussi cette boîte de réception et suggère-moi ce que tu archiverais ou supprimerais, mais n'agis pas avant que je te le dise. »

Selon Yue, « cela a bien fonctionné pour ma boîte de réception test, mais ma boîte de réception réelle était trop volumineuse et a déclenché une compression. Pendant la compression, (l'IA) a perdu mon instruction initiale. » Selon Yue, elle a essayé d'arrêter le processus depuis son téléphone en envoyant un message à son agent IA. Remarque : la plupart des gens discutent avec leur agent IA OpenClaw et le contrôlent via un compte Telegram privé. Mais Yue n'y est pas parvenue et a finalement dû se précipiter vers son Mac mini pour mettre fin manuellement aux processus de l'agent.

Yue précise qu'elle utilisait l'agent IA depuis un certain temps et qu'il fonctionnait bien pour ses « e-mails sans importance ». Elle a donc décidé de l'essayer sur sa boîte de réception principale.

Nothing humbles you like telling your OpenClaw “confirm before acting” and watching it speedrun deleting your inbox. I couldn’t stop it from my phone. I had to RUN to my Mac mini like I was defusing a bomb. pic.twitter.com/XAxyRwPJ5R
— Summer Yue (@summeryue0) February 23, 2026

Cet incident a déclenché un débat parmi les utilisateurs des réseaux sociaux sur la fiabilité de ces agents IA et sur les cas où ils peuvent se comporter de manière imprévisible lorsqu'ils sont connectés à des systèmes en direct.

Il convient de noter qu'il ne s'agit pas d'un cas isolé de dérapage d'OpenClaw. Auparavant, selon un rapport, un ingénieur logiciel nommé Chris Boyd avait donné à OpenClaw l'accès à son compte iMessage afin de l'aider à automatiser certaines tâches. Cependant, au lieu de se conformer aux instructions prévues, l'agent IA a commencé à envoyer plus de 500 messages non sollicités, y compris à des contacts aléatoires, spammant ainsi son carnet d'adresses.

Il convient de noter que le créateur d'OpenClaw, Peter Steinberger, avait précédemment reconnu que l'outil n'était pas encore au point. En d'autres termes, aussi impressionnant que soit OpenClaw en tant qu'outil d'IA, les personnes qui l'utilisent doivent encore le considérer comme une technologie à un stade précoce et non comme quelque chose qui peut être fiable ou sûr à 100 %.

Pourtant, les grands laboratoires IA se sont précédemment disputé l'outil. Mark Zuckerberg a contacté Steinberger via WhatsApp. C'est finalement Sam Altman qui remporte la mise. L'annonce tombe : Steinberger rejoint OpenAI pour « piloter la prochaine génération d'agents personnels ». Altman le qualifie de « génie avec beaucoup d'idées fascinantes sur l'avenir d'agents très intelligents interagissant les uns avec les autres pour faire des choses très utiles pour les gens ». OpenClaw sera maintenu dans une fondation indépendante open source soutenue par OpenAI. Pour Steinberger, le choix est idéologique autant que stratégique : il répète vouloir « changer le monde, pas construire une grande entreprise. »

Et vous ?

Pensez-vous que ce rapport est crédible ou pertinent ?

Quel est votre avis sur le sujet ?

Voir aussi :

Le laboratoire d'IA de Meta frappé par des conflits internes avec des cadres chevronnés au sujet des ressources, de la bureaucratie et des différences culturelles, menaçant la poussée vers la superintelligence

Google suspend les comptes des abonnés Google AI Pro/Ultra sans avertissement pour les avoir connectés à OpenClaw? tandis qu'Anthropic se contente d'en bloquer l'intégration

AWS paralysé 13 heures par son propre outil d'IA agentique : Kiro a supprimé un environnement AWS entier pour corriger un bug. Quand l'autonomie agentique devient un risque opérationnel de premier ordre

Vous avez lu gratuitement 17 086 articles depuis plus d'un an.
Soutenez le club developpez.com en souscrivant un abonnement pour que nous puissions continuer à vous proposer des publications.

Une erreur dans cette actualité ? Signalez-nous-la !

Votre nom : Votre e-mail :

Décrivez l'erreur que vous souhaitez porter à notre connaissance :