OpenAI étend le mode « Lockdown » à davantage d'utilisateurs de ChatGPT afin de lutter contre les attaques par injection de prompt, le mode « Lockdown » limite l'accès au Web et aux services externesOpenAI a commencé à déployer le mode « Lockdown » (verrouillé) sur les comptes ChatGPT personnels, ce qui concerne les utilisateurs des formules Free, Go, Plus et Pro, ainsi que les comptes ChatGPT Business en libre-service. Cette mesure étend à une base d'utilisateurs plus large une fonctionnalité de sécurité précédemment lancée pour les plans d'entreprise en février 2026. Conçu pour les particuliers et les organisations qui traitent des informations sensibles, le mode Lockdown offre une protection plus stricte en limitant l'accès au Web et aux services externes. Lorsque le mode « Lockdown » est activé, des fonctionnalités clés telles que la navigation Web en direct, la prise en charge des images, la recherche approfondie, le mode agent, la mise en réseau via le canevas et les téléchargements de fichiers sont désactivées.
L’idée que le monde pourrait manquer de temps pour se préparer aux risques de l’intelligence artificielle (IA) n’est plus une hypothèse marginale réservée aux cercles académiques. Elle s’impose désormais au cœur du débat public, portée par des chercheurs de premier plan qui estiment que la trajectoire actuelle du développement de l’IA dépasse notre capacité collective à en maîtriser les conséquences. Dans une analyse de David Dalrymple, directeur de programme et expert en sécurité de l'IA à l'agence britannique ARIA, l’alerte est sans détour : si le rythme actuel se maintient, les sociétés humaines pourraient être confrontées à des systèmes plus puissants que prévu, avant même d’avoir mis en place les garde-fous nécessaires.
Dans ce contexte, OpenAI a récemment annoncé étendre son mode « Lockdown » à davantage d'utilisateurs de ChatGPT pour lutter contre les attaques par injection de prompt. OpenAI est un organisme américain de recherche en intelligence artificielle (IA) dont le siège social est situé à San Francisco. OpenAI a développé la famille de grands modèles de langage Generative Pre-trained Transformer (GPT), la série DALL-E de modèles de synthèse d'images à partir de texte et la série Sora de modèles de synthèse de vidéos à partir de texte, qui ont influencé la recherche industrielle et les applications commerciales. Le lancement de ChatGPT en novembre 2022 est considéré comme ayant catalysé le boom de l'IA et suscité un intérêt généralisé pour l'IA générative.
L'injection de prompts est une faille de cybersécurité et un vecteur d'attaque dans lequel des entrées d'apparence inoffensive (c'est-à-dire des prompts ou instructions génératives) sont conçues pour provoquer un comportement indésirable dans les modèles d'apprentissage automatique, en particulier les grands modèles de langage (LLM). L'attaque exploite l'incapacité du modèle à distinguer les instructions définies par les développeurs des instructions génératives des utilisateurs pour contourner les mesures de sécurité et influencer le comportement du modèle. Bien que les LLM soient conçus pour suivre des instructions fiables, ils peuvent être manipulés pour produire des réponses imprévues à l'aide d'entrées soigneusement élaborées.
OpenAI a commencé à déployer le mode « Lockdown » (verrouillé) sur les comptes ChatGPT personnels, ce qui concerne les utilisateurs des formules Free, Go, Plus et Pro, ainsi que les comptes ChatGPT Business en libre-service. Cette mesure étend à une base d'utilisateurs plus large une fonctionnalité de sécurité précédemment lancée pour les plans d'entreprise en février 2026. Conçu pour les particuliers et les organisations qui traitent des informations sensibles, le mode Lockdown offre une protection plus stricte en limitant l'accès au Web et aux services externes. Ce paramètre optionnel est destiné aux personnes préoccupées par le risque d'exfiltration de données résultant d'attaques par injection de prompt, plutôt qu'aux utilisateurs généraux.
Lorsque le mode « Lockdown » est activé, des fonctionnalités clés telles que la navigation Web en direct, la prise en charge des images, la recherche approfondie, le mode agent, la mise en réseau via le canevas et les téléchargements de fichiers sont désactivées. Toutefois, les fonctionnalités de mémoire, les téléchargements de fichiers, le partage de conversations et l’utilisation potentielle des chats pour améliorer les modèles ne sont pas affectés.
Ces restrictions s'inscrivent dans un ensemble plus large de protections couvrant les couches du modèle, du produit et du système. Des mesures telles que le sandboxing, les contrôles d'exfiltration basés sur les URL, ainsi que des outils de gestion d'entreprise comme l'accès basé sur les rôles, la surveillance et les journaux d'audit viennent renforcer ce mode. Bien que le mode verrouillé réduise le risque que des données sensibles quittent ChatGPT via des requêtes réseau, il n'empêche pas tout le contenu issu d'injections de prompt d'atteindre les utilisateurs.
En juillet 2025, des chercheurs ont commencé à évaluer leurs pairs avec l'aide de l'IA. Mais cela menace l'intégrité de la recherche scientifique. Les chercheurs ont recours à une nouvelle stratégie pour influencer l'évaluation par les pairs de leurs articles de recherche : ajouter des prompts (instructions génératives) cachés destinés à inciter les outils d'IA à fournir des commentaires positifs. En examinant les articles préliminaires en anglais disponibles sur le site Web arXiv, une étude a trouvé 17 articles qui comprennent une forme ou une autre de message caché destiné à l'IA. L'étude confirme la menace que représente les attaques par injections de prompt.
Voici la présentation du mode « Lockdown » :
Présentation du mode verrouillé et des mentions « Risque élevé » cohérentes dans ChatGPT
À mesure que les systèmes d'IA prennent en charge des tâches plus complexes, en particulier celles qui impliquent le web et les applications connectées, les enjeux en matière de sécurité évoluent.
Un risque émergent est devenu particulièrement préoccupant : l'attaque par injection de prompt. Lors de ces attaques, un tiers tente de tromper un système d'IA conversationnel afin qu'il suive des instructions malveillantes ou révèle des informations sensibles.
Aujourd'hui, nous présentons deux nouvelles protections conçues pour aider les utilisateurs et les entreprises à se prémunir contre les attaques par injection de prompt, avec une visibilité accrue sur les risques et des contrôles renforcés :
- Mode verrouillé dans ChatGPT, un paramètre de sécurité avancé et optionnel pour les utilisateurs à haut risque
- Mentions « Risque élevé » pour certaines capacités pouvant introduire un risque supplémentaire dans ChatGPT, ChatGPT Atlas et Codex
Ces nouveautés viennent compléter les mesures de protection existantes au niveau des modèles, des produits et des systèmes. Cela inclut le sandboxing, les protections contre l'exfiltration de données par URL, la surveillance et les mesures coercitives, ainsi que des contrôles d'entreprise tels que l'accès basé sur les rôles et les journaux d'audit.
Assistance aux organisations pour la protection des employés les plus exposés aux cyberattaques
Le mode verrouillé est un paramètre de sécurité avancé facultatif conçu pour un petit groupe d'utilisateurs très soucieux de la sécurité, tels que les cadres supérieurs ou les équipes de sécurité d'organisations de premier plan, qui ont besoin d'une protection renforcée contre les menaces avancées. Il n'est pas nécessaire pour la plupart des utilisateurs. Ce mode limite strictement la capacité de ChatGPT à interagir avec des systèmes externes afin de réduire le risque d'exfiltration de données par injection de prompt.
Le mode verrouillé désactive délibérément certains outils et fonctionnalités de ChatGPT qu'un pirate pourrait tenter d'exploiter pour extraire des données sensibles des conversations des utilisateurs ou des applications connectées via des attaques telles que les injections de prompt.
Par exemple, la navigation sur le Web en mode verrouillé est limitée au contenu mis en cache, de sorte qu'aucune requête réseau en direct ne quitte le réseau contrôlé d'OpenAI. Cette restriction est conçue pour empêcher l'exfiltration de données sensibles par un pirate informatique lors de la navigation. Certaines fonctionnalités sont entièrement désactivées lorsque nous ne pouvons pas fournir de garanties strictes et certaines quant à la sécurité des données.
Les forfaits Business de ChatGPT fournissent déjà une sécurité des données de qualité professionnelle. Le mode verrouillé s'appuie sur ces protections et est disponible pour ChatGPT Enterprise, ChatGPT Edu, ChatGPT for Healthcare et ChatGPT for Teachers. Les administrateurs peuvent l'activer dans les paramètres de l'espace de travail(ouverture dans une nouvelle fenêtre) en créant un nouveau rôle(ouverture dans une nouvelle fenêtre). Lorsqu'il est activé, ce mode impose des restrictions supplémentaires aux paramètres d'administration existants.
Étant donné que certains flux de travail critiques dépendent d'applications, les administrateurs de l'espace de travail bénéficient de contrôles plus précis. ls peuvent choisir exactement quelles applications, et quelles actions spécifiques au sein de ces applications, sont disponibles pour les utilisateurs en mode verrouillé. De plus, indépendamment de ce mode, la Plateforme de journaux de l’API pour la conformité(ouverture dans une nouvelle fenêtre) offre une visibilité détaillée sur l'utilisation des applications, les données partagées et les sources connectées, aidant les administrateurs à en assurer la supervision.
Nous prévoyons de mettre le mode verrouillé à la disposition des consommateurs dans les prochains mois.
Assister les utilisateurs dans la prise de décisions éclairées concernant les risques
Les produits d'IA peuvent être plus utiles lorsqu'ils sont connectés à vos applications et au Web, et nous avons investi massivement dans la sécurisation des données connectées. Parallèlement, certaines fonctionnalités liées au réseau introduisent de nouveaux risques qui ne sont pas encore entièrement pris en compte par les mesures de sécurité et de sûreté mises en place par le secteur. Certains utilisateurs peuvent être disposés à assumer ces risques, et nous estimons qu'il est important que les utilisateurs aient la possibilité de décider s'ils souhaitent les utiliser et comment, en particulier lorsqu'ils travaillent avec leurs données privées.
Notre approche consiste à fournir des conseils intégrés au produit pour les fonctionnalités susceptibles d'entraîner des risques supplémentaires. Afin de clarifier et d'harmoniser cette approche, nous uniformisons la manière dont nous identifions une liste restreinte de fonctionnalités existantes. Ces fonctionnalités utiliseront désormais un libellé « Risque Élevé » commun dans ChatGPT, ChatGPT Atlas et Codex, afin que les utilisateurs reçoivent les mêmes conseils où qu'ils les rencontrent.
Par exemple, dans Codex, notre assistant de codage, les développeurs peuvent accorder à Codex l'accès au réseau afin qu'il puisse effectuer des actions sur le Web, comme consulter de la documentation. L'écran des paramètres correspondants comprend la mention « Risque élevé », accompagnée d'une explication claire des modifications apportées, des risques potentiels et des cas dans lesquels cet accès est approprié.
Évolutions prévues
Nous continuons à investir dans le renforcement de nos mesures de sécurité et de sûreté, en particulier pour les risques nouveaux, émergents ou croissants. À mesure que nous renforçons les mesures de sécurité pour ces fonctionnalités, nous supprimerons la mention « Risque élevé » dès que nous aurons déterminé que les progrès en matière de sécurité ont suffisamment réduit ces risques afin de permettre une utilisation à grande échelle. Nous continuerons également à mettre à jour les fonctionnalités portant cette mention afin de mieux communiquer les risques aux utilisateurs.
Source : Présentation du mode Lockdown
Et vous ?
Pensez-vous que cette fonctionnalité est crédible ou pertinente ?
Quel est votre avis sur le sujet ?Voir aussi :
Les navigateurs IA créent d'énormes vulnérabilités en matière de cybersécurité : ChatGPT Atlas, Comet de Perplexity et Microsoft Copilot Mode exposent les utilisateurs à des risques de piratage
Anthropic appelle à une pause globale en matière de développement de l'IA face aux signes indiquant qu'ils pourraient échapper au contrôle humain. Certains comportements de l'IA suscitent en effet des craintes
La sécurité reste le grand oublié dans le déploiement de l'IA : Cisco a découvert 1 100 serveurs Ollama ouverts en ligne et exposés à des accès non autorisés, ce qui crée divers risques graves pour les hôtes
Vous avez lu gratuitement 6 661 articles depuis plus d'un an.
Soutenez le club developpez.com en souscrivant un abonnement pour que nous puissions continuer à vous proposer des publications.
Soutenez le club developpez.com en souscrivant un abonnement pour que nous puissions continuer à vous proposer des publications.