Un chercheur décortique le mécanisme publicitaire de ChatGPT jusqu'aux cookies déposés sur les sites marchands, tandis qu'OpenAI rate ses objectifs et entraîne Oracle dans sa chute

Le 29 avril 2026 à 22:34, par Stéphane le calme

78PARTAGES

Un chercheur décortique le mécanisme publicitaire de ChatGPT jusqu'aux cookies déposés sur les sites marchands,
tandis qu'OpenAI rate ses objectifs et entraîne Oracle dans sa chute

C'était, paraît-il, le dernier recours. En 2024, Sam Altman qualifiait lui-même la combinaison de l'IA et de la publicité de chose « particulièrement troublante », et promettait qu'OpenAI ne s'y résoudrait qu'en cas d'absolue nécessité. Nous y sommes. Depuis février 2026, ChatGPT diffuse des publicités aux utilisateurs américains des offres gratuites et Go. Et un chercheur vient de mettre au jour le fonctionnement précis de la machinerie; côté serveur, côté client, jusqu'aux cookies déposés sur les sites marchands.

Pour comprendre pourquoi OpenAI a franchi ce Rubicon publicitaire, il faut d'abord rappeler dans quel état se trouvent ses finances. C'est en janvier 2026 qu'OpenAI a officiellement annoncé le lancement de tests publicitaires aux États-Unis, d'abord pour les utilisateurs du tier gratuit puis pour les abonnés de son offre Go à 8 dollars par mois. Le modèle de placement retenu est simple : les publicités s'affichent au bas des réponses lorsqu'un produit ou service sponsorisé est jugé pertinent par rapport à la conversation en cours. Les abonnés Plus, Pro, Business, Enterprise et Education sont, pour l'instant, épargnés.

L'argument officiel d'OpenAI est celui de l'accessibilité : maintenir la rapidité, la fiabilité et l'amélioration continue des offres gratuites et bas de gamme exige des investissements infrastructurels considérables, et la publicité est présentée comme le mécanisme de financement d'un accès plus large, non comme un abandon du modèle d'abonnement. Sauf que les chiffres qui filtrent racontent une histoire moins flatteuse... et c'est précisément ce que la mécanique technique mise au jour par un chercheur en sécurité permet de mesurer autrement.

Les pubs arrivent dans le flux de conversation, pas à côté

La première chose à comprendre, c'est l'architecture technique. Lorsqu'un utilisateur envoie un message à ChatGPT, le backend ouvre une réponse en Server-Sent Events (SSE) à l'adresse chatgpt.com/backend-api/f/conversation. La majorité des événements de ce flux sont des sorties du modèle. Certains sont des blocs publicitaires.

Ces blocs ont un type explicitement nommé : single_advertiser_ad_unit. Concrètement, le backend injecte des objets structurés de ce type dans le flux SSE pendant que le modèle répond. L'annonce arrive donc au même niveau technique que la réponse de l'IA, même si elle est présentée visuellement séparée. Un exemple capturé dans la nature montre une publicité Grubhub (livraison de cuisine chinoise) apparue dans le fil d'une conversation sur un voyage à Pékin. Le ciblage est contextuel : même compte, sujet différent, marque différente. Lors de conversations sur les vols vers Pékin, l'annonce bascule vers un comparateur de billets. Sur les playoffs NBA, place à une application de billetterie. Sur la productivité, Canva.

Le chercheur n'a pas trouvé de preuve formelle que le ciblage incorpore aussi l'historique complet des conversations, mais ne peut pas l'exclure non plus.

Chaque bloc publicitaire contient plusieurs éléments : l'identifiant stable du compte annonceur (adacct_<32 caractères hexadécimaux>

, une URL de destination enrichie de paramètres UTM spécifiques à ChatGPT (utm_source=chatgptpilot), et surtout quatre jetons chiffrés en Fernet AES-128-CBC avec HMAC-SHA256. C'est là que les choses deviennent franchement intéressantes du point de vue de la sécurité.

L'exemple que le chercheur a donné :

Code :

Sélectionner tout

1
2
3
4
5
6
7
8
9
10
11
12
13
14
event: delta
data: {
  "type":           "single_advertiser_ad_unit",
  "ads_request_id": "069e89b3-c038-7764-8000-6e5a193e5f69",
  "ads_spam_integrity_payload": "gAAAAABp6Js_<...redacted...>",
  "preamble":       "",
  "advertiser_brand": {
    "name":        "Grubhub",
    "url":         "www.grubhub.com",
    "favicon_url": "https://bzrcdn.openai.com/cabfae7ead26b03d.png",
    "id":          "adacct_6984ed0ba55481a29894bb192f7773b4"
  },
  "carousel_cards": [{
    "title":     "Get Chinese Food Delivered",
    "body":      "Satisfy Your Cravings with Grubhub Delivery.",
    "image_url": "https://bzrcdn.openai.com/cabfae7ead26b03d.png",
    "target": {
      "type":  "url",
      "value": "https://www.grubhub.com/?utm_source=chatgptpilot&utm_medium=paid&utm_campaign=diner_gh_search_chatgpt_kw_traffic_nb_x_nat_x&utm_content=nbchinese&oppref=gAAAA<...>&olref=gAAAA<...>",
      "open_externally": false
    },
    "ad_data_token": "eyJwYXlsb2<...>"
  }]
}

Quatre jetons, une chaîne d'attribution serrée

Chaque annonce est accompagnée de quatre blobs chiffrés Fernet distincts, dont les rôles ont pu être reconstitués d'après leur position dans le flux.

Le premier, ads_spam_integrity_payload, reste côté serveur : c'est un mécanisme anti-fraude pour détecter les clics forgés. Le deuxième, oppref, voyage avec l'URL de clic et est immédiatement recopié par le SDK côté marchand dans un cookie de première partie nommé __oppref, avec une durée de vie de 720 heures, soit trente jours. C'est le jeton d'attribution principal : il accompagnera tous les événements ultérieurs du pixel côté marchand. Le troisième, olref, est présent sur l'URL de clic mais ne semble pas être conservé par le SDK observé, vraisemblablement destiné aux logs côté OpenAI. Le quatrième, ad_data_token, est encapsulé en base64 dans le flux SSE et semble être réconcilié côté serveur au moment du clic.

Ce qui rend ces jetons Fernet partiellement lisibles par n'importe qui, c'est une particularité de leur format : les neuf premiers octets sont publics; un octet de version 0x80 suivi d'un horodatage Unix sur 8 octets en big-endian. La date de création de n'importe lequel de ces jetons est donc récupérable sans la clé d'OpenAI. Le chercheur a ainsi pu dater un clic vers Home Depot avec une précision à la seconde : jeton émis à 11:30:08 UTC, page marchande chargée à 11:31:43 UTC. Latence : 95 secondes.

Le SDK OAIQ : la boucle se ferme chez le marchand

La deuxième moitié du dispositif opère entièrement chez l'annonceur, côté navigateur. Lorsque l'utilisateur clique sur la carte publicitaire, son navigateur s'ouvre sur la page marchande avec l'oppref en paramètre d'URL. La page charge alors un SDK JavaScript nommé OAIQ, actuellement en version 0.1.3, hébergé sur bzrcdn.openai.com.

Ce script effectue trois opérations : il lit le paramètre oppref dans l'URL, l'écrit dans le cookie __oppref, et pose un cookie sonde nommé __oaiq_domain_probe. Ensuite, chaque événement de mesure (vue de produit, ajout au panier, achat) est transmis en POST vers bzr.openai.com/v1/sdk/events. La boucle est fermée : OpenAI sait non seulement qu'une publicité a été vue et que l'utilisateur a cliqué dessus dans ChatGPT, mais aussi quelles actions ont été effectuées sur le site du marchand dans les trente jours suivants.

Les deux domaines à filtrer si l'on veut bloquer ce suivi sont donc bzrcdn.openai.com et bzr.openai.com. Les deux cookies à surveiller après un clic depuis ChatGPT sont __oppref et __oaiq_domain_probe. L'auteur de l'analyse les a d'ailleurs publiés dans son article sous forme de règles pour bloqueurs de publicités.

La promesse d'OpenAI face à la réalité technique

OpenAI a publié ses principes publicitaires, et ils sont présentés de façon rassurante. La société affirme que les publicités n'influencent pas les réponses de ChatGPT, que les conversations restent privées vis-à-vis des annonceurs, et qu'elle ne vend jamais les données des utilisateurs. Techniquement, rien dans l'analyse publiée ne contredit directement ces affirmations : les blocs publicitaires sont distincts du flux du modèle, clairement typés, et ne semblent pas modifier les réponses générées.

Envoyé par OpenAI

Les publicités n'influencent pas les réponses fournies par ChatGPT. Celles-ci sont optimisées uniquement en fonction de leur utilité pour vous, Lorsque vous voyez une publicité, celle-ci est toujours clairement identifiée comme sponsorisée et visuellement distincte de la réponse organique.

Au cours du test, nous déterminons quelle publicité afficher en associant les publicités soumises par les annonceurs au sujet de votre conversation, à vos discussions passées et à vos interactions antérieures avec des publicités. Par exemple, si vous recherchez des recettes, vous pourriez voir des publicités pour des kits repas ou des services de livraison de courses. S'il y a plusieurs annonceurs, nous sélectionnerons celui qui est le plus pertinent pour votre discussion et vous le proposerons en premier.

Mais la nuance est ailleurs. Pendant les tests, le ciblage incorpore le sujet de la conversation en cours, les discussions passées, et les interactions précédentes avec les publicités. Autrement dit, même si la réponse du modèle n'est pas altérée, l'historique conversationnel sert de signal de ciblage, une donnée d'une richesse sans équivalent dans l'univers publicitaire classique. Google et Meta ciblent sur la base de comportements de navigation ; ChatGPT cible sur la base de ce que vous avez dit, cherché, demandé dans vos moments de doute ou de décision.

D'après les estimations publiées dans la presse spécialisée, OpenAI aurait généré entre 4 et 20 millions de dollars de revenus publicitaires engagés pour sa version bêta avant la fin du premier trimestre 2026. Ce chiffre reste négligeable par rapport à l'échelle nécessaire pour contribuer significativement à un chiffre d'affaires annuel cible de 25 milliards de dollars. Les publicités ne sauveront pas les finances d'OpenAI à court terme, mais elles posent un cadre, une infrastructure, et surtout un précédent.

Le débat de fond : publicités transparentes ou publicités intégrées ?

Sur les forums spécialisés, où l'analyse a été largement discutée, plusieurs fils de discussion éclairent les tensions réelles. Un commentateur fait remarquer que le fait que les blocs publicitaires arrivent comme des événements distincts les rend facile à bloquer. Il continue en disant qu'une fois qu'ils seront intégrés directement dans le texte du modèle, « les choses deviendront vraiment intéressantes ». Un autre rétorque qu'il n'est pas nécessaire d'intervenir au niveau des poids du modèle pour obtenir un effet similaire : il suffit de générer des mots-clés à partir de la requête, d'injecter des consignes d'annonceurs dans le contexte, et de laisser le modèle produire une réponse naturellement orientée.

La question du passage aux publicités intégrées (invisibles, non étiquetées, indissociables de la réponse) est dans tous les esprits, même si aucun élément technique ne prouve qu'OpenAI s'y prépare. Mais la pression économique est réelle, et l'histoire des plateformes numériques invite à la prudence : le câble était sans publicité, puis ne l'était plus. Netflix était sans publicité, puis ne l'était plus. OpenAI a précisé qu'une offre sans publicité restera toujours disponible sous forme payante. Pour combien de temps, et à quel prix ?

Sur le plan de la concurrence, l'enjeu est aussi stratégique. La menace la plus immédiate pour Google ne réside peut-être pas dans le fait que ChatGPT s'approprie directement ses revenus publicitaires, mais dans le fait qu'il établisse un cadre alternatif pour la publicité au sein d'une interface d'IA et que les annonceurs commencent à allouer des budgets de test supplémentaires à ChatGPT, réduisant ainsi la part de Google dans les nouvelles dépenses publicitaires numériques, même si ses revenus absolus se maintiennent.

Depuis le lancement des tests aux États-Unis, OpenAI a annoncé une expansion vers le Canada, l'Australie et la Nouvelle-Zélande, avec l'ambition d'étendre le dispositif à de nombreux autres marchés dans l'année. La machine est lancée.

La facture qui ne passe pas

Les publicités dans ChatGPT ne sont pas une décision de produit. Elles sont une décision de survie financière, et le Wall Street Journal a rendu l'équation publique le 28 avril 2026. OpenAI n'a pas atteint son objectif interne d'un milliard d'utilisateurs actifs hebdomadaires d'ici fin 2025, n'en comptant qu'environ 900 millions en février 2026, et a manqué plusieurs de ses cibles mensuelles de revenus début 2026, sous la pression de la concurrence croissante de Google Gemini et d'Anthropic. Plus structurellement inquiétant : la part de ChatGPT dans le trafic web d'IA générative est passée de 86,7 % à 64,5 % en un an, pendant que Gemini bondissait de 5,7 % à 21,5 %.

Ce sont les alertes internes qui ont fait le plus de dégâts. La directrice financière Sarah Friar a fait part à d'autres dirigeants de ses inquiétudes quant à la capacité d'OpenAI à honorer ses futurs contrats informatiques si son chiffre d'affaires ne progressait pas assez rapidement, un aveu particulièrement mal venu à quelques mois d'une introduction en Bourse espérée à 1 000 milliards de dollars de valorisation.

Les marchés ont sanctionné immédiatement. Oracle, lié à OpenAI par un accord de calcul de 300 milliards de dollars sur cinq ans, a perdu jusqu'à 7 % en séance. SoftBank, son plus grand investisseur externe, a plongé de 9,9 % à Tokyo, sa pire performance en six mois. CoreWeave a reculé de plus de 5 %. OpenAI a pourtant levé 122 milliards de dollars lors de sa plus grande levée de fonds jamais réalisée, mais s'attend à épuiser cette somme en trois ans même si elle atteint ses objectifs de revenus.

C'est dans ce contexte que le SDK OAIQ déposant ses cookies sur les sites marchands prend une tout autre dimension. La boucle d'attribution que le chercheur a reconstituée n'est pas un détail d'architecture, c'est l'infrastructure d'un modèle économique de substitution, construit en urgence par une entreprise dont le récit de croissance irrésistible commence à se fissurer.

Sources : Buchodi, OpenAI

Et vous ?

Peut-on réellement faire confiance à une IA dont le modèle économique dépend partiellement de la publicité contextuelle, même si ses réponses ne sont techniquement pas altérées ?

La distinction entre « publicité injectée dans le flux SSE » et « publicité intégrée dans la réponse du modèle » est-elle tenable sur le long terme, ou n'est-ce qu'une question de trimestres avant que la frontière s'efface ?

Le ciblage basé sur l'historique des conversations constitue-t-il un traitement de données personnelles sensibles au sens du RGPD, et comment les autorités européennes vont-elles se positionner ?

Si OpenAI ouvre officiellement un marché publicitaire en temps réel lié au contexte conversationnel, quelles barrières réelles existent pour empêcher une course aux enchères algorithmique sur vos intentions les plus personnelles ?

Vous avez lu gratuitement 22 934 articles depuis plus d'un an.
Soutenez le club developpez.com en souscrivant un abonnement pour que nous puissions continuer à vous proposer des publications.

Une erreur dans cette actualité ? Signalez-nous-la !

Votre nom : Votre e-mail :

Décrivez l'erreur que vous souhaitez porter à notre connaissance :

Identifiez-vous

Créer un compte

Un chercheur décortique le mécanisme publicitaire de ChatGPT jusqu'aux cookies déposés sur les sites marchands, tandis qu'OpenAI rate ses objectifs et entraîne Oracle dans sa chute

Identifiant
Mot de passe

Mot de passe oublié ?