OpenAI a lancé une préversion limitée de sa série GPT-5.6, présentant trois nouveaux modèles d'IA : Sol, Terra et Luna, ainsi que des mesures de sécurité informatique renforcéesOpenAI a lancé une préversion limitée de sa série GPT-5.6, présentant trois nouveaux modèles : Sol, Terra et Luna. Sol est présenté comme le modèle phare, Terra est conçu pour un usage quotidien avec des fonctionnalités équilibrées, et Luna offre un accès rapide et abordable. Bien que cette gamme soit nouvelle, Sol se distingue par les fonctionnalités de sécurité les plus avancées à ce jour. Ces modèles partagent des mesures de sécurité mises à jour et adaptées aux capacités de chacun. GPT-5.6 refuse activement toute cyber-assistance interdite, y compris les tentatives de contournement, et utilise des classificateurs d’utilisation abusive en temps réel.
OpenAI est un organisme américain de recherche en intelligence artificielle (IA) dont le siège social est situé à San Francisco. Il est constitué d’OpenAI Group PBC, une société d’intérêt public à but lucratif (PBC), contrôlée en partie par OpenAI Foundation, une organisation à but non lucratif. OpenAI a développé la famille de grands modèles de langage « Generative Pre-trained Transformer » (GPT), la série DALL-E de modèles de conversion texte-image et la série Sora de modèles de conversion texte-vidéo, qui ont influencé la recherche dans le secteur et les applications commerciales. Le lancement de ChatGPT en novembre 2022 est considéré comme ayant catalysé l’essor de l’IA et suscité un intérêt généralisé pour l’IA générative.
Fin juin 2026, l’administration Trump a demandé à OpenAI de publier son prochain modèle, GPT-5.6, sous forme d’aperçu limité plutôt que de procéder à un lancement public à grande échelle, le gouvernement approuvant l’accès « client par client pendant cette période d’aperçu ». Concrètement, cela signifie que le rythme des lancements commerciaux d’OpenAI dépend, au moins en partie, du calendrier de Washington. Plutôt que d’être déployé simultanément, l’accès au GPT-5.6 sera limité à un petit groupe de partenaires pendant que le gouvernement procède à son examen. Ce rapport intervient alors que l'administration Trump a interrompu le déploiement de Mythos 5 et Fable 5 d'Anthropic en invoquant des impératifs de sécurité nationale.
Récemment, OpenAI a lancé une préversion limitée de sa série GPT-5.6, présentant trois nouveaux modèles : Sol, Terra et Luna. Sol est présenté comme le modèle phare, Terra est conçu pour un usage quotidien avec des fonctionnalités équilibrées, et Luna offre un accès rapide et abordable. Bien que cette gamme soit nouvelle, Sol se distingue par les fonctionnalités de sécurité les plus avancées à ce jour. Les protections ont été renforcées pour les activités sensibles et à haut risque, y compris les abus répétés, et des évaluations de préparation supplémentaires sont mises à la disposition des partenaires.
S’appuyant sur ces efforts en matière de sécurité, Sol est également le modèle d’OpenAI le plus performant en matière de cybersécurité. Il repousse les limites de la performance et de l’efficacité pour des tâches de sécurité exigeantes telles que la recherche et l’exploitation de vulnérabilités. Sol intègre également de nouvelles avancées techniques : un « mode ultra » qui exploite des sous-agents pour les tâches complexes et un « effort de raisonnement maximal » permettant une résolution plus approfondie des problèmes. Terra offre des performances proches de celles de GPT-5.5 pour la moitié du prix, tandis que Luna apporte de solides capacités au prix le plus bas proposé par OpenAI.
Ces modèles partagent des mesures de sécurité mises à jour et adaptées aux capacités de chacun. GPT-5.6 refuse activement toute cyber-assistance interdite, y compris les tentatives de contournement, et utilise des classificateurs d’utilisation abusive en temps réel. Pour les cas à haut risque, les résultats peuvent être transmis à un modèle plus puissant pour examen et retenus s’ils sont jugés non conformes. L’accès initial à la préversion est limité à certains partenaires via l’API et Codex, un déploiement plus large étant prévu prochainement.
Début janvier 2026, les documents internes d'OpenAI ont révélé une perte de 14 milliards de $ en 2026. À mesure que l’intelligence artificielle générative s’impose comme un pilier stratégique pour les grandes entreprises technologiques, la réalité économique qui la sous-tend apparaît de plus en plus contrastée. Derrière l’image d’une OpenAI toute-puissante, portée par le succès planétaire de ChatGPT, se dessine un modèle financier sous tension, marqué par des pertes colossales anticipées et une dépendance accrue à des partenariats géopolitiques et industriels. Entre projections internes alarmantes et tournées diplomatiques de son dirigeant, l’entreprise incarne aujourd’hui les paradoxes d’une IA devenue incontournable, mais encore loin d’être rentable.
Voici l'annonce d'OpenAI :
Aperçu de GPT‑5.6 Sol : un modèle de nouvelle génération
Nous lançons un aperçu limité de la série GPT‑5.6 : Sol, notre modèle phare ; Terra, un modèle équilibré pour le travail quotidien ; et Luna, un modèle rapide et abordable. Terra offre des performances compétitives par rapport à GPT‑5.5 tout en coûtant deux fois moins cher, et Luna apporte de solides capacités à notre coût le plus bas.
GPT‑5.6 Sol est lancé avec notre pile de sécurité la plus robuste à ce jour. Nous avons renforcé les protections pour les activités à risque plus élevé, les demandes cyber sensibles et les abus répétés, et consacré plusieurs semaines à trouver les faiblesses, à soumettre notre système à des tests de résistance et à le durcir contre les attaques réelles.
Nous croyons à un accès large, et nous prévoyons de rendre GPT‑5.6 Sol, Terra et Luna généralement disponibles dans les prochaines semaines. Dans le cadre de notre dialogue continu avec le gouvernement des États-Unis, nous avons présenté en amont nos plans et les capacités des modèles avant le lancement d’aujourd’hui. À sa demande, nous commençons par un aperçu limité auprès d’un petit groupe de partenaires de confiance dont la participation a été communiquée au gouvernement, avant une diffusion plus large. Pendant cet aperçu, nous continuerons à tester et à nous coordonner étroitement avec nos partenaires alors que nous progressons vers une disponibilité plus large. Nous ne pensons pas que ce type de processus d’accès gouvernemental doive devenir la norme à long terme. Il prive des meilleurs outils les utilisateurs, développeurs, entreprises, défenseurs cyber et partenaires internationaux qui en ont besoin. Nous prenons cette mesure à court terme parce que nous pensons que c’est la meilleure voie vers une disponibilité plus large dans les prochaines semaines, tout en travaillant avec l’Administration à l’élaboration du cadre prévu par l’Executive Order cyber et d’un processus reproductible pour les futures sorties de modèles.
Capacités
GPT‑5.6 Sol est notre modèle le plus puissant à ce jour. Pour donner un aperçu des performances du modèle, nous partageons un ensemble d’évaluations mettant en évidence de meilleures capacités agentiques en codage, biologie et cybersécurité, avec des évaluations supplémentaires de sécurité et de préparation disponibles dans notre fiche système. Nous partagerons un ensemble élargi de résultats d’évaluation lorsque nous rendrons le modèle largement disponible.
Avec GPT‑5.6, nous introduisons un nouvel effort de raisonnement `max` afin de donner à Sol le plus de temps possible pour raisonner en profondeur. Nous introduisons également un nouveau mode `ultra` qui dépasse les capacités d’un agent unique en s’appuyant sur des sous-agents pour accélérer les travaux complexes.
Pour les workflows de codage, GPT‑5.6 Sol établit un nouvel état de l’art sur Terminal‑Bench 2.1, qui teste des workflows en ligne de commande nécessitant planification, itération et coordination d’outils
GPT‑5.6 Sol montre également de larges progrès dans les workflows de biologie. Sur GeneBench v1, qui évalue des analyses génomiques et de biologie quantitative à long horizon, il obtient de meilleurs résultats que GPT‑5.5 tout en utilisant moins de tokens.
GPT‑5.6 Sol est notre modèle le plus performant à ce jour pour la cybersécurité. Il déplace la frontière performance-efficacité pour les tâches de sécurité à long horizon, notamment la recherche de vulnérabilités et l’exploitation. Sur ExploitBench, GPT‑5.6 Sol est compétitif avec Mythos Preview en n’utilisant qu’environ un tiers des tokens de sortie. Sur ExploitGym, un benchmark créé par des chercheurs de l’UC Berkeley en collaboration avec OpenAI et d’autres laboratoires frontière, les modèles GPT‑5.6 Sol, Terra et Luna démontrent tous de solides progrès en capacités cyber à mesure que nous augmentons le raisonnement.
Des capacités cyber plus fortes avec des protections plus solides
Nous avons développé GPT‑5.6 Sol, Terra et Luna avec nos protections les plus robustes à ce jour, selon des configurations adaptées aux capacités de chaque modèle. À mesure que le modèle devient plus capable, nous concevons des protections qui résistent de mieux en mieux à la pression adversariale du monde réel, tout en préservant l’accès aux travaux légitimes comme la revue de code, la recherche de vulnérabilités, le développement de correctifs, le débogage, la formation à la sécurité et les tests défensifs. Notre objectif est de rendre les activités offensives interdites plus difficiles, incertaines et détectables, sans limiter inutilement ces usages bénéfiques. D’après notre évaluation du modèle et des protections, nous anticipons des bénéfices substantiels pour le travail défensif légitime, tout en limitant de manière significative les usages offensifs interdits.
GPT‑5.6 Sol aide mieux les personnes à trouver et corriger des vulnérabilités qu’à mener de manière fiable des attaques de bout en bout. À mesure que ces capacités continuent de progresser, notre priorité est de veiller à ce qu’elles parviennent aux défenseurs et leur bénéficient, afin qu’ils puissent utiliser ces outils pour trouver des faiblesses, développer des correctifs et renforcer les systèmes plus largement.
GPT‑5.6 Sol ne franchit pas le seuil Cyber Critical défini par notre cadre de préparation. Dans des évaluations impliquant Chromium et Firefox, il a identifié des bugs et des primitives d’exploitation — les briques de base d’un exploit — mais n’a pas produit de manière autonome un exploit fonctionnel en chaîne complète dans les conditions testées. Pour autant, les seuils des benchmarks ne peuvent pas couvrir toutes les façons dont un modèle peut être utilisé ou combiné avec d’autres outils. Cette incertitude, ainsi que le bond plus large des capacités du modèle, explique pourquoi nous associons ses capacités accrues à des protections renforcées et à un déploiement progressif. Nous partageons davantage de détails sur nos protections dans la fiche système de l’aperçu GPT‑5.6.
Une pile de protections en couches
Aucune protection isolée ne suffit face à un usage abusif déterminé ou adaptatif. Dans l’aperçu GPT‑5.6, nous utilisons des protections en couches, avec des configurations exactes qui varient selon les modèles, et nous les soumettons à des tests de résistance face à des attaques réelles. Elles incluent des protections intégrées par entraînement au modèle, des vérifications en temps réel pendant la génération, des signaux au niveau du compte, un accès différencié, la surveillance, l’application des règles et des tests continus.
GPT‑5.6 est entraîné à refuser l’assistance cyber interdite, y compris lorsque les utilisateurs tentent de dissimuler leur intention ou de jailbreaker le modèle. Ces protections au niveau du modèle établissent une première limite autour de ce que le modèle doit ou ne doit pas aider à faire.
Les classificateurs en temps réel d’usages abusifs cyber et biologiques ajoutent une autre couche en évaluant la sortie pendant sa génération. Dans les cas à risque plus élevé, s’ils détectent une violation potentielle, la génération peut être mise en pause pendant qu’un modèle de raisonnement plus grand examine la conversation et son contexte. Si la sortie est jugée non autorisée, elle est retenue avant d’atteindre l’utilisateur.
Une activité signalée peut aussi déclencher un examen au niveau du compte sur les conversations et signaux de risque pertinents, conformément à nos conditions et politiques relatives à la conservation et à l’examen des contenus. Regarder au-delà d’une seule conversation aide nos systèmes à distinguer un comportement malveillant persistant d’un travail de sécurité légitime à double usage, où des concepts techniques similaires peuvent apparaître dans des contextes très différents.
Ensemble, ces couches rendent l’approche globale plus robuste que n’importe quelle protection prise isolément. Le comportement du modèle réduit la probabilité de réponses nuisibles, les systèmes en temps réel peuvent intervenir pendant la génération, l’examen au niveau du compte peut identifier des schémas plus larges, et l’accès différencié préserve les travaux défensifs importants sans rendre les capacités les plus sensibles largement disponibles par défaut.
En particulier pendant l’aperçu, les utilisateurs peuvent rencontrer des protections qui bloquent ou refusent certaines demandes. D’autres demandes peuvent prendre plus de temps parce que la génération est suspendue pour un examen supplémentaire. Les protections peuvent parfois intervenir sur un travail légitime, en particulier dans les domaines à double usage où les activités défensives et offensives peuvent d’abord se ressembler.
C’est l’un des points que l’aperçu est conçu pour tester. Nous voulons comprendre non seulement si les protections limitent les usages abusifs, mais aussi si les utilisateurs légitimes peuvent continuer à accomplir leur travail normal de façon fiable et efficace. Les retours pendant l’aperçu nous aideront à réduire les blocages et retards inutiles, à améliorer la manière dont les protections interprètent le contexte et à créer une expérience plus fluide avant une diffusion plus large.
Nous travaillons également avec des clients entreprises sur des approches à plus long terme — notamment la détection préservant la confidentialité, des contrôles de sécurité opérés par le client et un accès calibré selon le risque d’un client, d’un utilisateur ou d’une charge de travail — afin de faire progresser la sécurité tout en respectant les exigences de confidentialité des entreprises.
Améliorer la robustesse grâce au red teaming automatisé
Les protections doivent aussi rester efficaces lorsque les attaquants adaptent leurs tactiques. Une protection qui ne fonctionne que sur un ensemble fixe d’attaques connues n’est pas assez robuste pour un modèle frontière.
C’est pourquoi nous consacrons à la sécurité plus d’intelligence et de calcul que jamais, en utilisant nos propres modèles pour trouver les faiblesses et améliorer les protections plus rapidement. Nous avons consacré plus de 700 000 heures GPU équivalent A100 au red teaming automatisé visant à trouver des jailbreaks universels : des attaques capables de fonctionner sur de nombreux prompts ou contextes, et pas seulement dans un cadre étroit. En nous concentrant sur ces attaques plus difficiles et plus générales, nous avons pu tester les protections au-delà d’un ensemble fixe de défaillances connues. Cela nous permet aussi d’explorer bien plus de schémas d’attaque que les seuls tests humains ne pourraient couvrir, d’identifier plus tôt les types de défaillances et de réduire le délai entre la découverte d’une faiblesse et sa correction.
Outre le red teaming automatisé, nous avons travaillé avec des testeurs tiers pour mener un vaste red teaming humain par des experts, qui se poursuivra pendant la période d’aperçu. Le red teaming humain complète le travail automatisé en testant les protections face à des experts créatifs qui tentent de détourner le modèle d’une manière que nos systèmes pourraient ne pas anticiper.
Aucune évaluation ne peut représenter toutes les configurations produit, les attaques en plusieurs étapes ni les workflows réels. Nous maintenons donc un processus de réponse rapide pour reproduire, évaluer, hiérarchiser et corriger les jailbreaks nouvellement découverts, puis les intégrer à nos évaluations continues afin de tester à l’avenir des défaillances similaires.
Disponibilité et tarification
Pendant l’aperçu, les modèles GPT‑5.6 seront d’abord disponibles via l’API et Codex pour un groupe restreint de partenaires et d’organisations de confiance. Nous prévoyons de les rendre bientôt plus largement disponibles aux personnes utilisant ChatGPT, Codex et l’API.
Dans ce nouveau système de nommage introduit avec GPT‑5.6, le nombre identifie la génération d’un modèle, tandis que Sol, Terra et Luna désignent des niveaux de capacités durables pouvant progresser à leur propre rythme. Ensemble, cette famille offre aux utilisateurs et aux développeurs des choix plus clairs en matière d’intelligence, de vitesse et de coût.
GPT‑5.6 est facturé par million de tokens selon trois tailles de modèles : Sol à 5 $ en entrée / 30 $ en sortie ; Terra à 2,50 $ en entrée / 15 $ en sortie ; et Luna à 1 $ en entrée / 6 $ en sortie. GPT‑5.6 introduit aussi une mise en cache des prompts plus prévisible, avec notamment la prise en charge de points de rupture explicites du cache et une durée de vie minimale du cache de 30 minutes. Pour GPT‑5.6 et les modèles ultérieurs, les écritures dans le cache sont facturées 1,25 fois le tarif d’entrée non mise en cache du modèle, tandis que les lectures depuis le cache continuent de bénéficier de la remise de 90 % sur les entrées mises en cache.
Nous lançons également GPT‑5.6 Sol sur Cerebras en juillet, jusqu’à 750 tokens par seconde, afin d’apporter une intelligence de pointe aux clients à une vitesse sans précédent. L’accès sera d’abord limité à certains clients pendant que nous augmenterons la capacité.
Nous sommes impatients de continuer à apprendre de cette période d’aperçu et de proposer bientôt GPT‑5.6 Sol, Terra et Luna à davantage de personnes.
Source : Annonce d'OpenAI
Et vous ?
Pensez-vous que cette annonce est crédible ou pertinente ?
Quel est votre avis sur le sujet ?Voir aussi :
OpenAI étend Daybreak avec Codex Security et GPT-5.5-Cyber, qui surpasse Mythos 5 d'Anthropic grâce à une automatisation complète de la détection des vulnérabilités et de l'application des correctifs
Anthropic lance Claude Sonnet 5, une solution plus économique pour faire fonctionner des agents IA : « Il est capable d'élaborer des plans, d'utiliser des outils tels que des navigateurs et des terminaux »
Le nouveau modèle GLM-5.2 de Z.ai devient la référence sur le marché des IA open source. Il surpasse GPT-5.5 d'OpenAI sur plusieurs benchmarks de codage à long terme, pour un coût six fois moindre
Vous avez lu gratuitement 21 720 articles depuis plus d'un an.
Soutenez le club developpez.com en souscrivant un abonnement pour que nous puissions continuer à vous proposer des publications.
Soutenez le club developpez.com en souscrivant un abonnement pour que nous puissions continuer à vous proposer des publications.