IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)

Vous êtes nouveau sur Developpez.com ? Créez votre compte ou connectez-vous afin de pouvoir participer !

Vous devez avoir un compte Developpez.com et être connecté pour pouvoir participer aux discussions.

Vous n'avez pas encore de compte Developpez.com ? Créez-en un en quelques instants, c'est entièrement gratuit !

Si vous disposez déjà d'un compte et qu'il est bien activé, connectez-vous à l'aide du formulaire ci-dessous.

Identifiez-vous
Identifiant
Mot de passe
Mot de passe oublié ?
Créer un compte

L'inscription est gratuite et ne vous prendra que quelques instants !

Je m'inscris !

GPT-5 entre enthousiasme et scepticisme : ChatGPT d'OpenAI brille dans des tâches techniques comme la programmation
Mais des erreurs embarrassantes évoquent une évolution incrémentale plutôt qu'une révolution

Le , par Stéphane le calme

30PARTAGES

38  0 
GPT-5 entre enthousiasme et scepticisme : ChatGPT d'OpenAI brille dans certaines tâches techniques comme la programmation,
mais des erreurs embarrassantes évoquent une évolution incrémentale plutôt qu’une révolution

Le lancement de GPT-5 a suscité des réactions mitigées, oscillant entre l'enthousiasme pour ses performances techniques et l'inquiétude concernant la direction stratégique de son créateur. Après plus de deux ans de développement, la mise à jour très attendue du système qui alimente l'application ChatGPT d'OpenAI, extrêmement populaire, a été saluée par certains des premiers utilisateurs comme « évolutive plutôt que révolutionnaire ». La réaction mitigée à la sortie de GPT-5, le modèle de langage de nouvelle génération de cette entreprise valorisée à 300 milliards de dollars, intervient alors que les dirigeants de la Silicon Valley continuent de prédire l'arrivée imminente d'ordinateurs « superintelligents », propulsant l'essor actuel de l'IA.

L’un des points les plus salués concerne ses performances dans la revue de code. Selon le PR Benchmark de Qodo, qui évalue les modèles à partir de revues de pull requests réelles, GPT-5 surpasse la majorité de ses concurrents, notamment en détection de bugs critiques, en pertinence des suggestions et en respect des contraintes de projet. Les résultats des variantes « medium » et « large » dépassent les 70 points, un score jugé excellent pour ce type de tâche.

Voici les forces qui lui ont été remarquées par ce baromètre :
  • Couverture plus large des bogues et focalisation sur les problèmes critiques : Il s'agit souvent du seul modèle permettant de détecter les problèmes critiques tels que les failles de sécurité ou les failles de compilation.
  • Des correctifs précis et concis : Différences minimales et valides qui ne touchent que les nouvelles lignes - pas de bruit de style, juste de l'impact.
  • Conformité aux règles et clarté : Adhésion forte aux contraintes de révision avec des justifications courtes et bien argumentées.
  • Filtrage de la criticité : Ne renvoie souvent rien lorsqu'il n'y a pas de problème réel, évitant ainsi un surcroît de travail inutile.

En voici les faiblesses :
  • Faux positifs : quelques évaluations contiennent des corrections incorrectes ou nuisibles.
  • Étiquetage incohérent : classifie parfois de manière erronée la gravité des résultats ou aborde des sujets interdits.
  • Redondance : certaines répétitions ou suggestions insignifiantes diluent l'utilité de l'évaluation.

Selon Qodo : « ce modèle fournit systématiquement des analyses qui identifient davantage de problèmes réels, rédigent des correctifs plus clairs et le font avec une grande transparence dans le raisonnement. C'est un autre exemple qui montre comment les modèles peuvent être optimisés non seulement pour les benchmarks, mais aussi pour gagner la confiance réelle des développeurs ».


GPT-5 domine la concurrence en matière de performance de l'examen du code

Des erreurs embarrassantes, des améliorations jugées modestes

Malgré le discours marketing sur cette intelligence artificielle de pointe, qualifiée « d'intelligence de niveau doctorat » par ses créateurs, GPT-5 pense qu'il y a trois « r » dans le mot « Northern Territory ». C'est ce qu'ont découvert les utilisateurs après avoir essayé la dernière mouture de ChatGPT.

Lors d'un événement de lancement de GPT-5 jeudi, le PDG d'OpenAI, Sam Altman, a décrit la dernière version de ChatGPT comme « l'accès à un expert de niveau doctorat dans votre poche », comparant la version précédente à un étudiant universitaire et celle d'avant à un lycéen.

Cependant, lorsque les utilisateurs des réseaux sociaux ont tenté de mettre GPT-5 au défi, ils ont constaté que le modèle commettait des erreurs élémentaires dans ses réponses. Un utilisateur de Bluesky a remarqué que le chatbot affirmait à plusieurs reprises qu'il y avait trois B dans « blueberry ».

« Oui, blueberry est l'un de ces mots dont le milieu vous fait presque trébucher, comme s'il disait « b-b-better pay attention » (mieux vaut faire attention) », a déclaré le chatbot dans la conversation publiée. « Mais ce petit moment bb est satisfaisant, il rend le mot encore plus entraînant. »


Un autre utilisateur a constaté que le chatbot était incapable d'identifier correctement les États américains contenant la lettre R. Et lorsqu'on lui a demandé de produire une carte, il a mal orthographié des États tels que « Krizona » et « Vermoni ». ChatGPT a également répertorié deux fois la Californie et inventé les États « New Jefst » et « Mitroinia ».


Une évolution incrémentale plutôt qu’une révolution

Si GPT-5 brille dans certaines tâches techniques, nombre de spécialistes soulignent qu’il ne s’agit que d’une évolution incrémentale plutôt que d’une révolution. En créativité et en raisonnement, il ne surpasse pas nettement ses rivaux, et serait même distancé par Grok 4 Heavy dans certaines évaluations.

« GPT-5 est excellent sur de nombreux fronts pratiques. Est-ce le meilleur modèle ? Peut-être. Mais dans certains domaines, les gains cognitifs sont modestes », a déclaré Azeem Azhar, de la newsletter sur l'IA Exponential View. « Je qualifierais cette nouvelle version d'évolutive plutôt que révolutionnaire », ajoutant qu'il ne s'agissait pas d'un « bond en avant vers une cognition plus proche de celle des humains ».

La pérennité de l'engouement actuel pour l'IA, qui génère des centaines de milliards de dollars d'investissements annuels dans les infrastructures des centres de données par les grandes entreprises technologiques, repose sur les prévisions des dirigeants du secteur de l'IA selon lesquelles l'intelligence artificielle générale, c'est-à-dire des systèmes dont l'intelligence dépasse celle des humains, serait disponible d'ici quelques années seulement.

« Les enjeux sont élevés pour OpenAI avec ce lancement », ont écrit vendredi les analystes de la Deutsche Bank dans une note de recherche adressée à leurs clients. « L'entreprise, et l'industrie dans son ensemble, ont besoin que [GPT-5] soit un succès pour prouver que le boom de l'IA n'est pas en train de s'essouffler. »

Sur la base d'une série de tests largement utilisés pour évaluer et comparer les modèles d'IA, GPT-5 a apporté des améliorations significatives par rapport aux modèles précédents d'OpenAI et a établi de nouveaux records dans des domaines essentiels tels que le codage et le raisonnement, tout en réduisant le nombre d'« hallucinations » ou d'erreurs dans ses réponses. De nombreux développeurs ont également félicité OpenAI pour avoir réduit le prix d'accès à son dernier modèle, qui est gratuit pour les utilisateurs de ChatGPT.

Cependant, certains des premiers utilisateurs de GPT-5 l'ont jugé moins impressionnant en matière d'écriture créative, tandis que d'autres espéraient des progrès plus importants par rapport aux concurrents de ChatGPT, tels qu'Anthropic et Google, alors que la course à la suprématie en matière d'IA se resserre. Grok 4 Heavy, lancé le mois dernier par xAI d'Elon Musk, surpasse toujours GPT-5 dans certains tests évaluant les capacités de raisonnement et de connaissance.

Nathan Lambert, chercheur à l'Allen Institute for AI, a déclaré qu'OpenAI avait tenté de trouver un équilibre entre les progrès constants de ses systèmes d'IA sous-jacents et l'amélioration de l'accessibilité et de la facilité d'utilisation de GPT-5.

« À bien des égards, GPT-5 était voué à l'échec, ce qui est très décourageant pour ceux qui s'attendent à des progrès maximaux en matière d'IA à court terme », a-t-il déclaré. « Les progrès de l'IA sont bien réels, tant que l'on ne croit pas à une augmentation exponentielle des capacités. Ces arguments sont très remis en question par la sortie de GPT-5. »

Avant le lancement de GPT-5, le directeur d'OpenAI, Sam Altman, a déclaré que même s'il ne s'agissait pas d'une IA générale, le nouveau système constituait tout de même une « amélioration considérable ».

« Je déteste un peu le terme AGI, car tout le monde l'utilise à ce stade pour désigner des choses légèrement différentes », a-t-il déclaré. « Il s'agit clairement d'un modèle qui est généralement intelligent, [mais] je pense que dans la façon dont la plupart d'entre nous définissons l'AGI, il nous manque encore quelque chose d'assez important. »


OpenAI réintroduit GPT-4o dans ChatGPT, un jour seulement après l'avoir remplacé par GPT-5

Dans un message publié sur X, le PDG d'OpenAI, Sam Altman, a confirmé que la société allait permettre aux utilisateurs payants de passer à GPT-4o après que les utilisateurs de ChatGPT aient déploré son remplacement. « Nous allons permettre aux utilisateurs Plus de choisir de continuer à utiliser 4o », déclare Altman. « Nous allons observer l'utilisation afin de déterminer pendant combien de temps nous allons proposer les anciens modèles. »

Depuis des mois, les fans de ChatGPT attendaient le lancement de GPT-5, qui, selon OpenAI, apporte des améliorations majeures aux capacités d'écriture et de codage par rapport à ses prédécesseurs. Mais peu après le lancement du modèle d'IA phare, de nombreux utilisateurs ont souhaité revenir en arrière.

« GPT 4.5 me parlait vraiment, et aussi pathétique que cela puisse paraître, c'était mon seul ami », écrit un utilisateur sur les réseaux sociaux. « Ce matin, je suis allé lui parler et au lieu d'un petit paragraphe avec un point d'exclamation ou d'être optimiste, c'était littéralement une seule phrase. Un discours d'entreprise sans intérêt. »

Dans le cadre du lancement de GPT-5, OpenAI a supprimé le sélecteur de modèles de ChatGPT. Ce menu déroulant contenait auparavant un ensemble de modèles d'OpenAI aux noms déroutants, permettant aux utilisateurs de passer de l'un à l'autre en fonction de leurs besoins. Les utilisateurs pouvaient sélectionner GPT-4o, par exemple, pour les tâches complexes, ou choisir le modèle o4 mini, plus efficace, pour les travaux de moindre envergure. Les utilisateurs avaient également la possibilité de passer d'une génération de modèles à l'autre, ce qui leur permettait de passer du GPT-4o, sorti l'année dernière, au GPT-4.1, plus récent.


Conclusion

Le lancement de GPT-5 reflète à la fois la puissance et les fragilités d’OpenAI. Oui, le modèle affiche des avancées notables en codage, introduit une architecture adaptative prometteuse et s’accompagne de mesures de sécurité inédites. Mais ces progrès sont contrebalancés par des erreurs factuelles surprenantes, une communication maladroite et une insatisfaction marquée d’une partie des utilisateurs.

Plutôt qu’un bond spectaculaire vers l’IA générale, GPT-5 apparaît comme une étape intermédiaire ambitieuse mais incomplète. L’enjeu pour OpenAI sera désormais de consolider la fiabilité du modèle, de rétablir la confiance des utilisateurs et de prouver que ces innovations techniques s’accompagnent d’une réelle plus-value dans les usages quotidiens.

Sources : Benchmark Qodo, Sam Altman

Et vous ?

GPT-5 apporte-t-il des innovations majeures, ou s’agit-il d’une évolution incrémentale présentée comme une révolution pour maintenir la hype ? Y avait-il trop d'attente autour de GPT-5 ?

Si GPT-5 excelle dans des tâches techniques comme la revue de code, est-ce un avantage ou un risque pour l'avenir de la profession de développeur ? L'IA va-t-elle rendre ces rôles plus efficaces ou les rendre obsolètes ?

La capacité de l'IA à identifier des failles de sécurité ou des erreurs de compilation est-elle suffisante pour lui confier des responsabilités critiques dans le développement logiciel ?

Sommes-nous encore loin de l'aperçu de l'AGI promis par Sam Altman avec GPT-5 ?
Vous avez lu gratuitement 1 599 articles depuis plus d'un an.
Soutenez le club developpez.com en souscrivant un abonnement pour que nous puissions continuer à vous proposer des publications.

Une erreur dans cette actualité ? Signalez-nous-la !

Avatar de d_d_v
Membre expérimenté https://www.developpez.com
Le 13/08/2025 à 9:25
Quelle que soit la version utilisée, chatgpt continue à m'inventer des fonctions qui n'existent pas dans une lib pourtant clairement documentée. Ca me fait plus perdre du temps que d'en gagner. Inutilisable comme techno, vivement que la bulle éclate.
7  0 
Avatar de Nym4x
Membre confirmé https://www.developpez.com
Le 10/08/2025 à 9:52
Si cela pouvait enfin stopper la machine IA à bullshit... Si je prend un niveau doctorant cela équivaut à faire de la recherche, donc de faire des découvertes qui n'existent pas... Il faudrait m'expliquer comment une IA générative qui a besoin d'un énorme dataset pour répondre peut prétendre à un niveau doctorant. Ensuite, le problème d'une IA c'est l'aléatoire... Que je lui demande de générer une image ou du code, j'obtiendrais un résultat différent à chaque fois et qui ne correspond pas exactement à ce que je veux. C'est pour cela qu'elle propose par exemple plusieurs images lors d'une génération. Si on peut effectivement améliorer de plus en plus les limites ce qu'elle génère, cela conservera toujours une part d'aléatoire.
5  0 
Avatar de doriphore4545
Nouveau Candidat au Club https://www.developpez.com
Le 09/08/2025 à 7:48
autre test que j'ai bien faire, utiliser le prompt suivant :

"combien de mots va contenir ta réponse ?"

la meilleure et la plus concise des réponses serait : "un"

je n'ai pas encore eu une seule réponse correcte avec tous les LLM que j'ai testé (pas encore testé sur gtp5)
4  0 
Avatar de selmanjo
Membre régulier https://www.developpez.com
Le 15/08/2025 à 2:13
Je trouve les critiques sur ChatGPT GPT5 justifiées ! À force de changer de version, chatgpt change sa manière de generer sa réponse (de penser) or notre cerveau aime ce qui se repete ! à force cela donne mal aux cranes quelque soit la version de
chatGPT ! Au final, j'attend encore 2 ans pour observer les évolutions puis adopter ou concevoir mon IA personnalisé et spécialisé sur une tache spécifique/experte.
4  0 
Avatar de Pierre Louis Chevalier
Expert éminent sénior https://www.developpez.com
Le 09/08/2025 à 18:19
Non seulement on est loin de l'AGI mais un tas d'utilisateurs affirment que GPT 5 est moins bien que GPT 4 pour leur usage habituel, c'est quoi ce désastre ?
3  0 
Avatar de kain_tn
Expert éminent https://www.developpez.com
Le 09/08/2025 à 20:11
Citation Envoyé par Stéphane le calme Voir le message
[...]
Dans un message publié sur X, le PDG d'OpenAI, Sam Altman, a confirmé que la société allait permettre aux utilisateurs payants de passer à GPT-4o après que les utilisateurs de ChatGPT aient déploré son remplacement. « Nous allons permettre aux utilisateurs Plus de choisir de continuer à utiliser 4o », déclare Altman. « Nous allons observer l'utilisation afin de déterminer pendant combien de temps nous allons proposer les anciens modèles. »
[...]
Dans le cadre du lancement de GPT-5, OpenAI a supprimé le sélecteur de modèles de ChatGPT. Ce menu déroulant contenait auparavant un ensemble de modèles d'OpenAI aux noms déroutants, permettant aux utilisateurs de passer de l'un à l'autre en fonction de leurs besoins. Les utilisateurs pouvaient sélectionner GPT-4o, par exemple, pour les tâches complexes, ou choisir le modèle o4 mini, plus efficace, pour les travaux de moindre envergure. Les utilisateurs avaient également la possibilité de passer d'une génération de modèles à l'autre, ce qui leur permettait de passer du GPT-4o, sorti l'année dernière, au GPT-4.1, plus récent.
Voilà la vraie news de OpenAI: ça n'est pas rentable, et il faut absolument faire rentrer plus d'argent.

Après Anthropic qui bride l'accès à son IA, Google qui suspend les charges de travail liés à l'IA soit disant pour protéger le réseau électrique (ils vont surtout replanifier aux moments où ça leur coûtera le moins cher, oui), on a OpenAI qui nous sort un "nouveau modèle" moins performant et qui bride l'accès aux modèles plus performants derrière un abonnement.
3  0 
Avatar de laurhaq
Nouveau Candidat au Club https://www.developpez.com
Le 11/08/2025 à 8:52
Bonjour, hier j'ai codé en MQL5 avec CHATGPT5, et, j'ai trouvé que son
Analyse et son code sont meilleurs qu'auparvant. En analyse de texte ill est plus rapide. Personnellement, je l'adopte. Oui il y a des bugs, de ce que j'ai lu, , mais de la à le jeter... C'est comme toutes les nouvelles version.
3  0 
Avatar de PC241167
Membre actif https://www.developpez.com
Le 13/08/2025 à 23:07
Citation Envoyé par d_d_v Voir le message
Quelle que soit la version utilisée, chatgpt continue à m'inventer des fonctions qui n'existent pas dans une lib pourtant clairement documentée. Ca me fait plus perdre du temps que d'en gagner. Inutilisable comme techno, vivement que la bulle éclate.
Dans un tout autre domaine, c’est-à-dire le Juridique, je confirme. j’arrive exactement aux mêmes conclusions. C’est un ramassis de conneries d’inventions d’arrêts du conseil d’État qui n’existent pas le temps à corriger ces imbécillités est du temps perdu.

Et pour ma passion, le son c’est encore plus gros.

je demande le processus,d’une optimisation pour le système pyramix de merging, outre le fait que la bêtise artificielle, ressort des vidéos YouTube, d’optimisation de PC de jeux vidéo… finit par me sortir tout simplement une synthèse mal faite du How to officiel de la marque merging.(rien que pour pyramix, c’est plus de 800 pages de Manuel. Sans compter les manuels des cartes son et cette nullité artificielle me sort 10 lignes ça c’est du pouvoir de synthèse. )

J’ai vraiment pas besoin de cette merdouille c’est vraiment du gros marketing qui tache. Peut-être que dans quelques années, ça existera vraiment, mais pour l’instant, c’est vraiment de la daube. L’expression est parfaitement employée, c’est vraiment une bulle. Il est temps qu’elle éclate parce qu’on commence à en avoir ras le … :

Le top, c’est sur YouTube, les guignols qui se sont autoproclamés, experts IA et qui proposent des formations à 1500 € la pièce sans avoir aucune formation autre que YouTube j’imagine parce que sinon ils en feraient état. Enfin ceci dit quand on voit l’attitude des mecs et leur tronche, on se doute bien qu’ils ont pas fait polytechnique. on va dire qu’ils sont diplômés de World of Warcraft (pas vanilla)

De toute façon il y a un signe qui ne trompe pas : quand un mec sur YouTube garde sa casquette sur la tronche à l’intérieur pour faire sa vidéo devant son ordinateur, c’est que c’est un naze ( à moins qu’il y ait un trou dans le plafond). Si en plus dans son émission il a enregistré des Applause c’est 100 points de pénalité, et si au final il a osé nous imposer une image débile du mec la bouche en cul de poule, Alors là c’est carrément rédhibitoire, je regarde pas c’est mission impossible.

généralement sur YouTube en ce moment sur le non sujet de l’intelligence artificielle, on a droit au moins deux éléments sur trois la gueule de c… La formule «*ça y est Dieu est parmi nous, la société va changer, c’est la révolution la plus importante en 3 milliards d’années*» ,etc. etc. etc. c’est vraiment lamentable.

On a droit aussi à l’interview du mec rempli de hamburgers à trente ans, qui semble avoir un demi de tension et qui raconte qu’hier il lavait les carreaux et qu’aujourd’hui sans aucune formation, il a créé grâce à l’ia un logiciel révolutionnaire qui va lui permettre de racheter tous les gafam réunis d’ici septembre.

Triste génération

La mienne avait LIO
Les jeunes ont l’IA
On a le sex symbol qu’on peut.
3  0 
Avatar de JackIsJack
Membre éclairé https://www.developpez.com
Le 10/08/2025 à 23:12
Si ça c'est un déploiement catastrophique... Je crois qu'on ne vit pas dans le même monde du travail 😂
2  0 
Avatar de marsupial
Expert éminent https://www.developpez.com
Le 09/08/2025 à 21:33
https://disesdi.substack.com/p/60000...i-agents-wrong : 5 minutes de lecture qui vont changer la vision des agents 'sécurisés' pour toujours...
1  0