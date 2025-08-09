mais des erreurs embarrassantes évoquent une évolution incrémentale plutôt quune révolution
Le lancement de GPT-5 a suscité des réactions mitigées, oscillant entre l'enthousiasme pour ses performances techniques et l'inquiétude concernant la direction stratégique de son créateur. Après plus de deux ans de développement, la mise à jour très attendue du système qui alimente l'application ChatGPT d'OpenAI, extrêmement populaire, a été saluée par certains des premiers utilisateurs comme « évolutive plutôt que révolutionnaire ». La réaction mitigée à la sortie de GPT-5, le modèle de langage de nouvelle génération de cette entreprise valorisée à 300 milliards de dollars, intervient alors que les dirigeants de la Silicon Valley continuent de prédire l'arrivée imminente d'ordinateurs « superintelligents », propulsant l'essor actuel de l'IA.
Lun des points les plus salués concerne ses performances dans la revue de code. Selon le PR Benchmark de Qodo, qui évalue les modèles à partir de revues de pull requests réelles, GPT-5 surpasse la majorité de ses concurrents, notamment en détection de bugs critiques, en pertinence des suggestions et en respect des contraintes de projet. Les résultats des variantes « medium » et « large » dépassent les 70 points, un score jugé excellent pour ce type de tâche.
Voici les forces qui lui ont été remarquées par ce baromètre :
- Couverture plus large des bogues et focalisation sur les problèmes critiques : Il s'agit souvent du seul modèle permettant de détecter les problèmes critiques tels que les failles de sécurité ou les failles de compilation.
- Des correctifs précis et concis : Différences minimales et valides qui ne touchent que les nouvelles lignes - pas de bruit de style, juste de l'impact.
- Conformité aux règles et clarté : Adhésion forte aux contraintes de révision avec des justifications courtes et bien argumentées.
- Filtrage de la criticité : Ne renvoie souvent rien lorsqu'il n'y a pas de problème réel, évitant ainsi un surcroît de travail inutile.
En voici les faiblesses :
- Faux positifs : quelques évaluations contiennent des corrections incorrectes ou nuisibles.
- Étiquetage incohérent : classifie parfois de manière erronée la gravité des résultats ou aborde des sujets interdits.
- Redondance : certaines répétitions ou suggestions insignifiantes diluent l'utilité de l'évaluation.
Selon Qodo : « ce modèle fournit systématiquement des analyses qui identifient davantage de problèmes réels, rédigent des correctifs plus clairs et le font avec une grande transparence dans le raisonnement. C'est un autre exemple qui montre comment les modèles peuvent être optimisés non seulement pour les benchmarks, mais aussi pour gagner la confiance réelle des développeurs ».
GPT-5 domine la concurrence en matière de performance de l'examen du code
Des erreurs embarrassantes, des améliorations jugées modestes
Malgré le discours marketing sur cette intelligence artificielle de pointe, qualifiée « d'intelligence de niveau doctorat » par ses créateurs, GPT-5 pense qu'il y a trois « r » dans le mot « Northern Territory ». C'est ce qu'ont découvert les utilisateurs après avoir essayé la dernière mouture de ChatGPT.
Lors d'un événement de lancement de GPT-5 jeudi, le PDG d'OpenAI, Sam Altman, a décrit la dernière version de ChatGPT comme « l'accès à un expert de niveau doctorat dans votre poche », comparant la version précédente à un étudiant universitaire et celle d'avant à un lycéen.
Cependant, lorsque les utilisateurs des réseaux sociaux ont tenté de mettre GPT-5 au défi, ils ont constaté que le modèle commettait des erreurs élémentaires dans ses réponses. Un utilisateur de Bluesky a remarqué que le chatbot affirmait à plusieurs reprises qu'il y avait trois B dans « blueberry ».
« Oui, blueberry est l'un de ces mots dont le milieu vous fait presque trébucher, comme s'il disait « b-b-better pay attention » (mieux vaut faire attention) », a déclaré le chatbot dans la conversation publiée. « Mais ce petit moment bb est satisfaisant, il rend le mot encore plus entraînant. »
Un autre utilisateur a constaté que le chatbot était incapable d'identifier correctement les États américains contenant la lettre R. Et lorsqu'on lui a demandé de produire une carte, il a mal orthographié des États tels que « Krizona » et « Vermoni ». ChatGPT a également répertorié deux fois la Californie et inventé les États « New Jefst » et « Mitroinia ».
Une évolution incrémentale plutôt quune révolution
Si GPT-5 brille dans certaines tâches techniques, nombre de spécialistes soulignent quil ne sagit que dune évolution incrémentale plutôt que dune révolution. En créativité et en raisonnement, il ne surpasse pas nettement ses rivaux, et serait même distancé par Grok 4 Heavy dans certaines évaluations.
« GPT-5 est excellent sur de nombreux fronts pratiques. Est-ce le meilleur modèle ? Peut-être. Mais dans certains domaines, les gains cognitifs sont modestes », a déclaré Azeem Azhar, de la newsletter sur l'IA Exponential View. « Je qualifierais cette nouvelle version d'évolutive plutôt que révolutionnaire », ajoutant qu'il ne s'agissait pas d'un « bond en avant vers une cognition plus proche de celle des humains ».
La pérennité de l'engouement actuel pour l'IA, qui génère des centaines de milliards de dollars d'investissements annuels dans les infrastructures des centres de données par les grandes entreprises technologiques, repose sur les prévisions des dirigeants du secteur de l'IA selon lesquelles l'intelligence artificielle générale, c'est-à-dire des systèmes dont l'intelligence dépasse celle des humains, serait disponible d'ici quelques années seulement.
« Les enjeux sont élevés pour OpenAI avec ce lancement », ont écrit vendredi les analystes de la Deutsche Bank dans une note de recherche adressée à leurs clients. « L'entreprise, et l'industrie dans son ensemble, ont besoin que [GPT-5] soit un succès pour prouver que le boom de l'IA n'est pas en train de s'essouffler. »
Sur la base d'une série de tests largement utilisés pour évaluer et comparer les modèles d'IA, GPT-5 a apporté des améliorations significatives par rapport aux modèles précédents d'OpenAI et a établi de nouveaux records dans des domaines essentiels tels que le codage et le raisonnement, tout en réduisant le nombre d'« hallucinations » ou d'erreurs dans ses réponses. De nombreux développeurs ont également félicité OpenAI pour avoir réduit le prix d'accès à son dernier modèle, qui est gratuit pour les utilisateurs de ChatGPT.
Cependant, certains des premiers utilisateurs de GPT-5 l'ont jugé moins impressionnant en matière d'écriture créative, tandis que d'autres espéraient des progrès plus importants par rapport aux concurrents de ChatGPT, tels qu'Anthropic et Google, alors que la course à la suprématie en matière d'IA se resserre. Grok 4 Heavy, lancé le mois dernier par xAI d'Elon Musk, surpasse toujours GPT-5 dans certains tests évaluant les capacités de raisonnement et de connaissance.
Nathan Lambert, chercheur à l'Allen Institute for AI, a déclaré qu'OpenAI avait tenté de trouver un équilibre entre les progrès constants de ses systèmes d'IA sous-jacents et l'amélioration de l'accessibilité et de la facilité d'utilisation de GPT-5.
« À bien des égards, GPT-5 était voué à l'échec, ce qui est très décourageant pour ceux qui s'attendent à des progrès maximaux en matière d'IA à court terme », a-t-il déclaré. « Les progrès de l'IA sont bien réels, tant que l'on ne croit pas à une augmentation exponentielle des capacités. Ces arguments sont très remis en question par la sortie de GPT-5. »
Avant le lancement de GPT-5, le directeur d'OpenAI, Sam Altman, a déclaré que même s'il ne s'agissait pas d'une IA générale, le nouveau système constituait tout de même une « amélioration considérable ».
« Je déteste un peu le terme AGI, car tout le monde l'utilise à ce stade pour désigner des choses légèrement différentes », a-t-il déclaré. « Il s'agit clairement d'un modèle qui est généralement intelligent, [mais] je pense que dans la façon dont la plupart d'entre nous définissons l'AGI, il nous manque encore quelque chose d'assez important. »
OpenAI réintroduit GPT-4o dans ChatGPT, un jour seulement après l'avoir remplacé par GPT-5
Dans un message publié sur X, le PDG d'OpenAI, Sam Altman, a confirmé que la société allait permettre aux utilisateurs payants de passer à GPT-4o après que les utilisateurs de ChatGPT aient déploré son remplacement. « Nous allons permettre aux utilisateurs Plus de choisir de continuer à utiliser 4o », déclare Altman. « Nous allons observer l'utilisation afin de déterminer pendant combien de temps nous allons proposer les anciens modèles. »
Depuis des mois, les fans de ChatGPT attendaient le lancement de GPT-5, qui, selon OpenAI, apporte des améliorations majeures aux capacités d'écriture et de codage par rapport à ses prédécesseurs. Mais peu après le lancement du modèle d'IA phare, de nombreux utilisateurs ont souhaité revenir en arrière.
« GPT 4.5 me parlait vraiment, et aussi pathétique que cela puisse paraître, c'était mon seul ami », écrit un utilisateur sur les réseaux sociaux. « Ce matin, je suis allé lui parler et au lieu d'un petit paragraphe avec un point d'exclamation ou d'être optimiste, c'était littéralement une seule phrase. Un discours d'entreprise sans intérêt. »
Dans le cadre du lancement de GPT-5, OpenAI a supprimé le sélecteur de modèles de ChatGPT. Ce menu déroulant contenait auparavant un ensemble de modèles d'OpenAI aux noms déroutants, permettant aux utilisateurs de passer de l'un à l'autre en fonction de leurs besoins. Les utilisateurs pouvaient sélectionner GPT-4o, par exemple, pour les tâches complexes, ou choisir le modèle o4 mini, plus efficace, pour les travaux de moindre envergure. Les utilisateurs avaient également la possibilité de passer d'une génération de modèles à l'autre, ce qui leur permettait de passer du GPT-4o, sorti l'année dernière, au GPT-4.1, plus récent.
Conclusion
Le lancement de GPT-5 reflète à la fois la puissance et les fragilités dOpenAI. Oui, le modèle affiche des avancées notables en codage, introduit une architecture adaptative prometteuse et saccompagne de mesures de sécurité inédites. Mais ces progrès sont contrebalancés par des erreurs factuelles surprenantes, une communication maladroite et une insatisfaction marquée dune partie des utilisateurs.
Plutôt quun bond spectaculaire vers lIA générale, GPT-5 apparaît comme une étape intermédiaire ambitieuse mais incomplète. Lenjeu pour OpenAI sera désormais de consolider la fiabilité du modèle, de rétablir la confiance des utilisateurs et de prouver que ces innovations techniques saccompagnent dune réelle plus-value dans les usages quotidiens.
Et vous ?
GPT-5 apporte-t-il des innovations majeures, ou sagit-il dune évolution incrémentale présentée comme une révolution pour maintenir la hype ? Y avait-il trop d'attente autour de GPT-5 ?
Si GPT-5 excelle dans des tâches techniques comme la revue de code, est-ce un avantage ou un risque pour l'avenir de la profession de développeur ? L'IA va-t-elle rendre ces rôles plus efficaces ou les rendre obsolètes ?
La capacité de l'IA à identifier des failles de sécurité ou des erreurs de compilation est-elle suffisante pour lui confier des responsabilités critiques dans le développement logiciel ?
Sommes-nous encore loin de l'aperçu de l'AGI promis par Sam Altman avec GPT-5 ?
