GPT-5 : OpenAI se préparerait à lancer son modèle tant attendu en août après des mois de retard et des coûts faramineux

il suscite des attentes élevées face à des rivaux open source comme DeepSeek

GPT-5 : des défis liés à son entraînement et des coûts pharaoniques

Des chercheurs pensent que les progrès de l'IA se heurtent à un mur

DeepSeek a mis fin au mythe du contrôle de l'IA par la Silicon Valley

Conclusion



GPT-5 est attendu comme la prochaine génération majeure des grands modèles de langage (LLM) GPT d'OpenAI. Le modèle fait l'objet de nombreuses spéculations de l'année dernière, certaines sources ayant annoncé son lancement pour l'été 2024. Mais des rapports ont souligné que le coût élevé du modèle et le manque de sources de données qualitatives ont entraîné un retard. Un nouveau rapport de The Verge indique que le lancement GPT-5 est imminent.OpenAI serait en phase finale de préparation de son modèle le plus sophistiqué à ce jour. GPT-5 a déjà fait son apparition en coulisses. Il suscite des attentes non seulement en matière de performances , mais aussi en matière d'implications stratégiques plus larges pour la plateforme et l'écosystème API d'OpenAI.Le PDG Sam Altman a confirmé le lancement imminent du modèle dans un message publié sur X (ex-Twitter) et a donné un aperçu de ses capacités lors d'une apparition dans un podcast avec Theo Von. Évoquant une question à laquelle il avait du mal à répondre, « je l'ai soumise au modèle, il s'agit de GPT-5, et il y a répondu parfaitement », a expliqué le PDG, décrivant ce moment comme lui ayant donné le sentiment d'être « inutile par rapport à l'IA ».OpenAI n'a pas encore communiqué de détails officiels, mais selon le rapport, le lancement devrait inclure plusieurs versions de GPT-5 : une version principale, une version « mini » plus petite et une version « nano » encore plus légère. Si les trois versions seront accessibles via l'API d'OpenAI, seules les versions principale et mini devraient être disponibles directement dans ChatGPT. La version nano, en revanche, devrait rester limitée à l'accès via l'API.Le prochain modèle GPT-5 devrait également reprendre les fonctionnalités de raisonnement du modèle o3 de l'entreprise, qui avait été testé séparément auparavant. Cette initiative permettra à OpenAI de présenter le modèle GPT-5 comme un système plus complet et plus performant. Elle ouvrirait la voie à son objectif plus large de création d'une intelligence artificielle générale (AGI), une IA capable d'effectuer des tâches à un niveau humain ou supérieur.« GPT-5 sera plus intelligent, plus rapide, plus polyvalent et meilleur dans toutes les tâches que GPT-4 », a déclaré le PDG d'OpenAI, Sam Altman, lors du Sommet mondial des gouvernements (WGS) à Dubaï en février 2024. Microsoft, partenaire proche et principal bailleur de fonds d'OpenAI, s'attendait à voir le nouveau modèle vers le milieu de l'année 2024. Toutefois, des sources proches de la startup ont rapporté que rien ne s'est passé comme prévu.Selon un rapport publié en décembre dernier, le projet est en cours depuis plus de 24 mois, mais les problèmes se sont multipliés et les chercheurs d'OpenAI n'entrevoient pas le bout du tunnel . Selon les sources proches du projet, OpenAI aurait effectué au moins deux grands entraînements dans le but de rendre GPT-5 plus intelligent. Chaque fois, de nouveaux problèmes sont apparus et le logiciel n'a pas donné les résultats escomptés par les chercheurs.Selon Sam Altman, la formation de GPT-4 a coûté plus de 100 millions de dollars. Les futurs modèles d'IA devraient dépasser le milliard de dollars. L'échec d'une formation est comparable à l'explosion d'une fusée spatiale peu de temps après son lancement. Les informations sur le projet restent rares.« Que nous brûlions 500 millions de dollars, 5 milliards de dollars ou 50 milliards de dollars par an, cela m'est égal. Je m'en fiche vraiment tant que nous pouvons rester sur une trajectoire où nous créons finalement plus de valeur pour la société que cela et tant que nous pouvons trouver un moyen de payer les factures. Nous sommes en train de créer l'AGI, et cela va coûter cher, mais cela en vaut vraiment la peine », a déclaré Sam Altman en mai 2024. L'un des principaux problèmes techniques est la qualité des données . En règle générale, les modèles deviennent plus performants au fur et à mesure qu'ils ingurgitent des données. Les données utilisées par OpenAI et ses concurrents proviennent principalement de livres, de publications universitaires et d'autres sources réputées. Ce matériel aide les grands modèles de langage à mieux communiquer avec l'utilisateur et à gérer un large éventail de tâches.Pour ses modèles précédents, OpenAI a utilisé de vastes quantités de données extraites du Net : articles de presse, messages sur les médias sociaux et articles scientifiques. Pour rendre GPT-5 plus intelligent, OpenAI doit l'agrandir. Cela signifie qu'il a besoin de plus de données, mais il n'y en a pas assez. OpenAI a constaté que les données en question ne sont pas aussi diversifiées qu'il le pensait, ce qui a limité la capacité d'apprentissage de G¨T-5.Les problèmes rencontrés par OpenAI dans le cadre du développement de GPT-5 ont montré à certains membres de l'entreprise que la stratégie « plus c'est gros, mieux c'est », qui avait été à l'origine de la plupart de ses succès antérieurs, est en train de s'essouffler. Les progrès rapides constatés après l'avènement de ChatGPT en 2022 ont considérablement ralenti. OpenAI n'est pas la seule entreprise à s'inquiéter du fait que les progrès se heurtent à un mur.Dans l'ensemble du secteur, le débat fait rage sur la question de savoir si l'amélioration des IA commence à plafonner . Ilya Sutskever, l'ancien scientifique en chef d'OpenAI, a déclaré que l'ère des données massives est révolue. « Les données n'augmentent pas parce que nous n'avons qu'un seul Internet. On peut même aller jusqu'à dire que les données sont le carburant fossile de l'IA », a déclaré Ilya Sutskever devant un parterre d'experts en 2024.Au début de l'année 2024, OpenAI commençait à ressentir la pression. GPT-4 avait déjà un an et les rivaux commençaient à rattraper leur retard. Un modèle d'Anthropic a été jugé meilleur que GPT-4 par de nombreux acteurs du secteur. Quelques mois plus tard, Google a lancé la nouvelle application d'IA la plus virale de l'année, appelée NotebookLM. Alors que GPT-5 était au point mort, OpenAI a commencé à développer d'autres projets et applications.Il s'agit notamment de versions allégées de GPT-4 et de Sora, un produit capable de produire des vidéos à partir d'invites textuelles. Selon des personnes au fait du dossier, cela a conduit à une lutte interne pour des ressources limitées entre les équipes travaillant sur les nouveaux produits et les chercheurs de GPT-5.OpenAI semble désormais prêt à livrer son modèle tant attendu, mais il pourrait toujours y avoir des surprises comme les fois précédentes. « Alors que le GPT-5 devrait faire ses débuts début août, les dates de sortie prévues par OpenAI changent souvent en fonction des défis liés au développement, des problèmes de capacité des serveurs, ou même des annonces et fuites concernant les modèles d'IA concurrents », indique le rapport de The Verge.Alors que les entreprises américaines investissent des milliards pour créer des modèles d’IA, l’efficacité de DeepSeek a jeté un doute profond sur la pertinence de ces dépenses. Selon certaines sources, le coût total de DeepSeek-R1 équivaudrait au salaire annuel d’un cadre supérieur de Google. En une semaine, l’application s’est hissée en tête des classements sur iPhone et Android. De plus, le modèle est open source et accessible à tous gratuitement.Contrairement à la stratégie d'OpenAI, qui garde ses modèles d'IA fermés, ses concurrents, tels que le français Mistral AI et le chinois DeepSeek, mettent leurs modèles d'IA à la disposition des membres de la communauté de l'IA à des fins d'expérimentation et, dans certains cas, de commercialisation.La stratégie de l'open source s'est avérée très fructueuse pour certaines entreprises. Meta investit massivement dans sa famille de modèles d'IA ouverts Llama et a déclaré au début du mois de mars 2025 que Llama avait enregistré plus d'un milliard de téléchargements. Parallèlement, le succès de son modèle ouvert R1 a permis à DeepSeek de constituer rapidement une large base mondiale d'utilisateurs et d'attirer l'attention des investisseurs chinois.DeepSeek a démontré que le développement d'un modèle performant ne nécessite pas forcément des dépenses colossales. Ce qui a ébranlé la Silicon Valley . Grâce à une combinaison d’architectures efficaces, d'optimisations logicielles et d’un modèle open source, l’entreprise a repensé la logique économique de l’IA. Ce faisant, elle pousse l’industrie à revaloriser l’ingéniosité algorithmique et l’efficacité technique plutôt que la seule puissance brute.En février 2024, Sam Altman a déclaré que GPT-5 sera plus intelligent, plus rapide, plus polyvalent et meilleur dans toutes les tâches que GPT-4 . « Ce bond en avant ne se résume pas à quelques fonctionnalités supplémentaires, il s'agit d'améliorer les capacités de l'IA dans tous les domaines. L'essence de l'avancée de GPT-5 réside dans son intelligence générale, qui promet des améliorations dans pratiquement toutes les tâches qu'elle entreprend », avait-il noté.À l'approche du lancement, les investisseurs et les développeurs s'intéressent désormais à la manière dont GPT-5 pourrait rationaliser les expériences fragmentées en matière d'IA et redéfinir les attentes vis-à-vis des systèmes d'IA à usage général. Face à une rivalité croissante dans ce domaine, de Gemini de Google à Claude d'Anthropic, la sortie de GPT‑5 est un moment décisif qui met à l’épreuve la capacité d’OpenAI à rester en tête de la course à l'IA. OpenAI prévoit de publier un modèle d'IA open source avant même le déploiement prévu en août. Ce modèle devrait être lancé d'ici la fin du mois de juillet. Selon les sources, il sera similaire au modèle o3 mini, avec de bonnes capacités de raisonnement et offrant à la communauté de l'IA l'accès à des outils puissants sans restrictions. Il s'agit d'une avancée majeure, car OpenAI n'a pas publié de modèle entièrement ouvert depuis GPT-2, sorti en 2019.Le modèle ouvert serait disponible sur plusieurs plateformes, notamment Microsoft Azure, Hugging Face et d'autres services cloud majeurs. Cette publication pourrait aider OpenAI à concurrencer des entreprises telles que Meta et DeepSeek, qui ont déjà publié plusieurs modèles ouverts cette année.Quel est votre avis sur le sujet ?Le lancement de GPT-5 serait imminent. Quelles sont vos attentes à son égard ?GPT-5 est considéré comme un test pour le leadership d'OpenAI dans la course à l'IA. Qu'en pensez-vous ?