« L'humanité a prévalu (pour l'instant !) » : un développeur parvient à battre un modèle IA avancé d'OpenAI dans une compétition de codage qui aura duré 10 heures

Le 20 juillet 2025 à 08:00, par Stéphane le calme

32PARTAGES

Un développeur parvient à battre un modèle IA avancé d'OpenAI dans une compétition de codage qui aura duré 10 heures
« L'humanité a prévalu (pour l'instant !) », a-t-il écrit

À bout de souffle, Przemysław Dębiak, un développeur polonais, a récemment accompli ce qui pourrait bientôt devenir impossible : armé de VS Code classique avec une autocomplétion de base pour accélérer les tâches répétitives, il a battu un modèle d'IA avancé d'OpenAI dans une compétition de codage. Le marathon de 10 heures l'a laissé « complètement épuisé ». Cette victoire a eu lieu lors du concours AtCoder World Tour Finals 2025 Heuristic à Tokyo où OpenAI s'est « contentée » de la deuxième place malgré son IA de pointe spécialement entraînée pour ce type de défi.

Przemysław Dębiak (connu sous le nom de « Psyho »), un ancien employé d'OpenAI, a battu de justesse le modèle d'IA personnalisé lors du concours AtCoder World Tour Finals 2025 Heuristic à Tokyo. AtCoder, une plateforme japonaise qui organise des concours de programmation et maintient des classements mondiaux, a organisé ce qui pourrait être le premier concours où un modèle d'IA a affronté directement les meilleurs programmeurs humains lors d'un grand championnat mondial sur site. Lors de cet événement, le fabricant de ChatGPT a participé en tant que sponsor et a inscrit un modèle d'IA dans un match d'exhibition spécial intitulé « Humains contre IA ». Malgré la nature infatigable du silicium, l'entreprise est repartie avec la deuxième place.

« L'humanité a prévalu (pour l'instant !) », a écrit Dębiak sur X, notant qu'il avait peu dormi alors qu'il participait à plusieurs compétitions sur trois jours. « Je suis complètement épuisé. ... Je suis à peine en vie ».

Le concours demandait aux concurrents de résoudre un problème d'optimisation complexe en 10 heures. Ce concours fait écho à l'histoire populaire américaine de John Henry, le conducteur d'acier qui s'est battu contre une machine de forage à vapeur dans les années 1870. À l'instar de la bataille légendaire d'Henry contre l'automatisation industrielle, la victoire de Dębiak représente un expert humain qui se pousse jusqu'à ses limites physiques pour prouver que les compétences humaines comptent encore à l'ère des progrès de l'IA.

Le marathon de codage met à l'épreuve l'endurance humaine et l'efficacité de l'IA

La finale de l'AtCoder World Tour est l'un des événements les plus exclusifs de la programmation compétitive. Seuls les 12 meilleurs programmeurs du monde, sur la base de leurs performances au cours de l'année précédente, y sont invités. La division Heuristique se concentre sur les problèmes d'optimisation « NP-hard ». En programmation, les heuristiques sont des techniques de résolution de problèmes qui permettent de trouver des solutions satisfaisantes grâce à des raccourcis et à des suppositions éclairées lorsque des réponses parfaites prendraient trop de temps à calculer.

Tous les concurrents, y compris OpenAI, étaient limités à un matériel identique fourni par AtCoder, ce qui garantissait l'égalité des chances entre les concurrents humains et les concurrents de l'IA. Selon les règles du concours, les participants pouvaient utiliser n'importe quel langage de programmation disponible sur AtCoder, sans pénalité pour une nouvelle soumission, mais avec une attente obligatoire de cinq minutes entre les soumissions.

Les résultats finaux du concours ont montré que Psyho a terminé avec un score de 1 812 272 558 909 points, tandis que le modèle d'OpenAI (répertorié comme « OpenAIAHC ») a obtenu 1 654 675 725 406 points, soit une marge d'environ 9,5 %. Le candidat artificiel d'OpenAI, un modèle de raisonnement simulé personnalisé similaire à o3, s'est classé deuxième au classement général, devant 10 autres programmeurs humains qui s'étaient qualifiés à l'issue de classements effectués tout au long de l'année.

OpenAI a qualifié cette deuxième place d'étape importante pour les modèles d'IA dans la programmation compétitive. « Les modèles comme o3 se classent parmi les 100 premiers dans les concours de codage/mathématiques, mais à notre connaissance, il s'agit de la première place dans le top 3 d'un concours de codage/mathématiques de premier plan », a déclaré un porte-parole de l'entreprise. « Des événements comme AtCoder nous permettent de tester la capacité de nos modèles à raisonner de manière stratégique, à planifier sur de longues périodes et à améliorer les solutions par essais et erreurs, comme le ferait un être humain ».

Réactions : admiration, respect et interrogations

La victoire de Dębiak a déclenché une vague de félicitations dans la communauté tech. Le PDG d’OpenAI, Sam Altman, a tweeté simplement : « Good job psyho. » Un message sobre, mais révélateur d’un certain respect pour un adversaire humain qui a su briller là où beaucoup pensaient la partie déjà jouée.

Les organisateurs d’AtCoder ont, eux aussi, salué la performance de l’IA, tout en soulignant que la créativité humaine avait, cette fois encore, pris le dessus.

Une trêve avant la domination des machines ?

Cette compétition pourrait rester dans les annales comme l’un des derniers bastions humains dans le domaine du codage compétitif pur. Non pas que les IA soient encore invincibles, mais leur courbe de progression est exponentielle. Leur capacité à apprendre de telles compétitions, à améliorer leurs heuristiques et à simuler l’intuition humaine pourrait rapidement leur permettre de prendre le dessus.

Mais il reste une leçon fondamentale : la force brute ne suffit pas toujours. Là où les machines optimisent, les humains imaginent. Et dans un monde où l’on valorise de plus en plus la vitesse, l’efficacité et la répétabilité, cet affrontement rappelle que l’intelligence humaine est précieuse parce qu’elle est imparfaite, émotionnelle, épuisable… et créative.

Un « vibe codeur » dépourvu de véritables compétences en programmation ne cesse de remporter des hackathons à San Francisco

Parallèlement, une autre révolution est en train de s’opérer. À San Francisco et dans d’autres pôles technologiques, des individus remportent hackathons et compétitions de prototypage... sans être de véritables développeurs. Ils pratiquent ce que l’on appelle le vibe coding : une approche où l’on interagit avec des modèles d’IA pour générer du code, souvent par simple saisie en langage naturel. Avec l'essor d'outils d'IA tels que ChatGPT, il est désormais possible de décrire un programme en langage naturel (français par exemple) et de demander au modèle d'IA de le traduire en code fonctionnel sans jamais comprendre comment le code fonctionne.

C'est la cas de Rene Turcios qui a perfectionné cette pratique pendant des années, bien avant que le terme ne soit popularisé, et qui s'en est servi pour remporter des prix lors de nombreux hackathons.

Rene Turcios est un jeune homme de 29 ans vivant à San Francisco, en Californie. Ancien joueur professionnel du jeu Yu‑Gi‑Oh!, il vit dans le quartier du Tenderloin, et son mode de vie atypique intrigue autant qu’il fascine. Depuis 2023, il aurait participé à plus de 200 hackathons, sans avoir de réelles aptitudes en programmation. Il n'écrit aucune ligne de code, s'appuyant uniquement sur le vide coding afin de transformer ses idées en prototypes fonctionnels.

Cette approche remet en question l’idée même de « savoir coder ». Dans ce paradigme, la valeur ne réside plus dans la syntaxe ou les algorithmes, mais dans la capacité à orchestrer l’intelligence artificielle comme un outil créatif.

Collin Lowenburg, ingénieur et organisateur de hackathons, se souvient de l'irruption de Rene Turcios sur le circuit. « Il a participé à tous les hackathons », explique Collin Lowenburg, qui s'est habitué à voir Rene Turcios régulièrement à AGI House, Founders Inc, Frontier Tower et d'autres lieux de hackathon à San Francisco. « Il a commencé à gagner, et il a continué à se frayer un chemin jusqu'au sommet », a-t-il déclaré au San Francisco Standard.

Et si l'avenir de la programmation appartenait au centaure (dans ce cas humain expérimenté assisté par IA) ?

La performance de Dębiak apparaît presque comme un vestige héroïque de l’époque artisanale du code. Il est encore possible, avec un esprit entraîné et une volonté surhumaine, de battre la machine. Mais de plus en plus, l’environnement professionnel et technologique évolue vers des modèles hybrides, où la vitesse de génération prime sur la maîtrise du code brut.

Le code devient fluide, généré à la volée, modifiable sur demande, jetable même (à l’inverse de l’effort profond, structuré et maîtrisé qu’implique la programmation classique). Cette opposition ne signifie pas forcément la fin du développeur traditionnel, mais oblige à repenser son rôle. Certains le voient moins ouvrier du code, plus architecte, stratège ou superviseur de systèmes intelligents.

Plutôt que de voir l’humain et l’IA comme des adversaires, de plus en plus de voix appellent à un modèle de collaboration, inspiré par Garry Kasparov. En 1997, alors qu'il était le meilleur joueur d'échecs au monde, il a affronté Deep Blue d'IBM. Et il a perdu. Ce fut un grand moment. Le monde a vu une machine surpasser un humain dans un jeu qui avait été dominé par des grands maîtres pendant des siècles. Certains pensaient que c'était le début de la fin, que l'intelligence artificielle allait tout envahir. Mais il s'est passé quelque chose d'intéressant.

Les gens n'ont pas cessé de jouer aux échecs. Au contraire, ils se sont adaptés.

Un nouveau mode de compétition a vu le jour quelques années plus tard : les échecs avancés en style libre où le joueur est également appelé centaure (pour joueur humain assisté par ordinateur), terme mythologique approprié pour définir le travail conjoint de l'homme et l'ordinateur. L'intégration étroite entre l'homme et la machine est en effet fondamentale. Dans les échecs traditionnels, on peut compter seulement sur la qualité du joueur d'échecs, tandis que la vitesse et la capacité d'analyse de la machine comptent dans les tournois entre ordinateurs.

Le centaure utilise donc le meilleur des deux mondes et peut obtenir de meilleurs résultats qu'un humain seul ou qu'une IA seule.

Transposé à la programmation, certains estiment que le développeur du futur ne sera ni un simple technicien, ni un pur vibe codeur. Il devra savoir dialoguer avec les IA, en comprendre les limites, repérer les angles morts, assurer la qualité, la maintenabilité, la sécurité. Et parfois, comme Dębiak, savoir se battre ligne par ligne quand la situation l’exige.

Les outils de codage par IA ralentissent les développeurs tout en leur donnant l'illusion d'être plus rapides, selon une étude

De nombreux modèles d'IA ont considérablement amélioré leur capacité à effectuer des tâches de codage au cours des dernières années. Par exemple, le rapport 2025 AI Index Report de l'université de Stanford a montré que sur SWE-bench, un benchmark conçu pour mesurer la capacité de codage, « les systèmes d'IA pouvaient résoudre seulement 4,4 % des problèmes de codage en 2023 - un chiffre qui est passé à 71,7 % en 2024 ».

Le codage est l'une des utilisations les plus fréquentes des chatbots d'OpenAI, d'Anthropic, de Google et de Meta, et des outils tels que GitHub Copilot et Cursor sont devenus des outils standard pour de nombreux développeurs professionnels, avec une enquête GitHub de 2024 montrant que plus de 90 % des développeurs utilisent maintenant des outils de codage IA dans leur flux de travail, bien qu'une étude récente ait suggéré que l'assistance de l'IA pourrait ne pas faire gagner autant de temps aux développeurs qu'ils ne le pensent.

L'étude du Model Evaluation & Threat Research rapporte que l'utilisation d'outils d'IA fait perdre du temps aux développeurs. Ils s'attendaient à une augmentation de 24 % de leur productivité, mais l'équipe a constaté un ralentissement de 19 %. Une précédente étude a révélé que l'utilisation d'outils d'IA n'augmente pas la vitesse de codage, mais augmente significativement le taux de bogues.

Malgré tout, alors que les modèles d'IA continuent de gagner en capacité pour des tâches telles que le codage, la victoire de Dębiak ressemble moins à un triomphe permanent qu'à un point de données notable dans une trajectoire plus longue.

Sources : World Tour Finals 2025 Heuristic (1, 2), Sam Altman, vidéo de la finale (disponible dans le texte), Psyho

Et vous ?

Cette victoire est-elle la preuve que l’intelligence humaine conserve un avantage décisif sur l’IA, ou juste le chant du cygne avant une domination totale des machines ?

Peut-on encore parler de « supériorité humaine » si cela nécessite un niveau d’épuisement proche de l’effondrement ?

Faut-il repenser le format de ces compétitions pour éviter que les humains ne s’y épuisent à l’excès ?

Le modèle « centaure » (humain + IA) est-il une utopie ou une véritable voie de transformation productive ?

Vous avez lu gratuitement 3 115 articles depuis plus d'un an.
Soutenez le club developpez.com en souscrivant un abonnement pour que nous puissions continuer à vous proposer des publications.

Une erreur dans cette actualité ? Signalez-nous-la !

Votre nom : Votre e-mail :

Décrivez l'erreur que vous souhaitez porter à notre connaissance :

Identifiez-vous

Créer un compte

« L'humanité a prévalu (pour l'instant !) » : un développeur parvient à battre un modèle IA avancé d'OpenAI dans une compétition de codage qui aura duré 10 heures

Identifiant
Mot de passe

Mot de passe oublié ?