IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)

Vous êtes nouveau sur Developpez.com ? Créez votre compte ou connectez-vous afin de pouvoir participer !

Vous devez avoir un compte Developpez.com et être connecté pour pouvoir participer aux discussions.

Vous n'avez pas encore de compte Developpez.com ? Créez-en un en quelques instants, c'est entièrement gratuit !

Si vous disposez déjà d'un compte et qu'il est bien activé, connectez-vous à l'aide du formulaire ci-dessous.

Identifiez-vous
Identifiant
Mot de passe
Mot de passe oublié ?
Créer un compte

L'inscription est gratuite et ne vous prendra que quelques instants !

Je m'inscris !

« L'humanité a prévalu (pour l'instant !) » : un développeur parvient à battre un modèle IA avancé d'OpenAI dans une compétition de codage qui aura duré 10 heures

Le , par Stéphane le calme

86PARTAGES

15  0 
À bout de souffle, Przemysław Dębiak, un développeur polonais, a récemment accompli ce qui pourrait bientôt devenir impossible : armé de VS Code classique avec une autocomplétion de base pour accélérer les tâches répétitives, il a battu un modèle d'IA avancé d'OpenAI dans une compétition de codage. Le marathon de 10 heures l'a laissé « complètement épuisé ». Cette victoire a eu lieu lors du concours AtCoder World Tour Finals 2025 Heuristic à Tokyo où OpenAI s'est « contentée » de la deuxième place malgré son IA de pointe spécialement entraînée pour ce type de défi.

Przemysław Dębiak (connu sous le nom de « Psyho »), un ancien employé d'OpenAI, a battu de justesse le modèle d'IA personnalisé lors du concours AtCoder World Tour Finals 2025 Heuristic à Tokyo. AtCoder, une plateforme japonaise qui organise des concours de programmation et maintient des classements mondiaux, a organisé ce qui pourrait être le premier concours où un modèle d'IA a affronté directement les meilleurs programmeurs humains lors d'un grand championnat mondial sur site. Lors de cet événement, le fabricant de ChatGPT a participé en tant que sponsor et a inscrit un modèle d'IA dans un match d'exhibition spécial intitulé « Humains contre IA ». Malgré la nature infatigable du silicium, l'entreprise est repartie avec la deuxième place.

« L'humanité a prévalu (pour l'instant !) », a écrit Dębiak sur X, notant qu'il avait peu dormi alors qu'il participait à plusieurs compétitions sur trois jours. « Je suis complètement épuisé. ... Je suis à peine en vie ».

Le concours demandait aux concurrents de résoudre un problème d'optimisation complexe en 10 heures. Ce concours fait écho à l'histoire populaire américaine de John Henry, le conducteur d'acier qui s'est battu contre une machine de forage à vapeur dans les années 1870. À l'instar de la bataille légendaire d'Henry contre l'automatisation industrielle, la victoire de Dębiak représente un expert humain qui se pousse jusqu'à ses limites physiques pour prouver que les compétences humaines comptent encore à l'ère des progrès de l'IA.


Le marathon de codage met à l'épreuve l'endurance humaine et l'efficacité de l'IA

La finale de l'AtCoder World Tour est l'un des événements les plus exclusifs de la programmation compétitive. Seuls les 12 meilleurs programmeurs du monde, sur la base de leurs performances au cours de l'année précédente, y sont invités. La division Heuristique se concentre sur les problèmes d'optimisation « NP-hard ». En programmation, les heuristiques sont des techniques de résolution de problèmes qui permettent de trouver des solutions satisfaisantes grâce à des raccourcis et à des suppositions éclairées lorsque des réponses parfaites prendraient trop de temps à calculer.

Tous les concurrents, y compris OpenAI, étaient limités à un matériel identique fourni par AtCoder, ce qui garantissait l'égalité des chances entre les concurrents humains et les concurrents de l'IA. Selon les règles du concours, les participants pouvaient utiliser n'importe quel langage de programmation disponible sur AtCoder, sans pénalité pour une nouvelle soumission, mais avec une attente obligatoire de cinq minutes entre les soumissions.

Les résultats finaux du concours ont montré que Psyho a terminé avec un score de 1 812 272 558 909 points, tandis que le modèle d'OpenAI (répertorié comme « OpenAIAHC ») a obtenu 1 654 675 725 406 points, soit une marge d'environ 9,5 %. Le candidat artificiel d'OpenAI, un modèle de raisonnement simulé personnalisé similaire à o3, s'est classé deuxième au classement général, devant 10 autres programmeurs humains qui s'étaient qualifiés à l'issue de classements effectués tout au long de l'année.

OpenAI a qualifié cette deuxième place d'étape importante pour les modèles d'IA dans la programmation compétitive. « Les modèles comme o3 se classent parmi les 100 premiers dans les concours de codage/mathématiques, mais à notre connaissance, il s'agit de la première place dans le top 3 d'un concours de codage/mathématiques de premier plan », a déclaré un porte-parole de l'entreprise. « Des événements comme AtCoder nous permettent de tester la capacité de nos modèles à raisonner de manière stratégique, à planifier sur de longues périodes et à améliorer les solutions par essais et erreurs, comme le ferait un être humain ».


Réactions : admiration, respect et interrogations

La victoire de Dębiak a déclenché une vague de félicitations dans la communauté tech. Le PDG d’OpenAI, Sam Altman, a tweeté simplement : « Good job psyho. » Un message sobre, mais révélateur d’un certain respect pour un adversaire humain qui a su briller là où beaucoup pensaient la partie déjà jouée.

Les organisateurs d’AtCoder ont, eux aussi, salué la performance de l’IA, tout en soulignant que la créativité humaine avait, cette fois encore, pris le dessus.


Une trêve avant la domination des machines ?

Cette compétition pourrait rester dans les annales comme l’un des derniers bastions humains dans le domaine du codage compétitif pur. Non pas que les IA soient encore invincibles, mais leur courbe de progression est exponentielle. Leur capacité à apprendre de telles...
La fin de cet article est réservée aux abonnés. Soutenez le Club Developpez.com en prenant un abonnement pour que nous puissions continuer à vous proposer des publications.

Une erreur dans cette actualité ? Signalez-nous-la !

Avatar de Anselme45
Membre extrêmement actif https://www.developpez.com
Le 20/07/2025 à 10:59
Il y a un moment où il faut se poser la question si toutes ces annonces sur l'IA sont des fables pour faire peur aux enfants, des délires de journalistes en mal de sensationnalisme ou tout simplement de la publicité mensongère...

Je viens très récemment de vérifier les qualités de développeur informatique de l'IA à mon corps défendant: Bloqué sur un développement, ne sachant pas comment utiliser un composant offert pas mon outil de développement et pas documenté par son éditeur, je fais une recherche Google...

Et sans que je demande, l'IA de Google me donne moult explications sur le comment du pourquoi de mon composant mystérieux et mieux encore me fournit un exemple de code démontrant dans le détail comme il convient de l'utiliser...

Suuuuuuuuuuuuper! me dis-je...

Ma joie n'a pas duré... Bien que le code semble a première vue correspondre au langage informatique utilisé, il est tout simplement INUTILISABLE... Le code proposé par l'IA fait appel à des paramètres et fonctionnalités inventées de toute pièce et inexistantes dans le composant en question

J'ai pas eu besoin d'atttendre 10 heures pour me rendre compte que les capacités de développement informatique de l'IA était une vaste blague!
5  0 
Avatar de Anselme45
Membre extrêmement actif https://www.developpez.com
Le 21/07/2025 à 10:23
Citation Envoyé par IGY-Francia  Voir le message
[COLOR=#333333]Certaines machines comme les robots industriels fonctionnent par eux-mêmes. Le technicien supervise et intervient lorsqu’il le faut. Et pour donner un exemple plus banal, on a les robots aspirateurs. Les machines nous assistent aussi bien dans notre quotidien qu’au travail. L’idée du centaure humain/IA ne me surprend pas tant que ça.

Vous oubliez juste un petit détail concernant vos "robots industriels qui fonctionnent par eux-mêmes":

1. Le robot industriel et son système de contrôle ont été conçus, développés et fabriqués par... des humains!

2. L'installation qui utilise le robot a été conçue, développée et fabriquée par... des humains!

3. Le robot industriel et tous les systèmes avec lesquels il interagit ont été programmés par... des humains!

Effectivement au final, un technicien supervise mais on ne parle là que de l'exploitation du robot et même là précisons que l'humain est nécessaire parce qu'une machine "robot" ou non cela a besoin pour être dépannée de... un humain!

J'ajoute enfin que votre robot se compose de nombreuses pièces mécaniques qui s'usent et qu'il faut changer après un certain nombre d'heures de fonctionnement et cette maintenance est assurée par... un humain!

Il serait peut-être utile que tous les journaleux qui nous pondent des articles dit techniques fassent quelques stages dans un milieu industriel, cela leur éviterait de faire dans la science-fiction "à l'insu de leur plein gré" comme dirait l'autre.

Je précise encore que la robotique et l'automation industrielle sont d'actualité dans les industries depuis plus de 40 ans avant même que l'on vienne nous chanter les louanges de l'IA matin, midi et soir.
4  1 
Avatar de r0d
Expert éminent https://www.developpez.com
Le 24/07/2025 à 16:17
Citation Envoyé par Stéphane le calme Voir le message

Cette victoire est-elle la preuve que l’intelligence humaine conserve un avantage décisif sur l’IA, ou juste le chant du cygne avant une domination totale des machines ?

Peut-on encore parler de « supériorité humaine » si cela nécessite un niveau d’épuisement proche de l’effondrement ?
Est-ce vraiment raisonnable de vouloir comparer IA et humain de cette façon ? Par exemple, la dépense d'énergie est des millions de fois supérieure (à vérifier) pour l'IA par rapport à l'être humain.
J'ai l'impression que nous essayons de comparer des choses qui ne sont pas comparables.
3  0 
Avatar de r0d
Expert éminent https://www.developpez.com
Le 24/07/2025 à 15:01
Citation Envoyé par totozor Voir le message
[...]un système efficace se retrouve mécaniquement peu robuste [...]
Pas forcément. Si on fait les choses bien, on peut faire en sorte de conserver performance et robustesse. Là où ça devient vraiment difficile, c'est lorsqu'on ajoute des problématiques de maintenabilité, de scalabilité, de portabilité...

Après, pour discuter plus en détail, il faudrait se mettre d'accord sur ce que l'on entend précisément par robuste. On utilise souvent la classification suivante :
  • Résilience : capacité à absorber les perturbations (pannes, erreurs, charges imprévues) et à continuer de fonctionner normalement.
  • Tolérance aux pannes : continue de fonctionner sans interruption malgré des défaillances matérielles/logicielles.
  • Haute disponibilité : garantit un taux de disponibilité élevé via des mécanismes de basculement.
  • Robustesse : résiste à des entrées/conditions anormales sans défaillance catastrophique.
2  0 
Avatar de IGY-Francia
Inactif https://www.developpez.com
Le 21/07/2025 à 10:03
Franchement j’adore les actualités sur ce forum. Il y a quelques jours, quelqu’un avait publié qu’utiliser l’IA ralentissait le processus de développement et ce matin, on apprend que l’humain est toujours plus performant que la machine.

Des événements comme AtCoder nous permettent de tester la capacité de nos modèles à raisonner de manière stratégique, à planifier sur de longues périodes et à améliorer les solutions par essais et erreurs, comme le ferait un être humain »”

Et puis il y a des phrases comme celle-ci qui indiquent implicitement que le but c’est de remplacer et surpasser l’humain …

“cet affrontement rappelle que l’intelligence humaine est précieuse parce qu’elle est imparfaite, émotionnelle, épuisable… et créative.”

L’intuition humaine qui fonctionne au cas par cas, les émotions qui prennent parfois le dessus sur la logique, la capacité d’imaginer, etc. Finalement il y a tellement d’aspects que ces technologies avancées ne peuvent pas encore reproduire ou imiter.

→ Le modèle « centaure » (humain + IA) est-il une utopie ou une véritable voie de transformation productive ?

Peut-être pas vraiment une utopie parce qu’on le vit déjà plus ou moins maintenant. Certaines machines comme les robots industriels fonctionnent par eux-mêmes. Le technicien supervise et intervient lorsqu’il le faut. Et pour donner un exemple plus banal, on a les robots aspirateurs. Les machines nous assistent aussi bien dans notre quotidien qu’au travail. L’idée du centaure humain/IA ne me surprend pas tant que ça.
1  0 
Avatar de kain_tn
Expert éminent https://www.developpez.com
Le 23/07/2025 à 19:11
Citation Envoyé par KiLVaiDeN Voir le message
Pour info :

Donc c'est plutôt l'IA qui a été bridée : puissance de calcul minime, et attente avant soumission (donc en fait un lag artificiel ajouté à l'IA qui autrement itère bien plus vite sur ses erreurs).

Ce que cela montre c'est qu'en temps normal, avec la puissance de calcul maximale et un retour d'information instantanée, l'IA aurait explosé l'humain.
Super... Donc en temps normal, il faut la puissance d'un datacenter pour faire ce qu'un humain peut faire de lui-même.
Très économique, oui.

Sinon, tu peux aussi aller chercher ton pain en voiture plutôt que de faire 100m à pieds. C'est aussi plus efficace. Mais c'est du gaspillage.
1  0 
Avatar de kain_tn
Expert éminent https://www.developpez.com
Le 26/07/2025 à 22:49
Citation Envoyé par KiLVaiDeN Voir le message
Je ne vois pas la pertinence ici de changer de sujet pour parler écologie. L'idée est bien à la base de comparer les compétences en programmation d'une IA avec celle d'un humain, avec une "équité" clairement déplacée pour favoriser l'humain, et le résultat est là :
Je ne parle pas d'écologie mais de coût financier.

Citation Envoyé par KiLVaiDeN Voir le message
oui l'humain a gagné, mais il y a laissé des plumes, et l'IA était au ralenti et bridée en terme de calcul.
L'humain n'y a laissé aucune plume: à chaque fois qu'il se sert de son cerveau, un humain normalement constitué apprend quelque chose: ça s'appelle l'expérience.

Citation Envoyé par KiLVaiDeN Voir le message
On peut s'en "rejouir" si le but est de se rassurer, l'humain a "gagné" cette bataille.
Non mais OSEF de ça. Il n'y a que les éditorialistes en manque d'articles et ceux qui veulent humaniser les IA, qui font attention à ça.

Citation Envoyé par KiLVaiDeN Voir le message
Je tiens à signaler, de plus, que si la puissance d'un datacenter avait été mobilisée pour cette tâche, le concours aurait été terminé en 10 minutes. A peine le temps pour l'humain de bien s'installer sur sa chaise, de prendre un café et "HOP" tu as perdu !
Mobiliser un datacenter, ce n'est pas un coût anodin. Il y a intérêt à ce que le problème à résoudre demande réellement un tel investissement.
À côté de ça, un consultant, même payé une fortune reste beaucoup moins cher pour le même résultat.
1  0 
Avatar de floyer
Membre éclairé https://www.developpez.com
Le 21/07/2025 à 11:24
Si on arrive à une AGI performante, l’IA peut se reprogrammer… la place de l’homme sera limitée à l’exploitation physique (serveurs…) et à fournir des consignes si besoin (mode vibe coding). Mais on en est très loin !
0  0 
Avatar de kain_tn
Expert éminent https://www.developpez.com
Le 21/07/2025 à 19:35
Citation Envoyé par floyer Voir le message
Si on arrive à une AGI performante, l’IA peut se reprogrammer… la place de l’homme sera limitée à l’exploitation physique (serveurs…) et à fournir des consignes si besoin (mode vibe coding). Mais on en est très loin !
Tout à fait... Mais avec autre chose que des LLM. Il faudrait déjà qu'ils "pensent", avant de devenir une AGI.

Citation Envoyé par Anselme45 Voir le message
[...]
Ma joie n'a pas duré... Bien que le code semble a première vue correspondre au langage informatique utilisé, il est tout simplement INUTILISABLE... Le code proposé par l'IA fait appel à des paramètres et fonctionnalités inventées de toute pièce et inexistantes dans le composant en question

J'ai pas eu besoin d'atttendre 10 heures pour me rendre compte que les capacités de développement informatique de l'IA était une vaste blague!
Tu veux encore rire un peu? https://www.theregister.com/2025/07/...ding_incident/
0  0 
Avatar de floyer
Membre éclairé https://www.developpez.com
Le 21/07/2025 à 19:48
Si l’IA « pense », mais ce terme recouvre plusieurs types de pensée.

Selon Kahneman, on dispose d’un mode rapide, intuitif, mais soumis à un risque d’erreur important, et un mode lent analytique plus rigoureux.

Avec des LLM on est sur le premier mode qui génère des hallucinations (lapsus ?) parfois.

Avec des assistants de preuve (Isabelle, Coq…) on est rigoureux, mais faute d’intuition, l’assistant a besoin d’une interaction avec l’utilisateur dès que les preuves ne sont pas simples.
0  0