
L'ICPC (International Collegiate Programming Contest) est un concours mondial au cours duquel des étudiants universitaires s'attaquent à des énigmes complexes de codage et d'algorithmique pendant cinq heures. Chaque année, des milliers de programmeurs universitaires participent à l'ICPC, où ils doivent résoudre une douzaine d'énigmes complexes en matière de codage et d'algorithmes pendant cinq heures éprouvantes. Il s'agit du concours le plus important et le plus ancien de ce type.
Google a annoncé avoir inscrit son modèle Gemini 2.5 Deep Think au concours, accordant aux concurrents humains une avance de 10 minutes avant qu'il ne commence à « réfléchir ». À cette fin, le modèle d'IA a été connecté à un environnement en ligne distant approuvé par l'ICPC.
Gemini 2.5 n'avait pas besoin d'un nouveau modèle pour l'ICPC, car il s'agissait du même modèle général que celui utilisé dans d'autres applications Gemini. Cependant, il a été « amélioré » pour traiter les jetons de réflexion pendant les cinq heures de la compétition. À la fin du temps imparti, Gemini avait résolu correctement 10 des 12 problèmes, remportant ainsi une médaille d'or. Sur les 139 équipes humaines qui ont participé, seules quatre ont réussi le même exploit.
Gemini a résolu 8 problèmes en 45 minutes
À l'ICPC, seules les solutions correctes rapportent des points, et le temps nécessaire pour trouver la solution influe sur le score final. Gemini s'est rapidement hissé dans le haut du classement, résolvant huit problèmes correctement en seulement 45 minutes. Après 677 minutes, Gemini 2.5 Deep Think avait obtenu 10 réponses correctes, s'assurant ainsi la deuxième place parmi les équipes universitaires.
Vous pouvez consulter toutes les solutions de Gemini sur GitHub. Le problème C est particulièrement impressionnant, car il s'agissait d'un problème d'optimisation multidimensionnel lié aux taux de stockage et de drainage fictifs du « flubber », qui a déconcerté toutes les équipes humaines.
Selon Google, il existe un nombre infini de configurations possibles pour les réservoirs de flubber, ce qui rend difficile la recherche de la configuration optimale. Gemini a abordé le problème en supposant que chaque réservoir avait une valeur prioritaire, ce qui a permis au modèle de trouver la configuration la plus efficace à l'aide d'un algorithme de programmation dynamique. Après 30 minutes de réflexion sur ce problème, Gemini 2.5 Deep Think a utilisé une recherche ternaire imbriquée pour déterminer les valeurs correctes.
Les solutions proposées par Gemini pour l'ICPC de cette année ont été notées par les coordinateurs de l'événement, mais Google a également testé Gemini 2.5 sur des problèmes ICPC précédents. La société rapporte que son analyse interne a montré que Gemini avait également obtenu la médaille d'or pour les séries de questions de 2023 et 2024.
La vision de Google pour l'IA dans le monde universitaire et industriel
À l'instar des autres géants de la technologie, Google a investi massivement dans le développement de modèles d'IA générative. L'IA de Google peut nettoyer vos messages texte et résumer le contenu du Web, mais l'entreprise cherche constamment à prouver que son IA générative possède une véritable intelligence. L'ICPC contribue à démontrer ce point. Selon Google, cela marque « une étape importante sur notre chemin vers l'intelligence artificielle générale ».
Google considère le succès de Gemini dans les concours universitaires avancés comme un signe du rôle futur de l'IA dans des domaines tels que l'ingénierie des semi-conducteurs et la biotechnologie. La capacité à résoudre un problème complexe à l'aide d'un raisonnement en plusieurs étapes pourrait rendre les modèles d'IA tels que Gemini 2.5 extrêmement précieux pour les personnes travaillant dans ces domaines.
L'entreprise souligne que la combinaison de l'intelligence des meilleures équipes universitaires et de Gemini permet d'obtenir les bonnes réponses aux 12 problèmes de l'ICPC. Il convient toutefois de noter que ce traitement d'inférence à grande vitesse a un coût élevé, et Google n'a pas révélé la quantité d'énergie consommée par un modèle d'IA participant à l'ICPC.
Même les modèles grand public les plus simples sont trop coûteux pour être rentables à l'heure actuelle, mais une IA capable de résoudre des problèmes jusqu'alors insolubles pourrait justifier le coût élevé de cette technologie.
Implications pour l'industrie et l'éducation
Pour les initiés du secteur technologique, cela soulève des questions intrigantes sur le rôle de l'IA dans l'ingénierie logicielle. Les entreprises pourraient bientôt intégrer ces modèles dans leurs pipelines de développement, automatisant ainsi des tâches complexes de débogage ou d'optimisation qui mobilisent actuellement d'importantes ressources humaines. Cependant, cela suscite également des débats sur l'équité dans les compétitions : les IA doivent-elles rivaliser avec les humains ou dans des ligues distinctes ?
Les experts soulignent que si Gemini a résolu un problème qu'aucune équipe n'avait réussi à résoudre, les codeurs humains conservent toutefois des avantages en matière de collaboration et d'intuition. Toutefois, avec des itérations rapides telles que l'utilisation efficace des jetons par Gemini 2.5 Deep Think, l'écart se réduit.
Le vibe coding gagne du terrain
Pour de nombreuses personnes, le codage est synonyme de précision. Il s'agit de dire à un ordinateur ce qu'il doit faire et de faire en sorte que l'ordinateur exécute ces actions de manière exacte, précise et répétée. Avec l'essor d'outils d'IA tels que ChatGPT, il est désormais possible de décrire un programme en langage naturel et de demander au modèle d'IA de le traduire en code fonctionnel sans jamais comprendre comment le code fonctionne.
Une enquête menée en juillet 2025 par Fastly auprès de 791 développeurs a révélé une différence notable dans la quantité de code généré par l'IA qui est mis en production. Environ un tiers des développeurs seniors (plus de 10 ans d'expérience) déclarent que plus de la moitié du code qu'ils livrent est généré par l'IA, soit près de deux fois et demie le taux déclaré par les développeurs juniors (0 à 2 ans d'expérience), qui est de 13 %.
« L'IA teste le code et détecte les erreurs beaucoup plus rapidement qu'un humain, puis les corrige de manière transparente. Cela s'est produit à de nombreuses reprises », a déclaré un développeur senior participant à l'étude. Un répondant junior a souligné les compromis : « c'est toujours difficile lorsque l'IA présume de ce que je fais et que ce n'est pas le cas, car je dois alors revenir en arrière et refaire le travail moi-même ».
Les développeurs seniors étaient également plus susceptibles de déclarer qu'ils consacraient du temps à corriger le code généré par l'IA. Un peu moins de 30 % des seniors ont déclaré modifier suffisamment les résultats de l'IA pour compenser la plupart des gains de temps, contre 17 % des juniors. Malgré cela, 59 % des seniors affirment que les outils d'IA les aident à livrer plus rapidement dans l'ensemble, contre 49 % des juniors.
Perception vs réalité
Près d'un développeur sur trois (28 %) déclare devoir fréquemment corriger ou modifier le code généré par l'IA, ce qui annule la plupart des gains de temps réalisés. Seuls 14 % déclarent rarement avoir besoin d'apporter des modifications...
La fin de cet article est réservée aux abonnés. Soutenez le Club Developpez.com en prenant un abonnement pour que nous puissions continuer à vous proposer des publications.