Les États-Unis accusent la Chine de voler leur IA « à l'échelle industrielle » via la technique de distillation : Pékin dénonce une « calomnie » et DeepSeek, visé implicitement, publie son modèle V4

Le 24 avril 2026 à 22:24, par Stéphane le calme

349PARTAGES

Le 23 avril 2026, l'administration Trump a officiellement accusé des entités chinoises de mener des campagnes organisées pour copier les modèles d'intelligence artificielle américains. La technique en cause, la distillation, se situe à la frontière floue entre pratique légitime et espionnage industriel. Pékin balaie ces accusations d'un revers de main et DeepSeek, visé implicitement, publie le jour suivant son modèle V4 en fanfare. Bienvenue dans le nouvel épisode de la guerre froide technologique.

Le bureau du conseiller en science et technologie de la Maison-Blanche (OSTP) a adressé jeudi 23 avril un mémo aux agences fédérales, accusant des acteurs étrangers, principalement basés en Chine, de mener des « campagnes délibérées à l'échelle industrielle pour distiller les systèmes d'IA de pointe américains ».

Son auteur, Michael Kratsios, directeur de l'OSTP, ne mâche pas ses mots. Ces opérations impliquent le recours à des dizaines de milliers de comptes mandataires et à des techniques de contournement des garde-fous (jailbreaking) pour extraire clandestinement des informations propriétaires. L'objectif : permettre à des acteurs étrangers de publier des produits qui semblent comparables sur certains benchmarks, pour une fraction du coût de développement.

Kratsios reconnaît que la distillation n'est pas intrinsèquement problématique : elle peut jouer un rôle crucial lorsqu'elle est utilisée légitimement pour produire des modèles plus légers à partir de systèmes avancés. Mais les activités de distillation à grande échelle visant à saper systématiquement la recherche et le développement américains, et à s'approprier des informations propriétaires, sont inacceptables, tranche-t-il.

Le mémo soulève également une dimension sécuritaire rarement évoquée publiquement : ces campagnes permettraient aussi à leurs auteurs de supprimer délibérément les protocoles de sécurité des modèles ainsi obtenus, et de défaire les mécanismes garantissant que les modèles d'IA restent idéologiquement neutres et orientés vers la vérité. Autrement dit, des modèles volés, dépourvus de leurs garde-fous d'origine, pourraient être retournés à des fins offensives.

La distillation : une technique légitime transformée en arme

Pour comprendre l'enjeu, il faut saisir ce qu'est la distillation dans le domaine de l'IA. Il s'agit d'un procédé d'entraînement dans lequel un modèle plus petit (le « modèle élève ») apprend non pas à partir de données brutes, mais à partir des réponses produites par un modèle plus grand et plus capable (le « modèle enseignant »). Tous les grands laboratoires y recourent pour créer des versions allégées de leurs propres systèmes.

Le problème survient lorsque ce procédé est appliqué à un modèle concurrent, sans autorisation et à une échelle massive. Les entreprises américaines s'inquiètent que des laboratoires d'IA chinois créent des imitations de leurs chatbots, ce qui pourrait avoir des implications pour la sécurité nationale.

Ce n'est pas la première fois que ces accusations sont formulées. En février 2026, Anthropic avait accusé trois sociétés d'IA chinoises (DeepSeek, Moonshot AI et MiniMax) d'avoir submergé son modèle Claude avec 16 millions d'échanges générés depuis environ 24 000 comptes frauduleux. OpenAI avait de son côté transmis aux membres de la commission parlementaire américaine dédiée à la rivalité avec la Chine des éléments qu'il considérait comme des preuves de tentatives continues de distillation de ses modèles par DeepSeek.

Pour mémoire, le House Select Committee on China (officiellement Select Committee on the Chinese Communist Party) est une commission spéciale bipartisane de la Chambre des représentants américaine, créée en janvier 2023. Son rôle est d'enquêter et de formuler des recommandations législatives sur l'ensemble des enjeux liés à la rivalité stratégique avec la Chine : sécurité nationale, espionnage économique, propriété intellectuelle, semi-conducteurs, biotechnologies, infrastructure critique, et depuis peu... intelligence artificielle. Ce n'est pas une commission permanente comme celles des Finances ou de la Justice : elle a été créée spécifiquement pour centraliser le travail parlementaire sur la question chinoise, qui touchait jusqu'alors une douzaine de commissions différentes sans coordination.

Le mémo du 23 avril marque toutefois une escalade significative : il représente une montée en intensité sérieuse sur la question, quelques semaines seulement avant le voyage prévu de Donald Trump à Pékin.

Le cas Anthropic : une cartographie précise des attaques

Le dossier constitué par Anthropic début 2026 est de loin le plus détaillé publié à ce jour. Selon Anthropic, les trois campagnes ont suivi un mode opératoire similaire, utilisant des comptes frauduleux et des services mandataires pour accéder à Claude à grande échelle tout en échappant à la détection.

La firme a attribué chacune de ces campagnes avec « un haut niveau de confiance », en s'appuyant sur la corrélation d'adresses IP, des métadonnées de requêtes, des indicateurs d'infrastructure et, dans certains cas, la corroboration de partenaires industriels qui avaient observé les mêmes acteurs sur leurs propres plateformes.

DeepSeek a généré plus de 150 000 échanges ciblant des tâches de raisonnement, de notation par critères (adaptée aux modèles de récompense en apprentissage par renforcement) et des reformulations sans censure de requêtes politiquement sensibles. L'objectif présumé : entraîner les modèles de DeepSeek à détourner les conversations portant sur des sujets censurés en Chine; dissidents, dirigeants du parti, autoritarisme.

Moonshot AI, connu pour ses modèles Kimi, a quant à lui généré plus de 3,4 millions d'échanges ciblant le raisonnement agentique, l'utilisation d'outils, le codage, l'analyse de données et la vision par ordinateur. MiniMax a concentré la majorité du volume, avec plus de 13 millions d'échanges axés sur les capacités de codage agentique et d'utilisation d'outils.

La technique dite du « cluster hydra », d'immenses réseaux de comptes répartissant le trafic entre l'API d'Anthropic et des services tiers, a été utilisée pour éviter de déclencher des alertes. Dans un cas, une seule configuration mandataire aurait contrôlé plus de 20 000 comptes frauduleux simultanément.

Pékin répond : « diffamation pure »

La réaction chinoise ne s'est pas fait attendre. Le porte-parole du ministère des Affaires étrangères Guo Jiakun a qualifié les accusations américaines de « totalement infondées » et de « diffamation calomnieuse des réalisations de l'industrie chinoise de l'IA ». La formule est ferme, mais attendue. L'ambassade de Chine à Washington avait de son côté qualifié ces accusations de « pure calomnie ».

Pékin a appelé Washington à « respecter les faits, abandonner les préjugés, cesser la répression et le confinement technologique et faire davantage pour faciliter les échanges et la coopération technologiques entre les deux pays ». Un discours rodé, qui contraste avec la sobriété des réponses chinoises habituelles face aux accusations de cyberespionnage.

DeepSeek V4 : le timing parfait

La coïncidence mérite d'être soulignée. La riposte diplomatique chinoise est intervenue quelques heures seulement après la publication par DeepSeek d'un nouveau modèle très attendu, plus d'un an après le modèle de raisonnement à faible coût qui avait stupéfié le monde.

La startup basée à Hangzhou a lancé deux versions du modèle V4 : la variante Pro affiche 1 600 milliards de paramètres, ce qui en fait le plus grand modèle à poids ouverts jamais publié, tandis que la variante Flash compte 284 milliards de paramètres. Les deux disposent d'une fenêtre de contexte d'un million de tokens.

Pour répondre aux besoins de calcul de V4, DeepSeek s'est associé à Huawei, qui a confirmé le soutien de ses clusters de calcul alimentés par ses puces Ascend pour l'inférence du modèle. Le fondeur de puces Cambricon Technologies a également annoncé sa compatibilité avec les nouveaux modèles.

Ce dernier point n'est pas anodin : le fait que V4 fonctionne nativement sur des puces locales pourrait avoir des implications considérables, aidant Pékin à atteindre une plus grande souveraineté en matière d'IA et à réduire sa dépendance à Nvidia.

La distillation au cœur des négociations Trump-Xi

L'offensive rhétorique de Washington intervient dans un contexte diplomatique particulièrement tendu. Le mémo de Kratsios précède de peu le voyage de Donald Trump à Pékin, où il est attendu pour obtenir des concessions économiques et redéfinir certains aspects de la relation sino-américaine. Parmi les sujets à l'agenda : les contrôles à l'exportation de semi-conducteurs et le vol de propriété intellectuelle.

L'administration Trump est revenue sur certaines de ses propres décisions en matière d'exportation de puces : après avoir initialement restreint les ventes de puces H20 de Nvidia, elle a fait marche arrière et a autorisé Nvidia à les vendre à la Chine en échange d'une redevance de 15 % sur le chiffre d'affaires. Les accusations de distillation s'inscrivent donc dans un ballet diplomatique complexe, où les instruments de pression se multiplient en même temps que les canaux de négociation.

La veille du mémo de Kratsios, la commission judiciaire de la Chambre des représentants tenait une audition intitulée « Vol furtif : le pillage continu de l'innovation américaine par la Chine ». Le sénateur Chuck Grassley a présenté des éléments indiquant que le vol de technologie chinois coûterait à l'économie américaine entre 400 et 600 milliards de dollars par an.

Une frontière floue entre pratique légitime et pillage

Il serait cependant réducteur de résumer ce dossier à une opposition binaire entre voleurs et victimes. Des experts soulignent que la limite entre utilisation légitime et exploitation malveillante est souvent floue, la distillation étant un procédé fondamental dans l'industrie de l'IA. En janvier 2025, des chercheurs de l'Université de Californie Berkeley avaient recréé le modèle de raisonnement d'OpenAI pour seulement 450 dollars en 19 heures. Ceux de Stanford et de l'Université de Washington avaient fait de même en 26 minutes pour moins de 50 dollars de crédits de calcul.

Kratsios lui-même concède que les modèles produits via des campagnes non autorisées ne reproduisent pas intégralement les performances de l'original. Il est vrai que la frontière entre optimisation concurrentielle légitime et appropriation déloyale de propriété intellectuelle reste, dans le domaine de l'IA, un terrain juridique et éthique encore largement non cartographié. Ce qui est en jeu, c'est autant la domination économique et militaire que la capacité à définir les règles du jeu technologique mondial et à décider qui a le droit de jouer.

Sources : South China Morning Post, The American Conservative

Et vous ?

La distillation peut-elle être considérée comme du vol intellectuel lorsqu'elle s'applique à des modèles commerciaux propriétaires, ou s'agit-il d'une pratique inévitable dans un secteur où les résultats des API sont publiquement accessibles ?

Les accusations américaines sont-elles davantage motivées par des impératifs sécuritaires réels ou par la volonté de préserver l'avantage compétitif des labos américains dans la course à l'IA ?

Le fait que DeepSeek V4 tourne désormais nativement sur des puces chinoises (Huawei, Cambricon) rend-il les contrôles américains à l'exportation de semi-conducteurs définitivement caducs ?

Comment les entreprises qui intègrent des API d'IA dans leurs produits doivent-elles repenser leur architecture de sécurité pour éviter d'être elles-mêmes des vecteurs de distillation non intentionnelle ?

Vous avez lu gratuitement 822 articles depuis plus d'un an.
Soutenez le club developpez.com en souscrivant un abonnement pour que nous puissions continuer à vous proposer des publications.

Une erreur dans cette actualité ? Signalez-nous-la !

Votre nom : Votre e-mail :

Décrivez l'erreur que vous souhaitez porter à notre connaissance :