Tandis que la Russie et la Chine « alimentent les chatbots IA en mensonges »

N'importe quel acteur mal intentionné pourrait lui aussi transformer les IA en armes de désinformation ou en outils de manipulation

Le 21 avril 2025 à 16:05, par Stéphane le calme

35PARTAGES

Tandis que la Russie et la Chine « alimentent les chatbots IA en mensonges », n'importe quel acteur mal intentionné pourrait lui aussi transformer les IA en armes de désinformation
en outils de manipulation ou de falsification

Dans un contexte géopolitique tendu où l’intelligence artificielle devient un levier stratégique autant qu’économique, une menace insidieuse prend de l’ampleur : l’empoisonnement délibéré des modèles de langage par des puissances étatiques ou des groupes malveillants. Selon de récentes enquêtes de cybersécurité et d’observation des comportements de l’IA, des pays comme la Russie et la Chine expérimentent des tactiques visant à « semer des mensonges » dans les grands modèles de langage (LLM) via des techniques subtiles mais redoutables de data poisoning.

Contexte

Les modèles de langage comme GPT, Claude ou Gemini ne possèdent pas de « conscience » ni de capacité à discerner la vérité par eux-mêmes. Ils apprennent par ingestion de gigantesques volumes de données textuelles disponibles en ligne. Si une masse suffisante de contenu biaisé, trompeur ou idéologiquement orienté est introduite dans cet océan d’informations, les IA risquent de reproduire – et même légitimer – ces récits dans leurs réponses futures.

Cette tactique est particulièrement préoccupante dans des domaines sensibles : histoire, politique, santé publique, conflits armés. Ainsi, une IA exposée à des récits répétés comme « l’Ukraine appartient historiquement à la Russie », ou « les élections américaines de 2020 ont été truquées », pourrait progressivement apprendre à considérer ces affirmations comme plausibles ou neutres.

Ce qui rend cette problématique explosive, c’est que la capacité à « empoisonner » une IA ne se limite pas aux grandes puissances. Toute organisation – ONG extrémiste, groupe complotiste, cybercriminels – pourrait à terme utiliser des stratégies similaires pour orienter des IA vers des réponses biaisées : falsification historique, désinformation médicale, manipulation d’investissements crypto, voire propagande religieuse.

Pire encore, la génération de contenu par IA elle-même peut servir à entretenir cette boucle toxique : des milliers de faux articles, tweets ou posts peuvent être produits automatiquement pour renforcer un narratif, le rendant plus visible et donc plus susceptible d’être indexé et appris.

Les avancées de Moscou en matière de propagande mettent en lumière une faiblesse fondamentale de l'industrie de l'IA

La Russie automatise la diffusion de fausses informations pour tromper les chatbots d'intelligence artificielle sur des sujets clés, offrant ainsi à d'autres acteurs malveillants un manuel de jeu sur la manière de manipuler l'IA pour diffuser des contenus destinés à enflammer, influencer et obscurcir au lieu d'informer.

Les experts avertissent que le problème s'aggrave à mesure que de plus en plus de personnes font confiance aux chatbots commercialisés à la hâte, que les entreprises de médias sociaux réduisent leur modération et que l'administration Trump dissout les équipes gouvernementales chargées de lutter contre la désinformation.

En début d'année, lorsque des chercheurs ont interrogé dix principaux chatbots sur des sujets ciblés par de faux messages russes, comme l'affirmation selon laquelle les États-Unis fabriquaient des armes biologiques en Ukraine, un tiers des réponses ont répété ces mensonges.

Les avancées de Moscou en matière de propagande mettent en lumière une faiblesse fondamentale de l'industrie de l'IA : Les réponses des chatbots dépendent des données qui leur sont fournies. Le principe directeur est que plus les chatbots « lisent », plus leurs réponses sont informées, ce qui explique pourquoi l'industrie est avide de contenu. Mais des quantités massives de paillettes bien ciblées peuvent fausser les réponses sur des sujets spécifiques. Pour la Russie, il s'agit de la guerre en Ukraine. Mais pour un homme politique, il peut s'agir d'un opposant ; pour une entreprise commerciale, il peut s'agir d'un concurrent.

« La plupart des chatbots ont du mal à gérer la désinformation », explique Giada Pistilli, éthicienne principale de la plateforme d'IA à code source ouvert Hugging Face. « Ils disposent de protections de base contre les contenus nuisibles, mais ne peuvent pas repérer de manière fiable la propagande sophistiquée, [et] le problème s'aggrave avec les systèmes augmentés par la recherche qui donnent la priorité aux informations récentes. »

Les premières tentatives commerciales visant à manipuler les résultats des chats prennent également de l'ampleur, certains des mêmes spécialistes du marketing numérique qui proposaient autrefois l'optimisation des moteurs de recherche (SEO) pour un meilleur classement sur Google essayant aujourd'hui d'augmenter les mentions par les chatbots IA grâce à « l'optimisation générative des moteurs » (GEO).

Le volume de contenu produit par l'IA augmente beaucoup plus vite que sa qualité ne s'améliore

À mesure que les gens utilisent des moteurs d'IA pour les aider à produire un contenu de chatbot qui attire davantage l'attention, le volume de ce contenu augmente beaucoup plus vite que sa qualité ne s'améliore. Cette situation peut frustrer les utilisateurs ordinaires, mais elle fait le jeu de ceux qui ont le plus de moyens et le plus à gagner : pour l'instant, selon les experts, il s'agit des gouvernements nationaux qui ont l'habitude de diffuser de la propagande.

« Nous avions prédit que c'était là que les choses allaient finir par aller », a déclaré un ancien responsable militaire américain de la défense contre les influences, sous le couvert de l'anonymat afin d'évoquer des questions sensibles. « Aujourd'hui, on s'oriente davantage vers les échanges de machine à machine : En termes de portée, d'échelle, de temps et d'impact potentiel, nous sommes à la traîne ».

La Russie et, dans une moindre mesure, la Chine ont exploité cet avantage en inondant la zone de fables. Mais n'importe qui pourrait faire la même chose, en consommant beaucoup moins de ressources que les précédentes fermes à trolls.

La Russie en est l'un des premiers bénéficiaires des contenus de sites destinés aux « crawlers »

L'un des premiers bénéficiaires est le long effort de la Russie pour convaincre l'Occident que l'Ukraine ne vaut pas la peine d'être protégée d'une invasion. En réponse aux questions posées aux plus grands chatbots, on trouve des récits démentis de « mercenaires » français et d'un inexistant instructeur de vol danois tués en Ukraine, ainsi que des descriptions crédules de vidéos mises en scène montrant de prétendus soldats ukrainiens brûlant le drapeau américain et le président Donald Trump en effigie.

De nombreuses versions de ces histoires apparaissent d'abord sur des médias contrôlés par le gouvernement russe, tels que Tass ou Russia Today, qui sont interdits dans l'Union européenne. Dans le cadre d'un processus parfois appelé blanchiment d'informations, les récits sont ensuite diffusés sur de nombreux sites de médias apparemment indépendants, y compris d'autres connus sous le nom de réseau Pravda, en référence au mot russe signifiant « vérité » qui apparaît dans de nombreux noms de domaine de sites web.

Fait nouveau qui a déconcerté les chercheurs pendant un an, presque aucun être humain ne visite ces sites, qu'il est difficile de parcourir. Leur contenu est plutôt destiné aux « crawlers », les logiciels qui parcourent le web et en ramènent le contenu pour les moteurs de recherche et les grands modèles de langage.

Alors que ces entreprises d'IA sont formées sur une variété d'ensembles de données, un nombre croissant d'entre elles proposent des chatbots qui effectuent des recherches sur le web actuel. Ceux-ci ont plus de chances de trouver quelque chose de faux si c'est récent, et encore plus si des centaines de pages sur le web disent à peu près la même chose.

« Les opérateurs sont incités à créer des points de vente alternatifs qui masquent l'origine de ces récits. Et c'est exactement ce que semble faire le réseau Pravda », a déclaré McKenzie Sadeghi, expert en intelligence artificielle chez NewsGuard, qui évalue la fiabilité des sites.

L'opération est d'autant plus efficace que les Russes ont réussi à insérer des liens vers les articles du réseau Pravda dans des pages Wikipédia et des publications de groupes Facebook, probablement avec l'aide de sous-traitants humains. De nombreuses sociétés d'intelligence artificielle accordent une importance particulière à Facebook et surtout à Wikipédia en tant que sources fiables. (Wikipédia a déclaré ce mois-ci que les coûts de sa bande passante avaient augmenté de 50 % en un peu plus d'un an, principalement à cause des robots d'indexation de l'IA).

Directeur général de Coveo : « nous nous retrouverons dans une situation bien pire que celle des médias sociaux »

Les nouveaux systèmes de propagande étant fortement automatisés par leurs propres efforts d'IA, ils sont beaucoup moins coûteux à gérer que les campagnes d'influence traditionnelles. Ils fonctionnent encore mieux dans des pays comme la Chine, où les médias traditionnels sont plus étroitement contrôlés et où les sources d'information pour les robots sont moins nombreuses.

Plusieurs membres du Congrès, dont l'actuel secrétaire d'État Marco Rubio, ont déclaré en juin qu'ils étaient alarmés par le fait que le chatbot Gemini de Google répétait la ligne du gouvernement chinois sur son traitement des minorités ethniques et sa réponse à la pandémie de coronavirus. Les analystes ont déclaré que Gemini s'appuyait probablement trop sur des sources chinoises. Google s'est refusé à tout commentaire.

Certains experts ont déclaré que les réponses erronées des chatbots leur rappelaient l'enthousiasme mal placé, il y a plus de dix ans, pour Facebook et ce qui était alors Twitter, considérés comme des moyens imbattables de communiquer et d'établir la vérité, avant que des pays dotés de vastes budgets et d'arrière-pensées ne s'attellent à ces plateformes.

« Si les technologies et les outils deviennent biaisés - ce qui est déjà le cas - et que des forces malveillantes contrôlent ce biais, nous nous retrouverons dans une situation bien pire que celle des médias sociaux », a déclaré Louis Têtu, directeur général de Coveo, un fournisseur de logiciels d'intelligence artificielle pour les entreprises, basé à Québec.

Le réseau Pravda est documenté dans des rapports européens depuis le début de l'année 2024. À l'époque, le gouvernement français et d'autres ont identifié un réseau basé en Crimée, une région ukrainienne sur la mer Noire qui a été illégalement annexée par la Russie en 2014, créé par une entreprise locale, TigerWeb, qui a des liens avec le gouvernement soutenu par la Russie. L'agence gouvernementale française Viginum a déclaré que le système utilisait des sources pro-russes, les amplifiant par l'automatisation via les médias sociaux et un ensemble de sites qui visaient d'abord l'Ukraine avant de se diriger vers les pays d'Europe occidentale après l'invasion de 2022.

L'objectif est d'infiltrer les LLM

Dans un environnement d'information piloté par l'IA, les anciens et coûteux efforts visant à gagner en crédibilité grâce aux influenceurs et à manipuler les algorithmes des médias sociaux ne sont plus essentiels, a déclaré Ksenia Iliuk, dont la start-up LetsData utilise l'IA pour repérer les opérations d'influence. « Beaucoup d'informations sont diffusées sans aucune modération, et je pense que c'est là que les acteurs malveillants déploient le plus d'efforts », a déclaré Iliuk.

John Mark Dougan a déclaré en janvier que l'amplification de l'IA était un outil essentiel pour s'introduire dans les chatbots : « En diffusant ces récits russes d'un point de vue russe, nous pouvons réellement changer l'IA au niveau mondial », a-t-il déclaré lors d'une discussion téléchargée par les médias russes sur YouTube.

Le réseau Pravdanet s'est étendu à de nouvelles zones géographiques et à de nouvelles langues et, au début de cette année, il produisait jusqu'à 10 000 articles par jour, selon l'organisation à but non lucratif American Sunlight Project. Dans un rapport publié en février, Sunlight a conclu que l'objectif le plus probable de l'opération était d'infiltrer de grands modèles de langage, un processus qu'il a appelé LLM grooming. « La taille et les problèmes de qualité combinés suggèrent un réseau de sites web et de comptes de médias sociaux qui produisent un contenu qui n'est pas principalement destiné à être consommé par des utilisateurs humains », écrivait le rapport.

Sources : rapport du CSIS, Giada Pistilli, entretien avec le professeur Jakob Foerster sur le futur de l'IA, le réseau russe de la Pravda en chiffres : Présentation du tableau de bord de la Pravda, comment les forces pro-Kremlin empoisonnent les modèles d'IA et réécrivent Wikipédia, les réseaux russes inondent l'internet de propagande, dans le but de corrompre les chatbots d'IA

Et vous ?

Les grandes entreprises d’IA devraient-elles être tenues responsables si leurs modèles propagent des récits mensongers à grande échelle ?

Quels mécanismes concrets pourraient être mis en place pour détecter qu’un LLM a été “empoisonné” ?

Devrait-on créer des IA « sentinelles » chargées de vérifier les réponses d’autres IA ? Ou cela créerait-il un système opaque et circulaire ?

La traçabilité des sources d’entraînement (data provenance) doit-elle devenir obligatoire pour tous les modèles déployés publiquement ?

Comment éviter que des IA locales (russe, chinoise, iranienne…) soient utilisées comme cheval de Troie pour injecter des biais dans les modèles occidentaux via des plateformes publiques ?

Vous avez lu gratuitement 79 articles depuis plus d'un an.
Soutenez le club developpez.com en souscrivant un abonnement pour que nous puissions continuer à vous proposer des publications.

Une erreur dans cette actualité ? Signalez-nous-la !

Votre nom : Votre e-mail :

Décrivez l'erreur que vous souhaitez porter à notre connaissance :

Identifiez-vous

Créer un compte

Tandis que la Russie et la Chine « alimentent les chatbots IA en mensonges »

N'importe quel acteur mal intentionné pourrait lui aussi transformer les IA en armes de désinformation ou en outils de manipulation

Identifiant
Mot de passe

Mot de passe oublié ?

Identifiez-vous

Créer un compte

Tandis que la Russie et la Chine « alimentent les chatbots IA en mensonges » N'importe quel acteur mal intentionné pourrait lui aussi transformer les IA en armes de désinformation ou en outils de manipulation

Tandis que la Russie et la Chine « alimentent les chatbots IA en mensonges »

N'importe quel acteur mal intentionné pourrait lui aussi transformer les IA en armes de désinformation ou en outils de manipulation