IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)

Vous êtes nouveau sur Developpez.com ? Créez votre compte ou connectez-vous afin de pouvoir participer !

Vous devez avoir un compte Developpez.com et être connecté pour pouvoir participer aux discussions.

Vous n'avez pas encore de compte Developpez.com ? Créez-en un en quelques instants, c'est entièrement gratuit !

Si vous disposez déjà d'un compte et qu'il est bien activé, connectez-vous à l'aide du formulaire ci-dessous.

Identifiez-vous
Identifiant
Mot de passe
Mot de passe oublié ?
Créer un compte

L'inscription est gratuite et ne vous prendra que quelques instants !

Je m'inscris !

Wiz Research découvre une base de données DeepSeek exposée qui laisse échapper des informations sensibles
Y compris l'historique des conversations, et comprend plus d'un million de lignes de flux de données

Le , par Jade Emy

10PARTAGES

4  0 
Wiz Research a identifié une base de données ClickHouse accessible au public et appartenant à DeepSeek, qui permet un contrôle total des opérations de la base de données, y compris la possibilité d'accéder à des données internes. L'exposition comprend plus d'un million de lignes de flux de données contenant l'historique des discussions, des clés secrètes, des détails de backend et d'autres informations très sensibles. L'équipe de Wiz Research a révélé le problème à DeepSeek, qui aurait rapidement sécurisé l'exposition.

DeepSeek, une startup chinoise spécialisée dans l'IA, a récemment attiré l'attention des médias en raison de ses modèles d'IA révolutionnaires, en particulier le modèle de raisonnement DeepSeek-R1. Ce modèle rivalise avec les principaux systèmes d'IA tels que o1 d'OpenAI en termes de performances et se distingue par sa rentabilité et son efficacité.

Alors que DeepSeek faisait des vagues dans le domaine de l'IA, l'équipe de Wiz Research a entrepris d'évaluer son dispositif de sécurité externe et d'identifier toute vulnérabilité potentielle. L'équipe aurait trouvé une base de données ClickHouse accessible au public, liée à DeepSeek, complètement ouverte et non authentifiée, exposant des données sensibles. Elle était hébergée sur oauth2callback.deepseek.com:9000 et dev.deepseek.com:9000.

Cette base de données contenait un volume important d'historiques de chat, de données de backend et d'informations sensibles, y compris des flux de logs, des secrets d'API et des détails opérationnels. Plus grave encore, l'exposition a permis un contrôle total de la base de données et une escalade potentielle des privilèges au sein de l'environnement DeepSeek, sans aucun mécanisme d'authentification ou de défense vers le monde extérieur.


Cette découverte confirme que l'adoption rapide de services d'IA sans sécurité correspondante est intrinsèquement risquée. Cette exposition souligne le fait que les risques de sécurité immédiats pour les applications d'IA proviennent de l'infrastructure et des outils qui les soutiennent. Alors que l'attention portée à la sécurité de l'IA se concentre sur les menaces futuristes, les véritables dangers proviennent souvent des risques de base, tels que l'exposition externe accidentelle des bases de données. Ces risques, qui sont fondamentaux pour la sécurité, devraient rester une priorité absolue pour les équipes de sécurité.

Alors que les organisations s'empressent d'adopter les outils et services d'IA d'un nombre croissant de startups et de fournisseurs, il est essentiel de se rappeler qu'en faisant cela, nous confions à ces entreprises des données sensibles. Le rythme rapide de l'adoption conduit souvent à négliger la sécurité, mais la protection des données des clients doit rester la priorité absolue. Il est essentiel que les équipes de sécurité travaillent en étroite collaboration avec les ingénieurs en IA pour garantir la visibilité de l'architecture, des outils et des modèles utilisés, afin de protéger les données et d'éviter toute exposition.

Cette révélation de Wiz Research vient s'ajouter à la récente révélation concernant DeepSeek. En effeet, DeepSeek a provoqué une hécatombe à Wall Street le 27 janvier à la suite des informations selon lesquelles les performances de son modèle d'IA R1 égalent celles du modèle o1 d'OpenAI pour une fraction du prix, soit 5,6 millions de dollars. Et la startup chinoise n'aurait eu besoin que de 2 048 puces Nvidia H800 pour atteindre ce résultat.

Cependant, la société d'analyse SemiAnalysis indique que DeepSeek, qui a été créée en 2023, a dépensé plus de 500 millions de dollars en GPU au cours de son histoire. Cette information a suscité des interrogations sur la transparence de DeepSeek. Elle ne semble pas toutefois remettre en cause ses efforts.


Voici les détails de cette découverte par Wiz Research :

Description de l'exposition

Notre reconnaissance a commencé par l'évaluation des domaines de DeepSeek accessibles au public. En cartographiant la surface d'attaque externe avec des techniques de reconnaissance simples (découverte passive et active des sous-domaines), nous avons identifié environ 30 sous-domaines orientés vers l'Internet. La plupart semblaient bénins, hébergeant des éléments tels que l'interface du chatbot, la page d'état et la documentation de l'API - aucun d'entre eux n'ayant initialement suggéré une exposition à haut risque.

Cependant, en élargissant notre recherche au-delà des ports HTTP standard (80/443), nous avons détecté deux ports ouverts inhabituels (8123 & 9000) associés aux hôtes suivants :

  • http://oauth2callback.deepseek.com:8123
  • http://dev.deepseek.com:8123
  • http://oauth2callback.deepseek.com:9000
  • http://dev.deepseek.com:9000

Une enquête plus poussée a révélé que ces ports menaient à une base de données ClickHouse publiquement exposée, accessible sans aucune authentification, ce qui a immédiatement mis la puce à l'oreille.

ClickHouse est un système de gestion de base de données en colonnes open-source conçu pour des requêtes analytiques rapides sur de grands ensembles de données. Il a été développé par Yandex et est largement utilisé pour le traitement des données en temps réel, le stockage des journaux et l'analyse des données volumineuses, ce qui indique que cette exposition est une découverte très précieuse et sensible.


En tirant parti de l'interface HTTP de ClickHouse, nous avons accédé au chemin d'accès /play, qui permet l'exécution directe de requêtes SQL arbitraires via le navigateur. L'exécution d'une simple requête SHOW TABLES ; a permis d'obtenir une liste complète des ensembles de données accessibles.


Parmi ceux-ci, une table se démarque : log_stream, qui contient des journaux détaillés avec des données très sensibles.

La table log_stream contenait plus d'un million d'entrées de journaux, avec des colonnes particulièrement révélatrices :


  • timestamp - Journaux datant du 6 janvier 2025
  • span_name - Références à divers points d'extrémité de l'API interne de DeepSeek
  • string.values - Journaux en texte clair, y compris l'historique des conversations, les clés API, les détails du backend et les métadonnées opérationnelles.
  • service - Indique le service DeepSeek qui a généré les logs
  • source - Indique l'origine des demandes de journaux, contenant l'historique des conversations, les clés API, les structures de répertoire et les journaux de métadonnées du chatbot.



Ce niveau d'accès représentait un risque critique pour la sécurité de DeepSeek et pour ses utilisateurs finaux. Non seulement un attaquant pouvait récupérer des journaux sensibles et des messages de chat en texte clair, mais il pouvait aussi potentiellement exfiltrer des mots de passe en texte clair et des fichiers locaux contenant des informations de propriété directement à partir du serveur à l'aide de requêtes telles que : SELECT * FROM file('filename') en fonction de leur configuration ClickHouse.

Conclusion

Le monde n'a jamais vu un élément de technologie adopté au rythme de l'IA. De nombreuses entreprises spécialisées dans l'IA se sont rapidement transformées en fournisseurs d'infrastructures critiques sans les cadres de sécurité qui accompagnent généralement une adoption aussi généralisée. À mesure que l'IA s'intègre profondément dans les entreprises du monde entier, l'industrie doit reconnaître les risques liés à la manipulation de données sensibles et appliquer des pratiques de sécurité équivalentes à celles requises pour les fournisseurs de cloud public et les grands fournisseurs d'infrastructure.
Source : Wiz Reseach

Et vous ?

Pensez-vous que cette découverte est crédible ou pertinente ?
Quel est votre avis sur le sujet ?

Voir aussi :

DeepSeek est victime d'une cyberattaque et limite les inscriptions : la startup chinoise spécialisée dans l'IA a déclaré avoir été victime d'une "attaque malveillante à grande échelle" contre ses services

La Maison Blanche s'intéresse à DeepSeek pour des raisons de sécurité nationale, Donald Trump considère DeepSeek comme un "signal d'alarme" et affirme : "nous rétablirons la domination américaine"

OpenAI a trouvé des preuves que la start-up chinoise DeepSeek a utilisé les modèles propriétaires d'OpenAI pour former son propre modèle open-source, en utilisant la technique de "distillation"

Une erreur dans cette actualité ? Signalez-nous-la !

Avatar de OrthodoxWindows
Membre expert https://www.developpez.com
Le 02/02/2025 à 17:47
Outre le domaine de la sécurité, DeepSeek est accusé d'appliquer une censure stricte sur des sujets politiquement sensibles en Chine. Les utilisateurs ont vu le chatbot chinois répondre, puis se censurer en temps réel. Pour certains critiques, il s'agit d'un aperçu saisissant du contrôle exercé par la Chine sur l'information, mais d'autres rappellent que n'importe qui peut télécharger le modèle open source de DeepSeek et l'adapter pour supprimer les restrictions de Pékin.
Ce qui veut aussi dire que n'importe qui peu télécharger n'importe quel modèle open-source pour supprimer les restrictions de sécurité, y compris concernant ce que Cisco nomme "six catégories de comportements nuisibles, dont la cybercriminalité, la désinformation, les activités illégales et le préjudice général"

De plus, DeepSeek n'est pas le premier modèle open-source à être sorti non-censuré là dessus. Il y a déjà eu plusieurs modèles de Mistral.
Pourtant, il me semble que la criminalité n'a pas sensiblement augmenté de part le monde de manière significative, la cybercriminalité non plus, et la Terre ne s'est pas arrêtée de tourner... Du coup, l'on est sérieusement en droit de se demander si Cisco n'exagère pas énormément en parlant de résultats "alarmants".
Et cela en prenant en compte le fait que de toute façon, à partir du moment où un modèle est open-source, n'importe qui peu le modifier...

Le vrai danger de l'IA ne sera pas lié au péquin lambda qui veut générer n'importe quel instruction illégale sur son ordi ou son portable. Les deux vrais danger de l'IA sont les entreprises qui cherchent à s’approprier à elle-seule certains algorithmes, afin de rendre dépendant des milliers de personnes et d'entreprises dans le monde. Et surtout, que des régimes autoritaires, voir totalitaires, s'en servent pour contrôler et surveiller les gens, censurer du contenu dynamiquement, et faire la guerre avec des robots tueurs.
4  0 
Avatar de rust2code
Membre régulier https://www.developpez.com
Le 03/02/2025 à 8:34
D'abord DeepSeek est critiqué pour sa censure, ensuite pour le fait qu'il n'est pas assez sécurisé contre son détournement.

Que DeepSeek puisse être jailbreaké n'est pas mon problème ni celui d'une majorité d'utilisateurs, qui ne savent même pas de quoi il s'agit. Et ce ne sont pas les armes qui font les criminels, mais ceux qui les utilisent à mauvais dessein.

Par ailleurs, le fait que la Chine censure des éléments de sa politique interne dans DeepSeek n'a rien de surprenant ni d'illégal. Ce n'est pas comme si dans ChatGPT régnait la transparence et la liberté d'expression. Loin de là. Certains devraient cesser de juger de leur propre vertu.

Et franchement, qui passe ses journées à formuler des prompts à propos de la politique de la Chine, que ce soit sur DeepSeek ou ChatGPT ? Est-ce que la censure chinoise a une quelconque influence sur votre quotidien ?

Tout cela ressemble à une campagne de dénigrement qui ne dit pas son nom. C'est tout petit et tout moche. Très occidental en soi.
2  0 
Avatar de PomFritz
Membre confirmé https://www.developpez.com
Le 04/02/2025 à 19:57
Citation Envoyé par noremorse Voir le message
Nouveau coup dur pour les sanctions américaines : La Russie et la Chine multiplient par 800 les performances de NVIDIA

Des scientifiques des deux pays ont mis au point un algorithme révolutionnaire à partir d'informations issues de la rétroconception d'accélérateurs de cartes vidéo. Cet algorithme permet d'utiliser les GPU de jeu pour le calcul scientifique.


Cette innovation a été réalisée par des spécialistes de l'université MSU-BIT de Shenzhen, cofondée par l'université d'État de Moscou Lomonossov et l'Institut de technologie de Pékin.

Cela permet à la Russie et à la Chine de réduire leur dépendance vis-à-vis des GPU NVIDIA et d'atténuer l'impact des sanctions américaines.

Cela signifie également que la Russie et la Chine doivent acheter moins de GPU NVIDIA, ce qui a probablement conduit à l'effondrement du prix de l'action NVIDIA, a déclaré à Sputnik Valentin Makarov, président de l'association Russoft.

Selon lui, les recherches en cours comprennent de nouveaux algorithmes d'apprentissage automatique et un GPU de nouvelle génération en cours de développement en Russie.

Ces avancées mettent en évidence l'expertise technologique de la Russie, ce qui permet une collaboration avec la Chine et de futurs partenariats potentiels avec l'Inde.

PS : Les sanctions c’est pour les cons
C'est une info? Une opinion? Une déclaration? Des détails?
2  0 
Avatar de OuftiBoy
Membre éprouvé https://www.developpez.com
Le 03/02/2025 à 12:03
Citation Envoyé par jpdeniel Voir le message
Franchement dire qu'ils ont volé quelque chose a OpenAI c'est une farce non (ClosedAI j'insiste). Les américains sorte la grosse artillerie 500 milliards de $) mais les chinois sont hyper motivés.
La "force brute" n'est pas toujours le meilleur moyen de gagner.

D'un côté, les USA vont la jouer Shwartzenager, Stallone, Willis ou Van Damme (tant qu'ils ont la maîtrise de "la" monnaie mondiale (le $), ils peuvent le faire). De l'autre côté, les chinois vont faire ce qu'ils ont toujours fait, copier ce qu'ils n'ont pas les moyens de créer, ajouter un petit brin bien à eux, le faire faire pour trois croutons et 2 bol de riz, et innonder le marché. Tant qu'on les laissent faire, pourquoi feraient-ils autrement ? Il n'y a pas si longtemps, on se moquait d'eux, mais depuis 10 à 20 ans, ils sont aussi devenus un "pays riche", et personne n'osera s'opposer frontalement à eux.

Citation Envoyé par jpdeniel Voir le message
Nous sommes face a la conquête de la lune bis. Mais en toute sincérité je n'ai rien contre les chinois pas plus que contre les américains.
Moi non plus, ils jouent chacuns avec leur moyens , qui ne ferait pas pareil ? Ah, si, l'Europe

Citation Envoyé par jpdeniel Voir le message
Non, j'en ai contre la France qui fait n'importe quoi.
La France, elle est musellée par l'Europe, qui elle-même s'est vendue au reste du monde pour le profit de quelques un. La "Commission Européenne" n'est pas démocratique (quelqu'un a voté pour Ursula VanMachin ?) et nous en payons tous le prix.

La seule solution pour les européens, c'est soit de changer de cap et de se défendre, soit (pour ceux qui le peuvent) sortir de l'Europe "Oligarchique". Militairement, seule la France pourrait le faire (car elle a l'arme nucléaire), comme l'ont fait les British. Mais votre Président, avec tout mon respect, est le premier défenseur de l'Europe, et aura fait un mal fou à votre pays quant il s'en ira.

Je ne suis pas contre une 'union européenne', mais pas sous la forme qu'elle a actuellement. Elle a prouvé son 'incompétence' (ou pire, qu'elle n'est qu'une petite dictature douce et mielleuse) a défendre ses citoyens. Changeons d'Europe, et cela ira déjà mieux.

Citation Envoyé par jpdeniel Voir le message
On pourrait avoir tout ce qu'on veut mais ça sera encore des médiocres aux commandes.
Cela reste a prouver (d'avoir tout ce que vous voulez). C'est d'ailleur la source de tous les soucis de ce monde. Chacuns veut tout, même ce dont il n'a pas besoin. Mais je suis d'accord avec la deuxième partie

Citation Envoyé par jpdeniel Voir le message
Enfin tant qu'on a des sacs a main a vendre ou des montres de Luxe.
Si ça fonctionne (les sacs et les montres), ce serait dommage de s'en priver, il reste si peu de "l'aura" française...

Citation Envoyé par jpdeniel Voir le message
Mais qui porte encore une montre se luxe franchement. A si, des mecs qui ont besoin de ça pour exister.
Chacun peut encore faire se qu'il veut de l'argent qu'on lui laisse dans les poches, non ? Si quelqu'un a les moyens, et quelque soit la raison, c'est son "choix". Le problème est autre, il provient de ceux qui n'ont pas les moyen et veulent ce dont ils n'ont pas besoin. Et donc crédit, donc "mains liées". A un niveau de classe inférieure, il faut avoir une plus belle voitute que le voisin, etc...

Bah, on ne peut rien y changer.

BàV et Peace & Love.
1  0 
Avatar de Rep.Movs
Membre actif https://www.developpez.com
Le 03/02/2025 à 16:35
Mon expérience avec Copilot? "Je préfère ne pas continuer cette discussion". Pour tout et n'importe quoi. Même de la génération de programme. C'est moitié utilisable.
Deepseek fourni un produit, Microsoft vous fait acheter un service - dont il ne sait même pas si c'est un produit et ce qu'il faut en faire.
1  0 
Avatar de OrthodoxWindows
Membre expert https://www.developpez.com
Le 04/02/2025 à 1:13
Citation Envoyé par Rep.Movs Voir le message
Mon expérience avec Copilot? "Je préfère ne pas continuer cette discussion". Pour tout et n'importe quoi. Même de la génération de programme. C'est moitié utilisable.
Deepseek fourni un produit, Microsoft vous fait acheter un service - dont il ne sait même pas si c'est un produit et ce qu'il faut en faire.
Je pari assez chère sur le destin funeste de Copilot ; le même que Microsoft BOB, Clippy et Cortana
1  0 
Avatar de OrthodoxWindows
Membre expert https://www.developpez.com
Le 02/02/2025 à 14:15
Citation Envoyé par noremorse Voir le message
Pendant ce temps là, le copain de Macron (Alexandre Zapolsky) pond Lucie qui ressemble plus à Lucie Castets que Lucy (film de Besson)

Donc Mistral ça n'existe pas ?

Lucy n'est pas vraiment un modèle, visiblement c'est fondé sur Llama 7B de Meta... Ce qui, comme d'habitude, est assez scandaleux au niveau de l'utilisation de l'argent public. Ils auraient pu au moins prendre un modèle de Mistral comme socle, comme ça il aurais toujours trompé les gens en laissant penser qu'il s'agit d'une IA original, mais au moins cela leur aurais évité de mentir sur le fait qu'il s'agit d'une "IA française".
0  0 
Avatar de noremorse
Membre actif https://www.developpez.com
Le 04/02/2025 à 12:03
Nouveau coup dur pour les sanctions américaines : La Russie et la Chine multiplient par 800 les performances de NVIDIA

Des scientifiques des deux pays ont mis au point un algorithme révolutionnaire à partir d'informations issues de la rétroconception d'accélérateurs de cartes vidéo. Cet algorithme permet d'utiliser les GPU de jeu pour le calcul scientifique.


Cette innovation a été réalisée par des spécialistes de l'université MSU-BIT de Shenzhen, cofondée par l'université d'État de Moscou Lomonossov et l'Institut de technologie de Pékin.

Cela permet à la Russie et à la Chine de réduire leur dépendance vis-à-vis des GPU NVIDIA et d'atténuer l'impact des sanctions américaines.

Cela signifie également que la Russie et la Chine doivent acheter moins de GPU NVIDIA, ce qui a probablement conduit à l'effondrement du prix de l'action NVIDIA, a déclaré à Sputnik Valentin Makarov, président de l'association Russoft.

Selon lui, les recherches en cours comprennent de nouveaux algorithmes d'apprentissage automatique et un GPU de nouvelle génération en cours de développement en Russie.

Ces avancées mettent en évidence l'expertise technologique de la Russie, ce qui permet une collaboration avec la Chine et de futurs partenariats potentiels avec l'Inde.

PS : Les sanctions c’est pour les cons
0  0