La commission irlandaise de protection des données a également contacté DeepSeek pour lui demander des détails sur la manière dont elle traite les données des utilisateurs irlandais.
DeepSeek a émergé comme un acteur majeur dans le paysage de l'IA et a suscité un vif intérêt notamment en raison de son LLM open source, DeepSeek R1, qui serait capable de rivaliser avec le modèle o1 d'OpenAI pour 95 % moins cher.
La semaine du 20 janvier, DeepSeek a en effet déployé un assistant IA gratuit, affirmant qu'il traite les données plus efficacement et à un coût bien moindre que ses concurrents. Le lundi 27 janvier, DeepSeek avait déjà dépassé ChatGPT en termes de téléchargements sur l'App Store d'Apple, ce qui a suscité l'émoi des investisseurs du secteur technologique.
Cependant, la manière dont les données collectées par le chatbot de DeepSeek pourraient être utilisées par le gouvernement chinois suscite de plus en plus d'inquiétudes. En Italie, les utilisateurs ont remarqué que l'application avait soudainement disparu des magasins Google et Apple. Ceux qui ont essayé d'y accéder ont reçu des messages indiquant qu'elle n'était « actuellement pas disponible dans le pays ou la région où vous vous trouvez » sur Apple, tandis que les utilisateurs de Google ont vu un avis indiquant que le téléchargement « n'était pas pris en charge ».
Le régulateur italien s'inquiète de la sécurité et de la protection de la vie privée de DeepSeek
Dans un communiqué publié sur son site, l'autorité italienne de protection des données a déclaré qu'elle avait envoyé une demande d'informations à DeepSeek ainsi qu'aux deux fournisseurs de service du chatbot IA chinois.
Les régulateurs ont sollicité des réponses de la part de DeepSeek et de ses filiales concernant le traitement des données personnelles. Ils désirent notamment savoir quelles données sont collectées, d'où elles proviennent, quelles sont les raisons de cette collecte, sur quelles bases juridiques ces données sont traitées et si elles sont stockées sur des serveurs en Chine.
Les fonctionnaires ont également cherché à comprendre comment l'IA de DeepSeek est formée, et plus précisément quels types d'informations sont utilisés. Ils ont notamment demandé si des données personnelles avaient été extraites par le biais du web scraping et comment les utilisateurs enregistrés et les non-utilisateurs étaient informés du traitement de leurs données.
Finalement, les régulateurs ont accordé un délai de 20 jours aux entreprises chinoises pour qu'elles fournissent les informations demandées.
Notons cependant que selon la loi chinoise sur le renseignement national, toutes les institutions, les entreprises, les organisations et tous les citoyens « doivent soutenir, aider et coopérer aux efforts du renseignement national, et protéger les secrets de travail du renseignement national dont ils ont connaissance ».
DeepSeek sous surveillance
Dans le cadre d'un autre développement, un porte-parole d'OpenAI a déclaré : « Nous sommes conscients et examinons les indications selon lesquelles DeepSeek pourrait avoir distillé nos modèles de manière inappropriée, et nous partagerons des informations dès que nous en saurons davantage. Nous prenons des contre-mesures agressives et proactives pour protéger notre technologie et nous continuerons à travailler en étroite collaboration avec le gouvernement américain pour protéger les modèles les plus performants construits chez nous. »
Bien que la distillation n'expose pas les poids des modèles et ne constitue pas une violation de la sécurité, l'entreprise n'autorise pas les utilisateurs de ses modèles exclusifs à développer des produits concurrents.
La demande d'information de l'autorité italienne de protection des données est présentée ci-dessous :
L'autorité italienne de protection des données a envoyé une demande d'informations à Hangzhou DeepSeek Artificial Intelligence et Beijing DeepSeek Artificial Intelligence, les sociétés qui fournissent le service de chatbot DeepSeek, basé à la fois sur le web et sur les applications.
Étant donné le risque potentiellement élevé que représentent les données de millions de personnes en Italie, l'Autorité a demandé aux deux sociétés et à leurs filiales de confirmer quelles données à caractère personnel sont collectées, les sources utilisées, les finalités poursuivies, la base juridique du traitement et si elles sont stockées sur des serveurs situés en Chine.
L'Autorité a également demandé aux entreprises quel type d'informations est utilisé pour former le système d'intelligence artificielle et, dans le cas où les données à caractère personnel sont collectées par le biais d'activités de « web scraping », de préciser comment les utilisateurs enregistrés et non enregistrés du service ont été ou sont informés du traitement de leurs données.
Les entreprises sont tenues de soumettre les informations demandées à l'Autorité dans un délai de 20 jours.
Étant donné le risque potentiellement élevé que représentent les données de millions de personnes en Italie, l'Autorité a demandé aux deux sociétés et à leurs filiales de confirmer quelles données à caractère personnel sont collectées, les sources utilisées, les finalités poursuivies, la base juridique du traitement et si elles sont stockées sur des serveurs situés en Chine.
L'Autorité a également demandé aux entreprises quel type d'informations est utilisé pour former le système d'intelligence artificielle et, dans le cas où les données à caractère personnel sont collectées par le biais d'activités de « web scraping », de préciser comment les utilisateurs enregistrés et non enregistrés du service ont été ou sont informés du traitement de leurs données.
Les entreprises sont tenues de soumettre les informations demandées à l'Autorité dans un délai de 20 jours.
Source : Autorité italienne de protection des données
Et vous ?
Quel est votre avis sur le sujet ?
Trouvez-vous l'initiative des régulateurs italiens pertinente et justifiée ?
Voir aussi :
OpenAI a trouvé des preuves que la start-up chinoise DeepSeek a utilisé les modèles propriétaires d'OpenAI pour former son propre modèle open-source, en utilisant la technique de "distillation"
SemiAnalysis affirme que DeepSeek a dépensé plus de 500 millions de dollars en puces Nvidia malgré les allégations au sujet d'une IA à bas prix, suscitant des interrogations sur la transparence de DeepSeek
DeepSeek Janus-Pro : Le générateur d'images d'IA open source « révolutionnaire » surpasserait DALL-E 3 d'OpenAI pour une fraction du prix, Sam Altman salue la prouesse et promet l'arrivée imminente de l'IAG