
DeepSeek publie une mise à jour de son modèle de raisonnement R1, dont les performances se rapprochent de celles d'o3 d'OpenAI et de Gemini 2.5 Pro de Google. Le succès mondial du modèle R1 en janvier a fait chuter les actions technologiques en dehors de la Chine. L'intelligence artificielle de DeepSeek est saluée pour ses performances et son coût inférieur à celui de ses concurrents américains. La mise à jour réduit le nombre de résultats erronés et améliore le raisonnement complexe.
L’apparition de DeepSeek a fait voler en éclats le mythe d’un monopole technologique américain sur l’intelligence artificielle. En moins de deux ans, cette entreprise chinoise a réussi à réduire considérablement l’écart qui la séparait des géants américains de l’IA, notamment grâce à une stratégie open source audacieuse. DeepSeek est devenue l'application gratuite la plus téléchargée aux États-Unis une semaine seulement après son lancement.
L'émergence de l'application chinoise d'intelligence artificielle DeepSeek a choqué les marchés financiers et incité le président américain Donald Trump à la qualifier de « signal d'alarme » pour l'industrie technologique américaine. L'affirmation de DeepSeek selon laquelle son modèle d'intelligence artificielle R1 a été fabriqué pour une fraction du coût de ses concurrents a soulevé des questions sur l'avenir de l'ensemble du secteur et a fait chuter la valeur de certaines des plus grandes entreprises du monde.
Récemment, la start-up chinoise DeepSeek, spécialisée dans l'intelligence artificielle, a publié la première mise à jour de son modèle de raisonnement R1, qui connaît un grand succès, intensifiant ainsi la concurrence avec ses rivaux américains tels qu'OpenAI. DeepSeek a déclaré via la plateforme de développement Hugging Face que R1-0528 était une mise à jour mineure de R1 qui améliorait néanmoins considérablement sa profondeur de raisonnement et ses capacités d'inférence, notamment en améliorant la gestion des tâches complexes, ce qui rapproche ses performances des modèles de raisonnement o3 d'OpenAI et de Gemini 2.5 Pro de Google.
Pour rappel, le lancement de R1 en janvier a fait le buzz dans le monde entier, a fait chuter les actions technologiques hors de Chine et a remis en question l'idée selon laquelle le développement de l'IA nécessite une puissance de calcul et des investissements considérables. Depuis la sortie de R1, des géants technologiques chinois tels qu'Alibaba et Tencent ont lancé des modèles prétendant surpasser ceux de DeepSeek.
La mise à jour récente était initialement peu détaillée, contrairement au lancement de R1 en janvier, qui était accompagné d'un article universitaire rédigé par plusieurs auteurs que la communauté mondiale de l'IA a analysé pour comprendre les stratégies de l'entreprise. L'entreprise basée à Hangzhou a déclaré plus tard dans un court message sur X que R1-0528 offrait des performances améliorées. Dans un message plus long publié sur WeChat, DeepSeek a déclaré que le taux d'« hallucinations », c'est-à-dire les résultats faux ou trompeurs, avait été réduit d'environ 45 à 50 % dans des scénarios tels que la réécriture et la synthèse.
Elle a ajouté que la mise à jour lui permettait également d'écrire de manière créative des essais, des romans et d'autres genres, et qu'elle avait amélioré ses capacités dans des domaines tels que la génération de code front-end et les jeux de rôle. "Le modèle a démontré des performances exceptionnelles dans diverses évaluations de référence, notamment en mathématiques, en programmation et en logique générale", a déclaré DeepSeek.
Le succès de DeepSeek a bouleversé la croyance selon laquelle les contrôles à l'exportation américains freinaient les progrès de la Chine en matière d'IA, après avoir lancé des modèles d'IA équivalents ou supérieurs aux modèles leaders du secteur aux États-Unis, pour un coût nettement inférieur. La start-up a ajouté qu'une variante de sa mise à jour avait été créée en reprenant le processus de raisonnement utilisé par le modèle R1-0528, afin d'améliorer encore le modèle Qwen 3 8B Base du géant technologique chinois Alibaba, un processus connu sous le nom de distillation. Le résultat a été une performance surpassant de plus de 10 % celle du modèle Qwen 3 original.
"Nous pensons que la chaîne de pensée de DeepSeek-R1-0528 revêtira une importance considérable tant pour la recherche universitaire sur les modèles de raisonnement que pour le développement industriel axé sur les modèles à petite échelle", a ajouté DeepSeek. Un autre rapport a révélé qu'un représentant de DeepSeek aurait déclaré à un groupe WeChat que la société avait achevé ce qu'elle a qualifié de « mise à niveau d'essai mineure » et que les utilisateurs pouvaient commencer à la tester.

En réponse à la concurrence de Deepseek, Gemini de Google a introduit des niveaux d'accès à prix réduit, tandis qu'OpenAI a baissé ses prix et lancé un modèle o3 Mini qui nécessite moins de puissance de calcul. Deepseek devrait toujours lancer R2, le successeur de R1. La sortie de R2 était initialement prévue pour mai. DeepSeek a également publié une mise à niveau de son grand modèle de langage V3 en mars.
Dans un climat où l’IA est dominée par des géants comme OpenAI, Google, et Anthropic, l’apparition de DeepSeek est perçue comme une réplique communautaire, radicalement différente par sa philosophie : ouverture, collaboration, transparence. Un défenseur de l’open source avait même affirmé que DeepSeek est plus qu'un LLM : "Ce n’est pas juste un modèle, c’est un mouvement". Sa montée en puissance ravive les mémoires d’une autre révolution numérique : celle du système d’exploitation Linux, qui, dans les années 90, a défié l’hégémonie de Microsoft avec un écosystème construit par une armée mondiale de volontaires.
Cependant, la fiabilité de DeepSeek a été remis en question de nombreuses fois. Un rapport du Congrès américain a notamment estimé que DeepSeek représente une "menace profonde" pour la sécurité nationale les États-Unis. Selon le rapport, DeepSeek siphonne les données des Américains pour le compte de Pékin et s'appuie sur des "technologies américaines volées". Le rapport affirme notamment : "DeepSeek n'est pas une simple application d'IA. C'est une arme dans l'arsenal du Parti communiste chinois, conçue pour espionner les Américains, voler notre technologie et subvertir la loi américaine".
Source : DeepSeek
Et vous ?


Voir aussi :



Vous avez lu gratuitement 39 articles depuis plus d'un an.
Soutenez le club developpez.com en souscrivant un abonnement pour que nous puissions continuer à vous proposer des publications.
Soutenez le club developpez.com en souscrivant un abonnement pour que nous puissions continuer à vous proposer des publications.