IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)

Vous êtes nouveau sur Developpez.com ? Créez votre compte ou connectez-vous afin de pouvoir participer !

Vous devez avoir un compte Developpez.com et être connecté pour pouvoir participer aux discussions.

Vous n'avez pas encore de compte Developpez.com ? Créez-en un en quelques instants, c'est entièrement gratuit !

Si vous disposez déjà d'un compte et qu'il est bien activé, connectez-vous à l'aide du formulaire ci-dessous.

Identifiez-vous
Identifiant
Mot de passe
Mot de passe oublié ?
Créer un compte

L'inscription est gratuite et ne vous prendra que quelques instants !

Je m'inscris !

La start-up chinoise DeepSeek lance R1-0528, un modèle IA doté d'une meilleure capacité de raisonnement et d'une meilleure gestion des tâches complexes

Le , par Jade Emy

6PARTAGES

2  0 
La start-up chinoise DeepSeek, spécialisée dans l'IA, a lancé R1-0528, un modèle doté d'une meilleure capacité de raisonnement et d'une meilleure gestion des tâches complexes

DeepSeek publie une mise à jour de son modèle de raisonnement R1, dont les performances se rapprochent de celles d'o3 d'OpenAI et de Gemini 2.5 Pro de Google. Le succès mondial du modèle R1 en janvier a fait chuter les actions technologiques en dehors de la Chine. L'intelligence artificielle de DeepSeek est saluée pour ses performances et son coût inférieur à celui de ses concurrents américains. La mise à jour réduit le nombre de résultats erronés et améliore le raisonnement complexe.

L’apparition de DeepSeek a fait voler en éclats le mythe d’un monopole technologique américain sur l’intelligence artificielle. En moins de deux ans, cette entreprise chinoise a réussi à réduire considérablement l’écart qui la séparait des géants américains de l’IA, notamment grâce à une stratégie open source audacieuse. DeepSeek est devenue l'application gratuite la plus téléchargée aux États-Unis une semaine seulement après son lancement.

L'émergence de l'application chinoise d'intelligence artificielle DeepSeek a choqué les marchés financiers et incité le président américain Donald Trump à la qualifier de « signal d'alarme » pour l'industrie technologique américaine. L'affirmation de DeepSeek selon laquelle son modèle d'intelligence artificielle R1 a été fabriqué pour une fraction du coût de ses concurrents a soulevé des questions sur l'avenir de l'ensemble du secteur et a fait chuter la valeur de certaines des plus grandes entreprises du monde.

Récemment, la start-up chinoise DeepSeek, spécialisée dans l'intelligence artificielle, a publié la première mise à jour de son modèle de raisonnement R1, qui connaît un grand succès, intensifiant ainsi la concurrence avec ses rivaux américains tels qu'OpenAI. DeepSeek a déclaré via la plateforme de développement Hugging Face que R1-0528 était une mise à jour mineure de R1 qui améliorait néanmoins considérablement sa profondeur de raisonnement et ses capacités d'inférence, notamment en améliorant la gestion des tâches complexes, ce qui rapproche ses performances des modèles de raisonnement o3 d'OpenAI et de Gemini 2.5 Pro de Google.

Pour rappel, le lancement de R1 en janvier a fait le buzz dans le monde entier, a fait chuter les actions technologiques hors de Chine et a remis en question l'idée selon laquelle le développement de l'IA nécessite une puissance de calcul et des investissements considérables. Depuis la sortie de R1, des géants technologiques chinois tels qu'Alibaba et Tencent ont lancé des modèles prétendant surpasser ceux de DeepSeek.


La mise à jour récente était initialement peu détaillée, contrairement au lancement de R1 en janvier, qui était accompagné d'un article universitaire rédigé par plusieurs auteurs que la communauté mondiale de l'IA a analysé pour comprendre les stratégies de l'entreprise. L'entreprise basée à Hangzhou a déclaré plus tard dans un court message sur X que R1-0528 offrait des performances améliorées. Dans un message plus long publié sur WeChat, DeepSeek a déclaré que le taux d'« hallucinations », c'est-à-dire les résultats faux ou trompeurs, avait été réduit d'environ 45 à 50 % dans des scénarios tels que la réécriture et la synthèse.

Elle a ajouté que la mise à jour lui permettait également d'écrire de manière créative des essais, des romans et d'autres genres, et qu'elle avait amélioré ses capacités dans des domaines tels que la génération de code front-end et les jeux de rôle. "Le modèle a démontré des performances exceptionnelles dans diverses évaluations de référence, notamment en mathématiques, en programmation et en logique générale", a déclaré DeepSeek.


Le succès de DeepSeek a bouleversé la croyance selon laquelle les contrôles à l'exportation américains freinaient les progrès de la Chine en matière d'IA, après avoir lancé des modèles d'IA équivalents ou supérieurs aux modèles leaders du secteur aux États-Unis, pour un coût nettement inférieur. La start-up a ajouté qu'une variante de sa mise à jour avait été créée en reprenant le processus de raisonnement utilisé par le modèle R1-0528, afin d'améliorer encore le modèle Qwen 3 8B Base du géant technologique chinois Alibaba, un processus connu sous le nom de distillation. Le résultat a été une performance surpassant de plus de 10 % celle du modèle Qwen 3 original.

"Nous pensons que la chaîne de pensée de DeepSeek-R1-0528 revêtira une importance considérable tant pour la recherche universitaire sur les modèles de raisonnement que pour le développement industriel axé sur les modèles à petite échelle", a ajouté DeepSeek. Un autre rapport a révélé qu'un représentant de DeepSeek aurait déclaré à un groupe WeChat que la société avait achevé ce qu'elle a qualifié de « mise à niveau d'essai mineure » et que les utilisateurs pouvaient commencer à la tester.

Citation Envoyé par DeepSeek
Le modèle DeepSeek R1 a fait l'objet d'une mise à jour mineure, la version actuelle étant DeepSeek-R1-0528. Dans la dernière mise à jour, DeepSeek R1 a considérablement amélioré ses capacités de raisonnement et d'inférence en tirant parti de ressources informatiques accrues et en introduisant des mécanismes d'optimisation algorithmique pendant la post-formation. Le modèle a démontré des performances exceptionnelles dans diverses évaluations de référence, notamment en mathématiques, en programmation et en logique générale. Ses performances globales se rapprochent désormais de celles des modèles leaders, tels que O3 et Gemini 2.5 Pro.

Par rapport à la version précédente, le modèle mis à jour présente des améliorations significatives dans le traitement des tâches de raisonnement complexes. Par exemple, dans le test AIME 2025, la précision du modèle est passée de 70 % dans la version précédente à 87,5 % dans la version actuelle. Cette avancée résulte d'une profondeur de réflexion accrue pendant le processus de raisonnement : dans le test AIME, le modèle précédent utilisait en moyenne 12 000 tokens par question, tandis que la nouvelle version en utilise en moyenne 23 000.

Au-delà de ses capacités de raisonnement améliorées, cette version offre également un taux d'hallucination réduit, une prise en charge améliorée des appels de fonction et une meilleure expérience pour le vibe coding.

En réponse à la concurrence de Deepseek, Gemini de Google a introduit des niveaux d'accès à prix réduit, tandis qu'OpenAI a baissé ses prix et lancé un modèle o3 Mini qui nécessite moins de puissance de calcul. Deepseek devrait toujours lancer R2, le successeur de R1. La sortie de R2 était initialement prévue pour mai. DeepSeek a également publié une mise à niveau de son grand modèle de langage V3 en mars.

Dans un climat où l’IA est dominée par des géants comme OpenAI, Google, et Anthropic, l’apparition de DeepSeek est perçue comme une réplique communautaire, radicalement différente par sa philosophie : ouverture, collaboration, transparence. Un défenseur de l’open source avait même affirmé que DeepSeek est plus qu'un LLM : "Ce n’est pas juste un modèle, c’est un mouvement". Sa montée en puissance ravive les mémoires d’une autre révolution numérique : celle du système d’exploitation Linux, qui, dans les années 90, a défié l’hégémonie de Microsoft avec un écosystème construit par une armée mondiale de volontaires.

Cependant, la fiabilité de DeepSeek a été remis en question de nombreuses fois. Un rapport du Congrès américain a notamment estimé que DeepSeek représente une "menace profonde" pour la sécurité nationale les États-Unis. Selon le rapport, DeepSeek siphonne les données des Américains pour le compte de Pékin et s'appuie sur des "technologies américaines volées". Le rapport affirme notamment : "DeepSeek n'est pas une simple application d'IA. C'est une arme dans l'arsenal du Parti communiste chinois, conçue pour espionner les Américains, voler notre technologie et subvertir la loi américaine".

Source : DeepSeek

Et vous ?

Pensez-vous que cette mise à jour est crédible ou pertinente ?
Quel est votre avis sur le sujet ?

Voir aussi :

DeepSeek échoue à tous les tests de sécurité : il est beaucoup plus facile de tromper DeepSeek pour qu'il fournisse des informations nuisibles que ses rivaux tels que ChatGPT, affirment les chercheurs de Cisco


Les entreprises d'IA s'inspirent de l'exemple de DeepSeek et créent des modèles performants et moins coûteux grâce à la « distillation », mais les experts préviennent qu'ils sont plus limités

OpenAI qualifie la startup chinoise DeepSeek d'entreprise « contrôlée par l'État » et demande à la Maison Blanche l'interdiction des modèles d'IA « produits en Chine »
Vous avez lu gratuitement 39 articles depuis plus d'un an.
Soutenez le club developpez.com en souscrivant un abonnement pour que nous puissions continuer à vous proposer des publications.

Une erreur dans cette actualité ? Signalez-nous-la !