DeepSeek a lancé DeepSeek V4 Pro et DeepSeek V4 Flash, sa première mise à jour majeure de modèle depuis plus d'un an. Les nouveaux modèles V4 introduisent une fenêtre contextuelle pouvant atteindre 1 million de jetons, ce qui permet de maintenir une meilleure cohérence dans les conversations et les documents plus longs, à moindre coût. DeepSeek V4 reste open source, ce qui permet aux utilisateurs d'inspecter, d'adapter ou de modifier le code. Son précédent modèle R1 avait bouleversé les marchés grâce à ses performances élevées à moindre coût. La concurrence chinoise croissante a intensifié la pression sur les stratégies mondiales en matière de dépenses dans l'IA.DeepSeek est une entreprise chinoise spécialisée dans l'intelligence artificielle (IA) qui développe des grands modèles de langage (LLM). La société a lancé un chatbot éponyme parallèlement à son modèle DeepSeek-R1 en janvier 2025. DeepSeek-R1 fournissait des réponses comparables à celles d'autres LLM contemporains, tels que le GPT-4 et l'o1 d'OpenAI. Son coût de formation aurait été nettement inférieur à celui d'autres LLM. La société affirme avoir formé son modèle V3 pour 6 millions de dollars, soit bien moins que les 100 millions de dollars qu'a coûté le GPT-4 d'OpenAI en 2023, et en utilisant environ un dixième de la puissance de calcul consommée par le modèle comparable de Meta, Llama 3.1. Le succès de DeepSeek face à des rivaux plus importants et mieux établis a été qualifié de « bouleversement de l'IA ».
Récemment, DeepSeek a lancé DeepSeek V4 Pro et DeepSeek V4 Flash, sa première mise à jour majeure de modèle depuis plus d'un an. Les nouveaux modèles V4 introduisent une fenêtre contextuelle pouvant atteindre 1 million de jetons, ce qui permet de maintenir une meilleure cohérence dans les conversations et les documents plus longs, à moindre coût. DeepSeek V4 reste open source, ce qui permet aux utilisateurs d'inspecter, d'adapter ou de modifier le code. V4 Pro est destiné à des tâches agentiques plus complexes en plusieurs étapes. DeepSeek affirme qu'il rivalise avec les principaux modèles propriétaires en matière de raisonnement et qu'il n'est devancé que par Gemini 3.1 Pro de Google en termes de connaissance du monde. V4 Flash est la variante plus rapide, offrant des réponses plus rapides tout en restant proche de V4 Pro pour les tâches agentiques plus simples.
Cette sortie intervient également dans un contexte de surveillance accrue. L'utilisation de DeepSeek a été interdite par les agences fédérales américaines et sur les appareils gouvernementaux pour des raisons de sécurité nationale, tandis que la Corée du Sud a temporairement suspendu les téléchargements pour des raisons de confidentialité avant de rétablir la disponibilité par la suite.
DeepSeek dévoile une version préliminaire de son modèle V4 tant attendu
La start-up chinoise spécialisée dans l'IA DeepSeek a publié une version préliminaire de son très attendu modèle V4, permettant aux utilisateurs de tester ses nouvelles capacités et fonctionnalités. Cette sortie intervient plus d'un an après que la société basée à Hangzhou a présenté son modèle de raisonnement R1, qui a bouleversé les marchés technologiques mondiaux en raison de ses performances surprenantes et de sa rentabilité.
À l'instar des précédentes versions de DeepSeek, cette dernière mise à jour est open source, ce qui permet aux développeurs de télécharger le code, de l'exécuter localement et, dans la plupart des cas, de le modifier. Le modèle est disponible en versions « pro » et « flash », en fonction de la taille, DeepSeek affirmant que le V4 offre des performances supérieures à celles de ses concurrents nationaux, notamment dans les tâches basées sur des agents, le traitement des connaissances et l'inférence.
« L'aperçu de la V4 de DeepSeek est une véritable prouesse », offrant des coûts d'inférence inférieurs à ceux des modèles précédents, a déclaré Neil Shah, vice-président de la recherche chez Counterpoint Research. Les coûts d'inférence désignent les dépenses informatiques et financières liées à l'exécution d'un modèle d'IA entraîné pour générer des résultats. DeepSeek a également indiqué que la V4 a été optimisée pour être utilisée avec des outils d'agents populaires...
La fin de cet article est réservée aux abonnés. Soutenez le Club Developpez.com en prenant un abonnement pour que nous puissions continuer à vous proposer des publications.