Après s'être attaquée à ChatGPT avec sa famille de modèle R1 sous licence MIT ouverte, le chinois DeepSeek s'attaque à un autre produit d'OpenAI : DALL-E. Selon l'entreprise, son nouveau nouvel ensemble de modèles d'IA multimodale peut surpasser DALL-E 3 d'OpenAI. Les modèles, qui peuvent être téléchargés à partir de la plateforme de développement d'IA Hugging Face, font partie d'une nouvelle famille de modèles que DeepSeek appelle Janus-Pro. Leur taille varie de 1 à 7 milliards de paramètres. Les paramètres correspondent en gros aux capacités de résolution de problèmes d'un modèle, et les modèles ayant plus de paramètres sont généralement plus performants que ceux qui en ont moins.Comme R1, Janus-Pro est placé sous licence MIT, ce qui signifie qu'il peut être utilisé commercialement sans restriction.
La startup chinoise DeepSeek a lancé un nouveau générateur d'images « révolutionnaire » qui, selon elle, peut surpasser les meilleurs modèles construits par des rivaux basés aux États-Unis pour une fraction du prix.
Janus-Pro, que DeepSeek décrit comme un « nouveau framework autorégressif », peut à la fois analyser et créer de nouvelles images. Selon l'entreprise, sur deux benchmarks d'évaluation de l'IA, GenEval et DPG-Bench, le plus grand modèle Janus-Pro, Janus-Pro-7B, bat DALL-E 3 ainsi que des modèles tels que PixArt-alpha, Emu3-Gen et Stability AI's Stable Diffusion XL.
Certes, certains de ces modèles sont plus anciens, et la plupart des modèles Janus-Pro ne peuvent analyser que de petites images d'une résolution maximale de 384 x 384. Mais les performances de Janus-Pro sont impressionnantes, compte tenu de la taille compacte des modèles.
« Janus-Pro surpasse le modèle unifié précédent et égale ou dépasse les performances des modèles spécifiques à une tâche », écrit DeepSeek dans un article publié sur Hugging Face. « La simplicité, la grande flexibilité et l'efficacité de Janus-Pro en font un candidat de choix pour la prochaine génération de modèles multimodaux unifiés ».
Le Janus-Pro de DeepSeek est libre d'utilisation sans restriction, contrairement aux générateurs d'images construits par des rivaux américains comme OpenAI et Stability AI. Il marque également une avancée dans la manière dont ces modèles sont formés et développés, l'un de ses modèles d'IA générative ayant coûté moins de 6 millions de dollars à construire, contre des milliards pour des entreprises telles que ChatGPT.
« C'est vraiment incroyable... Ce modèle génère des images et bat DALL-E 3 et Stable Diffusion d'OpenAI sur de nombreux critères », a déclaré l'entrepreneur Internet Brian Roemmele. « On ne soulignera jamais assez l'importance du nouveau modèle DeepSeek Janus-Pro 7B pour l'ensemble de l'écosystème de l'IA et pour le monde entier. Il est entièrement gratuit et l'ensemble du projet est open source ».
Le PDG d'OpenAI fait l'éloge de DeepSeek tout en assurant que son entreprise va dévoiler des modèles pavant la voie vers l'IAG
DeepSeek qualifie son dernier modèle d'IA open-source de « révolutionnaire », offrant aux développeurs et aux chercheurs un accès sans précédent à des technologies d'intelligence artificielle de pointe par le biais de plateformes gratuites telles que GitHub et Hugging Face.
« Le Janus Pro de DeepSeek représente une avancée significative dans la technologie de l'intelligence artificielle, en combinant des capacités avancées de compréhension et de génération d'images dans un modèle unique et puissant », a écrit la startup sur Hugging Face. « Sa combinaison de capacités avancées, son accessibilité en code source ouvert et ses performances impressionnantes en font un acteur important dans l'évolution de la technologie de l'intelligence artificielle ».
Sam Altman, qui dirige ChatGPT et OpenAI, le créateur de Dall-E, a fait l'éloge de l'IA rentable de DeepSeek, tout en affirmant que son entreprise dévoilerait des modèles améliorés qui ouvriraient la voie à une...
La fin de cet article est réservée aux abonnés. Soutenez le Club Developpez.com en prenant un abonnement pour que nous puissions continuer à vous proposer des publications.