La sortie du modèle R1 de DeepSeek a provoqué une onde de choc dans la communauté de l'IA, offrant une alternative open-source puissante à une fraction du coût. Formé avec l'apprentissage par renforcement, DeepSeek-R1 serait aussi performant que le modèle o1 d'OpenAI pour 95 % moins cher. Son ascension rapide - R1 étant devenue l'application la plus téléchargée de l'Apple Store, juste devant ChatGPT - a contraint l'industrie à repenser ses stratégies en matière d'IA.
S'exprimant sur X le 28 janvier, Sam Altman a fait l'éloge du grand modèle de langage de la startup chinoise DeepSeek, le qualifiant de « modèle impressionnant, en particulier en ce qui concerne ce qu'ils sont capables d'offrir pour le prix ». Cette remarque fait référence au fait que DeepSeek aurait été construit et entraîné pour moins de 6 millions de dollars, une bagatelle comparée aux milliards dépensés par les géants de la technologie tels qu'OpenAI.
deepseek's r1 is an impressive model, particularly around what they're able to deliver for the price.
— Sam Altman (@sama) January 28, 2025
we will obviously deliver much better models and also it's legit invigorating to have a new competitor! we will pull up some releases.
Dans sa publication, Sam Altman a également apporté son soutien au produit de sa propre entreprise, ChatGPT, en déclarant :
Nous allons évidemment fournir de bien meilleurs modèles et il est tout à fait stimulant d'avoir un nouveau concurrent ! Nous dévoilerons d'autres modèles.
Mais nous sommes surtout enthousiastes à l'idée de poursuivre l'exécution de notre feuille de route en matière de recherche et nous pensons qu'il est plus important que jamais de disposer de plus de puissance de calcul pour mener à bien notre mission. Le monde va vouloir utiliser BEAUCOUP d'IA, et sera vraiment très étonné par les modèles de nouvelle génération à venir.
Mais nous sommes surtout enthousiastes à l'idée de poursuivre l'exécution de notre feuille de route en matière de recherche et nous pensons qu'il est plus important que jamais de disposer de plus de puissance de calcul pour mener à bien notre mission. Le monde va vouloir utiliser BEAUCOUP d'IA, et sera vraiment très étonné par les modèles de nouvelle génération à venir.
C'est une bonne nouvelle pour les budgets technologiques et pour l'environnement, car les grands centres de données consomment déjà d'énormes quantités d'énergie.
Néanmoins, Sam Altman lui-même a semblé repousser l'idée que les futures avancées de l'IA seront moins coûteuses à produire, en particulier avec son commentaire selon lequel l'équipe d'OpenAI pense que « plus de calcul est plus important aujourd'hui que jamais pour réussir notre mission. »
En termes d'impact financier, les actions de SoftBank Group Corp., partenaire d'OpenAI, ont essuyé des pertes à la suite du succès de DeepSeek, chutant de 4,7 % le mardi 28 janvier matin à Tokyo.
Le succès de DeepSeek ne se limite pas uniquement aux modèles R1 sous licence MIT ouverte. L'entreprise a également publié DeepSeek Janus-Pro, un générateur d'images d'IA open source « révolutionnaire » qui serait capable de surpasser DALL-E 3 d'OpenAI pour une fraction du coût. Comptant 1 à 7 milliards de paramètres, ces modèles d'IA multimodale sont disponibles pour une utilisation commerciale sous licence MIT, renforçant ainsi l'accessibilité et la rentabilité de l'IA.
Source : Sam Altman, PDG d'OpenAI
Et vous ?
Quel est votre avis sur le sujet ?
Pensez-vous que DeepSeek sera en mesure de poursuivre son ascension au cours des prochains mois ?
Avec la sortie des modèles d'IA de DeepSeek, pensez-vous que les stratégies de développement de l'IA à budget élevé sont toujours pertinentes ?
Voir aussi :
Le laboratoire d'IA chinois DeepSeek a publié sa nouvelle famille de modèles R1 sous une licence MIT ouverte, affirmant que le modèle présente des performances comparables au raisonnement simulé o1 d'OpenAI
Nvidia rejette la menace DeepSeek et affirme que l'IA chinoise a toujours besoin de ses puces alors que ses actions ont dévissé de 17 %, effaçant 600 milliards de dollars de sa capitalisation boursière
L'IA chinoise DeepSeek Coder V2 devient le premier modèle de codage open-source à battre le GPT-4 Turbo d'OpenAI, elle vise à combler l'écart de performance avec les modèles à source fermée