Alibaba dévoile Qwen 3.6-Max-Preview, la version préliminaire de son prochain modèle d'IA avancé, qui est plus intelligent, plus performant et toujours en pleine évolutionAlibaba a présenté Qwen3.6-Max-Preview, la version préliminaire de son modèle d'intelligence artificielle (IA) de nouvelle génération. Disponible sur Alibaba Cloud via Qwen Studio et des API, ce modèle vise à améliorer les performances de codage agentique, à renforcer la capacité à suivre des instructions complexes et à garantir une plus grande cohérence factuelle. Alibaba positionne cette préversion comme s'inscrivant dans une évolution plus large vers des systèmes d'IA autonomes capables d'utiliser des outils ou d'effectuer des flux de travail structurés, plutôt que vers des modèles purement conversationnels.
Alibaba Group Holding Limited, connue sous le nom d'Alibaba, est une multinationale chinoise spécialisée dans le commerce électronique, la vente au détail, Internet et les technologies. Fondée le 28 juin 1999 à Hangzhou, dans la province du Zhejiang, la société propose des services de vente de particulier à particulier (C2C), d'entreprise à particulier (B2C) et d'entreprise à entreprise (B2B) via des places de marché chinoises et internationales, ainsi que des services locaux destinés aux consommateurs, dans les domaines des médias numériques et du divertissement, de la logistique et du cloud computing. Elle détient et exploite un portefeuille diversifié d'entreprises à travers le monde dans de nombreux secteurs d'activité.
Qwen (également connu sous le nom de Tongyi Qianwen) est une famille de grands modèles de langage développés par Alibaba Cloud, une filiale du groupe Alibaba. De nombreux modèles Qwen sont distribués sous la licence libre et open source Apache 2.0, sous la licence Qwen (avec code source disponible) ou sous la licence Qwen Research (à usage non commercial) ; d'autres modèles Qwen propriétaires sont proposés via Alibaba Cloud.
Le lancement de cette nouvelle préversion s’inscrit dans la continuité des efforts récents d'Alibaba pour repositionner sa famille de modèles Qwen sur des usages plus avancés. Mi-avril 2026, soit quelques semaines seulement après une crise interne marquée par le départ de plusieurs ingénieurs clés, le groupe a lancé Qwen3.6-35B-A3B, un modèle basé sur une architecture Mixture of Experts (MoE) optimisée pour le codage agentique et le raisonnement à l'échelle d'un dépôt entier. Capable de traiter des contextes allant jusqu’à un million de tokens et affichant des performances élevées sur les principaux benchmarks, ce modèle redéfinit les limites de l'IA open source pour les développeurs.
« Suite à la sortie de Qwen3.6-Plus, nous vous proposons un premier aperçu de notre prochain modèle propriétaire : Qwen 3.6-Max-Preview. Par rapport à Qwen3.6-Plus, cette version préliminaire offre une meilleure connaissance du monde et une meilleure capacité à suivre les instructions, ainsi que des améliorations significatives en matière de codage agentique sur un large éventail de benchmarks », a déclaré Alibaba dans un communiqué publié le 18 avril dernier.
Il s'agit d'un premier aperçu du prochain modèle Qwen d'Alibaba, qui succédera à Qwen3.6-Plus. Il ne s'agit pas d'une version stable définitive. Ce modèle fait actuellement l'objet de tests et d'itérations, dans le but d'améliorer ses capacités de codage, sa capacité à suivre des instructions et la fiabilité de ses connaissances.
Qu'est-ce que Qwen3.6-Max-Preview ?
Il s'agit d'un modèle propriétaire hébergé sur Alibaba Cloud et accessible via Qwen Studio et une API. Il est conçu pour offrir des performances accrues dans les tâches où le modèle doit se comporter davantage comme un assistant automatisé capable d'utiliser des outils, d'écrire du code et d'exécuter des flux de travail en plusieurs étapes.
Par rapport à Qwen 3.6-Plus, cette version préliminaire vise à améliorer les performances de codage de type « agent », à renforcer la capacité à suivre des instructions complexes et à assurer une plus grande cohérence factuelle. Elle est également conçue pour gérer de manière plus fiable les tâches réelles des développeurs, en particulier dans les environnements impliquant des référentiels, des terminaux et des appels d'outils.
Performances et benchmarks
D'après les résultats des évaluations de Qwen3.6-Max-Preview par rapport aux principaux modèles de pointe, cette version met en avant des améliorations dans plusieurs benchmarks de codage et de raisonnement. On note notamment des progrès dans les tâches d'ingénierie logicielle, la résolution de problèmes en mode terminal et la génération de code liée à des référentiels.
Qwen3.6-Max-Preview fait également état d'améliorations modérées dans les évaluations portant sur les connaissances générales et la capacité à suivre des instructions. L'accent est mis sur une cohérence globale et des performances plus solides dans des scénarios de codage concrets, plutôt que sur un seul indicateur remarquable.
Par rapport à Qwen 3.6-Plus, cette version préliminaire offre des améliorations significatives en matière de codage agentique (par exemple, SkillsBench +9,9, SciCode +6,3, NL2Repo +5,0, Terminal-Bench 2.0 +3,8), une meilleure connaissance du monde (SuperGPQA +2,3, QwenChineseBench +5,3) et une meilleure capacité à suivre des instructions (ToolcallFormatIFBench +2,8).
Accès pour les développeurs et détails sur l'API
Le modèle est accessible via les API de Qwen Studio et d'Alibaba Cloud Model Studio. Il prend en charge les interfaces standard de saisie assistée pour les chats et est compatible avec les formats d'API courants du secteur. Cette version prend également en charge la fonctionnalité preserve_thinking, une option permettant de conserver les traces de raisonnement internes tout au long des workflows des agents, ce qui s'avère particulièrement utile pour le débogage et les systèmes d'automatisation en plusieurs étapes impliquant une approche agentique.
Alibaba Cloud Model Studio prend par ailleurs en charge les protocoles standard du secteur, notamment les API de complétion de chat et de réponse compatibles avec les spécifications d'OpenAI, ainsi qu'une interface API compatible avec Anthropic.
Un exemple de code pour l'API de complétion de chat est fourni ci-dessous :
| Code python : | Sélectionner tout |
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 | """ Environment variables (per official docs): DASHSCOPE_API_KEY: Your API Key from https://modelstudio.console.alibabacloud.com DASHSCOPE_BASE_URL: (optional) Base URL for compatible-mode API. - Beijing: https://dashscope.aliyuncs.com/compatible-mode/v1 - Singapore: https://dashscope-intl.aliyuncs.com/compatible-mode/v1 - US (Virginia): https://dashscope-us.aliyuncs.com/compatible-mode/v1 DASHSCOPE_MODEL: (optional) Model name; override for different models. """ from openai import OpenAI import os api_key = os.environ.get("DASHSCOPE_API_KEY") if not api_key: raise ValueError( "DASHSCOPE_API_KEY is required. " "Set it via: export DASHSCOPE_API_KEY='your-api-key'" ) client = OpenAI( api_key=api_key, base_url=os.environ.get( "DASHSCOPE_BASE_URL", "https://dashscope-intl.aliyuncs.com/compatible-mode/v1", ), ) messages = [{"role": "user", "content": "Introduce vibe coding."}] model = os.environ.get( "DASHSCOPE_MODEL", "qwen3.6-max-preview", ) completion = client.chat.completions.create( model=model, messages=messages, extra_body={ "enable_thinking": True, # "preserve_thinking": True, }, stream=True ) reasoning_content = "" # Full reasoning trace answer_content = "" # Full response is_answering = False # Whether we have entered the answer phase print("\n" + "=" * 20 + "Reasoning" + "=" * 20 + "\n") for chunk in completion: if not chunk.choices: print("\nUsage:") print(chunk.usage) continue delta = chunk.choices[0].delta # Collect reasoning content only if hasattr(delta, "reasoning_content") and delta.reasoning_content is not None: if not is_answering: print(delta.reasoning_content, end="", flush=True) reasoning_content += delta.reasoning_content # Received content, start answer phase if hasattr(delta, "content") and delta.content: if not is_answering: print("\n" + "=" * 20 + "Answer" + "=" * 20 + "\n") is_answering = True print(delta.content, end="", flush=True) answer_content += delta.content |
La direction principale prise ici consiste à s'orienter vers des modèles qui fonctionnent davantage comme des agents que comme de simples outils de conversation. Au lieu de se concentrer uniquement sur la qualité du dialogue, les améliorations visent des tâches concrètes telles que le codage, l'utilisation d'outils et les flux de travail structurés. Le terme « direction » sert simplement à indiquer que le modèle est développé dans le but d'adopter un comportement plus autonome et axé sur les tâches, plutôt que de se limiter à de simples interactions par chat.
Source : Alibaba
Et vous ?
Quel est votre avis sur le sujet ?
Trouvez-vous cette initiative d'Alibaba crédible ou pertinente ?Voir aussi :
Alibaba présente Qwen 3.6 Plus, un modèle d'IA 100 % gratuit qui surpasserait Claude Sonnet 4.6 et permettrait de créer des applications en une seule instruction
Alibaba lance Qwen3.5, un modèle natif de vision-langage à poids ouvert de 397 milliards de paramètres, affichant de améliorations en matière de raisonnement, de codage et de capacités d'agent
Alibaba Cloud lance Qwen-Image-2.0, un modèle fondamental de génération d'images de nouvelle génération, combinant infographie professionnelle et photoréalisme dans un seul modèle d'IA
Vous avez lu gratuitement 247 articles depuis plus d'un an.
Soutenez le club developpez.com en souscrivant un abonnement pour que nous puissions continuer à vous proposer des publications.
Soutenez le club developpez.com en souscrivant un abonnement pour que nous puissions continuer à vous proposer des publications.