Qwen3.6-35B-A3B – 阿里通义千问开源混合专家(MoE)模型

Qwen3.6-35B-A3B是阿里巴巴通义千问团队于2026年4月16日正式开源的一款高性能混合专家(MoE)模型。

作为Qwen3.6系列的首个开源权重版本，它凭借“350 亿总参数、仅30亿激活参数”的极致能效比，在智能体编程和多模态推理领域树立了新的开源标杆，性能表现足以媲美甚至超越参数量大得多的稠密模型(如 Qwen3.5-27B)。

Qwen3.6-35B-A3B采用了先进的稀疏混合专家（MoE）架构，实现了性能与效率的完美平衡：

参数规模：总参数量高达350亿，但在推理时仅激活约 30 亿参数。
架构设计：采用Gated DeltaNet + Gated Attention 的混合注意力机制。每10层中包含3层线性注意力（DeltaNet）和 1 层标准注意力，配合MoE前馈网络（256个专家，每次激活8+1个）。
效率优势：这种设计大幅降低了显存占用和推理成本，使其在保持顶尖智能的同时，能够以更低的算力门槛进行部署。

该模型在代码生成、调试及复杂工作流处理上表现卓越，多项基准测试成绩超越前代及同级稠密模型：

作为原生视觉语言模型，它不仅能“看懂”图片，还能进行深度的空间推理：

为了适应复杂的智能体任务，Qwen3.6-35B-A3B引入了思维保留机制：

双模式支持：支持“思考模式”（展示完整思维链，适合复杂推理）和“非思考模式”（快速响应，适合日常问答）。
上下文复用：通过 preserve_thinking 参数，模型可以在多轮对话中保留并复用历史的推理轨迹。这意味着在进行多步代码调试或长周期任务时，模型不会“忘记”之前的思考路径，显著减少了重复推理的开销，提升了任务连贯性。

表格

评测基准	Qwen3.6-35B-A3B	Qwen3.5-27B (稠密)	Qwen3.5-35B-A3B (前代)
SWE-bench Verified	73.4	75.0	70.0
Terminal-Bench 2.0	51.5	41.6	40.5
QwenWebBench (Elo)	1397	1068	978
NL2Repo	29.4	27.3	20.5
RefCOCO (空间智能)	92.0	–	–

该模型已采用Apache 2.0协议完全开源，开发者可以通过多种渠道免费获取和使用：

模型权重下载：
- Hugging Face: Qwen/Qwen3.6-35B-A3B
- ModelScope: Qwen/Qwen3.6-35B-A3B
在线体验：
- 直接在 Qwen Studio 官网进行对话体验。
API 调用：
- 通过阿里云百炼平台，以 qwen3.6-flash 的名称调用 API，兼容OpenAI和Anthropic接口格式。
本地部署：
- 支持vLLM、SGLang、Transformers等主流推理框架。
- 个人用户可使用 Unsloth GGUF 量化版本在消费级显卡上运行。