阿里通义千问Qwen3.7预览版上线：数学推理杀入全球第七，思考模式先睹为快

阿里通义千问再次按下加速键。2026年5月18日，阿里云正式上线Qwen3.7系列两款预览模型——Qwen3.7-Max-Preview与Qwen3.7-Plus-Preview，已在Qwen Chat和大模型竞技场Arena AI开放体验。新模型预计将在5月20日阿里云峰会上正式发布。

通义千问Qwen3.7

通义千问Qwen3.7的定位非常清晰——Max为旗舰级大脑主打综合性能天花板，Plus为高性能均衡版，两者目前均仅开放思考模式。两款预览版在Arena AI的权威基准测试中表现惊艳，Qwen3.7-Max-Preview综合排名第13位，将阿里通义千问送入全球前六行列。

在数学推理领域，Qwen3.7-Max-Preview位列全球第7，在专家级应用和软件与IT领域也杀入第9，编程能力位列第10。视觉能力方面，Qwen3.7-Plus-Preview综合排名第16，助力通义千问视觉榜实验室排到全球第5。

一、双版本定位：旗舰大脑与均衡性能

Qwen3.7系列本次共放出两款预览模型：Qwen3.7-Max-Preview定位旗舰级大脑，是综合性能天花板，主要面向高复杂度推理任务和深度专业应用；Qwen3.7-Plus-Preview则主打高性能均衡，兼顾推理能力与多任务泛化，面向更广泛的用户群体。

两款模型目前均仅开放思考模式，专注高难度逻辑推理与深度计算。网页搜索、代码解释器等辅助工具暂未解锁，预计在正式发布后陆续开放。这也意味着当前的预览版更适合重度推理用户尝鲜体验。

两款新模型在Arena AI权威榜单中的表现堪称惊艳。Qwen3.7-Max-Preview在文本能力综合榜单中位列全球第13位，直接推动阿里通义千问实验室整体排名跻身全球前六。

细分赛道表现更为亮眼：数学推理位列全球第7，专家级应用位列全球第9，软件与IT领域位列全球第9，纯编程能力位列全球第10。在仅面向高难度专家级提示词的"专家竞技场"细分赛道，Qwen3.7-Max-Preview同样稳居第9，验证了其在高精度任务下的稳定逼近第一梯队。

视觉能力方面，Qwen3.7-Plus-Preview综合排名第16，使通义千问在视觉榜单所有实验室中排到全球第5。整体来看，阿里通义千问已全面具备与GPT-5、Claude Opus等头部模型正面竞争的实力。

从Qwen3.6到Qwen3.7，阿里云保持了极高的迭代频率。值得注意的是，本次预览版选择在5月20日阿里云峰会前低调上线，显然是为主论坛发布造势。

对开发者而言，预览版上线既是提前体验下一代模型能力的窗口，也释放了一个明确信号：阿里云正通过"小步快跑、快速迭代"的策略，在大模型军备赛中持续卡位关键节点。在当前全球大厂纷纷加码推理模型的背景下，Qwen3.7的提前预热，标志着国产大模型的竞争正式进入新一轮冲刺期。