阿里通义千问Qwen3.7预览版上线:数学推理杀入全球第七,思考模式先睹为快

阿里通义千问再次按下加速键。2026年5月18日,阿里云正式上线Qwen3.7系列两款预览模型——Qwen3.7-Max-Preview与Qwen3.7-Plus-Preview,已在Qwen Chat和大模型竞技场Arena AI开放体验。新模型预计将在5月20日阿里云峰会上正式发布。

通义千问Qwen3.7

通义千问Qwen3.7的定位非常清晰——Max为旗舰级大脑主打综合性能天花板,Plus为高性能均衡版,两者目前均仅开放思考模式。两款预览版在Arena AI的权威基准测试中表现惊艳,Qwen3.7-Max-Preview综合排名第13位,将阿里通义千问送入全球前六行列。

在数学推理领域,Qwen3.7-Max-Preview位列全球第7,在专家级应用和软件与IT领域也杀入第9,编程能力位列第10。视觉能力方面,Qwen3.7-Plus-Preview综合排名第16,助力通义千问视觉榜实验室排到全球第5。

一、双版本定位:旗舰大脑与均衡性能

Qwen3.7系列本次共放出两款预览模型:Qwen3.7-Max-Preview定位旗舰级大脑,是综合性能天花板,主要面向高复杂度推理任务和深度专业应用;Qwen3.7-Plus-Preview则主打高性能均衡,兼顾推理能力与多任务泛化,面向更广泛的用户群体。

两款模型目前均仅开放思考模式,专注高难度逻辑推理与深度计算。网页搜索、代码解释器等辅助工具暂未解锁,预计在正式发布后陆续开放。这也意味着当前的预览版更适合重度推理用户尝鲜体验。

二、硬核基准测试:数学杀入全球第七

两款新模型在Arena AI权威榜单中的表现堪称惊艳。Qwen3.7-Max-Preview在文本能力综合榜单中位列全球第13位,直接推动阿里通义千问实验室整体排名跻身全球前六。

细分赛道表现更为亮眼:数学推理位列全球第7,专家级应用位列全球第9,软件与IT领域位列全球第9,纯编程能力位列全球第10。在仅面向高难度专家级提示词的"专家竞技场"细分赛道,Qwen3.7-Max-Preview同样稳居第9,验证了其在高精度任务下的稳定逼近第一梯队。

视觉能力方面,Qwen3.7-Plus-Preview综合排名第16,使通义千问在视觉榜单所有实验室中排到全球第5。整体来看,阿里通义千问已全面具备与GPT-5、Claude Opus等头部模型正面竞争的实力。

三、小步快跑:阿里云的迭代策略

从Qwen3.6到Qwen3.7,阿里云保持了极高的迭代频率。值得注意的是,本次预览版选择在5月20日阿里云峰会前低调上线,显然是为主论坛发布造势。

对开发者而言,预览版上线既是提前体验下一代模型能力的窗口,也释放了一个明确信号:阿里云正通过"小步快跑、快速迭代"的策略,在大模型军备赛中持续卡位关键节点。在当前全球大厂纷纷加码推理模型的背景下,Qwen3.7的提前预热,标志着国产大模型的竞争正式进入新一轮冲刺期。

AD:精心整理了2000+好用的AI工具!点此获取

相关推荐

1 1

免费AI工具合集,点击进入

AI对话

玉米AI助手