Qwen 3.7 Max 深度测评:对比两代超大杯,谁更值得关注?
阿里对Qwen 3.7系列的保密工作极为出色,其预览版模型几乎是在毫无预兆的情况下,一夜之间登上了权威的Arena大模型竞技场榜单。
根据Arena(原大模型竞技场)最新发布的榜单数据,刚刚亮相的Qwen3.7-Max-Preview与Qwen3.7-Plus-Preview已提交了首份性能答卷。在衡量综合文本能力的总榜上,Qwen3.7-Max-Preview位列全球第13名。这一成绩不仅将阿里巴巴(实验室)的机构总排名推升至全球第6位,更使其稳固占据了国产大模型榜首的位置。
在多模态视觉理解领域,其表现同样突出。Qwen3.7-Plus-Preview在该专项榜单中排名第16,助力阿里在视觉领域的机构排名跃居全球第5,同样是该榜单中排名最高的中国模型。
面对这份亮眼的初步成绩,Qwen官方账号也表达了兴奋之情,直接表示:“已经迫不及待想要发布完整的Qwen3.7系列了!”
然而,这一迭代速度确实令人瞩目。就在四月底,Qwen3.6-Max的预览版才刚刚发布。目前3.6正式版尚未全面铺开,3.7的预览版便已接踵而至。这引发了行业思考:究竟是正式版的发布流程变得更加严谨审慎,还是模型本身的研发与迭代节奏已经进入了前所未有的加速阶段?
无论如何,开发者社区当前最核心的关切非常明确:这两款预览模型的正式版本,究竟何时能够开放使用?
Qwen3.7系列预览版来了!
今日清晨,Arena榜单的更新揭示了Qwen3.7预览版的首次竞技表现。
在竞争白热化的文本综合能力排行榜中,Qwen3.7-Max-Preview取得了第13名的席位。位列其前的,均是Claude Opus 4.6/4.7系列、Gemini 3.1/3 Pro系列以及GPT-5.4/5.4-High等国际顶尖模型。这使得Qwen3.7-Max-Preview成为全球前十五名中唯一的中国代表。
不仅如此,在数个关键的专业细分赛道上,该模型也展现了强大的竞争力,成功跻身全球前十:数学推理位列第7,专家提示(Expert Prompting)位列第9,软件/IT领域知识位列第9,编程能力位列第10。
同期发布的Qwen3.7-Plus-Preview,则在多模态视觉理解领域实现了突破。它在视觉榜单中排名第16位,这一表现直接助力阿里巴巴在该领域的机构排名上升至全球第5。同样,它也是该榜单中唯一上榜的中国模型。
Arena同步更新的“专家竞技场”排名也值得关注。在这个专注于评估模型在复杂、专家级提示下表现的榜单中,Qwen3.7-Max-Preview位列第9。值得注意的是,榜单第7名是另一款中国模型——小米的Mimo v2.5 Pro。国产模型在高端能力评测上的集体突破,已成为一个明确的行业趋势。
面对这样的性能数据,社区开发者的反馈非常务实:预览版的榜单成绩已经充分激发了兴趣,当前最迫切的期待,是正式版与开源版本能尽快发布,以便进行实际的部署与深度测试。
进入Qwen3时代,模型迭代显著加速
有行业观察者指出,Qwen发布新模型的速度,快到社区来不及对上一个版本进行充分探讨,下一个版本的讯息就已到来。这并非错觉,回顾Qwen的版本迭代时间线,可以清晰看到节奏的变化。
(注:下表重点收录主要里程碑版本,实际还有更多细分尺寸和专项模型,如Coder、VL、Omni等)
在早期发展阶段,Qwen的发布节奏与行业主流步伐相近,大约每4到6个月进行一次主要版本更新。真正的转折点出现在Qwen3系列。2025年发布的Qwen3,覆盖了从0.6B到235B的全参数规模,并引入了支持复杂链式推理的“Thinking”模式与追求极致响应速度的“Non-Thinking”模式,标志着其技术架构进入成熟期。
而从Qwen3开始,迭代速度明显提升,主要版本间隔缩短至2到3个月。特别是进入2026年后,从3.5到3.6再到3.7,几乎保持着每月都有重要进展的节奏,版本号更新之频密令人印象深刻。
当前的节奏也形成了一种新的发布模式:预览版率先在Arena等竞技平台接受公开评测与基准测试,收集社区和开发者的反馈,随后再推出经过优化的正式版本。这清晰地表明,Qwen团队已进入一个快速实验、敏捷开发、高频交付的新阶段。
业界仍记得Qwen前负责人林俊旸在离任时发布的推文:“Qwen的兄弟们,按原来安排继续干,没问题的。”他离开时,Qwen正处在3.5时代,与DeepSeek一同被视作国产开源模型的标杆。
无论是原有技术路线的坚定执行,还是在新领导力下的持续发力,从后续接连发布的3.5、3.6到如今的3.7版本来看,Qwen确实在沿着“更快迭代、更强性能”的路径稳步推进。
曾几何时,我们以年为单位等待硬件的一次重大升级。如今在大模型领域,我们却以月、甚至以周为单位,见证着一次次的性能突破与智能边界拓展。有人为此感到振奋,也有人因追赶速度而产生焦虑;无数开发者正彻夜调试代码,只为跟上这条飞速延伸的技术能力曲线。
技术进步的浪潮从不驻足等待。我们站在岸边,既是这场深刻变革的见证者,也正通过每一次的应用、测试与反馈,成为其中最积极的构建者与参与者。








