首页 > 其他资讯 > 中国第一：阿里通义千问 3.5-Max-Preview 首发亮相 LM Arena 国际大模型竞技场

中国第一：阿里通义千问 3.5-Max-Preview 首发亮相 LM Arena 国际大模型竞技场

时间：26-04-26

中国第一：阿里通义千问 3.5-Max-Preview 首发亮相 LM Arena 国际大模型竞技场

大模型赛道的竞争，从来都不缺乏看点。这不，阿里千问家族又添新丁了。3月20日，千问3.5系列的旗舰预览版——Qwen3.5-Max-Preview，正式在全球知名的LM Arena竞技场上线参战，并以1464的综合得分“亮见”首秀。

免费影视、动漫、音乐、游戏、小说资源长期稳定更新！ 👉 点此立即查看 👈

这个分数意味着什么？直接让阿里千问在LM Arena的全球大模型公司排行榜中，跃升至第五位。更重要的是，这个位置让它稳稳坐上了中国公司的头把交椅，把国际竞争的激烈程度又推高了一个层级。

说到LM Arena，可能有些朋友还不熟悉。这个平台由国际开源研究机构LMSYS操盘，评测机制相当硬核。它不依赖冰冷的自动化测试，而是让全球开发者对匿名的模型进行两两对战盲测投票，完全以实际“战斗”的胜负来评断高下。这种开放对战结合人工评估的方式，在业内口碑极高，被公认为目前最具参考价值的大模型性能试金石之一。

那么，这位新选手的具体表现如何？在剔除风格控制的纯实力比拼中，Qwen3.5-Max-Preview的绝对胜率位列全球第六。如果拆开看细分能力，它的数学解题水平排到了全球第五，而处理专家级复杂文本的能力则进入了全球前十。值得一提的是，这也是千问3.5系列第一次以旗舰身份，站上国际第三方评测的擂台，份量不言而喻。

话说回来，阿里千问今年的动作确实频繁。从除夕开始，Qwen3.5系列就马不停蹄地开源了多款模型，参数量覆盖了从0.8B到397B的八个不同规模，而且每个尺寸都在同级别中展现了领先的性能。

其中，不得不提的是Qwen3.5-Plus。它采用了一种巧妙的架构：总参数高达3970亿，但激活参数却控制在170亿。这种设计思路很清晰——用更少的“实际工作量”，去实现媲美甚至超越更大参数模型的性能，效率优势相当明显。而此次亮相的Qwen3.5-Max-Preview，作为该系列旗舰的预览版，算是先露个脸，后续的优化迭代还将持续吸收社区的反馈。可以预见，这场顶级较量，好戏还在后头。

这就是中国第一：阿里通义千问 3.5-Max-Preview 首发亮相 LM Arena 国际大模型竞技场的全部内容了，希望以上内容对小伙伴们有所帮助，更多详情可以关注我们的菜鸟游戏和软件相关专区，更多攻略和教程等你发现！