首页 > 其他资讯 > 中国第一:阿里通义千问 3.5-Max-Preview 首发亮相 LM Arena 国际大模型竞技场

中国第一:阿里通义千问 3.5-Max-Preview 首发亮相 LM Arena 国际大模型竞技场

时间:26-04-26

中国第一:阿里通义千问 3.5-Max-Preview 首发亮相 LM Arena 国际大模型竞技场

大模型赛道的竞争,从来都不缺乏看点。这不,阿里千问家族又添新丁了。3月20日,千问3.5系列的旗舰预览版——Qwen3.5-Max-Preview,正式在全球知名的LM Arena竞技场上线参战,并以1464的综合得分“亮见”首秀。

免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈

这个分数意味着什么?直接让阿里千问在LM Arena的全球大模型公司排行榜中,跃升至第五位。更重要的是,这个位置让它稳稳坐上了中国公司的头把交椅,把国际竞争的激烈程度又推高了一个层级。

中国第一:阿里通义千问 3.5-Max-Preview 首发亮相 LM Arena 国际大模型竞技场

说到LM Arena,可能有些朋友还不熟悉。这个平台由国际开源研究机构LMSYS操盘,评测机制相当硬核。它不依赖冰冷的自动化测试,而是让全球开发者对匿名的模型进行两两对战盲测投票,完全以实际“战斗”的胜负来评断高下。这种开放对战结合人工评估的方式,在业内口碑极高,被公认为目前最具参考价值的大模型性能试金石之一。

那么,这位新选手的具体表现如何?在剔除风格控制的纯实力比拼中,Qwen3.5-Max-Preview的绝对胜率位列全球第六。如果拆开看细分能力,它的数学解题水平排到了全球第五,而处理专家级复杂文本的能力则进入了全球前十。值得一提的是,这也是千问3.5系列第一次以旗舰身份,站上国际第三方评测的擂台,份量不言而喻。

中国第一:阿里通义千问 3.5-Max-Preview 首发亮相 LM Arena 国际大模型竞技场

话说回来,阿里千问今年的动作确实频繁。从除夕开始,Qwen3.5系列就马不停蹄地开源了多款模型,参数量覆盖了从0.8B到397B的八个不同规模,而且每个尺寸都在同级别中展现了领先的性能。

其中,不得不提的是Qwen3.5-Plus。它采用了一种巧妙的架构:总参数高达3970亿,但激活参数却控制在170亿。这种设计思路很清晰——用更少的“实际工作量”,去实现媲美甚至超越更大参数模型的性能,效率优势相当明显。而此次亮相的Qwen3.5-Max-Preview,作为该系列旗舰的预览版,算是先露个脸,后续的优化迭代还将持续吸收社区的反馈。可以预见,这场顶级较量,好戏还在后头。


这就是中国第一:阿里通义千问 3.5-Max-Preview 首发亮相 LM Arena 国际大模型竞技场的全部内容了,希望以上内容对小伙伴们有所帮助,更多详情可以关注我们的菜鸟游戏和软件相关专区,更多攻略和教程等你发现!

热搜     |     排行     |     热点     |     话题     |     标签

手机版 | 电脑版 | 客户端

湘ICP备2022003375号-1

本站所有软件,来自于互联网或网友上传,版权属原著所有,如有需要请购买正版。如有侵权,敬请来信联系我们,cn486com@outlook.com 我们立刻删除。