蚂蚁百灵Ling-2.6-1T开源模型权威测评:万亿级旗舰性能深度解析

2026-05-17阅读 0热度 0
蚂蚁集团

蚂蚁集团百灵大模型正式开源其万亿级综合旗舰模型 Ling-2.6-1T。此次发布标志着模型能力从参数竞赛向系统性工程效能的战略转变,旨在解决真实业务场景中的复杂挑战。

区别于单纯扩展参数或思维链的传统路径,Ling-2.6-1T 的设计哲学聚焦于一个核心命题:如何在维持顶级智能表现的同时,实现生产环境下的高效部署与稳定协同。模型围绕三大关键维度进行了深度优化。

以更低Token成本实现高阶综合智能

模型性能的提升必须伴随计算资源的线性膨胀吗?Ling-2.6-1T 通过架构创新给出了新的答案。它融合了MLA与Linear Attention的混合架构,并引入了抑制过程冗余的强化奖励机制。这一组合使模型在保有万亿参数容量上限的基础上,能够减少对冗长中间推理的依赖,通过优化后的“快思考”路径直接生成高质量输出。其直接优势在于,达成同等任务精度时,能显著降低推理所需的Token消耗,从而大幅提升模型的“智能效率比”。

在复杂任务中保障多步骤执行的可靠性

现实世界的智能体调度、代码工程与自动化流程,依赖的是对连续指令、工具调用、上下文状态及中间结果的精准掌控与连贯推理。Ling-2.6-1T 针对这一需求进行了专项强化。通过对复合型任务进行系统性训练,该模型在 AIME26、SWE-bench Verified、BFCL-V4、TAU2-Bench、IFBench 等多项执行类基准测试中,取得了开源模型的领先性能,证明了其处理复杂、多步骤任务的稳健执行能力。

推动万亿级模型无缝集成生产工作流

技术的终极考验在于工程化落地。Ling-2.6-1T 的定位清晰:不止于技术演示,而是成为可部署、可协作、可持续运维的企业级能力基座。它提供了从代码生成到缺陷修复的端到端工程化支持,并与主流Agent框架保持高度兼容,专为应对多工具协作、多步骤决策、多业务约束的实际生产场景而设计。

万亿级综合旗舰模型:蚂蚁集团百灵大模型开源Ling-2.6-1T

(图示:Ling-2.6-1T 以 16M tokens 完成 Artificial Analysis 完整评测)

为加速开发者生态构建,官方同步宣布,将延长其在 OpenRouter 平台上的免费API调用服务一周,以便更广泛的开发团队进行实际评估与集成测试。

模型开源地址如下:

Hugging Face:https://huggingface.co/inclusionAI/Ling-2.6-1T

ModelScope:https://www.modelscope.cn/models/inclusionAI/Ling-2.6-1T

免责声明

本网站新闻资讯均来自公开渠道,力求准确但不保证绝对无误,内容观点仅代表作者本人,与本站无关。若涉及侵权,请联系我们处理。本站保留对声明的修改权,最终解释权归本站所有。

相关阅读

更多
欢迎回来 登录或注册后,可保存提示词和历史记录
登录后可同步收藏、历史记录和常用模板
注册即表示同意服务条款与隐私政策