蚂蚁百灵Ling-2.6-1T开源模型权威测评：万亿级旗舰性能深度解析

2026-05-17阅读 0热度 0

蚂蚁集团

蚂蚁集团百灵大模型正式开源其万亿级综合旗舰模型 Ling-2.6-1T。此次发布标志着模型能力从参数竞赛向系统性工程效能的战略转变，旨在解决真实业务场景中的复杂挑战。

区别于单纯扩展参数或思维链的传统路径，Ling-2.6-1T 的设计哲学聚焦于一个核心命题：如何在维持顶级智能表现的同时，实现生产环境下的高效部署与稳定协同。模型围绕三大关键维度进行了深度优化。

以更低Token成本实现高阶综合智能

模型性能的提升必须伴随计算资源的线性膨胀吗？Ling-2.6-1T 通过架构创新给出了新的答案。它融合了MLA与Linear Attention的混合架构，并引入了抑制过程冗余的强化奖励机制。这一组合使模型在保有万亿参数容量上限的基础上，能够减少对冗长中间推理的依赖，通过优化后的“快思考”路径直接生成高质量输出。其直接优势在于，达成同等任务精度时，能显著降低推理所需的Token消耗，从而大幅提升模型的“智能效率比”。

在复杂任务中保障多步骤执行的可靠性

现实世界的智能体调度、代码工程与自动化流程，依赖的是对连续指令、工具调用、上下文状态及中间结果的精准掌控与连贯推理。Ling-2.6-1T 针对这一需求进行了专项强化。通过对复合型任务进行系统性训练，该模型在 AIME26、SWE-bench Verified、BFCL-V4、TAU2-Bench、IFBench 等多项执行类基准测试中，取得了开源模型的领先性能，证明了其处理复杂、多步骤任务的稳健执行能力。

推动万亿级模型无缝集成生产工作流

技术的终极考验在于工程化落地。Ling-2.6-1T 的定位清晰：不止于技术演示，而是成为可部署、可协作、可持续运维的企业级能力基座。它提供了从代码生成到缺陷修复的端到端工程化支持，并与主流Agent框架保持高度兼容，专为应对多工具协作、多步骤决策、多业务约束的实际生产场景而设计。

（图示：Ling-2.6-1T 以 16M tokens 完成 Artificial Analysis 完整评测）

为加速开发者生态构建，官方同步宣布，将延长其在 OpenRouter 平台上的免费API调用服务一周，以便更广泛的开发团队进行实际评估与集成测试。

模型开源地址如下：

Hugging Face：https://huggingface.co/inclusionAI/Ling-2.6-1T

ModelScope：https://www.modelscope.cn/models/inclusionAI/Ling-2.6-1T

蚂蚁百灵Ling-2.6-1T开源模型权威测评：万亿级旗舰性能深度解析

以更低Token成本实现高阶综合智能

在复杂任务中保障多步骤执行的可靠性

推动万亿级模型无缝集成生产工作流

相关阅读

最新教程

最新资讯