阿里发布千问3.6-Plus大模型百万上下文编程能力登顶国产直逼Claude

2026-04-25阅读 937热度 937

大语言模型

阿里千问3.6-Plus发布：国产编程大模型实现能力跃迁

2026年4月2日，阿里巴巴达摩院正式推出新一代大语言模型千问3.6-Plus。该模型具备高达100万token的长上下文处理能力，并在多项核心编程基准测试中位列国产模型首位。其综合编程性能已逼近国际顶尖的Claude系列，能够独立完成前端开发、复杂代码库任务及设计稿转代码等工作，标志着国产编程大模型已达到新的技术高度。

编程能力已成为大模型技术竞争的关键领域。此前，Anthropic公司的Claude系列凭借卓越的长上下文处理与代码生成精度，在全球范围内设定了行业标杆。尽管国产模型迭代迅速，但在处理复杂工程任务与理解大型代码仓库方面，仍存在可感知的性能差距。

面对国内云服务商与企业对自主可控AI编程工具的迫切需求，市场压力正驱动国内厂商加速技术突破。千问3.6系列正是阿里达摩院针对这一关键需求进行定向研发的成果。

超越基准测试：面向工程实践的能力优化

千问3.6-Plus的核心优势在于针对实际编程场景的多层次深度优化，其多项关键性能指标已达到国际一流水平。

在HumanEval、MBPP等通用编程评测集上，模型整体通过率较前代千问3.5提升超过25%，稳居国产模型领先位置。值得注意的是，其与Claude 3 Opus的得分差距已缩小至3%以内。

基准测试仅是起点，工程化能力才是真正的试金石。千问3.6-Plus的100万token长上下文窗口使其能够一次性完整读取中型项目的全部代码，实现全仓库级别的代码理解、缺陷排查与功能迭代。模型形成了从需求分析、代码编写、测试执行到问题修复的自主开发闭环。在处理复杂仓库任务时，其完成率从3.5版本的47%显著提升至82%。

对于前端开发者，模型的多模态能力实现了从设计到代码的直接转换。无论是Figma设计稿、页面截图或手绘原型，均可直接生成符合生产规范的前端代码，页面还原度据称超过90%，切实推进了“设计即代码”的工程实践。

从技术验证到商业部署：落地进程加速

性能的跨越直接推动了商业化进程。千问3.6-Plus目前已开放API接口，支持企业级深度定制与部署。据达摩院透露，该模型已在阿里内部电商前端与云运维等核心场景完成验证。在同等开发需求下，工程师效率提升超过40%；复杂Bug的平均排查时间从约2小时缩短至15分钟以内。这种效率提升对追求快速迭代的研发团队具有显著价值。

行业分析指出，该模型的推出有望改变高端编程场景下海外模型的垄断格局，为国内软件团队——尤其是中小企业——提供成本更优、本土适配更强的AI开发解决方案。随着其多模态编程能力的持续进化，未来可覆盖的工业级开发场景将进一步扩展。

阿里发布千问3.6-Plus大模型百万上下文编程能力登顶国产直逼Claude

阿里千问3.6-Plus发布：国产编程大模型实现能力跃迁

超越基准测试：面向工程实践的能力优化

从技术验证到商业部署：落地进程加速

相关阅读

最新教程

最新资讯