首发实测沐曦曦云C系列GPU适配智谱GLM-5.2

2026-06-18阅读 0热度 0

模型 GPU 沐曦

6月17日，智谱AI正式开源发布了全新旗舰大模型GLM-5.2。这一次，沐曦股份的曦云C系列GPU几乎实现了Day 0同步适配——模型上线，算力即刻就位。这背后依托的是全栈自主软硬件技术，让沐曦在国产GPU生态适配赛道上再次夯实了竞争壁垒。 GLM-5.2是智谱迄今为止能力最强的开源模型。它支持可商用的1M上下文，在长程任务处理上持续保持领先。说实在的，“1M上下文”能够真正落地，本身就是一项硬核技术突破。沐曦与智谱的合作并非首次。从GLM-5、GLM-5.1、GLM-OCR到GLM-4.6V，智谱全系列模型，沐曦均实现了Day 0同步适配。此次对GLM-5.2的支持，得益于曦云C系列自身的硬件算力与MXMACA软件栈的深度优化。这套方案的核心是全场景覆盖、高稳定性、低成本——直击大模型落地中的三大痛点：“适配周期长、迁移门槛高、性能损耗大”。帮助企业快速将GLM-5.2的技术优势转化为实际的产业价值。自2025年12月以来，沐曦已累计完成27款主流顶尖模型的Day 0适配，合作方包括智谱AI、通义千问、阶跃星辰、百度飞桨、DeepSeek等头部厂商。模型类型涵盖通用语言、多模态、OCR、机器翻译等，覆盖面广泛。无论从适配效率、数量还是生态广度来看，沐曦均处于行业前列。此次GLM-5.2的无缝接入，将进一步加速“模型-芯片-框架-应用”全国产AI自主闭环的落地进程。曦云C系列GPU采用沐曦全自研的核心GPU IP、指令集和架构，能效比高、通用性强，天然适合处理大模型的超大参数规模和长上下文推理。而MXMACA软件栈则扮演连接硬件算力与上层应用的“桥梁”——从底层驱动、用户态接口、MXCC编译器，到算子的深度适配，再到主流训练/推理框架的对接，实现全链路覆盖。它原生兼容PyTorch、TensorFlow、vLLM、SGLang等40多种主流AI框架，已成功运行500多个AI模型和4500多个热门开源项目。传统模型适配周期因此大幅缩短，曦云C系列为GLM-5.2的前沿能力提供了稳定的算力底座。

关于智谱GLM-5.2

几个关键数据值得关注。在全球百万用户参与盲测的前端开发评估系统Code Arena上，GLM-5.2拿下了全球可用模型第一。

GLM-5.2专门针对长程任务能力进行了深度优化。其几个新特性值得留意： - 稳定的1M上下文，能够可靠支撑长程任务 - 体感更强、更实用的Coding能力 - 极致的Infra优化，实现Day 0在国产算力平台上运行 - 采用MIT开源协议，无地域限制，推动技术平权

1M上下文与长程任务

GLM-5.2将1M Coding Agent的训练环境大幅扩展，覆盖大规模实现、自动化研究、性能优化等多个典型领域。在某些场景下，其1M上下文实际表现甚至超越Opus。正是基于1M上下文，GLM-5.2具备了长程交付能力——在FrontierSWE、SWE-Marathon、PostTrainBench等多个长程任务基准上，其表现介于Claude Opus 4.7与4.8之间，是开源模型中的最高水平。

实际体验更加直观。GLM-5.2能够自主完成从开发、联调、测试到打包上线的全流程，最终交付一个覆盖Web、移动端和小程序的多端应用。整个过程累计处理88万以上tokens，几乎用满1M上下文窗口。过去这类工程需要团队协作数周，现在GLM-5.2在一次连续长程任务中就能跑完。

Coding体感

在Coding方面，GLM-5.2在前端、后端、长程任务等场景下的成功率相比上一代GLM-5.1显著提升。复杂系统工程和深度调试也更加稳定。在主流编程基准上，GLM-5.2仍保持开源SOTA，与Claude Opus 4.8处于可比区间。举例：在Terminal-Bench 2.1（评测AI Agent通过命令行操作计算机的数据集）上，GLM-5.2比Opus 4.8低4%，但比GLM-5.1提升17.5%；在MCP-Atlas（工具使用评测数据集）上，它仅比Opus 4.8低0.8%。

GLM-5.2还引入了effort level，即“思考档位”控制。开发者可根据需求在能力、速度、成本之间灵活权衡。在相近的token预算下，GLM-5.2的Coding能力大致介于Claude Opus 4.7和Claude Opus 4.8之间。

极致Infra优化

GLM-5.2的进步不仅是模型本身的升级，更是模型架构、推理系统和训练基础设施协同设计的结果。智谱团队提出IndexShare方案——在每四层稀疏注意力层之间复用同一索引器（indexer），在1M上下文长度下，将单位token的FLOPs降至2.9倍。同时，改进了MTP层（用于投机解码），使接受长度（acceptance length）最多提升20%。训练侧则依赖自研Slime框架支撑大规模Agentic RL和OPD训练。

面向开发者与知识工作者

凭借稳定的1M上下文和可靠的长程任务能力，GLM-5.2可以长时间自主推进更复杂、更长链路的任务，锁定高价值场景。它正在改变开发者和知识工作者的工作方式。例如在大型重构工程上，GLM-5.2表现突出。在开发者Moonshot实验中，它用Rust从零再造了送人类登月的计算机——阿波罗11号制导计算机（AGC）：先将约4600行的定点CPU逐比特移植为Rust，再让当年65000行、一字未改的登月飞控程序在上面原样运行。整个过程由Agent全自主完成，甚至连差点中止登月的1202报警都复现了出来。通过智谱的Agent产品AutoClaw，GLM-5.2的1M上下文与长程任务能力还可服务于设计、法务等专业场景。例如从需求一次性生成数十个原型页面，然后自主持续迭代和微调，在长上下文中保持品牌规范与一致性。

首发实测沐曦曦云C系列GPU适配智谱GLM-5.2

关于智谱GLM-5.2

1M上下文与长程任务

Coding体感

极致Infra优化

面向开发者与知识工作者

相关阅读

最新教程

最新资讯