首发实测沐曦曦云C系列GPU适配智谱GLM-5.2

2026-06-18阅读 0热度 0
模型 GPU 沐曦
6月17日,智谱AI正式开源发布了全新旗舰大模型GLM-5.2。这一次,沐曦股份的曦云C系列GPU几乎实现了Day 0同步适配——模型上线,算力即刻就位。这背后依托的是全栈自主软硬件技术,让沐曦在国产GPU生态适配赛道上再次夯实了竞争壁垒。 GLM-5.2是智谱迄今为止能力最强的开源模型。它支持可商用的1M上下文,在长程任务处理上持续保持领先。说实在的,“1M上下文”能够真正落地,本身就是一项硬核技术突破。 沐曦与智谱的合作并非首次。从GLM-5、GLM-5.1、GLM-OCR到GLM-4.6V,智谱全系列模型,沐曦均实现了Day 0同步适配。此次对GLM-5.2的支持,得益于曦云C系列自身的硬件算力与MXMACA软件栈的深度优化。这套方案的核心是全场景覆盖、高稳定性、低成本——直击大模型落地中的三大痛点:“适配周期长、迁移门槛高、性能损耗大”。帮助企业快速将GLM-5.2的技术优势转化为实际的产业价值。 自2025年12月以来,沐曦已累计完成27款主流顶尖模型的Day 0适配,合作方包括智谱AI、通义千问、阶跃星辰、百度飞桨、DeepSeek等头部厂商。模型类型涵盖通用语言、多模态、OCR、机器翻译等,覆盖面广泛。无论从适配效率、数量还是生态广度来看,沐曦均处于行业前列。此次GLM-5.2的无缝接入,将进一步加速“模型-芯片-框架-应用”全国产AI自主闭环的落地进程。 曦云C系列GPU采用沐曦全自研的核心GPU IP、指令集和架构,能效比高、通用性强,天然适合处理大模型的超大参数规模和长上下文推理。而MXMACA软件栈则扮演连接硬件算力与上层应用的“桥梁”——从底层驱动、用户态接口、MXCC编译器,到算子的深度适配,再到主流训练/推理框架的对接,实现全链路覆盖。它原生兼容PyTorch、TensorFlow、vLLM、SGLang等40多种主流AI框架,已成功运行500多个AI模型和4500多个热门开源项目。传统模型适配周期因此大幅缩短,曦云C系列为GLM-5.2的前沿能力提供了稳定的算力底座。

关于智谱GLM-5.2

几个关键数据值得关注。在全球百万用户参与盲测的前端开发评估系统Code Arena上,GLM-5.2拿下了全球可用模型第一。 GLM-5.2专门针对长程任务能力进行了深度优化。其几个新特性值得留意: - 稳定的1M上下文,能够可靠支撑长程任务 - 体感更强、更实用的Coding能力 - 极致的Infra优化,实现Day 0在国产算力平台上运行 - 采用MIT开源协议,无地域限制,推动技术平权

1M上下文与长程任务

GLM-5.2将1M Coding Agent的训练环境大幅扩展,覆盖大规模实现、自动化研究、性能优化等多个典型领域。在某些场景下,其1M上下文实际表现甚至超越Opus。正是基于1M上下文,GLM-5.2具备了长程交付能力——在FrontierSWE、SWE-Marathon、PostTrainBench等多个长程任务基准上,其表现介于Claude Opus 4.7与4.8之间,是开源模型中的最高水平。 实际体验更加直观。GLM-5.2能够自主完成从开发、联调、测试到打包上线的全流程,最终交付一个覆盖Web、移动端和小程序的多端应用。整个过程累计处理88万以上tokens,几乎用满1M上下文窗口。过去这类工程需要团队协作数周,现在GLM-5.2在一次连续长程任务中就能跑完。

Coding体感

在Coding方面,GLM-5.2在前端、后端、长程任务等场景下的成功率相比上一代GLM-5.1显著提升。复杂系统工程和深度调试也更加稳定。在主流编程基准上,GLM-5.2仍保持开源SOTA,与Claude Opus 4.8处于可比区间。举例:在Terminal-Bench 2.1(评测AI Agent通过命令行操作计算机的数据集)上,GLM-5.2比Opus 4.8低4%,但比GLM-5.1提升17.5%;在MCP-Atlas(工具使用评测数据集)上,它仅比Opus 4.8低0.8%。 GLM-5.2还引入了effort level,即“思考档位”控制。开发者可根据需求在能力、速度、成本之间灵活权衡。在相近的token预算下,GLM-5.2的Coding能力大致介于Claude Opus 4.7和Claude Opus 4.8之间。

极致Infra优化

GLM-5.2的进步不仅是模型本身的升级,更是模型架构、推理系统和训练基础设施协同设计的结果。智谱团队提出IndexShare方案——在每四层稀疏注意力层之间复用同一索引器(indexer),在1M上下文长度下,将单位token的FLOPs降至2.9倍。同时,改进了MTP层(用于投机解码),使接受长度(acceptance length)最多提升20%。训练侧则依赖自研Slime框架支撑大规模Agentic RL和OPD训练。

面向开发者与知识工作者

凭借稳定的1M上下文和可靠的长程任务能力,GLM-5.2可以长时间自主推进更复杂、更长链路的任务,锁定高价值场景。它正在改变开发者和知识工作者的工作方式。 例如在大型重构工程上,GLM-5.2表现突出。在开发者Moonshot实验中,它用Rust从零再造了送人类登月的计算机——阿波罗11号制导计算机(AGC):先将约4600行的定点CPU逐比特移植为Rust,再让当年65000行、一字未改的登月飞控程序在上面原样运行。整个过程由Agent全自主完成,甚至连差点中止登月的1202报警都复现了出来。 通过智谱的Agent产品AutoClaw,GLM-5.2的1M上下文与长程任务能力还可服务于设计、法务等专业场景。例如从需求一次性生成数十个原型页面,然后自主持续迭代和微调,在长上下文中保持品牌规范与一致性。
免责声明

本网站新闻资讯均来自公开渠道,力求准确但不保证绝对无误,内容观点仅代表作者本人,与本站无关。若涉及侵权,请联系我们处理。本站保留对声明的修改权,最终解释权归本站所有。

相关阅读

更多
欢迎回来 登录或注册后,可保存提示词和历史记录
登录后可同步收藏、历史记录和常用模板
注册即表示同意服务条款与隐私政策