中国Mythos闷头做?马斯克Q1与唐杰预言对比

2026-06-20阅读 0热度 0
马斯克

Mythos 已被列入出口管制清单。

Anthropic 推出的这款模型曾令硅谷集体静默,如今美国政府明确禁止其流入中国市场。X 平台上有人直接向马斯克提问:中国何时能实现赶超?Musk 回答九个月。智谱首席科学家唐杰回应称:不需要那么久。

GLM-5.2 甫一发布,评测结果便全面逼近国际前沿,基座模型的差距正在以肉眼可见的速度缩小。唐杰的底气大概率源于此。但更值得深入探讨的问题是:要追上 Mythos,仅靠基座迭代是否足够?

不够。OpenAI 从 GPT-4 演进到 o1,核心增量来自后训练。Anthropic 的 Constitutional AI,本质上也是后训练方法论的体现。基座决定了能力的上限,后训练则决定了你能触及上限的多少。事实上,GLM 从 5.1 到 5.2 的能力跃迁,本身就是后训练策略的成功实践。

这引出一个关键事实:恰好两周前,机器之心报道了一家专注于大模型后训练的团队——Mind Lab,隶属于 Mindverse(心洲科技)。根据 HuggingFace 的数据,他们目前是全球唯一完成 GLM-5.1/5.2 系列后训练的外部团队。他们基于 GLM-5.1 后训练的模型 Macaron-V1-Preview,评测结果已超越基座本身,提分幅度显著。

这意味着什么?若 GLM 基座能力持续提升,Mind Lab 在后训练上已验证过的提分效果再叠加其上,通过后训练路线追平 Mythos 级别的智能,同样具备可行性。

但看到唐杰那条回帖后,重新审视 GLM 的后训练生态,会发现一些令人振奋的进展。

登陆 HuggingFace 探察一圈

从 HuggingFace 上看,Mind Lab 目前依然是全球唯一完成 GLM-5.1/5.2 系列模型后训练并公开发布的实验室。在 GLM-5.1 的 finetune 和 adapter 分类下,翻遍所有仓库,唯有他们完成了全流程并公开共享。

一个值得注意的细节:HuggingFace 上 GLM-5.1 后训练模型下载量排名第四的,实际上是另一个团队(inferencerlabs)对 Macaron 进行量化后可在 Mac 上直接运行的版本。别人的模型已在被二次加工和传播,生态影响力正在自发形成。

GLM-5.2 发布后再查看,Mind Lab 同样是第一个宣布支持并启动后训练的。值得一提的是,GLM-5.2 引入了全新架构设计 IndexCache,这是区别于 5.1 的核心技术变化之一。Mind Lab 已实现对 IndexCache 的完整适配,并将方案直接开源。新基座刚发布,核心新架构的训练支持就已到位并开源,这个响应速度本身就说明了问题。更早之前,他们在技术博客中已披露了对 DSA(动态稀疏注意力)和 MTP(多 token 预测)等 700B 以上模型特有架构模块的适配方案。

从架构适配到训练框架再到开源发布,每次 GLM 出新版,Mind Lab 跟进的速度都以天计,这不是临时抱佛脚能做到的。

后训练提升幅度几何

上一轮的成绩单已经摆在明处。

此前基于 GLM-5.1 的后训练,Mind Lab 的提分幅度相当可观:PinchBench 从 GLM-5.1 基座的 76.6 分提升至 Macaron-V1-Preview 的 92.5 分,上涨 15.9 分,相对提升约 20.8%;Terminal-Bench 2.0 从 63.5 分提升至 67.4 分,上涨 3.9 分。这个幅度说明一点:GLM 系列的基座能力远未被完全释放,后训练仍有巨大的提分空间。

现在他们已迁移至 GLM-5.2。5.2 相比 5.1 基座能力有显著跃升,后训练能释放的空间也随之变大。

GLM 5.1 到 5.2 的跨越,本质上就是后训练的胜利。而 Mind Lab 是目前唯一具备 GLM 5.1/5.2 后训练能力的外部团队,也是唯一具备 GLM 5 系列后训练能力的外部团队。智谱的基座能力仍在持续攀升,年底大概率会发布新一代模型。届时,基座本身的能力跨出一大步,Mind Lab 在后训练上积累的提分能力再叠加上去,逻辑链条是连贯的——Mind Lab 同样有机会追平 Mythos 同等水平的智能。

而且有一点容易被忽视:做后训练的团队,迭代周期天然比做基座的短。基座训练动辄数月,后训练的周期按周计算。新基座一出来,后训练团队理论上可以比基座团队自身更快地释放能力。在“从智谱新基座到 Mythos 级别产品”这段路上,Mind Lab 的节奏可能比你想象的更快,因为他们只专注这一件事。

除智谱自身外,唯有他们

既然后训练价值如此之大,为何参与者寥寥?

门槛不低。三个能力缺一不可:

对基座架构的深度理解。GLM 使用的 MTP 和 DSA 均为 700B 以上模型才采用的技术,IndexCache 更是支撑 GLM 5.2 训练至 1M 上下文的关键技术,并非拿开源训练框架直接跑通就能解决。

高质量训练数据的构造能力。后训练与预训练使用的数据完全不同,不拼规模,而拼质量与结构。这一领域的 know-how 在行业内高度不透明。

工程基础设施。大模型后训练同样消耗算力,同样需要精细到每个超参数的训练策略管理。就在最近,Mind Lab 直接开源了一套支持 GLM-5.1 和 5.2 的 Megatron 训练框架。这意味着他们不仅是在现有框架上做适配,而是从训练基础设施层面把 GLM 系列的后训练链路彻底打通,而这一工程本身就是一道极高的门槛。

GLM-5.1 发布至今已有一段时间,HuggingFace 上完成其后训练并开源的只有一家。除智谱自身外,Mind Lab 是目前唯一展现出有能力在 GLM 最新基座上做后训练的外部团队。这个位置本身就具有稀缺性。

九个月是否足够

Mythos 被禁,中国要获得同等能力只能依靠自主研发。马斯克说九个月,唐杰说用不了那么久。

唐老师表示,打造中国的 Mythos 需要两条腿走路:基座预训练迭代与后训练模型的自我迭代。智谱在前者的位置明确,而在后者,Mind Lab 是目前除智谱外唯一交出公开成果、并且持续在 GLM 最新基座上迭代的团队。

后训练赛道在国内尚未获得足够关注。大部分讨论集中于基座之争:谁的参数多、谁的评测高、谁又发布了新版本。但当基座差距逐渐收窄,后训练的质量将越来越成为产品体验的分水岭。

九个月是否足够,我们无法确定。但有一件事是确定的:在 GLM 5.1/5.2 的后训练路线上,目前唯一看得见路径、并且已用成绩证明过提分能力的外部团队,就是 Mind Lab。Mythos 级别的智能并非只有预训练一条路可抵达——在后训练这条路上,Mind Lab 已经站在了最前沿的位置。

这一点,令人振奋。

免责声明

本网站新闻资讯均来自公开渠道,力求准确但不保证绝对无误,内容观点仅代表作者本人,与本站无关。若涉及侵权,请联系我们处理。本站保留对声明的修改权,最终解释权归本站所有。

相关阅读

更多
欢迎回来 登录或注册后,可保存提示词和历史记录
登录后可同步收藏、历史记录和常用模板
注册即表示同意服务条款与隐私政策