中国Mythos闷头做？马斯克Q1与唐杰预言对比

2026-06-20阅读 0热度 0

马斯克

Mythos 已被列入出口管制清单。

Anthropic 推出的这款模型曾令硅谷集体静默，如今美国政府明确禁止其流入中国市场。X 平台上有人直接向马斯克提问：中国何时能实现赶超？Musk 回答九个月。智谱首席科学家唐杰回应称：不需要那么久。

GLM-5.2 甫一发布，评测结果便全面逼近国际前沿，基座模型的差距正在以肉眼可见的速度缩小。唐杰的底气大概率源于此。但更值得深入探讨的问题是：要追上 Mythos，仅靠基座迭代是否足够？

不够。OpenAI 从 GPT-4 演进到 o1，核心增量来自后训练。Anthropic 的 Constitutional AI，本质上也是后训练方法论的体现。基座决定了能力的上限，后训练则决定了你能触及上限的多少。事实上，GLM 从 5.1 到 5.2 的能力跃迁，本身就是后训练策略的成功实践。

这引出一个关键事实：恰好两周前，机器之心报道了一家专注于大模型后训练的团队——Mind Lab，隶属于 Mindverse（心洲科技）。根据 HuggingFace 的数据，他们目前是全球唯一完成 GLM-5.1/5.2 系列后训练的外部团队。他们基于 GLM-5.1 后训练的模型 Macaron-V1-Preview，评测结果已超越基座本身，提分幅度显著。

这意味着什么？若 GLM 基座能力持续提升，Mind Lab 在后训练上已验证过的提分效果再叠加其上，通过后训练路线追平 Mythos 级别的智能，同样具备可行性。

但看到唐杰那条回帖后，重新审视 GLM 的后训练生态，会发现一些令人振奋的进展。

登陆 HuggingFace 探察一圈

从 HuggingFace 上看，Mind Lab 目前依然是全球唯一完成 GLM-5.1/5.2 系列模型后训练并公开发布的实验室。在 GLM-5.1 的 finetune 和 adapter 分类下，翻遍所有仓库，唯有他们完成了全流程并公开共享。

一个值得注意的细节：HuggingFace 上 GLM-5.1 后训练模型下载量排名第四的，实际上是另一个团队（inferencerlabs）对 Macaron 进行量化后可在 Mac 上直接运行的版本。别人的模型已在被二次加工和传播，生态影响力正在自发形成。

GLM-5.2 发布后再查看，Mind Lab 同样是第一个宣布支持并启动后训练的。值得一提的是，GLM-5.2 引入了全新架构设计 IndexCache，这是区别于 5.1 的核心技术变化之一。Mind Lab 已实现对 IndexCache 的完整适配，并将方案直接开源。新基座刚发布，核心新架构的训练支持就已到位并开源，这个响应速度本身就说明了问题。更早之前，他们在技术博客中已披露了对 DSA（动态稀疏注意力）和 MTP（多 token 预测）等 700B 以上模型特有架构模块的适配方案。

从架构适配到训练框架再到开源发布，每次 GLM 出新版，Mind Lab 跟进的速度都以天计，这不是临时抱佛脚能做到的。

后训练提升幅度几何

上一轮的成绩单已经摆在明处。

此前基于 GLM-5.1 的后训练，Mind Lab 的提分幅度相当可观：PinchBench 从 GLM-5.1 基座的 76.6 分提升至 Macaron-V1-Preview 的 92.5 分，上涨 15.9 分，相对提升约 20.8%；Terminal-Bench 2.0 从 63.5 分提升至 67.4 分，上涨 3.9 分。这个幅度说明一点：GLM 系列的基座能力远未被完全释放，后训练仍有巨大的提分空间。

现在他们已迁移至 GLM-5.2。5.2 相比 5.1 基座能力有显著跃升，后训练能释放的空间也随之变大。

GLM 5.1 到 5.2 的跨越，本质上就是后训练的胜利。而 Mind Lab 是目前唯一具备 GLM 5.1/5.2 后训练能力的外部团队，也是唯一具备 GLM 5 系列后训练能力的外部团队。智谱的基座能力仍在持续攀升，年底大概率会发布新一代模型。届时，基座本身的能力跨出一大步，Mind Lab 在后训练上积累的提分能力再叠加上去，逻辑链条是连贯的——Mind Lab 同样有机会追平 Mythos 同等水平的智能。

而且有一点容易被忽视：做后训练的团队，迭代周期天然比做基座的短。基座训练动辄数月，后训练的周期按周计算。新基座一出来，后训练团队理论上可以比基座团队自身更快地释放能力。在“从智谱新基座到 Mythos 级别产品”这段路上，Mind Lab 的节奏可能比你想象的更快，因为他们只专注这一件事。

除智谱自身外，唯有他们

既然后训练价值如此之大，为何参与者寥寥？

门槛不低。三个能力缺一不可：

对基座架构的深度理解。GLM 使用的 MTP 和 DSA 均为 700B 以上模型才采用的技术，IndexCache 更是支撑 GLM 5.2 训练至 1M 上下文的关键技术，并非拿开源训练框架直接跑通就能解决。

高质量训练数据的构造能力。后训练与预训练使用的数据完全不同，不拼规模，而拼质量与结构。这一领域的 know-how 在行业内高度不透明。

工程基础设施。大模型后训练同样消耗算力，同样需要精细到每个超参数的训练策略管理。就在最近，Mind Lab 直接开源了一套支持 GLM-5.1 和 5.2 的 Megatron 训练框架。这意味着他们不仅是在现有框架上做适配，而是从训练基础设施层面把 GLM 系列的后训练链路彻底打通，而这一工程本身就是一道极高的门槛。

GLM-5.1 发布至今已有一段时间，HuggingFace 上完成其后训练并开源的只有一家。除智谱自身外，Mind Lab 是目前唯一展现出有能力在 GLM 最新基座上做后训练的外部团队。这个位置本身就具有稀缺性。

九个月是否足够

Mythos 被禁，中国要获得同等能力只能依靠自主研发。马斯克说九个月，唐杰说用不了那么久。

唐老师表示，打造中国的 Mythos 需要两条腿走路：基座预训练迭代与后训练模型的自我迭代。智谱在前者的位置明确，而在后者，Mind Lab 是目前除智谱外唯一交出公开成果、并且持续在 GLM 最新基座上迭代的团队。

后训练赛道在国内尚未获得足够关注。大部分讨论集中于基座之争：谁的参数多、谁的评测高、谁又发布了新版本。但当基座差距逐渐收窄，后训练的质量将越来越成为产品体验的分水岭。

九个月是否足够，我们无法确定。但有一件事是确定的：在 GLM 5.1/5.2 的后训练路线上，目前唯一看得见路径、并且已用成绩证明过提分能力的外部团队，就是 Mind Lab。Mythos 级别的智能并非只有预训练一条路可抵达——在后训练这条路上，Mind Lab 已经站在了最前沿的位置。

这一点，令人振奋。

中国Mythos闷头做？马斯克Q1与唐杰预言对比

登陆 HuggingFace 探察一圈

后训练提升幅度几何

除智谱自身外，唯有他们

九个月是否足够

相关阅读

最新教程

最新资讯