人形机器人通用小脑测评：2万小时数据零样本泛化

2026-06-20阅读 0热度 0

人形机器人

具身智能技术的推进，让机器人逐步具备理解环境、解读任务，乃至执行复杂指令的能力。但现实挑战在于：要让机器人真正融入物理世界，仅靠负责感知与决策的“大脑”系统远远不够，还需要一个负责全身实时运动协调、动态平衡与稳态控制的“小脑”模块。

试想一下，机器人需在毫秒级尺度上协调全身数十个自由度，在复杂地形中保持姿态稳定，遭遇外力冲击时快速恢复平衡，并持续输出高动态、高精度的运动——这些能力直接决定了它能否从实验室演示迈入“生产力工具”的范畴。

近期，银河通用机器人正式推出AstraBrain-WBC 0.5。作为银河星脑（AstraBrain）技术体系中专为人形机器人设计的全身实时运控“小脑”基础模型，其定位明确：构建机器人“通用小脑”的基础设施级能力。这不仅标志着银河通用在人形机器人运动智能领域的实质性突破，更首次将GPT所代表的规模化训练范式引入到人形机器人的实时运动控制领域，为打造机器人运动基础模型开辟出一条全新的技术路径。

称其引领人形机器人迈入“GPT时代”，并非简单套用Transformer架构。关键在于：该模型基于约20亿帧人类动作数据进行训练，数据体量接近GPT-1规模，模型参数达8000万级别，是全球首个达到这一量级的人形机器人全身实时运控大模型。更值得关注的是，该技术路线首次验证了类似GPT的Scaling Law效应——随着数据规模、模型容量和训练体系同步扩展，机器人的运动能力持续提升，并展现出更强的泛化性、鲁棒性与环境适应力。正如GPT推动人工智能从任务模型时代跨越至基础模型时代，AstraBrain-WBC 0.5探索的正是机器人运动控制从“单技能训练”向“运动基础模型”的范式迁移。这不仅是银河星脑在“小脑”维度的技术跃迁，更意味着人形机器人正从“技能时代”步入“基础模型时代”。

亮点一：20亿帧人类动作数据训练，打造行业最大规模人形机器人运动语料库

大模型领域有一条屡经验证的铁律：能力源自规模。GPT之所以具备强大的泛化性能，其根本在于海量数据与大规模模型协同作用下涌现出的能力。而AstraBrain-WBC 0.5探索的，正是这一规律在人形机器人运动控制领域的首次实践验证。

为训练该模型，银河通用机器人联合研究团队构建了目前行业最大规模的人形机器人动作训练数据集，累计汇聚约2万小时人类动作数据，覆盖舞蹈、体育运动、日常生活行为、工业操作、协同搬运等丰富场景。

该数据集不仅体量庞大，动作多样性同样突出。相较于传统数据集中大量重复的行走、站立等高频运动，AstraBrain-WBC 0.5的数据体系涵盖了丰富的长尾动作：复杂编舞、高动态冲刺、快速变向、跌倒恢复、双人协作搬运等，为模型提供了更全面的人体运动先验。测试表明，其动作空间覆盖范围相较行业广泛使用的AMASS数据集提升约4至5倍。

在此基础上，研究团队将模型参数规模扩展至8040万，使得AstraBrain-WBC 0.5成为全球首个达到GPT-1量级的人形机器人全身实时运控大模型。这一规模具有里程碑意义——此前业内代表性工作GAE训练数据量约数千小时，模型参数约1000万；SONIC训练数据约700小时，模型参数约1000万至2000万。相比之下，AstraBrain-WBC 0.5在训练数据量和模型容量上均实现了数量级跃升。

亮点二：首次将GPT式架构引入机器人运控领域

长期以来，人形机器人运控模型多采用浅层MLP网络。这类架构简单却容量有限，难以随数据规模增长持续获得性能增益。AstraBrain-WBC 0.5彻底打破了这一设计范式。

研究团队首次采用GPT风格的因果Transformer架构，将机器人全身运动控制重新定义为连续序列预测问题。

通俗而言，AstraBrain-WBC 0.5不再仅关注当前时刻的运动指令，而是能够结合历史连续动作序列，实时预测并控制未来运动趋势。这种能力与GPT理解语言序列的方式在本质上一脉相承——机器人所处理的并非孤立动作帧，而是一段连续的运动“语义流”。

同时，研究团队构建了由384个动作专家组成的运动先验库，通过蒸馏训练将其融合为统一的控制模型，实现了从“专家技能集合”到“通用运动基础模型”的能力跃迁。最终成型的AstraBrain-WBC 0.5模型参数规模达8040万级，已接近GPT-1时代的数据量与模型规模。

更为关键的是，AstraBrain-WBC 0.5并非简单将模型做大。该工作首次证明了机器人运动控制领域同样存在类似GPT的发展规律：

随着数据规模从百万级扩展至20亿帧、模型参数规模持续上升，模型性能持续提升，零样本泛化能力不断增强，未出现传统运控模型常见的性能瓶颈。

这意味着，人形机器人运动控制正步入“基础模型时代”。如果说过去机器人的学习目标是掌握单一技能，那么AstraBrain-WBC 0.5的目标则更像是理解整个人类动作世界。

亮点三：全身协同、敏捷运动、毫秒响应，让机器人拥有更接近人类的运动能力

规模化带来的价值最终体现在能力输出上。AstraBrain-WBC 0.5展现了此前人形机器人运控系统难以兼顾的四项核心能力。

更高自由度的全身协同控制

传统控制器往往擅长单一动作，而在复杂全身协调任务中容易出现动作割裂。AstraBrain-WBC 0.5在29自由度机器人上实现了全身协同控制，支持手脚联动、重心切换、身体协调等复杂动作。无论是舞蹈编排、体育运动还是协作搬运，都能输出稳定自然的运动表现。

更高动态运动能力

在真实机器人测试中，AstraBrain-WBC 0.5实现了大量训练集中从未出现的高动态动作的零样本执行。篮球运球、拳击出击、舞蹈旋转、翻身起立、协作搬运等复杂任务均可直接完成，无需针对单一动作重新训练。这意味着机器人首次展现出类似“运动泛化”的能力——面对从未见过的新动作，也能快速完成迁移与执行。

毫秒级实时响应

机器人控制必须满足严格的实时性约束。测试显示，AstraBrain-WBC 0.5经过工程优化后，在单张RTX 4090显卡上实现低于1.5毫秒的端到端推理延迟，整套动捕链路设备延迟小于20毫秒，可满足50Hz实时闭环控制需求。从感知到决策再到执行，动作切换流畅自然，即使在连续复杂动作之间切换，也能保持稳定控制。

前所未有的鲁棒性

对机器人而言，真正棘手的并非完成一次动作，而是在各种干扰条件下持续稳定运行。AstraBrain-WBC 0.5通过大规模运动先验学习，能够在快速运动、重心突变、复杂接触切换等场景中保持稳定控制。论文数据显示，随着数据规模从200万帧扩展至20亿帧，模型零样本跟踪误差持续下降；模型成功率从83.26%提升至92.58%，充分验证了规模化训练带来的显著增益。机器人在“小脑”维度第一次展现出类似大模型时代的Scaling Law特征。

亮点四：从实验室走向产业，打开机器人运动能力的商业化想象空间

AstraBrain-WBC 0.5的价值不仅体现为技术突破，更在于为机器人产业开辟了全新的应用空间。

作为运控基座模型，高效产生高质量动作数据

对于研究机构、开发者以及数据采集团队而言，AstraBrain-WBC 0.5提供了一套覆盖海量动作模式的运动基础模型。基于其稳定泛化的全身控制能力与灵巧操作能力，可以轻松采集高质量的VLA操作数据。这将大幅降低人形机器人全身控制模型的训练门槛与数据成本。

即想即有，创意内容实时跟踪

借助泛化的实时动作跟踪能力，开发者可快速生成舞蹈、演艺、互动展示等复杂动作内容。过去需要数周训练的动作设计，如今有望实现实时生成与快速部署。机器人动作创意创作正进入全新阶段。

人不能及，机器人先到

在应急救援、危险环境处置、灾害现场搜救等场景中，人类往往面临高风险挑战。AstraBrain-WBC 0.5支持实时全身遥操作与复杂动作跟踪能力，使机器人能够率先进入危险区域执行探测、处置和救援任务。未来，这种能力有望成为应急救援体系的关键组成部分。

亮点五：模型全面开源，邀请全球开发者共建机器人基础模型生态

正如GPT推动了人工智能生态的繁荣，银河通用机器人希望AstraBrain-WBC 0.5成为机器人运动基础模型发展的重要起点。目前，AstraBrain-WBC 0.5相关论文、代码与技术成果已全面开源，面向生态开放。

银河通用机器人期待与全球研究机构、高校、开发者及产业伙伴共同推动机器人运动基础模型的发展，加速具身智能技术创新与产业落地进程。

人形机器人能力跃迁的一块“关键拼图”

AstraBrain-WBC 0.5的发布，使人形机器人运动控制开始具备基础模型化的能力。通过大规模数据与GPT式架构的深度融合，机器人不再受限于单一动作的学习，而是逐步形成可泛化的通用运动生成与实时控制能力。

对银河星脑（AstraBrain）而言，这一突破意味着具身智能从认知到执行的关键闭环正在被补齐，具身智能将具备真正面向真实世界运行的基础能力支撑。

对行业生态层面，它标志着人形机器人运动控制正在迈向基础模型驱动的新范式，能力增长路径首次变得清晰且可规模扩展。

对产业与商业应用，人形机器人从“可演示”走向“可部署、可持续运行”的分水岭正在出现。AstraBrain-WBC 0.5为机器人规模化进入零售、工业与服务场景提供了底层能力基础。

人形机器人正迎来从实验室走向真实世界应用的关键拐点。银河通用通过AstraBrain-WBC 0.5所代表的技术路径，率先完成了从运动控制能力到基础模型范式的关键跨越，并持续引领具身智能的演进方向。