全球首个人形机器人通用小脑发布:2万小时数据引领零样本泛化时代
具身智能在过去几年经历了显著发展,机器人已能完成环境感知、任务理解乃至执行复杂指令。但要让机器人从实验室走向真实应用场景,仅依靠负责感知与决策的“大脑”是远远不够的——一套能够实现全身协调控制、实时运动执行和身体稳定控制的“小脑”,同样是成败的关键所在。
试想,机器人需要在毫秒级时间内协调全身数十个自由度,在崎岖地形中维持平衡,遭遇外部冲击后迅速恢复稳定,并且持续完成高动态、高精度的动作。这些能力,才是机器人从“演示原型”蜕变为“生产工具”的真实门槛。
近期,银河通用机器人正式发布了其重磅产品——AstraBrain-WBC 0.5,这是其“银河星脑”(AstraBrain)技术体系下,专为人形机器人全身实时运动控制打造的“小脑”基础模型。
作为银河星脑的核心组件之一,AstraBrain-WBC 0.5专注于“通用小脑”这一基础设施级能力的构建。这不仅是银河通用在人形机器人运动智能领域的重要里程碑,更重要的是,它首次将类似GPT的大规模训练范式,迁移到了人形机器人实时运动控制的赛道上来。
为何称AstraBrain-WBC 0.5引领人形机器人迈入了“GPT时代”?并非仅仅因为它采用了Transformer架构。
该模型基于约20亿帧人类动作数据训练,数据量级与GPT-1相当,参数量达到8000万级别,是全球首个达到此规模的人形机器人全身实时运动控制大模型。
更关键的是,它首次在人形机器人运动控制领域验证了类似GPT的扩展定律(Scaling Law)——随着数据规模、模型规模与训练体系的同步扩展,机器人的运动能力持续提升,通用性、稳定性和环境适应性也随之增强。
正如GPT将人工智能从“任务模型”时代推进到“基础模型”时代,AstraBrain-WBC 0.5所探索的,正是机器人运动控制从“单一技能训练”迈向“运动基础模型”的路径。这不仅是一次“小脑”维度的突破,更标志着人形机器人正从“技能时代”进入“基础模型时代”。
数据与模型:规模驱动能力涌现
大模型时代的一条铁律已被反复验证:能力源自规模。GPT之所以具备强大的泛化能力,本质上源于海量数据与大型模型共同作用催生的涌现能力。AstraBrain-WBC 0.5的目标,正是首次在人形机器人运动控制领域验证这一路径。
为训练该模型,银河通用联合研究团队构建了目前业内规模最大的人形机器人动作训练数据集,累计汇聚约2万小时的人类动作数据,覆盖舞蹈、运动、日常行为、工业操作、协作搬运等多种场景。
这些数据不仅体量庞大,多样性也远超以往。传统动作数据集通常充斥着大量重复的行走、站立等高频动作,而AstraBrain-WBC 0.5的数据体系则覆盖了复杂舞蹈、高动态运动、快速转向、跌倒恢复、协作搬运等长尾场景,为模型提供了更丰富的人体运动先验知识。数据显示,其动作空间覆盖范围比业内广泛使用的AMASS数据集提升了约4到5倍。
在此基础上,研究团队将模型规模扩展到8040万参数级别,使AstraBrain-WBC 0.5成为全球首个达到GPT-1量级的人形机器人全身实时运动控制大模型。这一规模在业内具有里程碑意义。作为对比,此前具有代表性的工作GAE训练数据仅数千小时,模型参数约1000万;SONIC训练数据约700小时,参数也在1000万到2000万之间。AstraBrain-WBC 0.5在数据规模与模型容量上,均实现了数量级的跨越。
架构革新:从MLP到因果Transformer
长期以来,人形机器人运动控制模型多采用浅层MLP网络。这类模型结构简单,但容量有限,当数据规模增长后性能提升空间极为有限。AstraBrain-WBC 0.5彻底颠覆了这一思路。
团队首次引入GPT风格的因果Transformer架构,将机器人全身控制重新定义为一个连续序列预测问题。
简而言之,该模型不再仅关注当前时刻的运动状态,而是能结合历史连续动作的上下文信息,实时预测并控制未来的动作趋势。这种能力与GPT理解语言序列的方式高度相似——机器人看到的并非孤立动作,而是一段连续的“运动语义”。
同时,研究团队构建了由384个动作专家组成的运动先验知识库,通过蒸馏训练将其融合为统一的控制模型,实现了从“专家技能集合”到“通用运动基础模型”的跃迁。最终形成的AstraBrain-WBC 0.5模型参数规模达到8040万级别,已接近GPT-1时代的数据与模型规模。
更重要的是,这不仅仅是简单地扩大模型。
这项工作首次证实,机器人运动控制领域同样存在类似GPT的发展规律:随着数据规模从百万级扩展到20亿帧,模型规模持续增长,性能持续提升,零样本泛化能力不断增强,且未出现传统运动控制模型常见的性能瓶颈。这意味着,人形机器人运动控制正稳步迈向“基础模型时代”。
如果说过去的机器人是在学习单个技能,那么AstraBrain-WBC 0.5更像是在学习整个人类动作世界。
四项核心能力:全身协同、零样本泛化、实时性与鲁棒性
规模化带来的价值最终体现在能力上。AstraBrain-WBC 0.5展现了此前人形机器人运动控制系统难以兼得的四项核心能力。
全身协同控制。传统控制器往往擅长单一动作,但在复杂全身协调任务中容易出现动作割裂。AstraBrain-WBC 0.5在29自由度机器人上实现了全身协同控制,手脚联动、重心切换、身体协调样样精准。无论是舞蹈、运动还是协作搬运,都能保持稳定自然的动作表现。
零样本泛化。在真实机器人测试中,AstraBrain-WBC 0.5实现了大量训练集中从未出现过的高动态动作的零样本执行。包括篮球、拳击、舞蹈、翻身起立、协作搬运等复杂任务,均可直接完成,无需为单个任务重新训练。这意味着机器人首次展现出类似“运动泛化”的能力,面对全新动作也能快速迁移。
实时性。机器人控制必须满足严格的实时性要求。经过工程优化,AstraBrain-WBC 0.5在单张RTX 4090显卡上实现了低于1.5毫秒的端到端推理延迟,整套动捕链路设备延迟小于20毫秒,完全满足50Hz实时闭环控制需求。从感知到决策再到执行,动作切换流畅自然,即使在连续复杂动作之间切换也能保持稳定控制。
鲁棒性。对于机器人而言,真正困难的从来不是完成一次动作,而是在各种干扰条件下持续稳定运行。AstraBrain-WBC 0.5通过大规模运动先验学习,能够在快速运动、重心变化、复杂接触切换等场景中保持稳定控制。论文数据显示,随着数据规模从200万帧扩展至20亿帧,模型零样本跟踪误差持续下降;模型成功率从83.26%提升至92.58%,有力验证了规模化训练带来的显著收益。
机器人在“小脑”维度首次展现出类似大模型时代的Scaling Law特征。
产业应用:开启全新想象空间
AstraBrain-WBC 0.5的意义不仅在于技术突破,更重要的,它为机器人产业打开了全新的应用空间。
对研究机构、开发者和数据采集团队而言,它提供了一套覆盖海量动作模式的运动基础模型。基于其稳定泛化的全身控制能力与灵巧操作能力,可轻松采集高质量VLA操作数据,大幅降低人形机器人全身控制模型的训练门槛。
借助其泛化的实时动作跟踪能力,开发者能够快速生成舞蹈、演艺、互动展示等复杂动作内容。过去需要数周训练才能完成的动作设计,如今有望实现实时生成与快速部署。机器人动作创意创作进入全新阶段。
在应急救援、危险环境处置、灾害现场搜救等场景中,人类往往面临极高的安全风险。AstraBrain-WBC 0.5支持实时全身遥操作与复杂动作跟踪能力,使机器人能够率先进入危险区域执行探测、处置和救援任务。未来,这种能力有望成为应急救援体系的关键组成部分。
开源生态:让运动基础模型成为起点
正如GPT推动了人工智能生态的繁荣,银河通用机器人希望AstraBrain-WBC 0.5成为机器人运动基础模型发展的重要起点。目前,AstraBrain-WBC 0.5的相关论文、代码与技术成果已全面开源,向生态开放。
银河通用期待与全球研究机构、高校、开发者及产业伙伴共同推动机器人运动基础模型的发展,加速具身智能技术创新与产业落地。
AstraBrain-WBC 0.5的诞生,使人形机器人运动控制开始具备基础模型化能力。通过大规模数据与GPT式架构的结合,机器人不再局限于单一动作学习,而是逐步形成可泛化的通用运动生成与实时控制能力。
对银河星脑(AstraBrain)而言,这一突破意味着具身智能从认知到执行的关键闭环正在被补齐,具身智能将具备真正面向真实世界运行的基础能力支撑。
对行业而言,它标志着人形机器人运动控制正在迈向基础模型驱动的新范式,能力增长路径首次变得清晰且可规模扩展。
对产业与商业而言,人形机器人从“可演示”走向“可部署、可持续运行”的分水岭正在出现。AstraBrain-WBC 0.5为机器人规模化进入零售、工业与服务场景提供了底层能力基础。
人形机器人已迎来从实验室走向真实世界应用的关键拐点。银河通用通过AstraBrain-WBC 0.5所代表的技术路径,率先完成了从运动控制能力到基础模型范式的关键跨越,并持续引领具身智能的演进方向。