人形机器人通用小脑模型测评:银河通用AstraBrain-WBC 0.5
今天,银河通用机器人官方投下了一枚重磅冲击波——全球首个人形机器人通用小脑GPT基础模型AstraBrain-WBC 0.5正式亮相。这个模型可不是什么小打小闹的升级,它背后是整整2万小时的人类动作数据,参数规模达到了8040万,直接对标GPT-1的量级,算是把人形机器人全身实时运动控制这个赛道,硬生生拉到了大模型时代。
简单来说,AstraBrain-WBC 0.5第一次为人形机器人构建了一个真正通用的全身实时运动控制基础模型。训练数据量有多大?2万小时的人类动作数据,换算下来是20亿帧画面。参数规模8040万,这个体量在机器人运动控制领域是头一遭。更重要的是,它首次证明了,在机器人运动控制这块,也存在和GPT类似的Scaling Law——数据量越大,效果越稳。你看,当训练数据从200万帧扩展到20亿帧,模型成功率直接从83.26%飙升到92.58%,零样本跟踪误差也在持续下降。这不是巧合,这是规律。
很多人会问,机器人的“大脑”和“小脑”到底有什么区别?打个比方:大脑决定机器人怎么理解世界,比如它看到一杯水,知道那是可以喝的;小脑则决定它怎么在真实世界里完成动作——比如伸手、握紧、保持平衡,不被一杯水绊倒。AstraBrain-WBC 0.5干的正是“小脑”的活儿,它要在毫秒级的时间内,协调全身几十个自由度,在复杂环境下保持平衡、抵抗外部扰动,同时连续完成高动态、高精度的动作任务。这活儿,以前全靠人工调参和专用算法硬扛,现在总算有了一个通用基础模型来兜底。
从技术架构上看,AstraBrain-WBC 0.5采用了GPT风格的因果Transformer架构。它把全身控制重新定义为一个连续序列预测问题——也就是说,机器人不再是一步一步死板地执行指令,而是根据动作历史,预测未来运动趋势,像人一样“预判”下一步该怎么动。这种思路,其实跟语言模型预测下一个词如出一辙。
话说回来,目前这个版本还只是0.5,距离真正成熟的人形机器人“小脑”还有一段路要走。但方向已经明确——数据驱动、大模型泛化、Scaling Law在运动控制领域的成立,意味着这条路越走越宽。对于整个机器人行业来说,这一步的意义,不亚于当年GPT-1对自然语言处理领域的冲击。接下来,就看这个“小脑”怎么在真实场景里落地了。




