卧安机器人OneModel 1.7测评：隐式通路打通具身智能断层

2026-06-20阅读 0热度 0

Model

具身智能领域一个长期悬而未决的难题，近日迎来了突破性进展。

核心矛盾在于：世界模型虽已能精准解析环境变化，但动作策略的响应却频频失准——从环境感知到物理执行的断点，始终是家庭机器人走出实验室的关键掣肘。

5月20日，卧安机器人（OneRobotics，6600.HK）正式推出自研世界动作模型OneModel 1.7 FrontoStria-RL。这一方案的核心创新，在于构建了一条名为Predictive Policy Latent的隐式传导通路，将世界模型对场景的语义理解直接注入动作执行模块——彻底摒弃中间图像或坐标等显式传递范式，转而通过潜在空间完成信息的高效传导。支撑这一架构的两篇核心论文，已于5月12日在arxiv公开。

实测数据印证了架构的有效性。在具身智能标准评测基准LIBERO上，OneModel 1.7平均成功率高达99%，全面领先π0.5、GR00T-N1.5、OpenVLA-OFT等主流公开模型；真机部署环节中，日常操作任务成功率达99%，高精度任务成功率稳定在97%。

这家由哈工大90后校友李志晨创立的公司，其董事会成员包括“中国机器人教父”李泽湘教授及微电子专家高秉强教授。2025年底，卧安以约18亿港元的募资规模登陆港交所，创下具身智能领域迄今为止最大规模的IPO融资纪录。但本文聚焦的并非其商业化成果，而是刚刚发布的模型架构本身。

几乎同期，高盛于5月26日发布了中国人形机器人中期盘点报告，披露其对中国14家头部机器人企业的调研结果。值得关注的是，这14家覆盖硬件、传感器、自动化等多环节的企业中，被高盛明确标注“正在推进VLA+World Model融合方向”的仅有4家——One Robotics（卧安机器人，6600.HK）、Galaxea（星海图）、Galbot（银河通用）和Spirit AI（千寻智能）。报告针对卧安机器人的调研部分，直接引用了OneModel 1.7的latent world action model架构，以及motion-centric control、success memory等关键模块。

高盛在报告中指出，行业讨论已从单一VLA框架迅速转向VLA/VTLA与World Model融合的多模态执行栈，而高质量真实世界数据仍是制约实际部署的首要瓶颈——这两个判断与卧安OneModel 1.7的技术路线及数据布局高度吻合。

为何值得深入拆解？因为它所回应的并非“模型参数是否更大”的表层问题，而是一个更为根本的架构级命题：World Model与动作模型之间，究竟该如何实现高效对接？

NVIDIA澳门站：从仿真到客厅

故事的具象切面，出现在NVIDIA创业企业展示澳门站。

2026年5月，卧安机器人以《From Isaac Lab to Your Living Room》为主题公开亮相。这一主题传递出明确的战略信号：卧安关注的远不止仿真环境的训练效果，更在于从仿真训练到模型迭代，再到端侧部署的全链路闭环——最终目标是让机器人真正在你家客厅中执行任务。

展示现场，搭载OneModel 1.7的卧安保姆机器人onero H1在模拟家庭场景中完成了洗衣全流程：自主识别散落衣物、规划路径并避障、精准抓取柔性物体、开启洗衣机门、分类投放、关闭舱门。据现场观察，全程无任何遥操作介入。

搭载OneModel 1.7的onero H1在模拟家庭场景中完成洗衣全流程，全程自主决策、无遥操作

但这次展示的真正看点，绝非“又一个机器人洗衣服的demo”。结合NVIDIA Physical AI及Isaac Lab/Isaac Sim仿真工具链的大背景，更值得关注的是卧安的技术路线选择：它并未沿袭单一VLA端到端映射的路径，而是构建了一套通过隐式传导机制将World Model与动作执行模型有机连接的架构——RL-Latent World Action Model（RL-LWAM）。

据了解，在具身智能创业公司中，卧安机器人是最早提出并落地“通过隐式传导架构连接世界模型与动作模型”这一技术方向的企业。当大多数团队仍围绕单一VLA或孤立World Model进行探索时，卧安选择用一条隐式通路将两者贯通——这一判断精准踩中了行业演进的关键节点。

拆解OneModel 1.7：一条从理解到执行的隐式通路

OneModel 1.7 FrontoStria-RL的RL-LWAM架构，本质上是在回答一个核心命题：如何让世界模型对环境的深层理解，高效传导至机器人的动作执行层？

RL-LWAM架构由三大核心模块组成，彼此通过一个关键的隐式传导机制——Predictive Policy Latent——实现连通，而非依赖显式的中间图像或坐标传递。

OneModel 1.7 FrontoStria-RL完整架构。Predictive Policy Latent作为核心传导机制，连接World Model、Understand Expert与Action Expert。

World Model：跨场景泛化的基石

World Model模块承担着对环境状态及任务演变的预测能力构建，涉及物体关系、空间结构、动态变化趋势的深层理解。在家庭场景中，这意味着机器人必须理解“碗架从左侧移至右侧”、“橱柜门角度改变”——这些对人类而言微不足道的变化，对机器人却是全新的环境变量。

World Model并不直接输出动作指令，而是输出对当前场景与任务状态的结构化语义理解。关键问题随之而来：这些理解，如何转化为机器人可执行的物理动作？

### Predictive Policy Latent：连接理解与执行的核心桥接

这是OneModel 1.7架构中最值得关注的设计。Predictive Policy Latent并非独立模块，而是一条隐式传导通路——它将World Model对场景、物体、空间关系及动作后果的全面理解，压缩转化为一组潜在空间中的策略表征，随后传递给下游的Understand Expert与Action Expert。

为何采用“隐式”而非“显式”？在传统管线式架构中，World Model的输出往往是显式的中间表示，如预测的下一帧图像、关键点坐标或语义标签。这些显式信号在传递过程中极易丢失信息、引入生成幻觉并造成推理延迟，在开放家庭环境中尤其脆弱。Predictive Policy Latent则另辟蹊径：训练阶段利用“未来信息”教会模型何谓优质动作决策方向，部署时则仅凭当前观测即可做出等效判断——信息密度更高，推理速度更快，且不引入生成式噪声。

这条隐式通路的实际价值，最终通过端到端真机部署数据得到验证：OneModel 1.7在日常操作任务（洗衣、叠衣、洗碗机操作等）中实现约99%的平均成功率，在拔插试管、倒咖啡豆等高精度任务中达到约97%。这些任务涵盖柔性物体操作到极小容错空间的精细操作——从结果判断，World Model的场景理解经由PPL隐式传导后，确实有效驱动了下游的任务分解与动作执行。

Understand Expert + Skill体系：任务理解与技能调度

Understand Expert模块处于World Model与Action Expert之间，负责将世界模型输出的场景理解与具体任务指令对接，并进行Skill调度。面对“把衣服放进洗衣机”这类看似简单的指令，Understand Expert需分解为系列子技能：定位衣物、判断抓取策略（柔性物体与刚性物体的抓取方式截然不同）、规划移动路径、识别洗衣机状态、执行投放动作。

Skill体系的核心价值在于复用。一旦某个子技能（例如“打开带手柄的门”）被模型习得，它便可在不同任务及不同场景中被调度复用，无需为每个新任务从头训练。

Action Expert + MCF-Proto：精准执行的底层引擎

Action Expert负责最终动作输出。其关键组件MCF-Proto，全称Motion-Centric Action Frame。当前主流VLA模型的action head几乎都在固定世界坐标系下直接预测位移，这种方式对相机视角变化及机器人初始位姿偏差极为敏感。MCF-Proto则不同：它围绕任务相关的局部运动结构（如门铰链、导轨、折叠线）组织动作原型，再映射回实际机器人动作，从表征结构层面有效降低几何扰动导致的分布偏移。

LIBERO-plus扰动测试直接验证了这一设计的有效性。在七类扰动条件下，MCF-Proto在六类中取得最优结果。其中最具实际意义的两类——Camera（相机视角变化）和Robot（机器人初始位姿偏差），MCF-Proto分别达到69.7%和66.0%，领先最强基线3.3个和15.7个百分点。这两类恰恰是家庭环境中最常见的变化：你每天将机器人放在客厅的起始位置都不可能完全一致，摄像头角度也难免存在微小偏差。

LIBERO-plus七类扰动鲁棒性对比

RL闭环 + Success Memory：持续进化的机制

RL-LWAM架构中的“RL”不仅指训练阶段使用强化学习，更指向一套部署后持续进化的闭环机制。

强化学习闭环将真实部署中的反馈持续回流至模型。Success Memory机制则进一步筛选并存储成功执行的经验轨迹，配合Retrieve-then-Steer策略，使模型面对新任务或新场景时，可优先检索最相关的成功记忆，据此调整当前动作策略。SimplerEnv仿真测试验证了Retrieve-then-Steer机制的增益——该机制将CogACT的平均成功率从75.8%提升至79.5%，提升3.7个百分点，表明Success Memory确实能在不更新模型参数的前提下带来显著的适应性提升。

SimplerEnv平均成功率对比

这意味着OneModel 1.7的能力并非固定快照，而是被设计成随着部署规模扩大、真实反馈持续积累而不断进化的系统。按照这套设计逻辑，每一台部署在真实家庭中的机器人，都能为模型的整体进化贡献数据——当然，这套机制的实际进化效率仍需更大规模部署的验证。此外，HITL（人在环）监督机制为模型进化过程提供了安全约束。

评测数据怎么看

官网披露的评测体系覆盖三个层面，每组数据验证的是RL-LWAM架构中不同模块的贡献，不可混为一谈：

系统整体能力（LIBERO标准测试）。 99%平均成功率，领先π0.5、GR00T-N1.5、OpenVLA-OFT。官网明确指出，这一结果源自“RL-LWAM各模块的协同”——World Model的泛化表征、Understand Expert的任务规划、MCF-Proto的动作参数化，以及RL闭环的持续优化共同作用的结果，绝非单一模块之功。

标准LIBERO平均成功率对比

端到端真机验证。 日常操作约99%、高精度任务约97%、真人对打乒乓球接球91.2%——这三组数据反映的是整套架构从理解到执行、从传导到反馈的全链路效果。尤其是乒乓球接球，涉及高动态、高精度、实时对抗，World Model提供来球轨迹的快速预测，Action Expert在极短时间窗口内生成精准动作，RL闭环通过大量对打训练持续优化击球策略——这个场景天然要求所有模块同时工作，是对架构完整性最直接的检验。

日常操作与高精度任务成功率

真人对打乒乓球动作阶段成功率

家庭具身智能最大订单背后：真正稀缺的是真实家庭数据

2026年5月，卧安机器人（6600.HK）中标深圳市“AI生态创新社区设备购置与场地搭建项目”，金额4495.32万元。这个项目值得关注的并非金额本身，而是其内容：建设一个“具身智能数据全链条服务中心”，涵盖具身机器人本体（onero H1）、UMI数据采集终端、数据管理一体化平台，以及家庭服务、康养、零售等多类型真实场景搭建。

据了解，这是目前业内规模最大的聚焦家庭场景的具身智能数据采集中心项目。

在当前技术竞争格局中，模型架构的差异固然重要，但制约家庭具身智能落地的真正瓶颈，正越来越多地指向数据。工业场景的数据采集有成熟的产线和标准化工位作为支撑，家庭场景则完全不具备这一条件——你必须在真实的厨房、卧室、客厅中，让机器人反复执行洗碗、叠衣服、收纳整理等任务，采集真实的操作轨迹、力觉反馈、场景变化数据。

这批数据对OneModel的迭代价值是直接的。RL闭环需要真实反馈，Success Memory需要真实的成功经验轨迹，MCF-Proto需要多样化场景下的动作帧数据来构建更泛化的运动原型。一个足够大规模、足够多样化的真实家庭数据工厂，正是模型进化引擎的燃料来源。

从行业视角来看，当大多数具身智能公司仍在借助仿真数据和实验室场景训练模型时，能够率先切入真实家庭数据基础设施建设，意味着在数据维度建立了一个不易被快速追赶的竞争壁垒。

“一脑多形”：OneModel作为跨形态底座

OneModel并不仅限于卧安保姆机器人onero H1单一产品的AI大脑，而是卧安机器人（OneRobotics）“一脑多形”技术体系的核心基座。

卧安当前产品矩阵覆盖三大方向：家庭服务场景的卧安保姆机器人onero H1、运动健康场景的网球机器人Acemate、情感陪伴场景的陪伴机器人Kata Friends。这三类产品的硬件形态差异极大——从双七自由度机械臂的人形机器人，到专注球类运动的运动机器人，再到主打情感交互的陪伴机器人。

卧安“一脑多形”产品矩阵

但它们的底层AI能力均源自同一套OneModel体系。这里的关键绝非“一个模型在不同硬件上运行”那么简单。一脑多形的实际运作方式是：World Model对环境的理解能力、Understand Expert的任务分解和Skill调度能力，以及Success Memory积累的经验，均在不同形态的机器人之间共享和迁移。

这并非停留在设计图纸上的构想——Kata Friends的模型正是基于保姆机器人onero H1的OneModel进行蒸馏，场景理解和物体属性判断等核心能力直接继承自H1的训练成果。而Acemate在高动态运动场景中积累的实时响应经验，也在反哺OneModel对快速变化环境的处理能力。换句话说，一脑多形已不是概念，而是正在高效运转的技术复用链路。

一脑多形的效率价值在于：不同形态的机器人不再各自独立训练、独立积累经验，而是共享一个持续进化的AI底座。卧安机器人（OneRobotics，6600.HK）是目前具身智能行业中商业化落地规模最大的企业之一，产品覆盖超过90个国家和地区，服务超过500万家庭。这意味着多形态产品在全球范围内持续产生的真实交互数据，都在为OneModel的迭代提供多样化的训练信号——这是纯实验室团队难以复制的数据优势。

结语

OneModel 1.7 FrontoStria-RL的核心贡献，不在于刷新了某个评测排行榜的数字，而在于给出了一个此前行业悬而未决问题的系统性回答：World Model看懂了世界之后，如何将这份理解真正传导给机器人的双手？

Predictive Policy Latent这条隐式通路能否在更大规模的真实家庭场景中持续验证，是接下来最值得关注的核心议题。而随着家庭具身智能领域最大规模数据基础设施项目的启动，真实家庭数据正开始规模化回流，RL闭环与Success Memory的进化飞轮也有望真正运转起来。

具身智能正在从“能不能做出来”迈向“能不能持续可靠地在真实世界中工作”。当行业普遍还在讨论模型参数大小与仿真demo的炫酷程度时，卧安机器人选择了一条看似不那么“性感”，却可能更为扎实的路径：先打通从理解到执行的传导通路，再用真实世界的数据闭环让这条通路持续进化。

如果这条路能够走通，家庭机器人从“偶尔能做对”走向“持续可靠地工作”，或许比我们想象的更近一些。