智元GO-2具身大模型深度评测：首创动作思维链如何刷新行业SOTA

2026-05-20阅读 0热度 0

具身智能

2026年4月9日，智元机器人推出其新一代具身智能基座模型Genie Operator-2（GO-2）。此次发布的核心在于其首创的“动作思维链”技术，该技术直接解决了机器人从“语义理解”到“物理执行”的可靠性瓶颈。相关论文已被CVPR 2026收录，其综合性能指标刷新了行业纪录，为机器人在动态复杂环境中的鲁棒性操作提供了全新解决方案。

无论是服务机器人还是工业协作机器人的终端用户，都曾面临指令执行偏差的困扰。例如，执行“取水杯”这一简单任务，机器人可能碰倒周边物品，或在遇到轻微障碍时陷入停滞。这一问题的根源，在于传统具身模型采用的“感知-执行”端到端映射存在固有局限。智元GO-2的研发，正是为了攻克这一长期阻碍行业发展的核心工程难题。

尽管大语言模型已极大提升了机器人的指令解析与上下文理解能力，但物理世界的执行是另一重挑战。传统模型将视觉等感知信号直接转换为底层电机控制指令，缺乏对任务步骤的显式分解与规划。这类似于不预判路径便盲目行动，一旦环境出现训练集之外的微小扰动，执行链路易发生崩溃，导致任务失败。

行业基准测试表明，在此之前，通用具身模型在非结构化真实场景中的长周期任务成功率，普遍低于30%。这一数据距离规模化商用所要求的稳定性和容错率，存在显著差距。这也解释了为何当前市场机器人多局限于路径固定的清洁、导览等任务，而难以承担需要灵活应变的家政服务或小批量柔性制造。

GO-2的突破性在于其“动作思维链”架构。该技术重塑了机器人的决策流程，使其成为一个“规划先行”的智能体。在接收到指令后，模型首先在内部推理并生成一个结构化的高层动作序列，明确“先做什么、后做什么”。这实现了从“环境驱动”的被动反应，到“目标驱动”的主动规划的根本范式转变。

为确保规划能精准落地，GO-2采用了异步双系统协同架构。该系统由两个并行模块构成：一个低频运行的“战略规划系统”，负责生成和维持全局任务序列；另一个高频运行的“战术控制系统”，则专注于实时感知与局部动作微调。这种“宏观规划与微观调整”的解耦设计，有效隔离了环境噪声对整体任务目标的干扰，大幅提升了执行韧性。

公开的评估数据显示，在涵盖12类通用任务的标准化测试集中，GO-2的平均成功率较前代最佳模型提升了42%。在引入动态障碍物、光线变化等干扰的极端测试场景下，其任务完成稳定性提升幅度超过60%。这些指标确立了其在具身智能领域的性能领先地位。

技术的真正考验在于实际部署。目前，GO-2已在多个前沿场景完成验证。在工业柔性产线上，集成GO-2的协作机器人可自适应完成多规格、混流零部件的精准抓取与分拣，无需针对每个新品进行耗时的人工示教。在家庭环境中，机器人执行如整理杂乱桌面、折叠不同材质衣物等非刚性任务时，其误操作率较传统方案降低了90%以上。

从产业影响看，“动作思维链”这类底层架构的突破，通常预示着应用拐点的临近。行业分析认为，随着执行可靠性的数量级提升，未来三年，通用服务机器人在特定场景的市场渗透率有望从个位数增长至20%以上。同时，工业协作机器人的应用范围，也将从程序化的装配环节，延伸至设备巡检、故障排查等高度非结构化的运维场景。一个真正实现“手脑合一”的智能体实用化阶段，正在开启。

智元GO-2具身大模型深度评测：首创动作思维链如何刷新行业SOTA

相关阅读

最新教程

最新资讯