智元GO-2具身大模型深度评测:首创动作思维链如何刷新行业SOTA

2026-05-20阅读 0热度 0
具身智能

2026年4月9日,智元机器人推出其新一代具身智能基座模型Genie Operator-2(GO-2)。此次发布的核心在于其首创的“动作思维链”技术,该技术直接解决了机器人从“语义理解”到“物理执行”的可靠性瓶颈。相关论文已被CVPR 2026收录,其综合性能指标刷新了行业纪录,为机器人在动态复杂环境中的鲁棒性操作提供了全新解决方案。

无论是服务机器人还是工业协作机器人的终端用户,都曾面临指令执行偏差的困扰。例如,执行“取水杯”这一简单任务,机器人可能碰倒周边物品,或在遇到轻微障碍时陷入停滞。这一问题的根源,在于传统具身模型采用的“感知-执行”端到端映射存在固有局限。智元GO-2的研发,正是为了攻克这一长期阻碍行业发展的核心工程难题。

尽管大语言模型已极大提升了机器人的指令解析与上下文理解能力,但物理世界的执行是另一重挑战。传统模型将视觉等感知信号直接转换为底层电机控制指令,缺乏对任务步骤的显式分解与规划。这类似于不预判路径便盲目行动,一旦环境出现训练集之外的微小扰动,执行链路易发生崩溃,导致任务失败。

行业基准测试表明,在此之前,通用具身模型在非结构化真实场景中的长周期任务成功率,普遍低于30%。这一数据距离规模化商用所要求的稳定性和容错率,存在显著差距。这也解释了为何当前市场机器人多局限于路径固定的清洁、导览等任务,而难以承担需要灵活应变的家政服务或小批量柔性制造。

GO-2的突破性在于其“动作思维链”架构。该技术重塑了机器人的决策流程,使其成为一个“规划先行”的智能体。在接收到指令后,模型首先在内部推理并生成一个结构化的高层动作序列,明确“先做什么、后做什么”。这实现了从“环境驱动”的被动反应,到“目标驱动”的主动规划的根本范式转变。

为确保规划能精准落地,GO-2采用了异步双系统协同架构。该系统由两个并行模块构成:一个低频运行的“战略规划系统”,负责生成和维持全局任务序列;另一个高频运行的“战术控制系统”,则专注于实时感知与局部动作微调。这种“宏观规划与微观调整”的解耦设计,有效隔离了环境噪声对整体任务目标的干扰,大幅提升了执行韧性。

公开的评估数据显示,在涵盖12类通用任务的标准化测试集中,GO-2的平均成功率较前代最佳模型提升了42%。在引入动态障碍物、光线变化等干扰的极端测试场景下,其任务完成稳定性提升幅度超过60%。这些指标确立了其在具身智能领域的性能领先地位。

技术的真正考验在于实际部署。目前,GO-2已在多个前沿场景完成验证。在工业柔性产线上,集成GO-2的协作机器人可自适应完成多规格、混流零部件的精准抓取与分拣,无需针对每个新品进行耗时的人工示教。在家庭环境中,机器人执行如整理杂乱桌面、折叠不同材质衣物等非刚性任务时,其误操作率较传统方案降低了90%以上。

从产业影响看,“动作思维链”这类底层架构的突破,通常预示着应用拐点的临近。行业分析认为,随着执行可靠性的数量级提升,未来三年,通用服务机器人在特定场景的市场渗透率有望从个位数增长至20%以上。同时,工业协作机器人的应用范围,也将从程序化的装配环节,延伸至设备巡检、故障排查等高度非结构化的运维场景。一个真正实现“手脑合一”的智能体实用化阶段,正在开启。

免责声明

本网站新闻资讯均来自公开渠道,力求准确但不保证绝对无误,内容观点仅代表作者本人,与本站无关。若涉及侵权,请联系我们处理。本站保留对声明的修改权,最终解释权归本站所有。

相关阅读

更多
欢迎回来 登录或注册后,可保存提示词和历史记录
登录后可同步收藏、历史记录和常用模板
注册即表示同意服务条款与隐私政策