阿里具身智能大模型Qwen-Robot系列权威评测

2026-06-17阅读 0热度 0

Robot

具身智能技术从实验室迈向真实场景时，核心挑战是：机器人如何精准理解指令并在复杂环境中自主执行任务？6月16日，阿里巴巴发布千问具身智能大模型Qwen-Robot系列，为各类机器人打造了一个能够解析自然语言、感知三维空间、并遵循物理定律的“统一底层平台”。

该系列包含三款核心模型——既可独立运作，也能像协作团队般联动，这标志着千问家族首个完整的具身智能矩阵正式落地。

先看负责核心操作的Qwen-RobotManip。传统模型在切换机器人平台时性能骤降。为解决这一痛点，该模型采用统一动作表征，并在海量开源语料上完成超过38000小时的预训练。第三方权威测评中，其不同版本直接包揽任务成功率前两名——从拧水龙头这类基础操作，到双臂倒薯条等复杂高难度动作，均实现突破性进展。

接下来是赋予机器人“认路”与“跑腿”能力的Qwen-RobotNa v。该模型将任务指令理解、目标搜索和自动驾驶等五大导航功能整合到同一框架中。其亮点在于“任务自适应观察机制”，让机器人摆脱僵化的记忆策略，灵活实现“边走、边看、边规划”。即使在完全陌生的空间内，也能高效完成寻物任务。

最后是提升机器人“思维”深度的Qwen-RobotWorld模型。它本质上是一个物理世界模型——如同运动员赛前预演动作，机器人能对下一时刻的物理状态和动作进行推演。这不仅弥补训练数据不足的短板，更关键的是，机器人在实际动手前即可完成轨迹预演，确保操作精度分毫不差。

通过三大模型的协同，具身智能系统将视觉感知、语言理解和动作决策深度融合。随着这一系列模型落地，机器人执行任务的泛化能力显著增强——这也意味着，机器人真正步入日常生活场景的进程正在加速。

阿里具身智能大模型Qwen-Robot系列权威评测

相关阅读

最新教程

最新资讯