宇树科技机器人动作生成测评:语音驱动实时操控全解析
5月19日,宇树科技发布了一段关键验证视频。视频采用一镜到底的拍摄手法,现场收声且未经剪辑,直观演示了其人形机器人G1如何仅通过外部语音指令,驱动AI自主实时生成动作序列。
宇树科技强调,此项演示的核心突破在于“实时生成”能力。机器人执行的所有动作,均由AI模型在接收到语音指令的瞬间自主计算并驱动执行,不依赖任何预编程的动作库或轨迹规划。这标志着人机交互向动态、自主的智能响应迈出了实质性一步。
在展示前沿技术潜力的同时,宇树科技也客观指出了当前阶段的挑战。由于完全依赖AI实时计算生成,系统在指令响应速度上仍存在可感知的延迟,动作的流畅度与执行精度也有明确的优化空间。这清晰揭示了从技术原理验证到高可靠性、高性能应用之间,所需经历的技术迭代与工程打磨路径。
理解G1的硬件配置有助于评估其能力基础。该机器人于2024年发布,身高约127厘米,体重35公斤。其运动灵活性源于23至43个关节电机的配置,并搭载了具备力感知与力控能力的灵巧手,为完成复杂的操作任务提供了必要的硬件支撑。
