伯牙智能获数千万天使轮融资,阿里前高管打造灵巧操作系统
灵巧手不应被简单视为机器人末端的硬件模块,它本质上是一套能够在真实物理世界中执行感知、在线修正并持续自进化的操作系统。这背后牵涉到技术路线选择、场景落地策略以及商业闭环的深层考量。
机器人灵巧手创业公司伯牙智能近日宣布完成数千万元天使轮融资。本轮由乾融控股领投,苏创投、熙诚致远跟投。所筹资金将重点用于高自由度灵巧手的迭代升级、软硬件研发团队扩充,以及在真实应用场景中积累操作数据和构建解决方案。
伯牙智能成立于2024年8月,创始人兼CEO刘欣具备深厚的智能汽车与操作系统产业背景。他曾担任阿里巴巴技术总监、阿里斑马智行产品负责人,后出任蔚来汽车乐道智能化产品负责人,长期致力于软硬一体复杂产品的定义与落地。在他看来,智能汽车与机器人在底层技术栈上高度同构:两者都需要感知、计算、控制以及对物理空间的理解。核心差异在于,汽车感知空间是为了规避碰撞,而机器人感知空间是为了与真实世界产生交互。
伯牙智能创始人兼CEO刘欣,图片来源:甲子引力
这样的团队基因决定了伯牙的产品哲学:既要精通复杂的软硬件系统工程,也要吃透机器人本体、控制算法与前沿研究。其核心目标,是将高自由度灵巧手从一个纯粹的机械末端,升级为融合硬件结构、触觉感知、力控算法与真实数据反馈的“灵巧操作系统”。
1. 技术取舍:基于人手生理学特征的混合驱动架构
过去一年,灵巧手赛道热度飙升,但技术方案也开始趋同。20个以上自由度、五指仿生、触觉感知、混合驱动、力位混合控制、仿真生态、大小脑架构——这些几乎成了高端灵巧手的标准配置。那么,什么才是真正的最优解?
力量与重量、速度与稳定性、触觉与成本、精密控制与柔顺性、硬件寿命与可维护性、模型泛化能力与真实任务成功率——这些是每一只灵巧手从实验室走向真实场景时,无法回避的现实约束。刘欣认为,技术路线本身并非决定性因素,关键在于要解决什么问题,以及为此做出怎样的取舍。
伯牙智能并未将灵巧手定义为孤立的机械末端。在许多系统中,机械臂负责将手送到目标位置附近,灵巧手则执行抓取与操作。按此逻辑,灵巧手公司最易讲述的是硬件参数:自由度、重量、负载、指尖力、触觉分辨率。但在伯牙看来,这种定义远远不够。
伯牙灵巧手夹取螺丝,图片来源:伯牙智能
机器人真正进入真实场景后,问题远不止“把手伸过去”那么简单。接触物体后会发生什么?杯子是否滑动?布料是否被拉紧?瓶身是否被捏变形?螺丝是否拧到位?这些问题都发生在接触之后,既不是单纯的视觉问题,也不是纯粹的机械结构问题,而是结构、驱动、触觉、力控、算法与数据共同作用的结果。因此,伯牙更倾向于将灵巧手定义为一套“灵巧操作系统”。
在这套系统中,硬件只是第一层。自由度、力量、重量和速度决定了手能否完成基础动作;触觉与力反馈决定了它能否感知所触碰的对象;控制系统决定了它能否在接触瞬间做出调整;数据与模型则决定了它能否在一次次成功与失败中持续进化。伯牙的首发产品——高山S1灵巧手,正是在这一逻辑下定义的。
高山S1灵巧手,图片来源:伯牙智能
高山S1重量不足500克,接近人手的自重,配备22个自由度和30N指尖力。从参数上看,它无疑属于高端灵巧手。但伯牙真正想强调的是这些指标背后的系统权衡:末端不能过重,否则会影响整机负载与动作效率;力量不能过小,否则无法完成真实抓握;自由度不能太低,否则难以覆盖复杂操作;结构又不能过度复杂,否则维护与量产会成为瓶颈。
这种取舍直接体现在驱动结构上。行业内,绳驱、直驱、连杆常被视为不同技术路线的标签。但伯牙并未简单选择其中一种,而是将手掌、小臂和手腕这三个看似“孤立”的部件组成协同系统。刘欣指出,人手的轻末端与大力量之所以能共存,关键在于力量并非全部来自手掌内部。主要驱动力来自小臂肌肉,通过肌腱传递至手指;手掌内部的小肌肉则更多负责精细调整。伯牙的混合驱动路线,正是沿着这一生理学思路展开的。
在高山S1中,抓握力量主要由小臂端驱动模块提供,通过腱绳传递至手指;手部保留用于外展、内收等精细动作的驱动单元;手腕则通过独立自由度扩大操作空间。这套设计在高自由度、轻量化和大力量之间找到了一个可交付的平衡点。刘欣用一个生动的比喻解释:“如果重工业客户需要单根手指承重5公斤,我们可以在不大改设计的前提下放大电机,就像一个人去健身房撸了半年铁,手变粗了,力量自然就上来了。”
2. 评价标准:从“精准重复”转向“实时修正”
机器人行业的许多评价标准源自传统工业机器人体系。例如重复定位精度,因为传统工业机器人面对的是高度结构化的产线任务,环境稳定、目标明确,核心能力就是精准重复同一动作。但灵巧手面对的是另一个世界:真实物体往往不是标准件。在这种场景下,“回到同一个位置”只是问题的一部分,更重要的是接触物体后,系统能否根据反馈修正动作。
因此,刘欣认为,在智能机器人时代,单纯强调重复定位意义有限。“你闭着眼睛,让手指重复一百次同样的角度,其实做不到。人类完成精细操作,靠的不是绝对重复定位,而是多模态反馈。”所以,评价标准必须从“精准重复”转向“实时感知与修正”。伯牙在硬件、控制和数据三个维度上展开了系统性布局。
首先在硬件基座上,通过降低物理延迟为感知修正留出空间。轻量的手部本体降低了运动惯性,确保了操作调整的响应速度;高达1000Hz的控制频率与3Hz的开合速度,让硬件能够快速响应指令;搭配0.01N的指尖触觉分辨率,使得灵巧手在接触的毫秒级时间窗口内具备高精度反馈与调整能力。这一思路也让腱绳的蠕变、磨损等不再是必须隐藏的脆弱点。伯牙通过材料、结构和保护设计,已将腱绳的使用寿命提升至数十万次。即便出现蠕变,也能通过“感知-修正”系统维持控制精度。对于腱绳的磨损与寿命问题,刘欣认为,在尽可能提高寿命的同时,让其便于维护和更换更为关键。他用了生活化的类比:“吉他弦也会断,但没人因为吉他弦会断就不买吉他。关键是弦能不能方便更换。”
其次在控制架构上,解耦复杂决策与高频执行,确保自适应调整能力。真实接触发生在极短的时间窗口内。手指碰到瓶身的一瞬间,力是否过大、物体是否滑移、指尖姿态是否需要调整,都需要系统快速响应。如果每一次接触和力控修正都交给端到端大模型重新推理,延迟和算力都会成为瓶颈。这正是行业转向“大小脑分层架构”的原因。大脑负责低频的复杂任务理解与规划,小脑负责高频的底层动作执行。这种分层的优势在于,大脑无需占用小脑的高频控制资源,小脑也不必每一步都等待大模型重新推理。前者解决“做什么”和“大致怎么做”,后者解决“接触之后如何稳定做成”。当硬件性能出现下滑时,这种解耦的系统仍有机会维持任务完成能力。
大小脑分层模型,图片来源:伯牙智能
在实际使用中,灵巧手不可能永远处于理想状态。腱绳可能逐渐磨损,传动间隙可能发生变化,传感器信号也可能出现噪声。在大小脑分层架构下,即便小脑执行的动作变慢、抖动或出现偏差,只要上层大脑仍能给出任务目标和策略约束,底层控制就可以围绕反馈持续修正;而完全端到端的方案,在硬件状态变化后,往往更容易出现泛化问题。伯牙的思路并非试图从硬件中消除所有不确定性,而是通过感知、控制和学习,将不确定性纳入系统闭环。
最后在数据层面,用“不完美的数据”让系统在真实环境中学会实时修正。刘欣并不认为只有“成功动作”才有价值。在真实操作中,一次抓取失败、一次打滑、一次差一点成功的动作,都可能帮助模型理解任务边界。“特别糟糕的数据当然要剔除,但次优数据有价值。它能告诉你,失败是怎么发生的。”如果说成功数据告诉系统“应该怎么做”,那么失败数据和次优数据则告诉系统“边界在哪里”。对于灵巧操作来说,这类数据尤其重要。因为真实世界中的许多失败并非灾难性的,而是发生在接触瞬间:力用大了、角度偏了、摩擦不够、物体开始滑移。只有记录这些过程,系统才有机会在下一次操作中提前修正。从这个角度看,伯牙的硬件、控制和数据思路都指向同一个目标:不是打造一只在实验室里重复定位最精准的手,而是打造一套能在真实世界中感知变化、处理误差、持续修正的灵巧操作系统。
3. 落地路径:不急于进入家庭场景
在人形机器人的叙事中,家庭一直是最具想象力的终极市场。一台机器人走进家庭,整理房间、端茶倒水、洗衣做饭、照顾老人和孩子——这是大众对具身智能最直观的图景。灵巧手作为机器人与物理世界交互的末端,也天然会被放进这个想象中。但伯牙智能并未将家庭作为首个主战场。
家庭场景并不适合早期产品快速验证。这里的物品种类繁杂,任务边界模糊,安全要求高,用户对价格和稳定性的容忍度也低。相比之下,科研机构和部分行业客户更像是高自由度灵巧手的早期入口。科研客户是伯牙最早面对的一批“开发者用户”。过去,很多机器人研究集中在移动、导航、机械臂控制等领域;但当机器人开始进入真实操作任务时,末端执行器的重要性被重新放大。对于科研机构来说,一只足够开放、可控、具备触觉与力控能力的高自由度灵巧手,本身就是开展操作学习、模仿学习、多模态感知和机器人控制研究的重要平台。这类客户的特点是:未必马上要求完整的行业解决方案,但对自由度、接口、传感器、控制能力和开发环境有较高要求。因此,科研市场不仅能带来早期收入,也能帮助伯牙建立开发者生态。
高山S1灵巧手执行抓取任务,图片来源:伯牙智能
除了科研市场,伯牙更看重的另一类早期场景,是那些已经具备明确人力成本压力、危险性或柔性操作需求的行业客户。刘欣判断,危险环境中的远程作业、海外高人工成本地区的服务与操作任务、需要处理多品类小批量零件的柔性装配,以及部分服务业场景,可能会更早落地。这些场景不一定要求机器人一开始就做到完全自主,很多时候,只要先实现远程化,就已经能创造价值。在高危环境中,让人离开现场本身就是价值;在人工成本高的地区,一个操作员远程管理或接管多台设备,也可能产生经济性;在柔性作业中,如果机器人可以完成部分重复操作,人类只在复杂环节介入,也能提升效率。商业化并不只有“全自动替代人”这一条路,远程操作、半自主操作和人机协同,都可能成为灵巧手的早期落地形态。
这也解释了为什么伯牙不愿意只做一个零部件供应商。对于灵巧操作来说,数据不只是训练材料,也会反过来定义产品迭代方向:哪些动作最常发生?哪些物体最难抓?哪些任务最容易失败?哪些传感器信号真正有用?哪些结构设计在真实使用中最容易磨损?这些问题很难仅靠实验室假设回答,必须进入真实场景才能被发现。如果只卖一只机械手,伯牙能获得的是硬件收入;但如果进入科研平台、行业客户和真实场景试点,它获得的将不只是订单,还有真实操作数据、任务反馈和工程迭代线索。硬件、控制、模型和数据之间,必须形成闭环。
刘欣认为,在高精度灵巧操作中,真机数据目前仍然非常关键。仿真当然有价值,尤其适合做算法预训练、任务验证和大规模实验,但灵巧手的接触、摩擦、形变、滑动和微小力反馈非常复杂,sim2real的差距依然存在。很多看似细微的接触差异,都会影响真实抓握和操作的稳定性。因此,伯牙希望通过科研客户、行业客户和真实场景试点,逐步积累高质量操作数据。这些数据不会简单开源,但公司会提供开发环境和生态支持,包括兼容ROS、Gazebo、MuJoCo、Isaac等机器人开发生态,让更多开发者和客户能基于伯牙的硬件和控制系统开展二次开发。
从这个角度看,伯牙的商业化路径与技术路线是一体的:先进入科研和行业场景,一方面可以更快形成收入,另一方面也是为了让产品在真实任务中被使用、被反馈、被修正。每一次真实抓取、每一次失败恢复、每一次远程接管,都会成为下一轮硬件设计、控制策略和模型训练的输入。这才是伯牙想要滚动起来的数据飞轮:不是先闭门造出一只完美的手,再等待通用机器人时代到来;而是在真实场景中边卖、边用、边采集、边迭代,让灵巧手从一个硬件部件,逐渐变成机器人操作能力的底层入口。






