宇树最大对手再分家,机器人行业竞争升级

2026-06-28阅读 0热度 0
机器人

智元与宇树在具身智能赛道的竞争日益白热化。继成立灵巧手子公司“临界点”后,智元再度落子数据领域,孵化出独立公司“觅蜂科技”。

觅蜂科技刚官宣完成数亿元天使+轮战略融资。这家公司瞄准的,正是行业最热切且资源最紧缺的环节之一:数据采集、清洗与流通体系建设。

谈智元,绕不开宇树。2025年,宇树纯人形机器人实际交付量突破5500台,对外宣称全球出货量居首;智元则在今年3月高调宣布第1万台通用具身机器人下线。量产节奏与商业化进程,双方始终被并置比较。

但这次,智元将竞争边界拉到了机器人硬件本体之外。

背后的关键信号是:智元联合创始人、总裁兼CTO彭志辉曾公开指出,智元并不缺资金,真正稀缺的是高质量数据。这句话直接揭开了整个具身智能行业正在经历的“数据饥荒”现状。

数据:比算力更稀缺的具身智能核心资产

进入具身智能时代,数据的战略价值正快速逼近大模型时代算力的地位。

大模型消耗的是数字世界的语料:网页、文档、代码、论文。但具身智能系统必须理解物理世界。机器人需亲身拿起水杯、推开房门、整理衣物,才能在动作与反馈之间建立深层认知。

这意味着所需数据远不止图像,还包含触觉反馈、力控信号、关节运动轨迹、多传感器时序同步等多模态信息。每条高质量的真机数据,几乎都对应一次真实的物理交互。

觅蜂科技在发布会上披露了一项数据:训练GPT-5级别的大模型所需的语料规模约为百亿小时量级;而当前全球可用于具身智能训练的高质量有效数据,仅约50万小时。

斯坦福大学HAI《2026年AI指数报告》的另一组数据同样值得关注:在RLBench仿真操作基准中,机器人任务成功率最高已达89.4%;但在更贴近真实家庭场景、任务链条更复杂的BEHA VIOR-1K仿真基准中,完整任务成功率仅为12.4%。

两项测试基准不同,但指向同一事实:机器人在短周期、结构化、受控环境中进步显著;一旦面对开放、动态、多步骤的真实任务,能力断层依然明显。

而高质量、多样化、覆盖广泛场景的真实世界训练数据不足,正是造成这一断层的关键瓶颈之一。

换句话说,当前机器人的能力短板,很大程度上源于“见过的真实世界太有限”。

因此,具身智能数据采集这一新兴赛道正快速崛起。

主流方式仍是真机遥操作:由真人远程操控机器人执行任务,同步记录视觉画面、动作指令与系统状态。这种方式数据质量高,但成本不菲、人力依赖强、规模化难度大。

真机遥操作示意图

觅蜂CEO姚卯青曾指出,国内一小时真机采集数据的成本通常在500元至1000元之间,还需协调机器人本体、专业操作员与适配场景三方资源,扩张效率受限。

另一条路径是仿真数据生成。企业借助数字孪生与高保真物理引擎,在虚拟环境中驱动机器人完成海量任务训练,降低采集门槛。但长期困扰行业的“Sim-to-Real鸿沟”依然存在——虚拟中学到的策略难以无缝迁移到现实物理世界。

即便数据采集完成,后续挑战才刚刚开始。各家企业采用的机器人平台、传感器型号、通信协议与数据格式千差万别。同一个“抓取杯子”的动作,在不同系统中可能被编码为完全异构的数据结构。大量原始采集数据还需经历清洗、标注、时空对齐、结构化建模等复杂处理流程,才能投入模型训练。

因此,当前多数企业仍停留在“自采—自用—自训”的闭环模式,数据资产高度分散、标准不一、复用率低。

随着数据价值持续凸显,竞争焦点正从机器人本体逐步延伸至数据采集、治理与流通等底层基础设施层面。行业整体到底缺多少数据?目前尚无权威统一口径。但可以明确的是,单靠某一家企业闭门造车式的自建采集体系,几乎不可能覆盖通用机器人所需应对的海量真实场景。

谁能率先构建起标准化、可扩展、高可用的数据供给网络,谁就更有可能成为本轮产业爆发中的“卖铲人”。

觅蜂科技瞄准的,正是这一结构性机会。

从采集到治理:构建可调度的数据基础设施

当然,数据采集只是起点,觅蜂的野心远不止于此。

当前业内高质量数据采集仍严重依赖机器人本体:企业须采购设备、部署场地、招募操作员,并通过遥操作完成采集——其中机器人硬件往往是最大成本项。

觅蜂在保留真机采集方案的同时,推出了MEgo系列“无本体采集”产品,包括MEgo View头戴式采集终端与MEgo Gripper采集夹爪。

MEgo系列采集设备

操作员佩戴或手持设备后,即可在超市、工厂、住宅等真实环境中自然记录操作行为,无需机器人全程参与。相比传统真机遥操作,无本体采集大幅降低了硬件门槛与部署复杂度,更利于规模化铺开。根据觅蜂的规划,其2026年目标产能中,60%至70%将由无本体采集方式贡献。

但采集只是第一步,能否高效治理、转化为可用训练集,才是真正决定数据价值的关键环节。

原始采集数据往往夹杂噪声、冗余帧、无效交互片段,还需完成时间轴对齐、6D轨迹重建、空间感知建模、质量筛选与细粒度标注等多重工序。即使坐拥海量原始数据,若缺乏系统性治理能力,也难以为模型训练所用。

为此,觅蜂将核心研发力量投向数据治理环节。其自主研发的MEgo Engine数据治理引擎,覆盖数据清洗、6D位姿重建、空间语义建模、质量校验、智能评分与自动化标注全流程。据官方信息,其自动标注效率较传统人工方式提升超10倍,目标是让采集后的数据更快、更稳地进入模型训练管道。

觅蜂不仅出售原始数据,更致力于提供“从原始数据到训练集”的一站式处理能力。

在更高维度,觅蜂还搭建了数据商城,尝试将零散、异构的数据资源进行标准化封装与接口化输出,面向全行业开放共享。

这一思路与早期云计算发展路径高度相似:云厂商将算力抽象为按需调用的服务,觅蜂则希望将数据本身也变成一种可交易、可组合、可复用的基础性生产资料。

按公司规划,觅蜂将于2026年实现千万小时级数据产能,并启动“蜂巢数据共创行动”,联合云服务商、场景方及行业组织,力争在2030年前达成百亿小时级数据规模。

这些仍是产能目标,能否如期落地,取决于硬件量产进度、采集网络建设效率以及真实订单转化能力。

但即便如此,资本市场已率先为这套逻辑投票。今年2月,觅蜂科技完成数亿元种子轮与天使轮融资,由红杉中国领投;6月再获数亿元天使+轮战略融资,由国方创投领投,多家产业资本与地方国资平台跟投。阿里云、百度智能云、京东云等头部云厂商也已与觅蜂签署战略合作,内容涵盖数据生态共建、场景协同开发及算力底座支持。

至此,从智元孵化而出的两家公司已各自锚定不同赛道:临界点聚焦灵巧手这一关键硬件节点,觅蜂则深耕具身智能的数据底座。

不过,独立融资虽为觅蜂打开了对外服务的空间,却并未天然化解同行对其“中立性”的疑虑。

中立性挑战:竞争对手会信任觅蜂的数据服务吗?

觅蜂首先要跨越的,是信任门槛——中立性。

其提出的“蜂巢数据共创行动”,本质是在构建一个跨企业的行业级数据协作网络。但要吸引其他机器人厂商加入,觅蜂必须证明:客户的专属数据不会流向智元,也不会被其他客户越权访问或使用。

姚卯青曾在公开场合回应此问题。他表示,觅蜂的数据交易采用“使用权”与“所有权”双轨制;对于购买数据所有权的客户,公司将完成完整资产交付,并在本地彻底销毁所有副本。甚至智元若需调用觅蜂数据,也须以市场化方式下单采购,不存在内部免费通道。这些机制至少在制度层面划清了数据隔离的红线。

但要让智元的竞争对手持续采购、长期合作,觅蜂还需通过法律协议约束、权限分级管理、交付审计流程及第三方合规认证,持续夯实其“可信中立第三方”的身份。

毕竟,对智元的竞对而言,选择觅蜂并非唯一解,也不是非选不可。京东已推出JoyEgoCam采集终端、具身数据基础设施及数据交易平台,并设定两年内积累超1000万小时真实场景视频数据的目标;鹿明机器人正加速布局无本体采集;灵初智能主打人类真实操作行为数据;光轮智能则聚焦合成数据生成与仿真基础设施建设。

它们争夺的,本质上是同一件事:将碎片化的物理世界场景与原始行为数据,转化为可持续供给、可泛化迁移、可迭代训练的高质量数据资产。

觅蜂还需同时应对“规模”与“质量”双重考验。千万小时目前仅为产能规划,而非已交付成果;无论是真机采集还是无本体采集,扩大规模均意味着持续投入硬件、人力与场景资源。若无法解决数据真实性、多样性与泛化能力问题,再庞大的数据集也可能沦为低质重复。

数据质量与规模的双重考验

最终决定觅蜂能否形成正向网络效应的核心变量,仍是同行对其的信任程度。值得肯定的是,智元推动觅蜂独立融资运营,至少为其争取到了对外服务的制度空间。

倘若数据始终封闭于智元体系内部,最多只能提升单一企业的模型竞争力;唯有经过标准化、商品化,并获得主流机器人厂商的认可与接入,才有望成长为支撑整个行业的新型基础设施。

说到底,对觅蜂而言,“千万小时产能”只是入场券。唯有当智元的竞争对手们愿意长期向它采购数据、委托数据处理,甚至将核心任务数据交由其托管与治理,这门生意才算真正立住脚跟。

免责声明

本网站新闻资讯均来自公开渠道,力求准确但不保证绝对无误,内容观点仅代表作者本人,与本站无关。若涉及侵权,请联系我们处理。本站保留对声明的修改权,最终解释权归本站所有。

相关阅读

更多
欢迎回来 登录或注册后,可保存提示词和历史记录
登录后可同步收藏、历史记录和常用模板
注册即表示同意服务条款与隐私政策