具身智能数据赛道新锐崛起:72天产能破千万小时深度解析
具身智能的Scaling Law遇到瓶颈了吗?
并非如此。真正的制约因素,可能比预想的更为具体——当前物理AI能够获取的真机交互数据规模,尚不足大型语言模型训练数据量的两万分之一。
这片“数据荒漠”不仅储量匮乏,更因标准不一、质量良莠不齐以及供需脱节而显得混乱。若无法实现高质量、标准化物理数据的规模化供应,具身智能技术将难以走出实验室的验证阶段。
变革正在酝酿。4月16日于上海张江,一家成立仅72天的创新企业——觅蜂科技(Maniformer),正式公布了其解决方案:MEgo系列无本体数据采集硬件。
该方案的核心,在于一只重量仅480克的多模态“机器手”与一个具备300°全景视野的感知终端。其设计目标直指行业痛点:解决物理世界数据采集成本高昂、效率低下、多源同步困难的难题。
同步,觅蜂科技发布了物理AI数据服务平台与MEgo Engine数据治理引擎,联合权威机构启动了“蜂巢数据共创行动”,并与京东云、百度云、阿里云等多家头部企业确立战略合作。这一系列举措显示,具身智能的数据基础设施构建,正由这家初创公司加速推动。
破解具身智能数据困局,构筑物理AI数据基座
发布会上,觅蜂科技董事长兼CEO姚卯青指出,AI正从数字领域深入物理世界,具身智能已成为下一代计算架构的核心方向。
△觅蜂科技董事长兼CEO姚卯青
然而,行业面临的“数据荒漠”挑战极为严峻。物理AI的真机数据量与大语言模型存在数个数量级的差距,叠加标准缺失、质量波动与供需错配,严重阻碍了技术从研发到产业化的进程。
为此,觅蜂科技将自身定位为一站式物理AI数据服务平台,以“整合全球数据服务于AI”为愿景,专注于构建具身智能数据的平台化供应基础设施,旨在实现数据供给的体系化、标准化与规模化。
区别于传统数据服务商,觅蜂的布局更为深入。其核心是构建一套完整的物理AI数据基础设施,覆盖真机遥操、无本体采集、仿真数据全范式,并贯通硬件、软件、平台与运营全链路。最终目标是提供类型全面、质量可靠、交付高效的“全、好、快”数据服务,让高质量数据如同基础设施资源般即取即用。
MEgo系列硬件发布,确立高保真全场景数据采集新标准
本次发布的核心是MEgo系列无本体数据采集硬件。其中,MEgo Gripper是一款面向通用场景的轻量化多模态数据采集夹爪。480克的极致重量设计,使其在全场景移动作业中近乎无感。
该设备集成了行业领先的毫米级轨迹重建技术,操作轨迹还原精度达1毫米。同时,通过亚毫秒级全局时间同步技术,实现了视觉、触觉、姿态等多模态数据的精准对齐,力求完整复现物理交互的每一个细节。
依托200°鱼眼镜头与三维触觉阵列,MEgo Gripper可与另一产品MEgo View实现原生协同,完成多终端数据无缝采集。最终输出的是包含视觉、深度、IMU、运动轨迹、多维触觉、夹爪状态在内的全维度交互数据集。
其亚毫秒级同步能力与Wi-Fi 6高速传输特性,确保了数据采集过程的高效与精准,旨在为具身智能模型训练提供高保真的物理交互素材。
MEgo View则被定义为行业首创的全场景、全视角、多模态空间感知采集终端。它创新性地采用了“超300°全景感知+腕部交互特写”双视角采集方案——头部相机实现300°超广域环境覆盖,腕部相机精准捕捉手部操作细节。所有通道均支持1080P 60fps高清视频流,旨在全方位捕获物理世界的实时交互信息,为复杂场景下的精细化操作数据采集提供了新范式。
MEgo View深度融合了亚毫秒级无线时间同步与硬件级精准触发技术,致力于实现多传感器数据在时间与空间维度上的完全对齐,旨在从根本上解决物理世界多视角数据时空难以统一的行业难题。
凭借轻量化、全无线、电池快换的设计,该设备可在工业产线、家庭服务、户外作业等各类复杂工况下灵活部署,实现“随行即采”,为模型训练提供高保真、高同步的全域空间感知数据。
当然,无本体采集虽能显著降低成本,但行业普遍面临因传感器布局差异导致的数据偏差问题,通常需要依赖大量算法补偿,才能打通从模型训练到真机部署的链路。
MEgo系列产品的一个关键优势,在于其与精灵G2 Air机器人具备原生同构特性。这意味着从数据采集源头,就确保了UMI(无本体)采集数据与真机数据的同源一致性,为模型训练提供高质量、无差异的数据样本,从而显著提升从采集、训练到部署的全链路效率。
基于MEgo系列同构型传感器和夹爪一致性数据训练出的模型,可以无缝对接并部署到G2 Air机器人上,快速实现机器人的自主作业能力。
据姚卯青介绍,依托全流程质检体系与正在构建的全球化采集网络,觅蜂科技计划在2026年实现千万小时级的数据产能,力求在数据质量与规模上均达到行业标杆水平。
蜂巢数据共创行动全球启动,构建开放协同数据生态
独行快,众行远。为推动产业协同,觅蜂科技联合上海电器科学研究所、国家数据标委会、工信部赛迪研究院,共同发起蜂巢数据共创行动。北京人形机器人创新中心、上海国地中心、灵初智能、帕西尼感知科技、大晓机器人、无界智航等数十家海内外机构成为首批响应单位。
该行动旨在打破数据孤岛、统一数据标准、链接全球供需,目标是构建一个开放高效的物理AI数据流通网络。最终愿景是让数据需求方便捷获取所需数据,让数据服务商精准对接市场需求,实现数据价值的高效流转。
觅蜂科技期望联合全球伙伴,共建标准、共享能力、共赢市场,目标是到2030年达成百亿小时级的数据产能,共同构建全球最大的物理AI数据生态,加速具身智能产业的规模化应用。
发布会上,贵州省大数据发展管理局党组书记、局长兼省政府副秘书长朱宗尧就数据工厂与新型基础设施发表演讲,对觅蜂科技在数据标准化、生态化建设方面的探索给予了积极评价。
随后,觅蜂科技与京东云、百度云、阿里云、猎聘、贵州大数据集团、张江集团举行了战略签约仪式,各方将在数据生态、场景协同、算力支撑、人才建设等领域展开深度合作,共同构筑物理AI数据产业的新生态。
具身智能的规模定律,最终依赖“数据基座”驱动
发布会同期举办了题为“共筑物理AI数据生态,驱动AGI未来”的圆桌论坛。论坛由具身研习社主编吕鑫燚主持,与会嘉宾包括觅蜂科技姚卯青、极佳视界朱政、光轮智能谢晨、原力灵机范浩强、智源研究院姚国才、阿里云张民英等业界代表。
讨论围绕数据生态构建、真机与仿真数据融合、世界模型的数据瓶颈、数据规模与能力涌现等核心议题展开。
各方达成一项基本共识:具身智能的核心竞争力,本质上是数据采集与转化效率的竞争。行业未来必将走向标准统一、供需协同、真机与仿真互补的平台化格局。论坛预测,到2026年底,全产业的有效数据量级有望突破千万小时,这将为具身智能的规模化落地奠定最关键的数据基础。
姚卯青在总结中强调,2026年将是具身智能的数据元年。觅蜂科技将以平台化供给为核心战略,以“蜂巢行动”为生态纽带,与全球伙伴共建数据生态、共享产业红利,目标是为即将到来的AGI时代,筑牢最坚实的数据根基。