具身智能融资排行榜:千寻、灵心巧手等五大玩家谁领跑?
2026年上半年,具身智能赛道融资热度不减,成为行业最醒目的底色。最近一场行业圆桌对话中,千寻智能、灵心巧手、星源智创、破壳机器人和蚂蚁灵波科技的几位负责人罕见同台,直面了行业最尖锐的几个议题。
这轮融资热潮还能烧多久?商业模式究竟是否走通?硬件链条够不够可靠?数据是否就是胜负手?还有,具身模型应该优先打磨基座能力,还是加速场景落地?
在这场对话里,几位创业者给出的判断并不统一,有的交锋激烈,有的互为印证。但所有讨论汇聚成一个共识:行业正处在关键的窗口期。以下为圆桌内容实录,经编辑整理。
融资热潮下的冷思考
王仲远:2026年上半年,融资热度确实高企——千寻智能三个月逼近50亿,星源智创成立不到一年拿了10亿,灵心巧手半年内完成B轮和B+轮,破壳机器人一个月拿了几千万美元天使轮,蚂蚁灵波背靠蚂蚁集团,资金储备也很厚实。先聊聊这波融资热吧——是商业化已经跑通,还是大家只是囤粮备战?
韩峰涛:密集融资的动机很直接——大家都在储备研发弹药。现阶段商业化还没跑通,规模落地仍需时间。但行业方向已经确认,很快将进入大规模模型预训练阶段,这对资金的需求是海量的。2026年是抢赛道席位、囤核心资源的关键窗口。如果今年拿不到头部级别的资金和估值,基本就失去了参与基础大模型研发的资格。
朱兴:具身智能与自动驾驶类似,是长周期赛道,目前仍处于技术驱动的早期阶段。不过经过两年发展,硬件、供应链、模型都有明显突破。2026年会有特定场景的小规模商业验证,2027年场景化落地节奏会明显加快。
许华哲:资本投入具身智能,本质上是在买一张通往物理世界通用智能的门票。数字AI已基本成熟,现在该押注的是物理世界——让机器人替代人类完成基础劳作。模型从VLA进化到世界模型后,研发资源消耗激增,没有大额融资支撑根本转不动。
周永:当前融资热潮远没到顶峰,这仅仅是序章。头部企业的估值,现在只是基于年出货1万台的体量——如果未来年出货量突破10万台,整个行业的资金体量会扩大十倍。对比新能源车和海外机器人赛道,国内具身智能企业的单轮融资规模其实偏小,成长空间非常大。
刘东:从资金使用上看,行业大致呈现7:3的分配——七成用于模型研发和技术储备,三成投入商业化落地验证。但不该只盯着人形机器人,工业自动化设备、机械臂这类硬件,也都能通过具身模型完成智能化升级。我们已经启动了多场景的商业化落地探索。
本体硬件,到底够不够成熟?
王仲远:现场做了个调研——当前机器人本体的产业链是否已进入成熟阶段?结果是一人同意、三人反对、一人中立。
韩峰涛(同意方):硬件的成熟度,得分情况看。如果以完美人形机器人的综合能力为100分,各板块差异很大:工业机械臂50分,轮式底盘40分,四足机器人30分,双足机器人15分,灵巧手只有5分,配套的AI能力更惨,只有3分。但大模型在快速赋能硬件,AI能力短期内能从3分拉到30-50分。从现阶段落地应用的角度看,当前硬件已经能支撑起大量潜在市场,所以我判定硬件具备阶段性成熟度。
朱兴(中立):过去两年,硬件和底层运动控制确实有关键突破,支撑了上层AI的落地尝试。但下一个核心主线是AI重新定义硬件——随着大脑级AI能力持续迭代,未来会对硬件架构和性能提出全新要求。当前的硬件体系,不一定适配得了未来的AI。所以我中立。
周永(反对方):远未成熟。硬件的成熟度可以分为三个阶段:第一阶段(60分)是“机器人生产机器人”,摆脱人工组装,解决一致性和成本问题;第二阶段(80分)实现机器人自主设计、自主生产,全程无需人工干预;第三阶段(95分)是高度模块化的自主运维——机器人交付后,能自己到配套站点换零件、快速恢复工作。目前行业连第一阶段都还没走完。
数据,是不是行业竞争的核心?
王仲远:一个明显的趋势是,行业竞争重心已从硬件转向数据。自动驾驶领域那条“十万、百万、千万小时数据”的逻辑,正在被引入具身智能。现场调研:数据是不是当下的重中之重?结果:全员同意。
韩峰涛:模型、算力、数据是AI三大核心。算力供给充足,模型架构也在持续迭代,所以高质量规模化数据成了目前最大的卡点。我们千寻智能是国内采用分布式模式采集高质量具身数据规模最大的企业,在全国布局了三十多万个数据采集点,有千人专职数据采集团队。从成立第一天起,数据就是第一核心战略。
朱兴:行业普遍存在一个问题——真机遥控数据重复度很高,有效且优质的数据非常稀缺。跟自动驾驶不一样,自动驾驶场景相对单一,数据边际效益递减。但具身智能领域,VLA模型、世界模型、物理原生基础模型的能力上限,完全由高质量数据量决定。我们去年投入大量资源,从海量真机原始数据里筛选优质数据做预训练,核心就是为了破解这个瓶颈。
许华哲:传统真机遥操作采集有三大痛点——量产能力不足、设备成本高、场景布设困难,尤其不适合家庭等复杂场景。当前更适配的是穿戴式轻量化采集方案:工作人员戴上数据手套、架个摄像头,就能采集多模态数据。这种方案可以依托大众居家场景做规模化采集,高效补齐复杂场景的数据缺口,也会催生新的数据采集业态。
周永:各家企业模型性能差距的核心,就在于数据体量和质量的差异。我们自研了触觉传感手套,可以同步采集视觉和触觉多模态数据,为全行业提供数据采集配套支持。此外,我们计划把高价仿生手的成本压缩到5000元以内,推动残障人士参与数据采集,实现技术普惠与数据规模化的双向赋能。
刘东:单纯比拼数据总时长意义不大,行业容易陷入“数据堆砌”的误区。我们摒弃了通用数据混叠积累的模式,聚焦物流、家庭等可商业化的垂直场景,定向采集场景专项高质量数据。深耕单一场域的数据体系,反而能更快加速模型迭代与场景落地。
模型能力、迭代路径与评测标准
韩峰涛:数字世界的AI技术已经接近成熟,它能完整掌握物理世界的理论知识。但具身智能的核心价值,就是把数字AI的能力迁移到真实物理世界。这必须依托海量真实场景数据。目前行业整体模型能力只有3分,未来靠规模化数据训练,完全可以快速拉到50分。我们千寻模型能反超英伟达、对标谷歌,核心优势就是高质量的积累。2026年会是模型能力分层的关键节点——谁有数据积累,谁就有壁垒。
朱兴:行业的下一个核心目标,是打造物理原生基础模型,而不是简单迁移复用数字AI能力。数据是根基,模态多元化是未来的关键。第一视角Ego数据加上高精度触觉数据,打通视觉和力觉两大模态,是下一阶段数据规模化积累和模型能力升级的核心方向。
许华哲:行业普遍存在“重榜单、重演示、轻落地”的问题。具身模型缺乏普惠的硬件载体,普通用户没法实地测试体验,模型性能怎么样,只能听企业自己说。下一阶段的竞争,核心应该是打造“拿来就能用”的落地级模型,用真实实操体验替代榜单分数比拼。
周永:行业亟需一个统一的模型落地评测标准。新场景的部署时长,应该是一个核心指标。目前一个新场景从零部署需要1-2个月,未来成熟模型应该能一周快速部署,标准化场景一天完成。另外,手物交互是物理交互的核心短板——很多模型能精准规划机械臂轨迹,但手部抓取和物件交接环节的容错率极低。这需要全行业合力补齐。
刘东:真机落地和端侧适配,是优质具身模型的两条硬性标准。第一,必须支持端侧独立部署,摆脱云端依赖,适应无网络、低延迟的真实场景。第二,要具备动作反思闭环能力——预测、执行、反思,持续提升任务准确率。我们即将发布的Omega EVA模型,就是目前全球运行速度最快、支持端侧部署的全身世界模型。现阶段,我们的底层方案已经服务了行业70%以上的头部企业。
王仲远随后做了调研:具身模型应该优先迭代基座模型,还是快速落地真实场景?结果是一人支持快速落地、三人中立、一人反对大规模仓促落地。
韩峰涛(反对方):现阶段模型的智能水平只相当于一两岁的孩子,场景部署和适配成本极高,根本不具备规模化商用条件。小规模试点可以积累需求、反向优化技术,但坚决反对大规模仓促落地。未来两年,核心任务是深耕基座模型预训练,夯实基础能力。预计2028年左右模型能力达标后,才会迎来大规模落地的窗口期。
刘东(支持方):基座模型迭代和场景落地验证必须同步推进。实验室环境再怎么人工优化,也复刻不了真实场景的复杂问题,模型适配真实场景需要1-2年的磨合周期。只埋头研发容易脱离实际需求。看看自动驾驶的发展经验——快速落地、持续迭代的企业,才能率先收获回报、规避技术路线偏差。
王仲远再问:行业是否需要第三方中立评测机构与赛事平台?多数嘉宾支持,许华哲是唯一反对的。
许华哲:商业化落地结果就是终极评判标准。第三方评测和行业赛事,存在应试优化的空间,而且无法复刻物理场景的所有变量。硬件、环境的细微差异都会导致评测失真,没法真实反映模型的实际能力。
朱兴:第三方评测有参考价值,但要满足两个前提:评测基准定义要科学,测试流程要公平公正。结构化的原子技能评测体系,能有效指导基座模型迭代。但最终还是要以实景落地能力为核心考核标准。行业后续应该逐步弱化榜单对标,聚焦真实应用能力。
刘东:所有模型最终都要落地物理空间、完成实际作业任务,榜单分数只是参考。评测不必限定硬件设备和模型品牌,可以围绕具体商业任务搭建测试场景,用单位时间作业量、任务成功率等客观商业指标来做评判——能落地解决产业实际问题的方案,就是好方案。
未来一年,行业会走向哪里?
韩峰涛:2026到2027年,是具身模型规模化迭代的关键阶段,会对标GPT-2到GPT-3的那种跨越式升级。未来一年,依托海量数据完成大规模预训练的企业,模型性能会跟其他玩家拉开巨大差距。纯学术机构很难再弯道超车,行业头部技术壁垒会快速成型。
朱兴:以人为中心、无本体依赖的多模态对齐数据,会成为行业的核心数据形态。未来一年,行业有望研发出物理原生基础模型——这是蚂蚁灵波的核心目标,预计2026年底能完成突破,最晚不超过2027年6月。
许华哲:我们重点做两件事情。第一,打造零部署成本的开箱即用模型——机器人放那儿就能工作,不需要复杂调试和场景布设。第二,强化智能体(Agent)能力,让机器人能依靠模型泛化能力自主串联长周期任务,能自主修正执行过程中的小失误,实现全天候连续作业和模型原生级的自主迭代。
周永:未来一到两年内,行业会形成完整的技术体系,包含三大模块:全自动数据标注系统、能精准预测3D结构和物理因果约束的融合物理引擎、适配真实场景的任务奖励机制。同时我们也在搭建轻量化智能体框架,大幅缩短模型的新场景部署周期,帮行业加快商业化落地速度。
刘东:未来一年,会是具身智能真机落地的元年。行业将迎来三大变革:第一,数据采集范式全面转型——从传统机器人遥操作采集,转向以人为中心的轻量化采集。第二,模型范式迭代升级——从行业主流的VLA模型,集体进化到具身世界模型,这也是数据采集模式变革的必然结果。第三,商业化落地常态化——大批机器人和端侧模型会进驻真实生产场景,摆脱人工遥控,自主完成80%-90%的常规任务。真机落地,将成为行业常态。




