大模型编程与具身智能抓取双赛道竞争激烈：原力灵机已抢先入局

2026-06-13阅读 0热度 0

大模型

当行业竞相发表论文、拍摄演示视频、争夺概念话语权时，原力灵机早已将筹码押在一个极其具体的动作上——**Picking**（抓取）。近期，原力灵机宣布通过股权并购方式，与物流机器人公司Atomix完成合并。这意味着模型能力与真实场景正式融为一体。与此同时，智谱、阶跃星辰、商汤、阿里等中国头部大模型公司，罕见地集体参与原力灵机的新一轮融资。资本不会无缘无故集结，这背后的判断颇具深意。原力灵机创始人兼CEO唐文斌用一个比喻点明了方向的核心逻辑： > **Picking，就是具身智能领域的Coding。** 这不禁让人追问：Picking之于具身智能，真的会像Coding之于大模型吗？要理解这个判断，需先回溯Coding之所以成为大模型基石的逻辑原点。 Coding不止是一项“技能”。它天然自带闭环：代码→运行→反馈→修正→再运行。这个闭环让模型在规模化训练中持续迭代、不断进化。正因如此，它成为大模型时代公认的原子任务。Anthropic正是靠牢牢抓住这个原子任务，在行业中建立起鲜明的技术辨识度，资本市场也以一路走高的估值给予了实质认可。那么，具身智能要获得真正通用的智能，同样需要一个这样的基础性原子任务。从大模型的数据成长逻辑反向拆解，这个理想任务需满足四层约束：**高频**——持续产生数据；**真实**——补全仿真环境拉不出的物理细节；**可验证**——成功与失败能被系统记录；**可迁移**——不局限在单一封闭场景。最后别漏了“通用”二字——通用啊同志们，这才是关键。在唐文斌看来，Picking不仅符合以上标准，还具备三点独特优势。 **首先，Picking能规模化产出高质量的物理世界真实数据。** 具身数据的极度稀缺是行业公认的难题。而物流仓储恰是一个已被验证的理想场景。任务边界清晰，SKU（库存单位）极度多样，原生素材源源不断。全球物流仓库每天产生上亿次真实抓取动作，Picking作为该场景最高频、最核心的操作，自然成为数据汇集的核心入口。 **其次，Picking自带可验证的成功信号。** 机器人将包裹从A点移至B点，成功或失败一目了然。即便出现瑕疵，也可拆解为：抓取失败、中途掉落、放置偏差、识别错误、路径规划失败等细节。反馈信号越清晰，模型迭代优化的方向就越明确。 **最后，Picking的能力可迁移到其他任务上。** 表面看，Picking只是“从A挪到B”；但在具身训练的维度上，它是一个浓缩的物理命题。一次顺利的抓取，串联起感知预判、运动决策、伺服控制及全链路反馈。抓取的本质——手眼协调、力控与空间理解——恰是绝大多数操作任务的底层基础。如果模型能将不同工况下的灵活抓放逻辑吃透，那么分拣装箱、居家劳作、精密装配，乃至更开放的复杂环境作业，都可沿着这条能力主线逐步拓展。 **依托数据、反馈与能力迁移的统一逻辑，Picking之于具身智能，正如Coding之于大模型。** 进入2026年，具身智能行业逐渐走出混沌期，竞争焦点也顺理成章地从“Benchmark”（基准测试）转向“Business”（商业落地）。“具身智能必须走出Demo，在真实产线上接受ROI（投资回报率）验证”，已成为行业内越来越明确的共识。在这个节骨眼上，Picking这个原子任务的价值格外突出。它足够具体，可嵌入真实场景，每天产生海量任务，成本收益都可计算，失败的样本也能直接回炉训练——这正是行业最缺的东西。当然，具身智能的难度远高于大模型，因为物理世界的数据采集门槛远远高于互联网文本数据。谁能低成本、大规模地获取真实数据并形成闭环，谁就能在竞争中掌握主动权。 **但这里有个关键问题：并非所有场景都适合启动数据飞轮。** 家庭环境太开放，任务边界太散，且容错率极低；传统工业场景则高度结构化，大量任务已被专用机器和自动化产线解决，机器人能锻炼的泛化能力也比较有限。那么，Picking到底该从哪里开始？**物流，尤其是消费品仓储和分拣，恰好卡在一个绝佳的平衡点上。** 它比家庭场景更可控，又比传统工业场景更长尾、更复杂。海量网购订单催生了数十万种SKU，包裹形态五花八门，流水线全天候运转，抓取需求高频且稳定。更重要的是，劳动力缺口在那里实实在在地存在——客户有痛点，也有预算。这一逻辑**已得到全球范围的验证**。Skild AI、Physical Intelligence、Figure AI这些海外玩家，早早将目光锁定在仓储场景，依托真实的分拣任务快速积累数据，迭代速度明显快于那些深耕小众场景的同行。原力灵机与Atomix的合并，正是在这个逻辑下最有战略纵深的落子。切莫将此事简单理解为一家模型公司和一家场景公司的普通合并。Atomix深耕物流分拣场景多年，手握成熟的客户网络、真实的仓储部署经验和持续运转的产线。而原力灵机**自研的DM0具身原生大模型**，突破了单机独立训练的老模式，采用多源数据联合训练、跨机型通用预训练技术，能将散落在各地仓库、由不同型号机械臂产生的零散抓取数据，整合提炼为通用性更强的实操能力。最丰富的Picking“矿场”，遇上了能合并消化海量异构数据的模型底座——这就成了场景与技术真正的双向奔赴。合并之后，场景侧每天产生的海量真实Picking数据，直接灌入模型侧进行迭代；模型变强之后，又能反哺更多仓库、更多机型。这条从数据到模型、再从模型到场景的闭环，在一个组织体内自然流转，再也不用跨越公司边界去协调外部合作。**原本处于“合作关系”的两家公司，现在合并为一家后，数据飞轮就变成了“内生机制”。** 再回到Coding这个话题。Coding之所以能成为大模型时代的原子任务，一个核心原因就是它让大模型拥有了一个可持续运转的数据飞轮：代码生成→运行→报错→修改→再运行，每一步都有反馈，每一次失败都能变成下一轮优化的素材。海量真实开发任务不断产生数据，数据反过来推动模型能力提升，模型能力提升后又进入更多开发场景。唐文斌所说的Picking时刻，对具身智能的意义正是如此。它不只是让模型进入了物流场景。更重要的是，**具身数据第一次有机会从“采集型数据”走向“场景型数据飞轮”**。数据太少、太贵、太难规模化，这些问题一直困扰着具身智能行业。为了训练具身机器人，企业往往需要专门搭建采集环境，安排人员遥操作，设计任务流程，再将数据清洗成模型可用的格式。这类数据当然有价值，但本质上它是为了训练而采集的。采一次，多一批数据；不采，就没有新增。说白了，这个模式下数据增长依赖人工组织、设备投入和项目预算，很难自然积累。 **Picking则将数据产生嵌进了真实的业务现场。** 具身机器人在仓库里完成分拣、抓取、搬运，它本身就是一次生产任务。只要任务在持续发生，数据就会源源不断地产生。抓取成功、抓取失败、掉落、误识别、放置偏差、路径卡顿、节拍变化……所有这些都可被系统记录下来，成为模型继续优化的素材。**数据不再是专门设置环节“额外采集”出来的训练材料，而是从真实场景中自然流出来的生产副产品。** 这一步非常关键。只有数据生成和真实业务绑定在一起，具身智能才能真正形成飞轮。任务越多，数据越多；数据越多，模型越强；模型越强，机器人完成任务的稳定性和效率就越高；效率越高，机器人就能进入更多仓库、覆盖更多SKU、处理更多复杂情况，新的数据又会继续回流。所以，Picking的价值不只是解决了模型进场景的问题。它更像一个支点，**将模型、机器人、场景和数据归拢到一条更顺畅的管线之内**。原力灵机和Atomix的合并，也完全可以放在这个框架里去理解——真实任务入口、机器人执行系统和模型迭代能力，被放进了同一条链路里。话说回来，那些大模型公司已经在Coding上见识过这套逻辑的威力了。所以智谱、阶跃星辰、商汤、阿里这些大模型玩家集体押注，看中的绝不仅仅是一个物流机器人项目。他们看中的，是一个可能率先跑通的物理世界数据飞轮。**任何Demo都只能证明机器人能做好“这一次”，而Picking飞轮要证明的是：机器人能越做越好。** 这才是唐文斌所说“Picking就是具身智能的Coding”背后真正的含义。再往后看，具身智能赛道可施展拳脚的地方，其实远不止Picking这么简单。Picking当然不是行业的终点，更不会是具身智能的全部。但它是飞轮的支点，是数据范式转型的起爆点，是从实验室走向真实世界的分水岭。可以肯定地说：谁先在Picking上跑通真实世界的数据飞轮，谁就拿到了具身智能下半场的那张入场券。

大模型编程与具身智能抓取双赛道竞争激烈：原力灵机已抢先入局

相关阅读

最新教程

最新资讯