大模型编程与具身智能抓取双赛道竞争激烈:原力灵机已抢先入局 2026-06-13阅读 0热度 0 大模型 当行业竞相发表论文、拍摄演示视频、争夺概念话语权时,原力灵机早已将筹码押在一个极其具体的动作上——**Picking**(抓取)。 近期,原力灵机宣布通过股权并购方式,与物流机器人公司Atomix完成合并。这意味着模型能力与真实场景正式融为一体。与此同时,智谱、阶跃星辰、商汤、阿里等中国头部大模型公司,罕见地集体参与原力灵机的新一轮融资。资本不会无缘无故集结,这背后的判断颇具深意。 原力灵机创始人兼CEO唐文斌用一个比喻点明了方向的核心逻辑: > **Picking,就是具身智能领域的Coding。** 这不禁让人追问:Picking之于具身智能,真的会像Coding之于大模型吗? 要理解这个判断,需先回溯Coding之所以成为大模型基石的逻辑原点。 Coding不止是一项“技能”。它天然自带闭环:代码→运行→反馈→修正→再运行。这个闭环让模型在规模化训练中持续迭代、不断进化。正因如此,它成为大模型时代公认的原子任务。Anthropic正是靠牢牢抓住这个原子任务,在行业中建立起鲜明的技术辨识度,资本市场也以一路走高的估值给予了实质认可。 那么,具身智能要获得真正通用的智能,同样需要一个这样的基础性原子任务。 从大模型的数据成长逻辑反向拆解,这个理想任务需满足四层约束:**高频**——持续产生数据;**真实**——补全仿真环境拉不出的物理细节;**可验证**——成功与失败能被系统记录;**可迁移**——不局限在单一封闭场景。最后别漏了“通用”二字——通用啊同志们,这才是关键。 在唐文斌看来,Picking不仅符合以上标准,还具备三点独特优势。 **首先,Picking能规模化产出高质量的物理世界真实数据。** 具身数据的极度稀缺是行业公认的难题。而物流仓储恰是一个已被验证的理想场景。任务边界清晰,SKU(库存单位)极度多样,原生素材源源不断。全球物流仓库每天产生上亿次真实抓取动作,Picking作为该场景最高频、最核心的操作,自然成为数据汇集的核心入口。 **其次,Picking自带可验证的成功信号。** 机器人将包裹从A点移至B点,成功或失败一目了然。即便出现瑕疵,也可拆解为:抓取失败、中途掉落、放置偏差、识别错误、路径规划失败等细节。反馈信号越清晰,模型迭代优化的方向就越明确。 **最后,Picking的能力可迁移到其他任务上。** 表面看,Picking只是“从A挪到B”;但在具身训练的维度上,它是一个浓缩的物理命题。一次顺利的抓取,串联起感知预判、运动决策、伺服控制及全链路反馈。抓取的本质——手眼协调、力控与空间理解——恰是绝大多数操作任务的底层基础。如果模型能将不同工况下的灵活抓放逻辑吃透,那么分拣装箱、居家劳作、精密装配,乃至更开放的复杂环境作业,都可沿着这条能力主线逐步拓展。 **依托数据、反馈与能力迁移的统一逻辑,Picking之于具身智能,正如Coding之于大模型。** 进入2026年,具身智能行业逐渐走出混沌期,竞争焦点也顺理成章地从“Benchmark”(基准测试)转向“Business”(商业落地)。“具身智能必须走出Demo,在真实产线上接受ROI(投资回报率)验证”,已成为行业内越来越明确的共识。在这个节骨眼上,Picking这个原子任务的价值格外突出。它足够具体,可嵌入真实场景,每天产生海量任务,成本收益都可计算,失败的样本也能直接回炉训练——这正是行业最缺的东西。 当然,具身智能的难度远高于大模型,因为物理世界的数据采集门槛远远高于互联网文本数据。谁能低成本、大规模地获取真实数据并形成闭环,谁就能在竞争中掌握主动权。 **但这里有个关键问题:并非所有场景都适合启动数据飞轮。** 家庭环境太开放,任务边界太散,且容错率极低;传统工业场景则高度结构化,大量任务已被专用机器和自动化产线解决,机器人能锻炼的泛化能力也比较有限。 那么,Picking到底该从哪里开始?**物流,尤其是消费品仓储和分拣,恰好卡在一个绝佳的平衡点上。** 它比家庭场景更可控,又比传统工业场景更长尾、更复杂。海量网购订单催生了数十万种SKU,包裹形态五花八门,流水线全天候运转,抓取需求高频且稳定。更重要的是,劳动力缺口在那里实实在在地存在——客户有痛点,也有预算。 这一逻辑**已得到全球范围的验证**。Skild AI、Physical Intelligence、Figure AI这些海外玩家,早早将目光锁定在仓储场景,依托真实的分拣任务快速积累数据,迭代速度明显快于那些深耕小众场景的同行。 原力灵机与Atomix的合并,正是在这个逻辑下最有战略纵深的落子。切莫将此事简单理解为一家模型公司和一家场景公司的普通合并。Atomix深耕物流分拣场景多年,手握成熟的客户网络、真实的仓储部署经验和持续运转的产线。而原力灵机**自研的DM0具身原生大模型**,突破了单机独立训练的老模式,采用多源数据联合训练、跨机型通用预训练技术,能将散落在各地仓库、由不同型号机械臂产生的零散抓取数据,整合提炼为通用性更强的实操能力。 最丰富的Picking“矿场”,遇上了能合并消化海量异构数据的模型底座——这就成了场景与技术真正的双向奔赴。合并之后,场景侧每天产生的海量真实Picking数据,直接灌入模型侧进行迭代;模型变强之后,又能反哺更多仓库、更多机型。这条从数据到模型、再从模型到场景的闭环,在一个组织体内自然流转,再也不用跨越公司边界去协调外部合作。**原本处于“合作关系”的两家公司,现在合并为一家后,数据飞轮就变成了“内生机制”。** 再回到Coding这个话题。Coding之所以能成为大模型时代的原子任务,一个核心原因就是它让大模型拥有了一个可持续运转的数据飞轮:代码生成→运行→报错→修改→再运行,每一步都有反馈,每一次失败都能变成下一轮优化的素材。海量真实开发任务不断产生数据,数据反过来推动模型能力提升,模型能力提升后又进入更多开发场景。唐文斌所说的Picking时刻,对具身智能的意义正是如此。 它不只是让模型进入了物流场景。更重要的是,**具身数据第一次有机会从“采集型数据”走向“场景型数据飞轮”**。 数据太少、太贵、太难规模化,这些问题一直困扰着具身智能行业。为了训练具身机器人,企业往往需要专门搭建采集环境,安排人员遥操作,设计任务流程,再将数据清洗成模型可用的格式。这类数据当然有价值,但本质上它是为了训练而采集的。采一次,多一批数据;不采,就没有新增。说白了,这个模式下数据增长依赖人工组织、设备投入和项目预算,很难自然积累。 **Picking则将数据产生嵌进了真实的业务现场。** 具身机器人在仓库里完成分拣、抓取、搬运,它本身就是一次生产任务。只要任务在持续发生,数据就会源源不断地产生。抓取成功、抓取失败、掉落、误识别、放置偏差、路径卡顿、节拍变化……所有这些都可被系统记录下来,成为模型继续优化的素材。**数据不再是专门设置环节“额外采集”出来的训练材料,而是从真实场景中自然流出来的生产副产品。** 这一步非常关键。只有数据生成和真实业务绑定在一起,具身智能才能真正形成飞轮。任务越多,数据越多;数据越多,模型越强;模型越强,机器人完成任务的稳定性和效率就越高;效率越高,机器人就能进入更多仓库、覆盖更多SKU、处理更多复杂情况,新的数据又会继续回流。 所以,Picking的价值不只是解决了模型进场景的问题。它更像一个支点,**将模型、机器人、场景和数据归拢到一条更顺畅的管线之内**。原力灵机和Atomix的合并,也完全可以放在这个框架里去理解——真实任务入口、机器人执行系统和模型迭代能力,被放进了同一条链路里。 话说回来,那些大模型公司已经在Coding上见识过这套逻辑的威力了。所以智谱、阶跃星辰、商汤、阿里这些大模型玩家集体押注,看中的绝不仅仅是一个物流机器人项目。他们看中的,是一个可能率先跑通的物理世界数据飞轮。**任何Demo都只能证明机器人能做好“这一次”,而Picking飞轮要证明的是:机器人能越做越好。** 这才是唐文斌所说“Picking就是具身智能的Coding”背后真正的含义。 再往后看,具身智能赛道可施展拳脚的地方,其实远不止Picking这么简单。Picking当然不是行业的终点,更不会是具身智能的全部。但它是飞轮的支点,是数据范式转型的起爆点,是从实验室走向真实世界的分水岭。可以肯定地说:谁先在Picking上跑通真实世界的数据飞轮,谁就拿到了具身智能下半场的那张入场券。