世界模型权威测评:AI迈向物理觉醒的关键技术解析
人工智能技术与产业发展的速度,如今真可谓一日千里。通往通用人工智能的道路上,谁能抓住下一个核心赛点?昨天开幕的北京智源大会,为这个问题勾勒出了一个日渐清晰的图景:全球AI竞争的焦点,正在从“虚拟世界的内容生成”,大步迈向“物理世界的真实交互”。这场关键的转折背后,蕴藏着不容忽视的“北京力量”。
让我们从一个生活场景说起:一个小女孩在卧室熟睡,门开着,厨房传来洗碗的嘈杂声。一旁的爸爸没有说话,只是朝卧室方向轻轻挥了挥手。妈妈立刻心领神会,起身去关上了门。
这个瞬间完成的默契,恰恰揭示了当前机器人最难跨越的能力壁垒——理解物理世界的复杂信息并自主决策。整个过程,大脑需要实时感知环境与声音,结合“女儿在睡觉需要安静”这个背景,解读爸爸手势中无声的暗示,最终执行“关门”的动作。全程无需一句言语,依赖的是人脑对物理世界天生的认知与决策能力。而未来,若想让机器人也具备这种能力,关键就在于“世界模型”。
此次北京智源大会上亮相的悟界·Physis-v0.1和悟界·Robo-Brain Orca,正是世界模型领域的最新成果。作为全球首款通用世界基座模型,悟界·Physis-v0.1的目标,是构筑起真实物理世界人工智能的底层核心引擎。它旨在有效弥补当前主流AI模型的几个核心短板:不懂真实物理规则、物理推演结果可信度低、以及长时序记忆的缺失。通过提供通用的基座能力,它能够实现各种场景下物理交互、感知与决策的统一,显著提升AI进行物理推理的真实性与可靠性。
而悟界·RoboBrain Orca,则是一个以下一时刻物理状态预测为核心的“具身大脑”。它打破了传统AI仅能处理文本的局限,推动人工智能从理解文字,走向感知、预测物理世界并与之进行实质性的交互。
有了世界基座模型和具身大脑的支撑,AI便获得了跨越“数字虚拟”与“物理现实”之间鸿沟的核心能力。说得更形象些:未来的机器人不仅能识别出“杯子放在桌子边缘”,更能预判出“杯子很可能掉下去摔碎”,甚至能理解“盖好盖子”与“没盖好盖子”的水杯跌落,所带来的不同后果。
构建面向物理世界的智能“基座”
那么,究竟什么是世界模型?我们又为什么必须投入研发?用智源研究院院长王仲远的话说,“世界模型,是面向物理世界的基座模型。”
长期以来,人工智能的应用大多停留在聊天、编写代码、生成图像等“虚拟”层面。然而,无论是机器人作业、自动驾驶还是科学发现,都迫切需要AI具备对物理规律的深刻理解与因果推理能力,而这恰恰是当前大模型和视频生成模型的短板。王仲远举了一个生动的例子:视频模型可以轻松生成一头在天上飞的猪,这在数字世界是一种趣味,但若放到物理世界,则无异于一场灾难。
要让AI真正融入物理世界,解决制造业、医疗、物流、养老等实体经济的实际痛点,王仲远提出,世界模型必须具备几项核心能力:物理正确、动作因果可溯、长程一致和通用泛化。
所谓物理一致性,指的是模型必须理解并遵守真实的物理规律。动作因果性,则要求模型能理解动作与状态变化之间的因果关联。长程可推演性,意味着模型需要在较长的时间跨度内保持逻辑连贯,不“失忆”、不“胡编乱造”。而通用泛化性,则是一个基座模型价值的终极体现——同一个“大脑”,既能指挥机器人端茶倒水,也能用于自动驾驶预判行人意图,还能辅助新药研发。这正是世界基座模型区别于传统专用模型的核心所在。
“真正的世界模型,必须能理解和推理真实物理世界的时间、空间、物理规律,并具备主动交互的能力。”王仲远强调。当然,他也指出,目前世界模型仍处于发展早期,前方仍有大量科研探索等待完成。
北京队竞逐万亿市场“无人区”
回顾过去几年,从大语言模型到视频生成模型、多模态大模型,AI技术的演进速度一次次超出预期。那么,下一个碘伏性的范式会是什么?王仲远判断,世界模型,特别是世界基座模型,有望在未来5到10年成为人工智能领域的重大技术碘伏和研究范式。
作为全球最早布局该领域的机构之一,智源研究院的路线图坚定而清晰:2023年智源大会期间,图灵奖得主、“卷积神经网络之父”杨立昆提出了新一代世界模型的概念;2024年,智源将世界模型明确为下一代大模型技术方向,并发布了悟界·Emu3模型;2025年,推出了全球首个原生多模态世界模型悟界·Emu3.5。如今,悟界·Physis-v0.1与悟界·RoboBrain Orca的亮相,再次印证了这支“北京队”向世界基座模型“无人区”发起冲锋的决心与实力。
一场围绕世界模型的万亿级市场竞赛,其实已经悄然打响。最近几个月,谷歌、英伟达等科技巨头纷纷重兵押注。摩根士丹利预测,到2035年,由世界模型赋能的产业规模将达到10万亿美元;国元证券也提出,到2030年,全球搭载世界模型的机器人市场规模将突破3万亿元,成为驱动AI下一轮增长的核心引擎。
其中尤为令人振奋的一点是,全球围绕世界模型的技术路线,目前仍处于百花齐放的探索阶段。与大语言模型时代海外巨头拥有显著先发优势的情况截然不同,在这条全新的赛道上,中国科研力量已经不再是单纯的跟随者。“我们已经有了自己独立且原创的技术路径,甚至开始去定义问题、定义技术路线本身。在世界模型这片无人区,中国正与世界处于同一起跑线。”王仲远的这番话,透露出一份笃定与自信。

