智元WorldArena世界模型总分冠军榜单

2026-05-29阅读 0热度 0

世界模型

世界模型赛道的竞争历来白热化，多轮结果公布后，CVPR 2026 WorldArena 的最终榜单正式揭晓。智元自主研发的世界模型 Genie Envisioner-Sim 2.0（简称 GE 2.0）斩获总冠军，在众多强手中占据领跑位置。

WorldArena 的权威性无可争议，它是当前世界模型领域最具公信力的评测基准。评估体系设计极为严苛——涵盖 16 项细分核心指标与 3 项真实应用任务，构建起多维度的立体评估框架，专门用于检验具身世界模型在感知精确度、物理规律建模、三维空间理解以及动作预测与落地执行层面的实际表现。学术严谨性与行业可信度兼备，全球几乎所有顶尖研究团队都参与其中，同场竞技。

本次评测中，智元团队直接采用原生 GE 2.0 模型，未针对赛题进行任何专项优化，仅基于榜单数据做了基础微调。简单来说，就是“轻装上阵”，结果依然拿下第一。这本身就是对 GE 2.0 通用适配能力的有力证明。面对近期世界模型领域持续升温的关注度和创业浪潮，智元保持着自己的技术节奏，从长远的第一性原理出发，专注于打磨具身世界模型的技术底层。此次登顶，是长期技术积累的必然结果。

裸考封神

智元 GE 2.0 模型实力登顶

未对 WorldArena 做任何针对性调优，裸考出战仍能断层领先，这本身就说明了模型底力。在 GE 2.0 的技术报告中，智元团队全面剖析了模型的能力构成。相较上一代，GE 2.0 并非单一性能点的提升，而是进化为一套全功能、高可用的世界模拟器。其核心价值在于构建了一个可试错、可迭代、可进化的虚拟仿真环境——机器人策略在该环境中自主积累经验、进行动态试错，规避真实场景的高昂成本，最终高效迁移至真实物理世界稳定运行。从“感知预测”到“仿真进化、自主决策”的闭环升级，这一步完成得非常扎实。

在功能矩阵层面，GE 2.0 首次全面覆盖长时序生成、多视角生成、本体状态生成、近实时推理以及奖励判别等关键环节，构建起世界模拟器完整的技术能力闭环。

长时序推演能力尤为值得深入关注。在长时序推理任务中，GE 2.0 展现出极高的稳定性，画面质量随推理时长衰减的程度远低于行业基线方案。即便在连续推演 40 至 50 秒的长视频片段时，其生成质量仍优于基线模型前 10 秒的表现。

闭环评测方面，作为世界模拟器，核心在于能否真实反映物理世界。智元团队验证了大量闭环评测结果，证明 GE 2.0 在多项任务上与真实世界保持强相关性。这种相关性不仅停留在宏观统计层面的“成功率一致”，团队还进行了逐案（Case-by-case）的 rollout 结果对比分析，并通过混淆矩阵（Confusion Matrix）提供了严谨的量化佐证。GE 2.0 作为策略评测器的可靠性，拥有扎实的数据支撑。

数据回流反哺机制也已打通。在奖励模型（Reward Model）的辅助下，GE 2.0 能对闭环评测的 rollout 过程进行自动化筛选，将世界模型中产出的有效高质量数据精准回流给策略模型（Policy Model）。实验数据表明，这一机制在多项任务上帮助策略模型实现了显著的性能提升。

从技术积累的视角来看，智元 GE 2.0 的登顶，是长期深耕底层算法、打磨物理 AI 核心能力的必然结果。相较于行业同类模型，GE 2.0 实现了全方位的技术跃升——不仅补全了长时序稳定推演、多视角精准生成、实时物理还原、闭环奖励判别等全维度能力，更突破了传统模型“重视觉、轻物理、难落地”的行业瓶颈。即便在 40 到 50 秒超长时序的复杂场景推演中，依然能保持画面稳定、物理逻辑精确、空间结构无偏差，生成的数据可直接用于机器人策略模型迭代。从“视觉拟真”到“物理可信、可用、可落地”的质变，算法的通用性、稳定性和实用性全面领先行业水平。

ALL IN AI

智元定位“具身智能的基础模型公司”

与多数聚焦机器人硬件整机、场景应用或单点技术优化的企业不同，智元坚定锚定具身智能基础模型公司的核心定位。其核心逻辑并非制造机器人本体，而是打造支撑整个物理 AI 行业发展的底层基础设施与通用基础能力。智元深耕的是通用具身基础模型，构建可适配全场景、可通用泛化、可自主进化的底层 AI 能力，为机器人的运动、感知、决策、作业提供核心大脑。

今年 4 月，智元连续一周举办“ALL IN AI”AI WEEK 成果发布，完成了开源数据集、开源仿真平台、基座大模型、世界仿真器、机器人部署应用平台五大核心维度的完整技术闭环搭建，构建了行业独有的“数据筑基—仿真赋能—模型进化—应用落地—生态开放”全链路能力体系。这并非单点技术的补齐，而是真正意义上的全能型布局。

AGIBOT WORLD 2026：首个系统性覆盖具身智能全域研究的开源数据集
Genie Sim 3.0：首个大语言模型驱动的仿真开发平台
Genie Operator-2：通用具身基座大模型，定义“知行合一”新高度
Genie Envisioner 2.0：世界模型驱动的环境模拟器
Genie Studio Agent：面向具身作业场景的零代码 Agent 应用平台

当前行业普遍存在数据质量参差不齐、仿真成本高、模型落地难、部署门槛高等痛点。智元通过全栈基础技术布局，打通了完整的价值闭环，解决了制约行业发展的共性底层难题。同时，智元坚持 ALL IN AI 的核心战略，所有技术迭代都围绕通用基础能力升级，而非单一场景的定制优化。其技术成果可覆盖全品类机器人、全行业的物理作业场景，具备极强的产业赋能属性。可以说，智元正在承担具身智能领域基础底座搭建者、行业标准定义者的角色。而这也正是它能够拿下世界模型赛道全球总冠军、持续领跑物理 AI 的核心根源。

真正的通用机器人，离不开硬件本体与智能系统的深度协同，更需要全栈自研的 AI 能力体系作为坚实底座。具身智能的未来，不在于零散的单点创新，而在于可持续进化、可协同放大的系统性能力。从建成全球首个 3000 平方米机器人实景数据采集场地，到推出一站式仿真开发平台 Genie Sim；从通用具身基础模型 Genie Operator 1，到实现对物理世界深度理解的世界模型 Genie Envisioner；再到面向全量开发者的具身智能一站式开发平台 Genie Studio——智元持续构建面向物理 AI 的完整能力底座，打通技术价值闭环，让每一项 AI 能力都成为推动机器人迈向“部署态”的坚实支撑。

锚定“部署态”

让具身智能从炫技走向商用闭环

“部署态”是今年智元在 2026 APC 合作伙伴大会上提出的核心概念。依托全栈技术闭环，实现机器人在真实复杂场景中大规模稳定作业、持续迭代，具备可落地、可复用的特质。这标志着具身智能从技术演示正式迈向规模化商用的新阶段。

成功实施“部署态”的关键在于底层算法的持续演进。智元 ALL IN AI 的核心逻辑始终围绕真实物理世界、真实作业需求、真实商用落地，全部服务于机器人规模化部署：真实场景数据集保证模型适配复杂真实环境；生成式仿真大幅降低试错成本；基座模型保障作业精准稳定；世界模型提升复杂任务自主决策能力；零代码平台彻底解决落地难、复制难、迭代难的产业痛点。技术价值到产业价值的完整闭环，正在一步步落地实现。

一次裸考登顶，是一次实力的印证；持续全域领跑，才是强者的常态。智元本次登顶 WorldArena 世界模型总分冠军，是长期坚持 All in AI 战略的成果。算法是未来具身智能产业的竞争核心，只有持续迭代世界模型、基座大模型等核心算法能力，深化虚实融合技术闭环，才能在具身智能这条长跑之路上，不断引领向前。