智元WorldArena世界模型总分冠军榜单

2026-05-29阅读 0热度 0
世界模型

世界模型赛道的竞争历来白热化,多轮结果公布后,CVPR 2026 WorldArena 的最终榜单正式揭晓。智元自主研发的世界模型 Genie Envisioner-Sim 2.0(简称 GE 2.0)斩获总冠军,在众多强手中占据领跑位置。

WorldArena 的权威性无可争议,它是当前世界模型领域最具公信力的评测基准。评估体系设计极为严苛——涵盖 16 项细分核心指标与 3 项真实应用任务,构建起多维度的立体评估框架,专门用于检验具身世界模型在感知精确度、物理规律建模、三维空间理解以及动作预测与落地执行层面的实际表现。学术严谨性与行业可信度兼备,全球几乎所有顶尖研究团队都参与其中,同场竞技。

本次评测中,智元团队直接采用原生 GE 2.0 模型,未针对赛题进行任何专项优化,仅基于榜单数据做了基础微调。简单来说,就是“轻装上阵”,结果依然拿下第一。这本身就是对 GE 2.0 通用适配能力的有力证明。面对近期世界模型领域持续升温的关注度和创业浪潮,智元保持着自己的技术节奏,从长远的第一性原理出发,专注于打磨具身世界模型的技术底层。此次登顶,是长期技术积累的必然结果。

裸考封神

智元 GE 2.0 模型实力登顶

未对 WorldArena 做任何针对性调优,裸考出战仍能断层领先,这本身就说明了模型底力。在 GE 2.0 的技术报告中,智元团队全面剖析了模型的能力构成。相较上一代,GE 2.0 并非单一性能点的提升,而是进化为一套全功能、高可用的世界模拟器。其核心价值在于构建了一个可试错、可迭代、可进化的虚拟仿真环境——机器人策略在该环境中自主积累经验、进行动态试错,规避真实场景的高昂成本,最终高效迁移至真实物理世界稳定运行。从“感知预测”到“仿真进化、自主决策”的闭环升级,这一步完成得非常扎实。

在功能矩阵层面,GE 2.0 首次全面覆盖长时序生成、多视角生成、本体状态生成、近实时推理以及奖励判别等关键环节,构建起世界模拟器完整的技术能力闭环。

长时序推演能力尤为值得深入关注。在长时序推理任务中,GE 2.0 展现出极高的稳定性,画面质量随推理时长衰减的程度远低于行业基线方案。即便在连续推演 40 至 50 秒的长视频片段时,其生成质量仍优于基线模型前 10 秒的表现。

闭环评测方面,作为世界模拟器,核心在于能否真实反映物理世界。智元团队验证了大量闭环评测结果,证明 GE 2.0 在多项任务上与真实世界保持强相关性。这种相关性不仅停留在宏观统计层面的“成功率一致”,团队还进行了逐案(Case-by-case)的 rollout 结果对比分析,并通过混淆矩阵(Confusion Matrix)提供了严谨的量化佐证。GE 2.0 作为策略评测器的可靠性,拥有扎实的数据支撑。

数据回流反哺机制也已打通。在奖励模型(Reward Model)的辅助下,GE 2.0 能对闭环评测的 rollout 过程进行自动化筛选,将世界模型中产出的有效高质量数据精准回流给策略模型(Policy Model)。实验数据表明,这一机制在多项任务上帮助策略模型实现了显著的性能提升。

从技术积累的视角来看,智元 GE 2.0 的登顶,是长期深耕底层算法、打磨物理 AI 核心能力的必然结果。相较于行业同类模型,GE 2.0 实现了全方位的技术跃升——不仅补全了长时序稳定推演、多视角精准生成、实时物理还原、闭环奖励判别等全维度能力,更突破了传统模型“重视觉、轻物理、难落地”的行业瓶颈。即便在 40 到 50 秒超长时序的复杂场景推演中,依然能保持画面稳定、物理逻辑精确、空间结构无偏差,生成的数据可直接用于机器人策略模型迭代。从“视觉拟真”到“物理可信、可用、可落地”的质变,算法的通用性、稳定性和实用性全面领先行业水平。

ALL IN AI

智元定位“具身智能的基础模型公司”

与多数聚焦机器人硬件整机、场景应用或单点技术优化的企业不同,智元坚定锚定具身智能基础模型公司的核心定位。其核心逻辑并非制造机器人本体,而是打造支撑整个物理 AI 行业发展的底层基础设施与通用基础能力。智元深耕的是通用具身基础模型,构建可适配全场景、可通用泛化、可自主进化的底层 AI 能力,为机器人的运动、感知、决策、作业提供核心大脑。

今年 4 月,智元连续一周举办“ALL IN AI”AI WEEK 成果发布,完成了开源数据集、开源仿真平台、基座大模型、世界仿真器、机器人部署应用平台五大核心维度的完整技术闭环搭建,构建了行业独有的“数据筑基—仿真赋能—模型进化—应用落地—生态开放”全链路能力体系。这并非单点技术的补齐,而是真正意义上的全能型布局。

  • AGIBOT WORLD 2026:首个系统性覆盖具身智能全域研究的开源数据集
  • Genie Sim 3.0:首个大语言模型驱动的仿真开发平台
  • Genie Operator-2:通用具身基座大模型,定义“知行合一”新高度
  • Genie Envisioner 2.0:世界模型驱动的环境模拟器
  • Genie Studio Agent:面向具身作业场景的零代码 Agent 应用平台

当前行业普遍存在数据质量参差不齐、仿真成本高、模型落地难、部署门槛高等痛点。智元通过全栈基础技术布局,打通了完整的价值闭环,解决了制约行业发展的共性底层难题。同时,智元坚持 ALL IN AI 的核心战略,所有技术迭代都围绕通用基础能力升级,而非单一场景的定制优化。其技术成果可覆盖全品类机器人、全行业的物理作业场景,具备极强的产业赋能属性。可以说,智元正在承担具身智能领域基础底座搭建者、行业标准定义者的角色。而这也正是它能够拿下世界模型赛道全球总冠军、持续领跑物理 AI 的核心根源。

真正的通用机器人,离不开硬件本体与智能系统的深度协同,更需要全栈自研的 AI 能力体系作为坚实底座。具身智能的未来,不在于零散的单点创新,而在于可持续进化、可协同放大的系统性能力。从建成全球首个 3000 平方米机器人实景数据采集场地,到推出一站式仿真开发平台 Genie Sim;从通用具身基础模型 Genie Operator 1,到实现对物理世界深度理解的世界模型 Genie Envisioner;再到面向全量开发者的具身智能一站式开发平台 Genie Studio——智元持续构建面向物理 AI 的完整能力底座,打通技术价值闭环,让每一项 AI 能力都成为推动机器人迈向“部署态”的坚实支撑。

锚定“部署态”

让具身智能从炫技走向商用闭环

“部署态”是今年智元在 2026 APC 合作伙伴大会上提出的核心概念。依托全栈技术闭环,实现机器人在真实复杂场景中大规模稳定作业、持续迭代,具备可落地、可复用的特质。这标志着具身智能从技术演示正式迈向规模化商用的新阶段。

成功实施“部署态”的关键在于底层算法的持续演进。智元 ALL IN AI 的核心逻辑始终围绕真实物理世界、真实作业需求、真实商用落地,全部服务于机器人规模化部署:真实场景数据集保证模型适配复杂真实环境;生成式仿真大幅降低试错成本;基座模型保障作业精准稳定;世界模型提升复杂任务自主决策能力;零代码平台彻底解决落地难、复制难、迭代难的产业痛点。技术价值到产业价值的完整闭环,正在一步步落地实现。

一次裸考登顶,是一次实力的印证;持续全域领跑,才是强者的常态。智元本次登顶 WorldArena 世界模型总分冠军,是长期坚持 All in AI 战略的成果。算法是未来具身智能产业的竞争核心,只有持续迭代世界模型、基座大模型等核心算法能力,深化虚实融合技术闭环,才能在具身智能这条长跑之路上,不断引领向前。

免责声明

本网站新闻资讯均来自公开渠道,力求准确但不保证绝对无误,内容观点仅代表作者本人,与本站无关。若涉及侵权,请联系我们处理。本站保留对声明的修改权,最终解释权归本站所有。

相关阅读

更多
欢迎回来 登录或注册后,可保存提示词和历史记录
登录后可同步收藏、历史记录和常用模板
注册即表示同意服务条款与隐私政策