Decart世界模型Oasis 3测评:实时生成逼真驾驶环境的优劣分析
周三,AI初创公司Decart正式推出最新交互式世界模型Oasis 3。该模型能够实时生成照片级逼真的驾驶环境,并同步开放API供开发者接入。这标志着Decart正式向物理AI领域发起攻势。
Decart最初瞄准的是需要大规模模拟稀有驾驶场景的自动驾驶公司,后续将扩展至机器人及更多物理AI应用。但其核心策略在于开发者生态——从第一天开放API,复制了当年OpenAI围绕大语言模型构建生态的模式。
“这是首个真正可编程且可投入使用的世界模型,”Decart联合创始人兼CEO Dean Leitersdorf表示,“我相信它足以催生一个完整的开发者社区。”
Decart已积累超10万名开发者社区成员,许多人正基于其实时视频模型Lucy构建产品,主要聚焦电商与直播领域。Oasis 3以Lucy为核心基础,标志着公司向物理AI的战略转型。API访问费用为每秒0.02美元,企业级价格按场景定制。
当前世界模型赛道竞争激烈。谷歌发布了研究预览版Genie 3,李飞飞创立的World Labs推出商用模型Marble,Luma与Runway等视频生成公司也正全力向世界模型方向转型。
从融资节奏看,Oasis 3发布距Decart完成3亿美元融资仅隔数周。Leitersdorf称该轮融资完全是“需求驱动”——电商、直播及物理AI领域对模型的需求激增。本轮后Decart估值接近40亿美元,丰田、Adobe、eBay及英伟达均成为战略投资者。为何巨头青睐?Leitersdorf一语道破:它们都是潜在客户。
Oasis 3的核心优势归结为两点:照片级真实感与无限生成能力。这得益于Decart的另一核心产品——DOS(Decart优化栈)实现的效率突破,该软件确保模型在英伟达、亚马逊及谷歌硬件上高效运行,从而大幅降低运行成本。
“这完全基于我们的实时技术栈,优化直达硬件层面,”Leitersdorf表示。“正因高度垂直整合,模型运行成本比行业任何竞争对手低一个数量级以上。”
他算了一笔账:公司成立至今累计算力支出“远不足”1亿美元,效率令人咋舌。
Oasis 3支持多摄像头环境生成,包含一个前置与两个侧置摄像头,用于系统训练与测试。与仅提供有限演示或研究预览版的产品不同,Decart允许开发者无限量生成模拟场景,这一特性至关重要。
表现最突出的是单一文本提示下的初始场景。用户可连续数小时与生成环境交互,印证了Decart宣称的效率优势。然而问题随之出现:场景一致性。长时间生成世界后,模型的一致性显著下降。
实测中,初始生成效果稳定,例如输入“纽约清晨街头场景”,初始画面颇具真实感。但一旦向前移动,环境便开始“漂移”。几分钟后,纽约的特征几乎消失,变为泛化的西方城市街景。尝试掉头返回之前的交叉路口,发现它已消失,取而代之的是全新环境。控制响应也不够灵敏,车辆方向难以精准操控——这是世界模型的通病。整体体验更像一场迅速失控的梦境意识流,而非连贯的模拟系统。
另一个老问题浮现:车辆直接穿模,表明物理碰撞模拟尚不完善。Leitersdorf称之为“正在攻克的重大研究难题”,原因很简单——正常驾驶数据远多于事故数据,模型学习不充分。
物理一致性为何难以维持?根源在于底层架构。Oasis 3采用自回归生成方式,逐帧生成内容,每帧需回溯之前内容推测下一帧。这是众多世界模型的核心架构特征,也是算力消耗极高的机制。
为改善一致性,Leitersdorf透露团队正设法扩展模型的记忆长度。
“每生成一帧需处理约8000个Token,”他解释,“以每秒数十帧的速度生成,相当于每秒处理数十万Token,上下文窗口迅速填满。我们正在研究如何实现更长上下文,存储数百万个Token,同时将记忆压缩为更少Token。”
下一版本中,一致性问题或可部分解决。新版本将支持用户基于真实环境视频(而非图像)启动世界生成。当然,Leitersdorf坦言,世界模型作为研究领域整体仍处早期。
但相比技术现阶段的局限,这位创始人更关注开发者介入后的可能性。
“这让我想起大语言模型发展早期,OpenAI为模型发明了API接口,”他比喻道,“正是开发者社区的兴起,通过不断探索和构建新应用场景,才推动了整个领域的进步。”
“三个月后再聊,”他说,“届时你可能看到100个开发者基于Oasis构建100种不同应用,每一款都令人惊喜。”
Q&A
Q1:Oasis 3是什么?它能实现哪些功能?
A:Oasis 3是AI初创公司Decart发布的最新交互式世界模型,核心能力在于实时生成照片级逼真的驾驶环境。它支持多摄像头视角,可供自动驾驶公司模拟稀有驾驶场景,同时向开发者开放API,允许无限量生成模拟场景,API定价为每秒0.02美元。
Q2:Oasis 3当前存在哪些主要缺陷?
A:主要包括三点:一、长时间运行后场景一致性显著下降,生成环境逐渐偏离初始提示;二、无法还原已生成的场景,掉头返回时原始环境消失;三、车辆直接穿越其他车辆,表明物理碰撞模拟不完善。此外,控制响应灵敏度不足也是用户反馈的问题。
Q3:Decart如何实现Oasis 3的低运行成本?
A:Decart依托自研DOS(Decart优化栈)软件,实现深度硬件级优化,使模型在英伟达、亚马逊及谷歌硬件上高效运行。凭借高度垂直整合的技术栈,Decart宣称其模型运行成本比行业对手低一个数量级以上,成立至今累计算力支出远不足1亿美元。
