阿里世界模型HappyOyster 1.0测评:实时探索重塑AI世界
6月17日,阿里巴巴推出了一款极具创新性的产品——HappyOyster 1.0,中文名为“快乐生蚝”。这并非普通的视频生成工具,而是一个支持实时交互、可自由构建的AI世界模型。其核心在于学习物理世界的运行逻辑:动作如何引发反馈,因果链条如何推演,以及人物与环境如何保持时空一致性。它不再仅仅“生成一段画面”,而是创造一个你可以进入并主动改变的数字世界。
上图展示的是HappyOyster 1.0的正式产品入口。
本质差异在于训练目标的根本不同。传统文生视频模型学习的是从文本到视频的单向映射:你输入一句指令,它生成一段视频,之后便无法干预。而世界模型学习的是从“当前状态/动作”到“下一状态/动作”的转移规律。换言之,它真正理解因果关系。因此,你可以在任意节点介入,改变世界的走向。在整个AI赛道中,这属于前沿领域——大语言模型已相对成熟,而世界模型仍处于探索阶段。HappyOyster 1.0率先啃下这块硬骨头,从海量自然视频中学习现实中人物与物体的演变规律,自主推导动作与反馈之间的因果链。即便面对从未见过的场景,也能融会贯通,生成新的因果逻辑,并维持数字世界的长期稳定性,甚至做到音视频同步不崩溃。
与上一版相比,本次在交互体验上做了显著升级。例如“世界探索”模式:只需输入一句话或上传一张图片,即可生成一个可供深度探索的世界。新增了前冲、下蹲、跳跃、攻击等操控按键,人物动作更加丰富,还能驾驶车辆、使用武器战斗,物理交互效果相当逼真。至于“实时导演”模式,则提供上帝视角:你可以随时暂停、回溯、分支叙事——在任意节点暂停,跳回关键节点,重新输入提示词改变剧情走向。同一个开局,可以衍生出无限种结局,且成本极低。目前,世界探索模式支持长达1分钟的连续实时位移与镜头控制;导演模式则可生成3分钟以上、480p或720p的实时画面。生成的内容还能一键分享出去。
事实上,HappyOyster 1.0瞄准的是下一代多模态互动内容的全新玩法。对开发者而言,制作一款交互式游戏不再需要花费数周甚至数月编写代码和测试:上传图片、输入提示词,即可快速生成符合物理规律的开放世界原型、角色交互及战斗场景。而对于互动短剧、虚拟陪伴、直播等场景,用户用自然语言就能构建人物与剧情,随时改写画面、角色与走向,将传统线性叙事转化为用户自主掌控的互动体验。文旅场景同样充满想象空间:游客不仅能与稳定的数字人IP互动,还能自行决定游览路线,甚至深入深海、月球等现实中难以触及的地方。
话说回来,世界模型这一方向整体仍处于极早期阶段,行业甚至缺乏一套可量化的评测标准。目前,HappyOyster团队已与南京大学合作,着手构建首个覆盖过程交互、跨模态对齐、长程一致性及物理仿真验证的行业基准,意在填补这一空白。据悉,近期还将全面开放API接口,与各行各业共同搭建生态,释放世界模型的生产力。从今天起,每日登录正式版即可免费领取积分,亲身探索那个可以实时交互的数字世界。
