Sora模型两年演进:从世界构建到技术迭代深度解析
今天凌晨,OpenAI在社交平台X上发布了一条简短的消息:“We're saying goodbye to Sora.”
这宣告了这款曾轰动全球的AI视频生成产品,正式退出历史舞台。从2024年2月惊艳亮相,到2026年3月黯然退场,Sora的生命周期满打满算,不过两年。从万人追捧到无人问津,这速度,甚至比它自己生成的视频还要快。
Sora为何关停?
官方的解释是“集中资源于更重要的领域”,直白点翻译,就是投入产出比失衡:太烧钱,且难以盈利。根据《华尔街日报》的报道,关停Sora只是OpenAI一系列战略调整中的一环,所有动作都指向同一个终极目标——推动公司上市。最新消息显示,其IPO进程最快可能在今年第四季度落地。
周二,首席执行官萨姆·奥特曼在内部会议上亲自宣布了这项调整,表示公司将逐步停止基于视频模型的相关产品线,将重心聚焦于商业应用及代码开发等核心功能。这并非简单的应用下架。面向普通用户的客户端、面向开发者的Sora API,乃至集成在ChatGPT中的视频生成功能,其技术支持都将被一并终止。可以说,这是一次彻底的“一刀切”,而Sora,则成为了这场战略聚焦中被“优化”掉的部分。
回顾:高开低走的“世界模型”
时间拉回2024年2月16日,OpenAI在深夜放出了Sora的演示视频。其中一段展现东京街头女子漫步的镜头,光影细腻,衣袂飘动,瞬间引爆了整个科技圈。那几天,“世界模型”成为了所有人讨论的焦点。OpenAI在技术报告中也毫不谦虚地写道:“Sora是通往物理世界模拟器的第一步。”即便图灵奖得主杨立昆(Yann LeCun)出面质疑Sora并非真正的世界模型,也未能平息当时的狂热。
整个2024年上半年,“中国版Sora”成了创业圈最火热的概念,大小公司蜂拥而入。然而有趣的是,OpenAI却迟迟没有向公众开放Sora。从2月预告到12月发布第一个公开版本,市场被吊足了十个月的胃口。这十个月里,快手的可灵、字节跳动的豆包视频、Google的Veo、Runway的Gen-3等竞品相继面世。
于是,当Sora终于在2024年12月以“Sora Turbo”之名正式亮相时,市场的第一反应是:“就这?”生成的视频质量虽属上乘,但远未达到早期演示视频那种震撼人心的效果。物理规则错误、多指问题、长序列画面一致性不佳等瑕疵依然存在,引发了全球用户的集体调侃。
最后的挣扎:Sora 2与迅速陨落
到了2025年9月,Sora 2登场。这一次OpenAI投入巨大,不仅推出了独立应用,更将其打造成一款AI版的TikTok:用户可以生成视频、创建虚拟形象、进行面部替换,甚至拥有社交信息流可供浏览。OpenAI自称“Sora 2是视频生成领域的GPT-3.5时刻”。
平心而论,其效果在当时确实惊艳,原生的音视频同步、对话口型匹配、音效生成等功能都处于领先地位。应用上线首日下载量即突破10万,不到五天便突破100万,下载速度甚至超过了当年的ChatGPT,迅速登顶App Store榜首。
然而,高光之后便是漫长的下坡路。随着OpenAI将免费的无限生成模式改为配额制和付费积分制,用户数量瞬间大幅流失。根据第三方数据平台SensorTower的统计,Sora 2的30天用户留存率已不足1%,60天留存率则趋近于零。
与此同时,竞争对手们并未停步。Google的Veo 3.1在画质与音频整合上实现了全面超越;快手的可灵2.5凭借超长视频生成和精准运动控制脱颖而出;直至字节跳动的Seedance 2.0横空出世,几乎终结了比赛。Sora 2曾引以为傲的技术优势,在短短几个月内便被蚕食殆尽。AI视频生成这条赛道从来都不缺选手,而Sora,已不再是其中最亮眼的那一个。
启示:AI浪潮下的产品宿命
Sora并非第一个,也绝不会是最后一个。回顾过去两年,AI浪潮中涌现又悄然消失的产品还少吗?Google的Bard在更名为Gemini之前,经历了数次推倒重来;Meta为元宇宙烧掉数百亿美元,但Horizon Worlds至今未见起色;Stability AI一度濒临倒闭,创始人被迫离职,Stable Diffusion险些成为无主遗产;还有Jasper、Copy.ai这些昔日的AI写作明星,风光时融资数亿,如今又有几人记得?它们中的大多数,都走得悄无声息。
从被寄予厚望的“世界模型”到一句简短的“再见世界”,Sora的历程揭示了一个朴素的道理:在AI这个飞速迭代的领域,没有任何产品是不可替代的。今天的行业王者,明天就可能成为战略弃子。唯一不变的,或许只有变化本身。毕竟,在AI技术的狂飙突进之下,明天的世界会变成什么样,谁又能真正预料呢?