Cursor新模型10万卡加持,性能比肩Opus与GPT
刚刚被 SpaceX 宣布以 600 亿美元收购的 Cursor,终于亮出了自己的大模型。
本周二,在旧金山举办的 Cursor Compile 大会上——这也是 Cursor 有史以来首次旗舰大会——这家公司正式发布了一个全新的 1.5 万亿 + 参数模型。更关键的是,它是在超过 10 万块 GPU 上完成预训练的。
才 25 岁的 CEO Michael Truell 在台上提到,这个新模型的规模跟 Opus、GPT 差不多大。但有趣的是,他随后爆了个料:Opus 4.5 到 4.8,以及 GPT-5 到 GPT-5.5,其实都没有大家想象的那么庞大——它们的参数都低于 2 万亿。注意,是 2 万亿,不是 1.5 万亿。换句话说,按照当前的性能表现,GPT-5.5 和 Opus 4.8 对于开源模型来说,并不是遥不可及的。
Truell 认为,现阶段唯一的护城河,就是规模化扩展。
放眼整个行业,他给出的判断是:目前唯一成功跃迁到约 10 万亿参数规模的 AI 实验室,只有 Anthropic。而 OpenAI 想在年底前重新追上 Anthropic,并不容易。接下来的 1-2 年里,Anthropic 只需要持续往 Mythos 上砸 RL 计算资源,它就会继续变强。
至于其他几家头部实验室,Truell 的看法是:Google 的模型规模还没有推到同等水平,在稀疏化路线上走得过于激进,后训练和强化学习能力也还没有充分转化为稳定、好用的产品体验;OpenAI 仍在消化 GPT-4.5 之后的路线调整压力;xAI 和 Meta 还在为下一阶段的大模型竞争做准备。
当然,消息一出,质疑声也很快出现:Truell 所说的「Opus 和 GPT-5.5 万亿参数模型」到底从何而来?这个数据来源本身就令人怀疑。
抛开这些外部判断不谈,Cursor 这次真正值得关注的地方在于:它不再满足于仅仅调用现成模型,而是开始系统性地训练自己的底座模型。这也是 Truell 在演讲中首次比较完整地披露的新模型计划。
和 Cursor 过去使用的模型相比,这个新模型有三个明显的变化:
第一,规模更大。这是他们迄今为止训练过的最大模型,规模已经接近前沿大模型公司的水准。第二,它是从零开始训练的,而不是基于开源模型继续微调。要知道,这家公司此前还曾卷入过「Cursor 套壳 Kimi」的争议。Truell 也特别补充说,他们依然喜欢开源,也希望未来能找到更多回馈开源社区的方式。但从零训练的好处在于,团队可以更完整地控制模型行为,让模型更贴合他们和开发者真正关心的工作负载。第三,这次训练使用的算力规模远超以往。相比过去能动用的算力,这次大约提升了 10 到 20 倍。过去从 Composer 1 到 Composer 2.5,相关模型更多是在相对有限的算力条件下训练出来的,和前沿实验室相比差距很大。这也限制了模型能力继续提升的空间——因为很多改进最终都会受制于一个问题:能不能用更多 GPU、跑更长时间的训练。现在算力规模上来之后,他们认为模型会有机会带来真正差异化的能力。
更重要的是,这个新模型不会只面向代码能力。团队希望它具备更通用的智能,因为 Cursor 的目标不只是让 AI 写代码,而是让任何人都能构建自己想要的东西。如今真正的瓶颈,已经不只是「代码写得好不好」,而是 AI 能不能像一个工程师同事一样工作。
这意味着模型需要会使用工程师常用的工具,能做规划,能测试软件,能真正点进界面里检查按钮和交互,也能清楚地向用户展示 Agent 到底改了什么。说白了,Cursor 想把模型能力从单纯的代码生成,推进到更完整的软件工程协作能力。
演讲中 Truell 还提到,这个模型的训练已经启动,预计会在接下来的几周内发布。相关能力背后也有外部算力或基础设施合作支持——这背后说的,显然就是 SpaceX 了。
当然,真正的答案,还要等模型发布后才能揭晓。

