AI包月折扣取消:OpenAI与Anthropic涨价对比

2026-05-31阅读 0热度 0
Anthropic


2180.16美元的token消耗,他只付了200美元。

这笔账是独立开发者Simon Willison在自己笔记本上算出来的。这位Django框架的联合创始人,写了二十年代码,也是英语圈里最早将AI编程工具用到极致的那批人。他常年用博客记录自己在各种AI工具上的尝试,眼下Claude Code和Codex是他的主力。

过去30天,他在Claude Code上烧掉了价值1199.79美元的token,Codex上是980.37美元,加总2180.16美元。而他每月实付的,仅仅是Anthropic的100美元Max订阅加上OpenAI的100美元Pro,一共200美元。

200块的订阅,撬动了2180块的算力。他自己都觉得这买卖不亏,赚翻了。

但很快他就意识到,自己犯了一个根本性的判断错误——他原以为,那些重度使用Agent的大公司,凭借采购规模,单位成本只会比他更低。事实恰恰相反:企业续约之后,面对的往往是更接近API原价的token账单。


消失的包月折扣

先看OpenAI这边。根据其最新的帮助中心说明,2026年4月2日起,Codex的计费方式正式与API的token用量对齐,不再按消息估算。


这次调整首先覆盖了新老Plus、Pro、Business以及新的Enterprise方案。旧模式是按消息估算——发一条消息等于固定扣掉N个额度,不管这条消息背后Agent读了多长的上下文、调用了多少次工具、重试了几遍。新模式直接按token用量计费,输入token、缓存输入token、输出token三类分别计算,跑了多少就付多少。

这就像把自助餐按人头收费改成了按克称重。对于动辄读取几十万token上下文、反复调用工具的重度Agent任务,新方案通常更贵,也更接近真实成本。

三周之后,4月23日,这套token计费模式扩展到了所有现有的Enterprise方案,连同Edu、Health、Gov和ChatGPT for Teachers一起,全部囊括进来。

过去企业关心的是“每人每月多少钱”,现在真正决定账单的,是Agent到底跑了多少token。过去签的是包月套餐,用量基本管够,相当于享受了一笔看不见的巨额折扣。4月之后,这层折扣被抽掉了,续约时大家才发现,需要面对的是API原价。

标价没涨,账单却涨了

OpenAI的做法算是明着涨价。最新价格页显示,GPT-5.5的API单价是输入5美元、输出30美元,每百万token。相比上一代GPT-5.4的输入2.5美元、输出15美元,直接翻了一番。


Anthropic这边,乍一看价格没动。最新价格表里,Opus 4.7和Opus 4.6的名义单价一模一样,都是输入5美元、输出25美元,每百万token。


但玄机藏在另一行小字里——Opus 4.7换了一套新的tokenizer。同样的文档喂进去,被切成的token数量可能增加,最多能多出35%。单价没动,总价却高了。Simon Willison估算,把这笔账算进去,Opus 4.7的有效价格大约是Opus 4.6的1.4倍。

真相很清晰:OpenAI把价格写在台面上,Anthropic把成本藏进了tokenizer里。一个明升,一个暗涨,各有各的玩法。

代码智能体,第一次让大厂赚到了钱

两个竞争对手,为什么敢在同一个月、几乎同步地提价?

答案就是投资人嘴里的那个词:PMF(产品与市场契合)。说白了,这两家终于找到了能让用户大把烧钱、还离不开的产品。

先看消费者订阅这笔账。


今年2月,ChatGPT产品负责人Nick Turley发推官宣:周活跃用户突破9亿,付费用户突破5000万。数据看起来很漂亮。但Simon Willison算了一笔细账:9亿人使用,5000万人付费,付费率只有5.6%。每人每月10到20美元,听着不少,可OpenAI自己的目标是上万亿美元的基建投入。按照这个速率,要凑够10亿到20亿付费用户,需要四年,这条路太长了。

代码智能体走的是另一条路。它面向的是一群极高薪的专业人士——工程师。他们烧掉的token比普通用户多得多。像Simon Willison这样的重度用户,单一家厂商每月就能烧出约1000美元。一个程序员一个月的付费能力,顶得上几十个聊天框用户。

Anthropic从一开始就把产品押在了编程和企业用户上。Opus 4.7专门面向专业软件工程、复杂智能体工作流和高风险企业任务,瞄准的正是“高价值工作+高消耗”这条线。据《华尔街日报》报道,Anthropic向投资者预计,二季度营收有望冲到109亿美元,并可能首次实现季度运营盈利。


方向已经很清楚:消费者订阅贡献人气,代码智能体才是大厂第一张能兑现的支票。PMF说穿了,不是看用户有多少,而是看他们愿意烧多少。

被绕过的中间商,与失控的预算

这场变局里,有人狂喜,也有人坐立难安。

最先受冲击的是夹在中间的工具商。Claude Code和Codex直接触达企业的工程团队,等于把Cursor、Copilot、Devin这些中间层的议价空间,一口一口吃掉。这些中间层对模型厂商的依赖有多深?据VentureBeat在2025年8月的报道,当时Anthropic约40亿美元的营收里,光是Cursor和GitHub Copilot两家就贡献了12亿美元。

大厂直连工程师的那一刻,中间商的议价权就开始动摇。如今,Cursor已经开始以自研模型反击上游,不然命运就要攥在别人手里。


继3月的Composer 2后,Cursor于5月再发自研模型Composer 2.5,价格较旧版降约86%,基准比肩Opus 4.7。

另一边,被频频拿出来当反例的是“AI账单失控”,焦点之一就是Uber。据The Information报道,Uber进入2026年才几个月,就把全年的AI预算花光了,主因正是Claude Code。听上去吓人,其实不难理解——Claude Code直到2025年11月才好用到能当日常主力,一份2025年定下的预算,没料到2026年需求会这么猛,超支再正常不过。

还有微软取消部分Claude Code许可的传闻。据The Verge报道,这背后除了想推自家的Copilot CLI,也夹着财年节点的成本考量。如果两笔账一起算,未必是Claude Code不值。

把这些案例摆在一起,会发现一个共同点:暴涨的AI算力需求,正在冲垮那套保守的旧预算模型。这场浪潮中,真正被动的,是那些站在巨头和工程师之间、靠差价吃饭的中间商。

从座席费到FinOps

那么,当Agent按token计费成为常态,企业该怎么办?

游戏规则已经变了。决定账单的,不再是每人每月多少美元的座席费,而是Agent跑了多长的上下文、调用了多少次工具、重试了几遍、有没有开Fast mode、缓存命中率高不高。这意味着企业用AI,已经进入了云计算式的成本治理阶段。

预算上限、模型路由、缓存策略、审批流程、用量可观测性……这套FinOps(云成本治理)的工作,一样都不能少。AI智能体不再是“买了座席随便用”,而是要像云账单一样,被精打细算地管理起来。

这场变局有多大,真正的数字还没出来。从SpaceX最近的S-1文件里可以窥见冰山一角:


SpaceX的S-1招股文件原文显示,Anthropic自2026年5月起与SpaceX签署云服务协议,获得COLOSSUS和COLOSSUS II的算力容量,约定费用最高约为每月12.5亿美元,期限至2029年5月。一家公司愿意每月砸12.5亿美元买推理算力,账单另一头那串营收数字只会更惊人——那要等Anthropic和OpenAI的IPO招股书,才能看到经过审计的数字。

在那之前,企业能做的只有一件事:先管好自己的token。

参考资料:
https://simonwillison.net/2026/May/27/product-market-fit/
https://www.wsj.com/tech/ai/mind-blowing-growth-is-about-to-propel-anthropic-into-its-first-profitable-quarter-7edbf2f4


免责声明

本网站新闻资讯均来自公开渠道,力求准确但不保证绝对无误,内容观点仅代表作者本人,与本站无关。若涉及侵权,请联系我们处理。本站保留对声明的修改权,最终解释权归本站所有。

相关阅读

更多
欢迎回来 登录或注册后,可保存提示词和历史记录
登录后可同步收藏、历史记录和常用模板
注册即表示同意服务条款与隐私政策