AI包月折扣取消：OpenAI与Anthropic涨价对比

2026-05-31阅读 0热度 0

Anthropic

2180.16美元的token消耗，他只付了200美元。

这笔账是独立开发者Simon Willison在自己笔记本上算出来的。这位Django框架的联合创始人，写了二十年代码，也是英语圈里最早将AI编程工具用到极致的那批人。他常年用博客记录自己在各种AI工具上的尝试，眼下Claude Code和Codex是他的主力。

过去30天，他在Claude Code上烧掉了价值1199.79美元的token，Codex上是980.37美元，加总2180.16美元。而他每月实付的，仅仅是Anthropic的100美元Max订阅加上OpenAI的100美元Pro，一共200美元。

200块的订阅，撬动了2180块的算力。他自己都觉得这买卖不亏，赚翻了。

但很快他就意识到，自己犯了一个根本性的判断错误——他原以为，那些重度使用Agent的大公司，凭借采购规模，单位成本只会比他更低。事实恰恰相反：企业续约之后，面对的往往是更接近API原价的token账单。

消失的包月折扣

先看OpenAI这边。根据其最新的帮助中心说明，2026年4月2日起，Codex的计费方式正式与API的token用量对齐，不再按消息估算。

这次调整首先覆盖了新老Plus、Pro、Business以及新的Enterprise方案。旧模式是按消息估算——发一条消息等于固定扣掉N个额度，不管这条消息背后Agent读了多长的上下文、调用了多少次工具、重试了几遍。新模式直接按token用量计费，输入token、缓存输入token、输出token三类分别计算，跑了多少就付多少。

这就像把自助餐按人头收费改成了按克称重。对于动辄读取几十万token上下文、反复调用工具的重度Agent任务，新方案通常更贵，也更接近真实成本。

三周之后，4月23日，这套token计费模式扩展到了所有现有的Enterprise方案，连同Edu、Health、Gov和ChatGPT for Teachers一起，全部囊括进来。

过去企业关心的是“每人每月多少钱”，现在真正决定账单的，是Agent到底跑了多少token。过去签的是包月套餐，用量基本管够，相当于享受了一笔看不见的巨额折扣。4月之后，这层折扣被抽掉了，续约时大家才发现，需要面对的是API原价。

标价没涨，账单却涨了

OpenAI的做法算是明着涨价。最新价格页显示，GPT-5.5的API单价是输入5美元、输出30美元，每百万token。相比上一代GPT-5.4的输入2.5美元、输出15美元，直接翻了一番。

Anthropic这边，乍一看价格没动。最新价格表里，Opus 4.7和Opus 4.6的名义单价一模一样，都是输入5美元、输出25美元，每百万token。

但玄机藏在另一行小字里——Opus 4.7换了一套新的tokenizer。同样的文档喂进去，被切成的token数量可能增加，最多能多出35%。单价没动，总价却高了。Simon Willison估算，把这笔账算进去，Opus 4.7的有效价格大约是Opus 4.6的1.4倍。

真相很清晰：OpenAI把价格写在台面上，Anthropic把成本藏进了tokenizer里。一个明升，一个暗涨，各有各的玩法。

代码智能体，第一次让大厂赚到了钱

两个竞争对手，为什么敢在同一个月、几乎同步地提价？

答案就是投资人嘴里的那个词：PMF（产品与市场契合）。说白了，这两家终于找到了能让用户大把烧钱、还离不开的产品。

先看消费者订阅这笔账。

今年2月，ChatGPT产品负责人Nick Turley发推官宣：周活跃用户突破9亿，付费用户突破5000万。数据看起来很漂亮。但Simon Willison算了一笔细账：9亿人使用，5000万人付费，付费率只有5.6%。每人每月10到20美元，听着不少，可OpenAI自己的目标是上万亿美元的基建投入。按照这个速率，要凑够10亿到20亿付费用户，需要四年，这条路太长了。

代码智能体走的是另一条路。它面向的是一群极高薪的专业人士——工程师。他们烧掉的token比普通用户多得多。像Simon Willison这样的重度用户，单一家厂商每月就能烧出约1000美元。一个程序员一个月的付费能力，顶得上几十个聊天框用户。

Anthropic从一开始就把产品押在了编程和企业用户上。Opus 4.7专门面向专业软件工程、复杂智能体工作流和高风险企业任务，瞄准的正是“高价值工作+高消耗”这条线。据《华尔街日报》报道，Anthropic向投资者预计，二季度营收有望冲到109亿美元，并可能首次实现季度运营盈利。

方向已经很清楚：消费者订阅贡献人气，代码智能体才是大厂第一张能兑现的支票。PMF说穿了，不是看用户有多少，而是看他们愿意烧多少。

被绕过的中间商，与失控的预算

这场变局里，有人狂喜，也有人坐立难安。

最先受冲击的是夹在中间的工具商。Claude Code和Codex直接触达企业的工程团队，等于把Cursor、Copilot、Devin这些中间层的议价空间，一口一口吃掉。这些中间层对模型厂商的依赖有多深？据VentureBeat在2025年8月的报道，当时Anthropic约40亿美元的营收里，光是Cursor和GitHub Copilot两家就贡献了12亿美元。

大厂直连工程师的那一刻，中间商的议价权就开始动摇。如今，Cursor已经开始以自研模型反击上游，不然命运就要攥在别人手里。

继3月的Composer 2后，Cursor于5月再发自研模型Composer 2.5，价格较旧版降约86%，基准比肩Opus 4.7。

另一边，被频频拿出来当反例的是“AI账单失控”，焦点之一就是Uber。据The Information报道，Uber进入2026年才几个月，就把全年的AI预算花光了，主因正是Claude Code。听上去吓人，其实不难理解——Claude Code直到2025年11月才好用到能当日常主力，一份2025年定下的预算，没料到2026年需求会这么猛，超支再正常不过。

还有微软取消部分Claude Code许可的传闻。据The Verge报道，这背后除了想推自家的Copilot CLI，也夹着财年节点的成本考量。如果两笔账一起算，未必是Claude Code不值。

把这些案例摆在一起，会发现一个共同点：暴涨的AI算力需求，正在冲垮那套保守的旧预算模型。这场浪潮中，真正被动的，是那些站在巨头和工程师之间、靠差价吃饭的中间商。

从座席费到FinOps

那么，当Agent按token计费成为常态，企业该怎么办？

游戏规则已经变了。决定账单的，不再是每人每月多少美元的座席费，而是Agent跑了多长的上下文、调用了多少次工具、重试了几遍、有没有开Fast mode、缓存命中率高不高。这意味着企业用AI，已经进入了云计算式的成本治理阶段。

预算上限、模型路由、缓存策略、审批流程、用量可观测性……这套FinOps（云成本治理）的工作，一样都不能少。AI智能体不再是“买了座席随便用”，而是要像云账单一样，被精打细算地管理起来。

这场变局有多大，真正的数字还没出来。从SpaceX最近的S-1文件里可以窥见冰山一角：

SpaceX的S-1招股文件原文显示，Anthropic自2026年5月起与SpaceX签署云服务协议，获得COLOSSUS和COLOSSUS II的算力容量，约定费用最高约为每月12.5亿美元，期限至2029年5月。一家公司愿意每月砸12.5亿美元买推理算力，账单另一头那串营收数字只会更惊人——那要等Anthropic和OpenAI的IPO招股书，才能看到经过审计的数字。

在那之前，企业能做的只有一件事：先管好自己的token。

参考资料：
https://simonwillison.net/2026/May/27/product-market-fit/
https://www.wsj.com/tech/ai/mind-blowing-growth-is-about-to-propel-anthropic-into-its-first-profitable-quarter-7edbf2f4

AI包月折扣取消：OpenAI与Anthropic涨价对比

消失的包月折扣

标价没涨，账单却涨了

代码智能体，第一次让大厂赚到了钱

被绕过的中间商，与失控的预算

从座席费到FinOps

相关阅读

最新教程

最新资讯