罗福莉怒批大模型价格战:行业理性何在
这两天AI圈发生了一件颇具行业意义的事件,恰好与我们近期的战略思考不谋而合。4月6日,小米MiMo大模型负责人罗福莉在社交平台X上发表长文,将Anthropic封禁OpenClaw等第三方工具的动作,与MiMo最新推出的Token Plan联系起来,深入探讨了Agent算力分配与定价策略的核心逻辑。
事件导火索是4月4日,Anthropic宣布Claude将不再支持OpenClaw这类第三方工具的直连调用。用户若继续使用,只能选择额外的套餐或直接通过API Key接入。这实质上堵住了一个漏洞——过去,借助OpenClaw等开源框架的用户,可以通过月费订阅模式大量消耗Claude算力,而现在这条路已被彻底切断。
罗福莉的核心观点,可以提炼为以下五条:
第一,Claude Code的订阅本质是一套精密的算力均衡系统,目前很可能处于亏损状态;而第三方框架的上下文管理严重低效,实际成本可能高达订阅价格的几十倍。
第二,封禁并非完全阻断,第三方框架仍可通过API调用Claude。短期的“阵痛”将倒逼框架进行工程优化,最终沉淀为行业标准规范。
第三,那种“低价售卖token+对第三方完全开放”的模式,表面诱人,实则暗藏风险,大模型公司不应盲目陷入价格战。
第四,MiMo的Token Plan采用按token额度计费的方式,全面支持第三方框架接入,核心目标是确保长期、稳定的高质量服务交付。
第五,行业真正的突破口,不在于追求更便宜的token,而在于推动高效Agent框架与强大模型能力的协同进化。
一、第三方框架的“效率黑洞”:token浪费到底有多严重?
先聚焦Claude Code的订阅机制。它本质上是一套为均衡算力分配而设计的系统。行业普遍的猜测是:这款产品大概率不盈利,甚至持续亏损。除非Anthropic的API利润率能达到惊人的10到20倍,但这可能性微乎其微。
第三方框架接入带来的具体亏损数字难以精准量化,但问题根源非常清晰:上下文管理能力堪忧。以OpenClaw为例,它处理单次用户查询时,往往将多轮低价值的工具调用拆解成多个独立的API请求。关键问题在于,每次请求都携带一个超长的上下文窗口,动辄超过10万token。
即便缓存机制能命中部分内容,这种做法依然极度浪费。更糟糕的是,它还会显著抬高其他查询的缓存未命中率。最终结果就是,处理一次查询的实际API请求数,比Claude Code最新原生框架高出数倍。
如果按API标准定价折算,真实成本轻松达到订阅价格的几十倍。这不是一个小缺口,称之为“效率黑洞”毫不为过。
二、封禁的背后逻辑:短期阵痛与长期规范
那么,Anthropic是否要彻底封杀第三方框架?并非如此。OpenClaw、OpenCode这类框架依然可以通过API调用Claude,只是不能再“蹭”着订阅套餐享受低价。短期内,最直接的影响就是使用这些Agent的用户将面临成本压力,费用可能轻松飙升几十倍。
不过,这种压力未必全是坏事。它恰恰会形成一股强劲的驱动力,迫使框架开发者全力优化上下文管理策略:如何最大化prompt缓存的命中率?如何高效复用已处理过的上下文?如何大幅削减无效的token消耗?
眼前的阵痛,最终会转化为扎实的工程规范。这对整个Agent生态的健康演进,未尝不是一个必要的催化过程。
三、警惕价格战陷阱:大模型公司要先算清这笔账
这里想给所有大模型公司划个重点:在尚未厘清编程解决方案的合理定价模型之前,千万别轻易卷入价格战。
用极低的价格出售token,同时向第三方框架完全敞开大门——这套组合拳看似对开发者极具吸引力,实则是精心设计的陷阱。Anthropic刚刚亲手填上的,正是这个坑。
更深层的问题在于:如果用户把时间和精力耗费在低质量的Agent框架、极不稳定且缓慢的推理服务,以及为了降本而被迫降级的模型上,折腾一圈发现自己什么也没做成,那么用户体验和留存率从何而来?这只会形成一个伤害用户信任的恶性循环。
四、MiMo Token Plan的设计逻辑:以稳定与高质量为锚
我们设计MiMo Token Plan时,明确支持第三方框架接入,并按token额度计费。底层的商业逻辑与Claude近期推出的额外用量包如出一辙。为什么这样设计?核心目标只有一个:追求长期、稳定地交付高质量的模型与服务。
我们不做一锤子买卖,不想让用户冲动付费后因体验不佳而流失。可持续的Agent生态,必须建立在可持续的服务质量之上。

▲雷军发布关于MiMo Token Plan定价介绍(图源:微博)
五、真正的出路:效率与能力的协同进化
把视野拉得更宏观一点:全球算力供给的增速,已经逐渐落后于Agent应用所创造的token需求增速。在这种背景下,一味追求“更便宜的token”只会走向死胡同。
真正的突破点在于协同进化——让“token使用效率更高的Agent框架”与“能力更强、推理更高效的模型”相互促进、共同升级。
Anthropic此次举措,无论其具体初衷如何,客观上正在推动整个生态向更清晰的方向分化:开源框架和闭源框架都必须各自找到效率最优解。这大概是件好事。Agent时代,不属于烧掉最多算力的人,而属于把算力用得最聪明的人。
结语:平衡的艺术——算力、框架与定价
在Agent加速落地的当下,行业竞争的核心逻辑正在发生根本性转变:从“谁的token更便宜”,转向“谁能把算力用得更有价值”。Anthropic对第三方工具调用路径的收紧,以及MiMo Token Plan的设计思路,都指向同一个结论:大模型的商业化已经进入更精细、更务实的深水区。
未来的AI编程解决方案,胜负手不再只是模型能力本身。上下文管理的精细度、框架的运行效率、服务的长期稳定性,以及与之相匹配的定价逻辑——这一整套系统的平衡能力,才是真正的关键。谁能真正帮助开发者用更少的浪费撬动更高的产出,谁才可能在下一轮Agent生态的竞争中占据主导地位。
