罗福莉怒批大模型价格战：行业理性何在

2026-06-24阅读 0热度 0

调用编程罗福莉大模型上下文

这两天AI圈发生了一件颇具行业意义的事件，恰好与我们近期的战略思考不谋而合。4月6日，小米MiMo大模型负责人罗福莉在社交平台X上发表长文，将Anthropic封禁OpenClaw等第三方工具的动作，与MiMo最新推出的Token Plan联系起来，深入探讨了Agent算力分配与定价策略的核心逻辑。

▲罗福莉在社交媒体X上的发文部分截图（图源：X）

事件导火索是4月4日，Anthropic宣布Claude将不再支持OpenClaw这类第三方工具的直连调用。用户若继续使用，只能选择额外的套餐或直接通过API Key接入。这实质上堵住了一个漏洞——过去，借助OpenClaw等开源框架的用户，可以通过月费订阅模式大量消耗Claude算力，而现在这条路已被彻底切断。

罗福莉的核心观点，可以提炼为以下五条：

第一，Claude Code的订阅本质是一套精密的算力均衡系统，目前很可能处于亏损状态；而第三方框架的上下文管理严重低效，实际成本可能高达订阅价格的几十倍。

第二，封禁并非完全阻断，第三方框架仍可通过API调用Claude。短期的“阵痛”将倒逼框架进行工程优化，最终沉淀为行业标准规范。

第三，那种“低价售卖token+对第三方完全开放”的模式，表面诱人，实则暗藏风险，大模型公司不应盲目陷入价格战。

第四，MiMo的Token Plan采用按token额度计费的方式，全面支持第三方框架接入，核心目标是确保长期、稳定的高质量服务交付。

第五，行业真正的突破口，不在于追求更便宜的token，而在于推动高效Agent框架与强大模型能力的协同进化。

一、第三方框架的“效率黑洞”：token浪费到底有多严重？

先聚焦Claude Code的订阅机制。它本质上是一套为均衡算力分配而设计的系统。行业普遍的猜测是：这款产品大概率不盈利，甚至持续亏损。除非Anthropic的API利润率能达到惊人的10到20倍，但这可能性微乎其微。

第三方框架接入带来的具体亏损数字难以精准量化，但问题根源非常清晰：上下文管理能力堪忧。以OpenClaw为例，它处理单次用户查询时，往往将多轮低价值的工具调用拆解成多个独立的API请求。关键问题在于，每次请求都携带一个超长的上下文窗口，动辄超过10万token。

即便缓存机制能命中部分内容，这种做法依然极度浪费。更糟糕的是，它还会显著抬高其他查询的缓存未命中率。最终结果就是，处理一次查询的实际API请求数，比Claude Code最新原生框架高出数倍。

如果按API标准定价折算，真实成本轻松达到订阅价格的几十倍。这不是一个小缺口，称之为“效率黑洞”毫不为过。

二、封禁的背后逻辑：短期阵痛与长期规范

那么，Anthropic是否要彻底封杀第三方框架？并非如此。OpenClaw、OpenCode这类框架依然可以通过API调用Claude，只是不能再“蹭”着订阅套餐享受低价。短期内，最直接的影响就是使用这些Agent的用户将面临成本压力，费用可能轻松飙升几十倍。

不过，这种压力未必全是坏事。它恰恰会形成一股强劲的驱动力，迫使框架开发者全力优化上下文管理策略：如何最大化prompt缓存的命中率？如何高效复用已处理过的上下文？如何大幅削减无效的token消耗？

眼前的阵痛，最终会转化为扎实的工程规范。这对整个Agent生态的健康演进，未尝不是一个必要的催化过程。

三、警惕价格战陷阱：大模型公司要先算清这笔账

这里想给所有大模型公司划个重点：在尚未厘清编程解决方案的合理定价模型之前，千万别轻易卷入价格战。

用极低的价格出售token，同时向第三方框架完全敞开大门——这套组合拳看似对开发者极具吸引力，实则是精心设计的陷阱。Anthropic刚刚亲手填上的，正是这个坑。

更深层的问题在于：如果用户把时间和精力耗费在低质量的Agent框架、极不稳定且缓慢的推理服务，以及为了降本而被迫降级的模型上，折腾一圈发现自己什么也没做成，那么用户体验和留存率从何而来？这只会形成一个伤害用户信任的恶性循环。

四、MiMo Token Plan的设计逻辑：以稳定与高质量为锚

我们设计MiMo Token Plan时，明确支持第三方框架接入，并按token额度计费。底层的商业逻辑与Claude近期推出的额外用量包如出一辙。为什么这样设计？核心目标只有一个：追求长期、稳定地交付高质量的模型与服务。

我们不做一锤子买卖，不想让用户冲动付费后因体验不佳而流失。可持续的Agent生态，必须建立在可持续的服务质量之上。

▲雷军发布关于MiMo Token Plan定价介绍（图源：微博）

五、真正的出路：效率与能力的协同进化

把视野拉得更宏观一点：全球算力供给的增速，已经逐渐落后于Agent应用所创造的token需求增速。在这种背景下，一味追求“更便宜的token”只会走向死胡同。

真正的突破点在于协同进化——让“token使用效率更高的Agent框架”与“能力更强、推理更高效的模型”相互促进、共同升级。

Anthropic此次举措，无论其具体初衷如何，客观上正在推动整个生态向更清晰的方向分化：开源框架和闭源框架都必须各自找到效率最优解。这大概是件好事。Agent时代，不属于烧掉最多算力的人，而属于把算力用得最聪明的人。

结语：平衡的艺术——算力、框架与定价

在Agent加速落地的当下，行业竞争的核心逻辑正在发生根本性转变：从“谁的token更便宜”，转向“谁能把算力用得更有价值”。Anthropic对第三方工具调用路径的收紧，以及MiMo Token Plan的设计思路，都指向同一个结论：大模型的商业化已经进入更精细、更务实的深水区。

未来的AI编程解决方案，胜负手不再只是模型能力本身。上下文管理的精细度、框架的运行效率、服务的长期稳定性，以及与之相匹配的定价逻辑——这一整套系统的平衡能力，才是真正的关键。谁能真正帮助开发者用更少的浪费撬动更高的产出，谁才可能在下一轮Agent生态的竞争中占据主导地位。