小米罗福莉LLM 公司应谨慎定价避免价格战引发恶性循环

2026-05-02阅读 0热度 0

小米

小米集团 MiMo 负责人谈AI行业Token价格战：效率才是未来关键

小米集团MiMo负责人罗福莉近日在X平台发表深度分析，直指当前AI行业围绕“Token（词元）”展开的价格竞争。她认为，单纯的价格比拼已陷入误区，真正的竞争壁垒在于工程效率与资源利用率。

▲ 图源：罗福莉本人社媒账号

此番思考的契机，源于Anthropic近期切断Claude第三方工具的订阅通道。几乎同时，MiMo也推出了自身的Token计费方案，这让罗福莉对行业底层逻辑有了更清晰的洞察。她的核心分析聚焦于以下四个维度：

Claude Code的订阅机制在资源分配设计上颇具巧思，但其商业模型的可持续性存疑。除非其API利润率能实现数量级的提升，否则该服务很可能处于亏损状态。

根本矛盾在于第三方框架的接入效率。以OpenClaw为例，其上下文管理机制存在显著缺陷。一次用户查询，往往引发多轮低价值工具调用，每一次都是独立的、携带超长上下文（常超过10万tokens）的API请求。

即便存在缓存，这种粗放的调用模式也造成了严重的资源浪费，甚至拉低整体缓存命中率。最终，用户实际触发的API调用量可能是原生框架的数倍，导致实际API成本远超订阅收入，形成难以弥合的成本鸿沟。

Anthropic此举并非完全封禁。OpenClaw等框架仍可通过API调用Claude，只是无法再借用用户的订阅额度。

短期内，第三方智能体的用户将直接承受成本上升的压力，使用费用可能激增。但这股压力将转化为工程优化的核心动力，迫使框架开发者彻底重构其上下文管理逻辑，提升提示词缓存效率，从根本上降低Token消耗。这实质上是推动行业走向工程自律的关键一步。

基于此，一个务实的行业建议是：大型语言模型公司在设计出具备商业可持续性的编程订阅方案前，应避免盲目卷入Token价格战。

一味压低Token价格并完全开放低效框架接入，表面是用户友好，实则重蹈覆辙。更严重的是，若用户算力被低效Agent大量吞噬，他们将被迫降级使用性能更弱但成本更低的模型，任务完成度无法保障。这对用户体验和长期留存构成恶性循环。

MiMo的Token Plan遵循清晰的逻辑：支持第三方工具，按实际Token使用量计费，这与Claude新推出的用量套餐思路一致。其目标是保障长期、稳定的高品质服务输出，而非鼓励不可持续的冲动性消耗。

从宏观算力供需看，全球计算资源的增长已难以匹配Agent应用激发的Token需求指数级暴涨。破局之道不在于提供更廉价的Token，而在于推动“更高效率的Agent框架”与“更强大且更高效的底层模型”协同进化，形成系统性的效率提升。

纵观全局，Anthropic此次调整，客观上推动了开源与闭源生态向更健康、更注重效率的方向演进。这或许是行业走向成熟的必经阶段。

最终，Agent时代的竞争，决胜点不在于谁消耗了最多算力，而在于谁最擅长将每一份算力转化为有效价值。