小米罗福莉LLM 公司应谨慎定价避免价格战引发恶性循环

2026-05-02阅读 0热度 0
小米

小米集团 MiMo 负责人谈AI行业Token价格战:效率才是未来关键

小米集团MiMo负责人罗福莉近日在X平台发表深度分析,直指当前AI行业围绕“Token(词元)”展开的价格竞争。她认为,单纯的价格比拼已陷入误区,真正的竞争壁垒在于工程效率与资源利用率。

▲ 图源:罗福莉本人社媒账号

此番思考的契机,源于Anthropic近期切断Claude第三方工具的订阅通道。几乎同时,MiMo也推出了自身的Token计费方案,这让罗福莉对行业底层逻辑有了更清晰的洞察。她的核心分析聚焦于以下四个维度:

1. 漂亮的订阅设计,难掩巨大的成本鸿沟

Claude Code的订阅机制在资源分配设计上颇具巧思,但其商业模型的可持续性存疑。除非其API利润率能实现数量级的提升,否则该服务很可能处于亏损状态。

根本矛盾在于第三方框架的接入效率。以OpenClaw为例,其上下文管理机制存在显著缺陷。一次用户查询,往往引发多轮低价值工具调用,每一次都是独立的、携带超长上下文(常超过10万tokens)的API请求。

即便存在缓存,这种粗放的调用模式也造成了严重的资源浪费,甚至拉低整体缓存命中率。最终,用户实际触发的API调用量可能是原生框架的数倍,导致实际API成本远超订阅收入,形成难以弥合的成本鸿沟。

2. 断供“便车”,倒逼工程自律

Anthropic此举并非完全封禁。OpenClaw等框架仍可通过API调用Claude,只是无法再借用用户的订阅额度。

短期内,第三方智能体的用户将直接承受成本上升的压力,使用费用可能激增。但这股压力将转化为工程优化的核心动力,迫使框架开发者彻底重构其上下文管理逻辑,提升提示词缓存效率,从根本上降低Token消耗。这实质上是推动行业走向工程自律的关键一步。

3. 警惕价格战陷阱:低效的消耗是恶性循环

基于此,一个务实的行业建议是:大型语言模型公司在设计出具备商业可持续性的编程订阅方案前,应避免盲目卷入Token价格战。

一味压低Token价格并完全开放低效框架接入,表面是用户友好,实则重蹈覆辙。更严重的是,若用户算力被低效Agent大量吞噬,他们将被迫降级使用性能更弱但成本更低的模型,任务完成度无法保障。这对用户体验和长期留存构成恶性循环。

4. MiMo的选择:稳定品质优于冲动消费

MiMo的Token Plan遵循清晰的逻辑:支持第三方工具,按实际Token使用量计费,这与Claude新推出的用量套餐思路一致。其目标是保障长期、稳定的高品质服务输出,而非鼓励不可持续的冲动性消耗。

从宏观算力供需看,全球计算资源的增长已难以匹配Agent应用激发的Token需求指数级暴涨。破局之道不在于提供更廉价的Token,而在于推动“更高效率的Agent框架”与“更强大且更高效的底层模型”协同进化,形成系统性的效率提升。

纵观全局,Anthropic此次调整,客观上推动了开源与闭源生态向更健康、更注重效率的方向演进。这或许是行业走向成熟的必经阶段。

最终,Agent时代的竞争,决胜点不在于谁消耗了最多算力,而在于谁最擅长将每一份算力转化为有效价值

免责声明

本网站新闻资讯均来自公开渠道,力求准确但不保证绝对无误,内容观点仅代表作者本人,与本站无关。若涉及侵权,请联系我们处理。本站保留对声明的修改权,最终解释权归本站所有。

相关阅读

更多
欢迎回来 登录或注册后,可保存提示词和历史记录
登录后可同步收藏、历史记录和常用模板
注册即表示同意服务条款与隐私政策