小米入局AI价格战:DeepSeek直降99%全面对标深度解析
国产大模型的价格战,又添了一把火。
就在DeepSeek宣布其API促销价将转为永久正式价格后没几天,小米也跟进了。5月27日,小米正式宣布,其MiMo-V2.5系列API价格永久下调,并同步升级了新版Token Plan计费体系。这次调价幅度不小,最高降幅达到了99%,而且不再区分上下文窗口长度,无论是256K还是1M,都统一按一个价来算。
▲MiMo-V2.5系列API价格永久下调(图源:小米)
▲小米MiMo新版Token Plan计费体系:定价不变/Credits大幅提升(图源:小米)
仔细对比一下价格表就能发现,小米这次几乎是直接对标了DeepSeek当前的定价。调整后,MiMo-V2.5的输入缓存命中价格低至每百万Token 0.02元,未命中的输入为1元,输出为2元。更高阶的MiMo-V2.5-Pro也相应下调。这意味着,国内大模型API市场的“地板价”再次被夯实。
▲DeepSeek与小米MiMo API价格对比表(制表)
这个举动颇有些意思。要知道,就在不久前,小米MiMo的负责人还曾公开对行业价格战表达过不同看法。但另一边,小米又通过“100万亿Token免费计划”吸引了大量开发者,一度冲上全球调用量榜首。如今看来,面对激烈的市场竞争,小米最终还是选择了加入战局。
▲罗福莉在X上的发文部分截图(图源:X)
其实,近半年来国内大模型的套餐和定价策略一直在动态调整。有的在降价,也有的在收索低价套餐、减少额度,整体市场呈现出一种复杂的分化态势。小米此次的“永久降价”,无疑让本就白热化的竞争,温度又升高了几度。
一、Token Plan大改版:套餐容量提升5-8倍
除了API直接降价,这次更值得开发者关注的是Token Plan套餐体系的大幅升级。
简单说,就是“加量不加价”。小米重新梳理了计费规则,在保持套餐价格不变的前提下,大幅提升了套餐内的Credits额度,普遍达到了原来的5到8倍。这对于重度用户来说,无疑是个实实在在的利好。
从市场横向对比来看,调整后的小米套餐,其入门档位与市面上几家主流厂商的最低档位处于同一区间,并非最低,但也极具竞争力。而在高阶档位方面,小米也并非最贵的,市场上仍有定价更高的套餐选择。
▲国内大模型订阅制套餐价格对比(制表,统计截止时间为:2026/05/27)
为了让用户更直观地理解,小米还罕见地公布了新版Credits与Token的换算关系,并给出了在高缓存命中率场景下,不同套餐大致能支撑的Token规模。
▲小米MiMo Credits与Token换算关系
按照官方测算,在95%以上缓存命中的理想情况下,即便是39元的Lite套餐,使用MiMo-V2.5也能处理超过5亿Token。而659元的Max套餐,理论可用Token量更是突破了百亿大关。对于代码生成、智能体(Agent)这类缓存命中率通常较高的场景,实际能“薅到的羊毛”还会更多。
顺带一提,之前引发热议的“百万亿Token创造者激励计划”,已经在5月26日提前发放完毕,活动收官。所有现有套餐用户的Credits额度已在5月27日重置并切换至新规则,历史付费用户后续也会有额外福利。
二、小米为什么敢降价?推理系统上的持续优化
价格战背后,终究是技术实力和成本控制能力的比拼。小米这次也给出了降价的底气来源——推理系统的持续优化。
具体来说,团队基于SGLang HiCache完整支持了滑动窗口注意力机制,将KV Cache在GPU、CPU、SSD等多级存储间的数据搬运量大幅降低至优化前的约七分之一,同时可缓存的Token数量提升到了原来的5倍左右。再加上对专家并行方案、输入长度分桶策略的优化,集群的输入吞吐能力得到了提升,从而摊薄了每个Token的推理成本。
这套逻辑其实并不陌生,与DeepSeek的策略有异曲同工之妙:一方面通过更激进的缓存技术提高命中率,降低重复计算;另一方面则持续优化底层推理效率,提升硬件利用率。说到底,长期的价格竞争力,最终要落在推理系统和基础设施的硬功夫上。
三、模型能力进入前排后,小米MiMo补上价格牌
回顾小米MiMo近期的动作,可以发现一条清晰的路线图。
今年4月底,小米正式开源了MiMo-V2.5系列模型,采用宽松的MIT协议,允许商用和二次训练。在多项权威评测中,MiMo-V2.5-Pro的表现已经跻身全球开源模型第一梯队,甚至在部分Agent榜单上与顶级闭源模型并列。
真正让它在开发者社区快速打响知名度的,是5月初那轮“100万亿Token免费计划”。这一波操作直接助推其调用量在第三方平台上一度登顶。当然,这个领域的竞争瞬息万变,榜单排名几乎每周都在洗牌。
▲OpenRouter本周调用榜(截至5月27日上午9点)
截至5月27日,在最新的周榜和月榜中,MiMo的排名有所回落,DeepSeek等模型占据了前列。这恰恰反映了当前市场竞争的激烈程度:模型能力你追我赶,调用量榜单变化迅速,而价格则成为另一个关键的竞争维度。
▲(图源:OpenRouter)
▲(图源:OpenRouter)
在模型能力得到市场初步认可后,小米现在打出了“价格”这张牌。从开源到免费激励,再到如今的永久降价,这一系列组合拳,目的很明确:快速扩大开发者生态和用户基础。
结语:营收利润双降后,小米还是下场打起了价格战
值得注意的是,小米此次宣布降价,正值其发布最新一季度财报之后。财报显示,公司营收和净利润均出现同比下滑。然而,在整体业务承压的背景下,小米对AI的投入却并未减速,当季研发开支同比增长超过30%,研发人员数量创下历史新高。
管理层在财报沟通中也频繁提及AI,并暗示未来的投资可能会根据业务发展进一步增加。这传递出一个清晰的信号:AI是小米必须抓住的战略方向,即便短期需要承受压力。
从开源模型、冲击榜单,到如今直接卷入价格战,小米在AI领域的进攻姿态越来越明显。这场竞争早已超越了单纯的模型能力比拼,演变为一场围绕推理效率、算力成本和长期资金耐力的综合消耗战。随着价格底线被不断试探,市场洗牌的速度,恐怕只会越来越快。









