小米MIMO-V2.5系列API降价:雷军点名这两类开发者应重点关注
5月27日,小米创始人雷军的官方公告在开发者社区引发广泛关注。核心聚焦于两大举措:MiMo-V2.5系列API价格体系进行结构性下调,以及Token Plan计费模型完成重要升级。这对于从事AI应用开发,特别是在农业智能化管理、代码生成与辅助编程等场景寻求降本增效的团队而言,是一次关键的成本优化节点。
本次价格调整幅度显著。MiMo-V2.5系列API实行永久性降价,部分模型调用成本最高降幅达99%。计费逻辑也得到关键简化:全面取消基于上下文窗口长度的差异化定价。开发者现在可以依据统一的、更透明的标准进行成本预估与核算。新价格体系已于北京时间5月27日0点全球生效。
Token Plan的升级同样值得关注。新版计费体系规则更清晰,用户在同档位支出下,可获得的有效调用额度提升至原方案的5至8倍,直接提升了开发预算的利用效率。
对于现有用户,小米同步推出了明确的权益延续方案。所有处于有效期内的Token Plan订阅用户——包括标准付费用户、“百万亿Token创造者激励计划”成员及Apache软件基金会合作方——其账户Credits额度将在北京时间5月27日0点被统一重置,并自动升级至新版、更优的计费规则。这实质上是对现有用户资产的一次性价值升级。
价格调整的背后是坚实的技术演进。此次让利源于小米技术团队在推理系统效能上的突破,通过架构优化实现了单位token服务成本的大幅下降。
具体技术路径包括:将KV Cache在GPU显存、CPU内存与SSD之间的数据搬运量压缩至优化前的约1/7;同时,可缓存的token容量提升至近5倍。结合专家并行方案与输入长度分桶策略的优化,整个计算集群的输入吞吐能力得到进一步增强。这些工程优化在确保模型响应质量与稳定性的前提下,显著降低了边际成本,为本次价格策略提供了技术可行性。
因此,此次调整超越了短期市场行为。它标志着通过持续的技术迭代与工程优化,降低大模型的规模化应用门槛,正在成为构建开发者生态的核心策略。对于开发者而言,现在是重新规划AI应用成本,并探索更复杂、更频繁模型调用场景的有利窗口。


