MiMo-V2.5调价与激励计划收官:创作者百万亿Token奖励全解析
过去几个月,我们通过MiMo Orbit、百万亿Token创造者激励计划等举措,为开发者提供了直接体验MiMo并将其应用于真实业务场景的机会。这标志着MiMo规模化应用进程的正式启动。
今天,基于底层推理技术的持续突破,我们得以迈出更具决定性的一步:对模型服务的定价体系进行永久性的全面革新。
核心更新速览
- MiMo-V2.5系列API永久降价:最高降幅达99%,并统一了上下文长度计费标准。
- Token Plan计费体系优化:同等价值的计划,可用Token量提升至原方案的5-8倍,计费规则更加透明。
- 百万亿Token创造者激励计划圆满收官:计划内100T Tokens已提前完成发放。
- 当前有效Token Plan用户额度全量重置:所有在期用户将依据新规则获得全新额度。
生效时间:北京时间2026年5月27日0点。
MiMo-V2.5系列API永久降价
本次调价后,MiMo-V2.5系列API的调用成本显著降低,最高降幅达99%。新的定价体系不再区分上下文窗口长度,简化了模型选择流程,使成本预估更为直接和准确。
此次价格调整将于北京时间5月27日0:00全球同步生效,欢迎开发者接入测试。
Token Plan计费体系优化
除了API降价,Token Plan也完成了重要升级,核心是“加量不加价”。
- 用量大幅提升:在新的计费规则下,同等价值的Token Plan,其可用Token数量提升至原来的5-8倍。这意味着在Agent构建、代码生成等高消耗场景中,您的开发预算将更为宽裕。
- 规则清晰易懂:我们对计费规则进行了简化和优化,实现了“所见即所得”的透明化计费,让开发者能够清晰掌控资源消耗情况。
百万亿Token创造者激励计划圆满收官
“百万亿Token创造者激励计划”自4月28日启动以来,获得了全球开发者的积极参与。截至北京时间5月26日16:08,计划内的100T Tokens已全部提前发放完毕,活动顺利结束。我们在此感谢每一位参与者的支持。
请注意,Apache软件基金会成员的专属福利申请通道将保持长期开放,不受本次激励计划结束的影响。
惊喜:现有Token Plan用户额度全量重置
作为本次升级的特别福利,所有已订阅且当前仍在有效期内的Token Plan用户(包括通过百万亿Token激励计划及Apache专属福利获得计划的用户),其Credits额度将于北京时间5月27日0:00被全量重置,并立即按照新的、更优惠的计费规则执行。
此外,针对Token Plan已过期的历史付费用户,我们也准备了专属回馈礼遇,具体细节将于未来一周内公布。
推理技术优化说明
此次大规模价格调整的基石,是小米技术团队在推理系统上的深度优化。我们基于SGLang HiCache完整支持了SWA(滑动窗口注意力)技术,将KV Cache在GPU显存、CPU内存和SSD等多级存储间的数据搬运量降至优化前的近1/7,同时将可缓存的token数量提升至近5倍。这大幅提高了缓存命中率与整体推理效率。
同时,通过对专家并行方案、输入长度分桶策略等关键组件的优化,我们进一步提升了集群的输入吞吐能力。正是在确保服务质量不打折扣的前提下,单位token的服务成本得以持续下降,为本次永久性降价提供了坚实的技术支撑。关于推理优化的更多技术细节,我们将在后续的技术博客中详细解读。
结语
任何技术的终极价值,都体现在其被广泛应用的深度与广度上。我们坚信,通过持续的技术创新,能够构建出兼具顶尖性能与普惠成本模型的服务。这不仅是为了降低使用门槛,更是为了激发真实、持续且规模化的AI推理需求,从而推动整个AI基础设施生态的成熟与发展。
让更多人能够用上更强大的模型——这始终是MiMo团队的核心使命。