小米大模型API降价99%深度解析:行业影响与开发者应对策略
图片来源:界面图库
大模型市场的价格竞争再次升级。小米技术今日发布公告,宣布其MiMo-V2.5系列API实行永久性降价,最高降幅达到99%。此举距离DeepSeek宣布永久降价仅过去很短时间,一场围绕API调用成本的极限价格战已全面开启。
此次调价,小米不仅调整了价格,更重构了计费规则。公司取消了传统定价中按上下文窗口长度区分的模式,并对Token Plan计费体系进行了优化。核心在于,在同等付费水平下,开发者可使用的Token量最高可提升至原先的5到8倍,显著提升了资源利用效率。
具体降价细节显示力度空前。以高性能的MiMo-V2.5-Pro为例,调价后,输入缓存命中的价格降至0.025元/百万tokens。对比原价中≤256k规格的1.40元,降幅为98%;若对比原256k-1M长窗口规格的2.80元,降幅则触及99%。输入未命中缓存和输出的价格也分别实现了57%至86%的显著下调。
标准版MiMo-V2.5的降价同样激进。其输入缓存命中价格调整至0.020元/百万tokens,相比原价最高降幅达98%;输入未命中缓存和输出的价格降幅区间为64%到93%。这对于广大中小型开发者而言,大幅降低了模型接入与创新试错的成本门槛。
需要注意的是,本次调价核心聚焦于MiMo-V2.5系列。MiMo-V2.5-TTS系列维持限时免费接入政策,而更早的MiMo-V2-Pro与MiMo-V2-Omni两款高阶模型API价格保持不变。同时,旧系列的Token Plan套餐将不再调整并计划下线。这一系列动作明确指向一个战略目标:引导开发者生态全面迁移至性价比更优的V2.5系列。
小米的AI战略布局与人才引擎
MiMo-V2.5系列的快速演进,离不开其技术负责人罗福莉的推动。这位曾任职于DeepSeek的95后AI专家,于2025年11月加入小米并主导MiMo大模型研发。其团队平均年龄25岁,清北毕业生占比超60%。市场信息显示,雷军以极具竞争力的薪酬方案,吸引了这位年轻的技术领军者。
在罗福莉的带领下,小米MiMo大模型实现了快速迭代。今年3月,小米发布了MiMo-V2-Pro、MiMo-V2-Omni、MiMo-V2-TTS三大基础模型,随后迅速推出V2.5进阶版本,完善了高性能推理、轻量化交互及语音合成等全场景能力。目前,V2.5系列已成为小米面向商用普惠市场的主力产品线。
小米已构建起层次清晰的MiMo大模型产品矩阵:MiMo-V2.5-Pro定位高性能复杂推理,服务于企业级智能体开发与深度业务分析;MiMo-V2.5面向轻量化通用需求,覆盖广大中小开发者;MiMo-V2.5-TTS以免费策略主攻语音合成赛道,旨在抢占音频生态入口。此外,定位旗舰基座的MiMo-V2-Pro与专注全模态融合的MiMo-V2-Omni,共同构成了技术高地。
就在降价公告发布前夕,小米创始人雷军对外透露,“Xiaomi MiMo-V2.5-Pro在Artificial Analysis榜单的综合智能指数与Agent指数上,已取得全球开源模型并列第一的成绩”。他同时宣布,未来三年小米在AI领域的投入计划高达600亿元。这向市场传递了一个明确信号:小米正全力投入AI大模型赛道。
行业降价潮背后的深层动因
小米并非此轮降价的首发者。此前,国内头部大模型公司DeepSeek已率先对其DeepSeek-V4-Pro模型开启“永久降价”模式。该模型API在5月31日结束限时优惠后,整体价格调整为原定价的四分之一。调价后,其输入缓存命中价格同样为0.025元/百万tokens,整体降幅达75%。
DeepSeek-V4于今年4月下旬发布,凭借百万字超长上下文、领先的Agent能力与推理性能,在国内外开源领域引发广泛关注。其远低于GPT-4o、Claude等国际主流模型的调用成本,通过高性价比策略快速吸引了大量开发者与企业用户,也为小米等厂商的跟进提供了市场参照。
纵观国内大模型市场,一场“K型分化”正在显现。一方面,阿里云通义千问、字节跳动豆包等通用型大模型相继下调API价格,走“以价换量”的路线;另一方面,智谱GLM、腾讯混元等主打企业级深度定制与私有化部署的模型,则维持价格稳定甚至略有上浮,坚守“溢价保值”的高端市场。通用模型降价走量,高端模型溢价保值,已成为当前市场的新格局。
这一现象背后,远非简单的价格竞争。它标志着行业正从初期的营销驱动,转向深层次的技术效率竞赛。降价已成为底层算法优化、推理技术升级、以及算力成本下行等多重因素共同驱动的必然结果。
AI聚合平台AI.cc发布的《2026年AI API基础设施报告》印证了这一趋势。报告指出,过去一年企业级大模型的Token调用成本同比大幅下降67%。同时,开源模型已占据企业Token调用量38%的份额。这些数据清晰地表明:在技术快速普及阶段,性价比已成为决定市场格局的核心要素。
可以预见,随着技术红利持续释放与规模效应进一步凸显,大模型API的调用成本仍有下探空间。这场由头部厂商引领的降价潮,或许只是开端。对于整个生态而言,更低的门槛将催生更繁荣的创新,最终推动整个产业向前发展。

