小米大模型API价格下调99%:永久降价策略与行业影响深度解析
大模型市场的定价体系迎来关键转折。5月27日,小米技术团队正式公告,其MiMo-V2.5系列API接口启动永久性价格调整,核心型号最高降幅达99%。此举紧随DeepSeek的永久降价策略,标志着国内大模型竞争已全面转向成本效率与开发者价值的深度博弈。
新价格体系即时生效。小米彻底摒弃了按上下文窗口长度阶梯定价的传统模式,并对Token Plan计费结构进行了系统性优化。在同等预算下,开发者可调用的Token总量最高可提升至原先的5至8倍。这一调整显著增强了MiMo系列在成本敏感型开发场景中的竞争力。
定价体系重构,成本效率确立行业新基准
此次价格调整力度空前。旗舰型号MiMo-V2.5-Pro调整后,输入缓存命中成本降至0.025元/百万tokens。相较于原价,这比≤256k规格的1.40元降低了98%,较256k-1M长窗口规格的2.80元降幅高达99%。即便在输入未命中缓存的场景下,定价也调整为3.000元/百万tokens,降幅区间为57%至79%。输出定价同步降至6元/百万tokens,最高降幅达86%。
标准版MiMo-V2.5的降幅同样显著。其输入缓存命中价格调整为0.020元/百万tokens,较原价下降96%-98%。输出成本低至2元/百万tokens,最高降幅为93%。
需要关注的是,本次战略调价聚焦于MiMo-V2.5核心系列。MiMo-V2.5-TTS系列目前仍维持限时免费接入,而上代高阶模型MiMo-V2-Pro与MiMo-V2-Omni则保持原价。旧的Token Plan套餐即将停止服务并下线。这一产品策略清晰地指向一个目标:推动开发者生态向更具成本优势的V2.5系列迁移,加速新版本的市场渗透与采用率。
技术领军者驱动,小米AI的敏捷产品演进
MiMo-V2.5系列的快速迭代与市场策略,由核心负责人罗福莉主导。这位拥有DeepSeek背景的95后AI专家于2025年11月加入小米,全面执掌MiMo大模型业务。据悉,雷军以极具竞争力的薪酬架构邀请其加盟。在她的组建下,一支平均年龄25岁、清北毕业生占比超六成的精锐研发团队迅速成型。
在罗福莉的规划下,小米MiMo大模型实现了高速迭代。今年3月,小米推出MiMo-V2-Pro、MiMo-V2-Omni、MiMo-V2-TTS三大基础模型,随后快速演进至V2.5进阶版本,全面覆盖高性能推理、轻量化交互、语音合成等关键场景,构成了小米面向商业化普惠市场的核心产品阵列。
目前,小米已构建起层次分明的大模型产品矩阵:MiMo-V2.5-Pro定位企业级复杂推理与智能体开发;MiMo-V2.5服务于轻量化通用需求的中小开发者;MiMo-V2.5-TTS以免费策略布局语音合成生态入口。同时,MiMo-V2-Pro作为旗舰基座模型探索性能边界,MiMo-V2-Omni则专注于全模态融合的技术前沿。
在降价公告发布前夕,小米创始人雷军公开表示:“Xiaomi MiMo-V2.5-Pro在Artificial Analysis榜单的综合智能指数与Agent指数上,已位列全球开源模型榜首。”并宣布未来三年将在AI领域投入600亿元。此次降价可视为其大规模战略投入在市场上的首次实质性落地。
从DeepSeek到小米:行业降价潮背后的技术效率逻辑
小米并非本轮降价周期的发起者。此前,国内头部厂商DeepSeek已率先对其DeepSeek-V4-Pro模型API启动“永久降价”,计划在5月31日后将价格体系整体下调至原价的四分之一。调整后,其输入缓存命中价格同样为0.025元/百万tokens,与小米旗舰型号定价形成直接对标。
DeepSeek-V4系列自4月发布以来,凭借百万字超长上下文、领先的Agent架构与推理性能,迅速获得开发者与企业客户认可。其原有调用成本已显著低于GPT-4o、Claude等国际主流模型,此次进一步降价,为整个行业树立了新的成本效率标杆,也为小米等厂商的跟进提供了明确的参照与竞争压力。
当前国内大模型市场正呈现典型的“K型分化”格局。一方面,阿里云通义千问、字节跳动豆包等通用模型持续下调API价格,推行“以价换量”的普及策略;另一方面,智谱GLM、腾讯混元等聚焦深度定制与企业级服务的模型,则维持价格稳定甚至策略性上浮,坚守价值驱动的溢价定位。市场正从初期混战,演变为“通用模型规模化普及、高端模型价值化深耕”的双轨并行态势。
这一现象背后,远非单纯的价格竞争。它标志着行业竞争焦点,已从初期的市场声量转向深层次的技术效率与工程优化。价格下调,日益成为底层算法革新、推理引擎优化、以及算力成本持续摊薄后的必然结果,是技术红利向市场端的直接传导。
AI聚合平台AI.cc发布的《2026年AI API基础设施报告》佐证了这一趋势。报告指出,过去一年企业级大模型的Token调用成本同比下降67%。同时,开源模型已占据企业Token调用量38%的份额。这些数据指向一个明确结论:在技术快速民主化的当下,成本效率与综合性价比,已成为决定大模型市场格局的核心竞争要素。小米的此次降价,既是应对市场竞争的战术反应,更是其技术实力与规模效应的集中体现。这场由底层技术驱动的新一轮行业洗牌,序幕刚刚拉开。
