小米MiMo-V2.5-Pro UltraSpeed评测:3倍价享10倍输出体验
2026年6月9日,小米MiMo官方宣布与TileRT达成合作,正式推出Xiaomi MiMo-V2.5-Pro的UltraSpeed模式。通过模型与系统的极致协同设计(Codesign),在通用GPU上实现了万亿参数模型的生成速度首次突破1000 tokens/s——这不是小幅度优化,而是实打实的性能跨越。
同步上线的还有MiMo-V2.5-Pro-UltraSpeed API,采用限时体验价。定价为MiMo-V2.5-Pro的3倍,但输出速度提升了约10倍(注意:仅支持API体验,不适用于Token Plan)。官方解释直截了当:3倍价格,10倍输出体验。作为参考,小米MiMo-V2.5-Pro的价格为每百万tokens输入0.025元(缓存命中)或3元(未命中缓存),每百万tokens输出6元。换算下来,UltraSpeed模式虽然更贵,但速度和性价比显著提升。
由于高速推理资源供给有限,UltraSpeed模式采取申请制、限时开放。通过申请的开发者可以接入API体验,时间窗口仅为2026年6月9日至6月23日23:59,共计两周。名额有限,提交申请后不承诺审核时效与通过率——小米明确表示会优先审核具备真实业务需求的企业和专业开发者场景。
通过审核的用户还能获得限时免费的Chat体验(两周开放窗口内有效)。为确保资源受限下的体验质量与使用公平,官方制定了以下规则:每个账号每日最多成功进入队列10次;单次会话时长上限30分钟;如果会话空闲超过5分钟,系统自动释放资源。简单说,就是让真正需要的用户用上,而非被闲置占用。
申请入口:platform.xiaomimimo.com/ultraspeed
Chat体验:ultraspeed.xiaomimimo.com
