小米迄今最强大模型Xiaomi MiMo-V2.5系列开启公测

2026-04-25阅读 858热度 858

其他

小米MiMo-V2.5系列模型开启公测，Pro版与标准版即将全球开源

就在今天，小米正式宣布，其Xiaomi MiMo-V2.5系列模型已启动公测。更值得关注的是，该系列中的MiMo-V2.5-Pro和MiMo-V2.5模型即将面向全球开源，这无疑为开发者社区和行业应用注入了一股新的活力。

根据官方公告，此次发布的MiMo-V2.5系列阵容齐整，涵盖了MiMo-V2.5、V2.5-Pro、V2.5-TTS Series以及V2.5-ASR等多个型号。这一代模型的核心提升点非常明确：推理能力更强、智能体（Agent）运行更稳、上下文处理长度显著增加，同时在指令遵循与模糊指令理解、全模态感知与理解等方面都有长足进步。伴随模型升级的，还有经过优化的Token Plan定价方案。

MiMo-V2.5-Pro：更强的智能体，更长的专注力

可以说，MiMo-V2.5-Pro代表了小米目前最强的模型实力。在通用智能体能力、复杂软件工程以及长程任务处理这些关键维度上，它已经具备了与全球顶尖Agent模型（如Claude Opus 4.6、GPT-5.4）同台竞技的资本，相较于上一代的MiMo-V2-Pro实现了全方位的跃升。

内部测试的结果相当惊人。当MiMo-V2.5-Pro搭配合适的运行框架时，它能够稳定完成单次涉及近千轮工具调用的超长任务链。在智能体场景下的指令遵循能力也有了质的飞跃——不仅能精准捕捉上下文中的隐性要求，还能在超长任务周期内始终保持逻辑的一致性。至此，这款模型已经可以以更高的置信度，去承担那些真正严肃、专业的复杂工作了。

显然，MiMo-V2.5-Pro就是为更高难度、更复杂的任务目标而生的。小米甚至将那些通常需要人类专家花费数天乃至数周才能完成的项目交给它，让它独立跑完全程，而最终交付的质量依然极高。以下是两个颇具说服力的案例：

用Rust实现完整的SysY编译器

这个任务直接源自北京大学《编译原理》课程的核心项目，要求模型使用Rust语言从零开始实现一个完整的SysY编译器，包括词法分析器、语法分析器、抽象语法树（AST）、Koopa IR中间代码生成、RISC-V汇编后端以及性能优化。作为参考，北大本科生完成该项目通常需要数周时间。然而，MiMo-V2.5-Pro仅用时4.3小时，经过672次工具调用就完成了全部工作，并在隐藏测试集上取得了233/233的满分成绩，其高效的生产力价值可见一斑。

它的工作方式并非盲目试错，而是展现了清晰的工程思维：先搭建完整的编译器流水线骨架，再逐层攻克各个模块——Koopa IR部分满分（110/110），RISC-V后端满分（103/103），性能优化部分同样满分（20/20）。首次编译就通过了137/233的测试点，高达59%的冷启动通过率意味着，在运行任何测试之前，其整体架构就已经基本正确。过程中也并非一帆风顺，在第512轮时，一次重构导致lv9/riscv相关测试回退了两个点，但模型能够自行诊断问题、恢复状态并继续推进。

开发一个视频编辑器

仅凭“构建一个视频编辑器Web应用”这样一句简单的指令，MiMo-V2.5-Pro便自主交付了一款功能可用的Web应用。这款应用具备了多轨道时间线、片段裁剪、交叉淡化、音频混合以及导出流程等核心功能。最终生成的代码量达到8,192行，整个过程历经1,868次工具调用，在11.5小时的自主工作中完成。

MiMo-V2.5：越级全模态Agent，百万级上下文

MiMo-V2.5则是为智能体场景而生的原生全模态大模型，它能同时处理视觉、听觉和文本信息，并将理解转化为实际行动。这一次，MiMo-V2.5带来了几个关键升级：

首先，其Agent能力已全面超越前代的MiMo-V2-Pro。在Claw-Eval等权威Agent评测中，MiMo-V2.5的表现已超过MiMo-V2-Pro的水平，能够胜任日常简单任务，同时API调用成本降低了约50%。

其次，在多模态感知能力上，它实现了对MiMo-V2-Omni的全面超越。在跨模态推理、视频理解、图表分析等能力上均有显著提升，在VideoMME、CharXiv、MMMU-Pro等评测中，其表现已逼近甚至超越了业界的顶级闭源模型。

MiMo-V2.5全系列：更高的Token效率

整个MiMo-V2.5系列都对Token效率进行了专项优化，旨在用更少的Token完成更多的工作。

具体来看，在达到相同的Agent基准榜单ClawEval分数的情况下：MiMo-V2.5-Pro相比Kimi K2.6节省了42%的Token消耗；而MiMo-V2.5相比Muse Spark则节省了高达50%的Token。

MiMo-V2.5全系列：如何搭配使用？

面对不同的任务需求，两款模型如何选择？这里有个简单的指南：MiMo-V2.5-Pro专为那些超长、高难度的Agent任务打造；而MiMo-V2.5则能覆盖绝大多数通用Agent场景。此外，MiMo-V2.5支持原生的全模态Agent能力，涵盖图像、音频与视频处理；同时，它具备更高的平均推理速度，能够更迅速地响应对时延敏感的任务。

Token Plan焕新升级

伴随着模型更新，小米也对Token Plan定价方案进行了一系列实质性的优化，旨在为用户提供更灵活、更实惠的选择：

Credits速率更新，更优惠
MiMo-V2.5：1x（消耗1 Token = 1 Credit）
MiMo-V2.5-Pro：2x（消耗1 Token = 2 Credits）
值得注意的是，原先1 Token = 4 Credits的计费方式已被取消。从现在起，Token Plan不再区分256k和1M上下文窗口的Credit倍率，计费方式更加简洁。

夜间专属优惠速率
北京时间每天00:00至08:00，所有模型的Credits消耗速率将在原有基础上再享受8折优惠。

自动续费享折扣
新增了「连续包月」订阅模式。老用户开通自动续费可享受次月7折优惠，新用户则可享受次月77折优惠，均限一次。同时新增「包年」订阅周期，一次订阅即可享受全年88折优惠，此优惠不再与首购或自动续费折扣叠加。

上线福利：Token Plan用户Credits全量重置
所有在截至北京时间4月22日22:00前已购买Token Plan的用户，其账户内的Credits额度将被全部重置清零，并重新开始计算。这相当于给现有用户送上了一份“重新开始”的礼物。

参考