MiniMax M3深度评测:百万上下文原生多模态旗舰模型

2026-06-01阅读 0热度 0
其他

6月1日,MiniMax稀宇科技正式上线M3模型。一句话定义其定位:这是国内首个将“高级编码与智能体、百万级长上下文、原生多模态”三大硬核能力整合于开放生态的旗舰级模型。

首个三项能力兼备的国产旗舰模型:MiniMax M3 发布,百万上下文、原生多模态

先讲核心结论。在编码与智能体评测中,M3表现直接跃居行业第一梯队。它具备自主任务拆解、外部工具调用和多步推理链能力。注意一个关键细节:官方声称其生成的代码目标是“交付级”——即可以直接投入生产,而非需要人工二次修正的半成品。这种定位对开发者的实际工作流极具吸引力。

支撑这些能力的,是自研的MiniMax Sparse Attention(MSA)架构。基于此架构,M3的API最高支持100万tokens上下文窗口,且官方保证至少51.2万tokens稳定可用。百万上下文不再是参数噱头,而是长程Agent、长代码编写、长视频理解等场景真正需要的基础设施。换言之,若你需要模型一口气通读数百页技术文档再执行任务,M3是少数能胜任的选手。

M3也是一款原生多模态模型,而非后期拼接方案。MiniMax重构了整个数据管线,将预训练数据规模扩充至百T量级,从训练第零步即开始多模态对齐。结果:文本与视觉语义空间高度统一,模型解读图表和公式如同阅读文字般自然流畅。

看一组硬核评测数据。在BrowseComp智能体评测中,M3取得83.5分,直接超越Opus 4.7的79.3分。该项测试衡量模型自主浏览网页、检索信息的能力——分数差距直接对应工程落地潜力的实质性差异。

更具说服力的,是MiniMax官方交给M3的一个任务:独立复现ICLR 2025杰出论文《Learning Dynamics of LLM Finetuning》。结果M3连续运行近12小时,全程自主产出18次代码提交和23张实验图表,成功复现核心实验。过程中,多模态能力使其读懂论文中的图表与公式,百万上下文保证正文、代码、实验日志一次性载入窗口,而编码加Agent能力驱动整个长流程执行。这是典型的“全栈能力闭环”演示。

另一个实验同样值得关注。向M3提供四个仅完成预训练的Base模型,要求其在12小时内自主完成数据合成、训练、评测、迭代全流程,使这些模型具备数学推理、代码生成、知识问答等能力。全程零人工干预。最终M3综合得分37.1,在所有参赛模型中排名第三,仅次于Opus 4.7的42.4和GPT-5.5的39.3。能挤入这一量级的排位赛,本身就是实力的有力佐证。

值得一提的是,MiniMax同时提供M3和M3-highspeed两个版本的API,两个版本输出结果完全一致,仅后者响应速度更快。且全面支持自动Cache,无需手动配置,开箱即用。

开放生态方面,M3即将在HuggingFace和GitHub上完成开源,并支持私有集群部署与微调。这对有定制化需求的企业用户是实实在在的利好。

价格方面,M3的API在上下文≤512K场景下,推出限时7天五折优惠:

  • 输入价格:标准版2.1元/百万tokens,优先版3.15元/百万tokens
  • 输出价格:标准版8.4元/百万tokens,优先版12.6元/百万tokens
  • 缓存读取:标准版0.42元/百万tokens,优先版0.63元/百万tokens

订阅套餐同步升级。Token Plan全面改造为基于积分的用量扣减体系,目前公开档位包括Plus、Max和Ultra。核心变化有三:第一,扣减方式从按固定次数计费,改为按实际资源消耗折算为积分——简单任务消耗更少,复杂任务按真实用量扣减;第二,统一额度池,不再按能力拆分额度,所有覆盖范围内的模型共用同一套积分;第三,用量展示更直观,控制台以进度条形式实时呈现积分额度与消耗情况。此外,新模型能力可通过对应API或工具接入页面直接调用。

对于老套餐用户,MiniMax提供迁移适应补偿。升级后,套餐内积分额度按额度窗口展示和控制,短期内使用节奏可能需要调整。为帮助平稳过渡,部分老套餐用户将获得一次性补偿积分。该补偿积分与套餐内额度共用同一使用池,但设有独立有效期。具体发放资格、金额及有效期,以控制台实际显示为准。

整体来看,M3的这次发布并非简单堆砌参数。它试图证明一件事:一个模型能够同时将代码能力、长上下文和多模态做到一线水准,并将这些能力真正开放给开发者——不是PPT上的路线图,而是看得见、用得着的实际产品。接下来焦点很明确:开发者们会为这个“完整的开放世界”买单吗?

免责声明

本网站新闻资讯均来自公开渠道,力求准确但不保证绝对无误,内容观点仅代表作者本人,与本站无关。若涉及侵权,请联系我们处理。本站保留对声明的修改权,最终解释权归本站所有。

相关阅读

更多
欢迎回来 登录或注册后,可保存提示词和历史记录
登录后可同步收藏、历史记录和常用模板
注册即表示同意服务条款与隐私政策