最新MiniMax M3开源模型权威测评:原生多模态百万上下文性能全解析
6月12日,稀宇科技旗下MiniMax在开源社区投下一枚重磅炸弹——正式释放MiniMax M3模型权重,并同步公开MSA(MiniMax Sparse Attention)技术论文。仅隔三天,6月15日,官方进一步推出完整开源的模型版本。对于持续追踪多模态大模型开源动态的从业者而言,这周的信息流无疑被M3刷屏。
M3模型的核心定位是什么?一句话:MiniMax打造的原生多模态旗舰,总参数量428B,激活参数仅23B。关键在于“原生”——M3是首个从零开始采用多模态混合训练的开源模型,而非先训练文本再后期拼接视觉模块。这才是根植于模型底层的多模态基因。
发布仅两周,M3便登顶Artificial Analysis综合智能指数排行榜,夺得全球开源模型最高排名。在当前开源模型竞争白热化的环境下,这一成绩的含金量无需赘述。
用户量激增自然带来体验挑战。官方坦承访问压力,但优化响应迅速:输出速率从上线初期的约30 TPS提升至约80 TPS,并计划进一步提速30%-40%。这意味着模型交互将愈发流畅,告别等待转圈的尴尬。
在编码和智能体评测中,M3达到了“行业顶尖”水准。它能自主拆解任务、调用工具并完成多步推理,生成的代码直接可交付——绝非那种“能跑但需大修”的半成品。对开发者而言,这一能力或许比参数规模更具吸引力。
开源模型已正式发布,有兴趣的读者可直接前往Hugging Face体验。链接如下:https://huggingface.co/MiniMaxAI/MiniMax-M3
