MiniMax M3模型评测:1M上下文与多模态编程能力
6月1日,国产大模型厂商MiniMax正式推出新一代通用大模型MiniMax M3,引发行业关注。该模型在技术架构与能力组合上均有显著突破。
M3的核心亮点在于其自主研发的稀疏注意力架构MiniMax Sparse Attention(MSA)。该架构显著提升了编程能力、智能体能力、超长上下文处理以及原生多模态支持等关键维度,实现了代际性跨越,而非简单的增量更新。
据官方资料,M3是国内首款同时具备前沿编程能力、百万级超长上下文(1M)与原生多模态支持的大模型。更关键的是,它是全球唯一将这一完整能力组合全面开源的模型。开源策略使得开发者能够直接用于垂直领域落地,对技术生态的促进意义重大。
性能方面,MiniMax公布的数据显示,在百万token上下文规模下,M3单token计算量仅为上一代模型的二十分之一。推理效率的飞跃,将显著降低实际部署成本并提升响应速度。
