多模态大模型MiniMax M3开源,响应速度倍增
国内人工智能领域的头部玩家MiniMax,今日正式将其原生多模态旗舰大模型MiniMax M3全面开源。在此之前,模型权重已向全球开发者开放,并同步上线了一篇聚焦稀疏注意力机制的高影响力技术论文。开源社区迅速被点燃讨论热情,技术圈内掀起一波深度研究热潮。
先看M3的综合表现。作为MiniMax战略级投入打造的多模态基座模型,M3总参数规模达428B,但每轮推理仅需激活23B参数。关键在于,它是当前开源生态中首个从预训练阶段就坚持图像、文本、语音等多模态数据联合优化的原生模型——彻底抛弃了传统后融合或单模态迁移路径。正是这种架构创新,让它发布后仅两周便拿下全球权威综合智能评估榜单的开源模型类别冠军。
不过,上线初期确实遇到一点小麻烦:流量暴增导致响应延迟。好在团队迅速完成首轮性能优化,吞吐量从30 TPS直接拉升到80 TPS。后续持续优化计划已排期,低延迟与高并发能力将进一步提升。
编程能力方面,M3表现同样抢眼。在多个高难度编程基准测试与智能体任务中,成绩远超同级别开源模型。它不仅自主解析复杂工程需求、规划多步骤执行路径,还能精准调度外部API、工具链与运行环境,实现端到端闭环操作。更难得的是,M3生成的代码可直接交付生产——不再是“看起来能用但需大量返工”的半成品,而是真正的高可读性、强鲁棒性、易维护性。这对开发者而言,减负增效的效果实实在在。
而无处不在的细节是,M3的这些能力显然不是拼凑而来,而是从一开始就用多模态数据训练原生模型的结果。这正是它与市场上绝大多数开源模型的最大区别。这种“原生”思维,或许才是大模型真正走向实用化的关键一步。
