MiniMax M3开源实测:多模态响应速度倍增
中国AI领域迎来又一里程碑——稀宇科技MiniMax正式开源其旗舰模型MiniMax M3。此前官方已提前发布模型权重,并同步公开了稀疏注意力机制的相关论文,技术透明度极高。开发者社区迅速聚焦,对该多模态模型的综合实力展开热议。
综合性能荣登开源榜首
作为MiniMax倾力打造的旗舰级模型,M3参数规模高达428B,但推理时仅激活23B参数。这一设计在保持大模型知识容量的同时,显著降低计算资源消耗,实现了效率与能力的精妙平衡。更关键的是,M3是业内首个从零训练阶段直接融合多模态数据的模型,而非后期拼接多模态模块。
依托扎实的技术架构,M3发布仅两周便在全球综合智能指数排行榜中登顶开源模型第一。上线初期因访问量激增出现短暂响应延迟,官方已将生成速度从30 TPS优化至80 TPS,并计划持续提升吞吐能力。
顶尖编码与代码交付能力
在代码生成与智能体任务上,M3的表现极为突出。它不仅能自主拆解复杂需求,还擅长调用外部工具完成多步推理——这正是当前大模型最具实际应用价值的能力之一。
相较传统模型,M3输出的代码质量显著提升。官方对其代码交付能力充满信心,强调生成结果可直接投入生产环境,无需人工返工修改。这意味着开发者能够获得切实的生产力释放,而非停留在“看起来可用”的演示阶段。
