国产GPU里程碑:摩尔线程MusaCoder实现大模型全链路训练测评
GPU底层算子开发,向来以其高复杂度著称。它要求开发者既要精通并行计算原理,又要对具体硬件微架构有精准把握。近期,摩尔线程宣布开源了MusaCoder——一个专为GPU内核代码生成而生的代码大模型。值得注意的是,其从指令监督微调到强化学习的完整后训练回路,完全运行于基于MTT S5000显卡构建的夸娥智算集群,这标志着首个利用国产GPU平台完成全流程训练的开源模型正式诞生。
MusaCoder推出了9B和27B两个参数版本,核心目标是提升GPU底层编程的效率与可及性。在KernelBench基准评估中,MusaCoder-27B-RL取得了93.2%的Overall Pass@8成绩,超越了包括Claude Opus 4.7、DeepSeek-V4 Pro在内的多个前沿大模型。该模型的生成代码已在实际部署中验证,能够带来显著的运行速度提升。
这一成果的技术意涵在于,它验证了从国产GPU硬件到大规模AI训练的全栈可行性。稳定的算力支撑为国内构建自主AI基础设施提供了关键的技术范本。下一步,摩尔线程将推动MusaCoder深度集成到开发环境中,致力于降低生态参与门槛,推动国产GPU软件栈的成熟与创新。
