平头哥M890 AI芯片首发评测:性能飙升3倍的国产算力新标杆
在2026阿里云峰会上,平头哥半导体正式发布了新一代训推一体AI芯片——真武M890。这款芯片的推出,直接回应了当前AI算力密集型应用对硬件性能的迫切需求。
真武M890的核心提升是显著的。官方数据显示,其整体性能达到前代真武810E的三倍。这一飞跃源于架构层面的多项关键升级。
核心规格:大显存与高带宽的强强联合
首先,芯片集成了144GB的HBM高带宽显存。对于千亿乃至万亿参数的大模型训练,大容量显存能有效减少与系统内存的数据交换,直接提升计算单元的利用率和训练吞吐量。
其次,片间互联带宽提升至800GB/s。这一指标对于多芯片扩展性至关重要。高带宽确保了在分布式训练集群中,梯度同步和参数更新的通信延迟被降至最低,避免了性能瓶颈。
此外,真武M890原生支持从FP32到FP4的混合精度计算。这种灵活性允许开发者在模型训练阶段使用高精度保障收敛稳定性,在推理部署时切换至低精度以实现极致的能效比和吞吐量,真正覆盖了AI全生命周期。
集群效能:自研互联技术的加持
单卡性能是基础,集群效率才是量产算力的关键。平头哥为此同步推出了自研的ICN Switch1.0互联芯片。
结合ICN Switch1.0,真武M890可实现64卡的全带宽无损互联。该方案大幅降低了大规模集群的通信开销,使得计算资源能更专注于矩阵运算本身,从而提升集群的整体有效算力(MFU)和长周期训练任务的稳定性。
战略定位:面向Agentic时代的体系化升级
真武M890的发布是阿里云“芯-云-模型-推理”全栈技术体系升级的一环。其设计目标明确指向了未来的Agentic AI(智能体)时代。
AI智能体的复杂决策与自主任务执行,要求底层硬件具备高并发、低延迟的推理能力,同时仍需支持持续的模型微调与学习。真武M890的训推一体特性、高带宽集群能力及精度可扩展性,正是为应对此类异构、动态的计算负载而构建。
从芯片级性能突破到集群级互联优化,真武M890展现了平头哥在高端AI算力市场的完整技术栈布局。其与上层云服务及模型工具的深度整合,或将重塑AI基础设施的竞争维度。
