Napier AI芯片实测:推理性能13倍超越Blackwell
6月16日,AI芯片初创公司Tensordyne突然公布重大进展:全新AI推理系统Tensordyne Napier (TDN)正式亮相,声称每Token能耗仅为NVIDIA Blackwell系统的1/17,吞吐量达到后者的13倍。若数据属实,这意味推理效率实现质的飞跃。
Napier处理器由Tensordyne联合博通、HPE瞻博网络共同开发,目前已成功流片并在台积电3nm工艺上量产。其核心技术突破在于采用对数数学设计——将AI推理中极为消耗算力的大规模乘法运算简化为加法运算。同时,芯片内部集成大量SRAM缓存与HBM内存,处理器间通信延迟被压缩至1微秒以内,对分布式推理场景至关重要。
基于Napier,Tensordyne构建了名为TDN72的“推理舱”,每个舱内集成72颗算力芯片。单个标准机柜可容纳四个舱,合计288颗芯片。整套机架级TDN系统能以每秒1000 Token/用户的速度执行T级大语言模型推理,预估每年可额外创造3300万美元营收。对大规模部署推理服务的厂商而言,这一数字极具吸引力。
