XCENA融资1.35亿美元,全力开发计算内存控制器芯片取得关键新突破
AI集群面临的内存瓶颈,正催生一批专注计算存储的硬件初创公司。XCENA便是其中一员,这家新锐企业刚完成1.35亿美元融资,计划用一款颠覆性的芯片改变游戏规则。
本轮B轮融资由韩国基金Atinum Investment与IMM Investment联合领投,另有六家以上机构参与跟投。据此计算,公司当前估值已达5.7亿美元。考虑到XCENA成立于2022年,这一成长速度确实令人瞩目。
创始团队出身三星电子和SK海力士——这两家企业在全球显存市场占据主导地位。因此,技术路线非常聚焦:开发一款名为MX1的“计算内存控制器”,专门优化AI推理过程中的数据搬运瓶颈。
举一个实际场景。大语言模型处理提示词时,会用到KV缓存这种数据结构。问题在于,显卡内置显存容量有限,一旦KV缓存装不下,就必须移往外部DRAM。这个“搬移”动作直接拉高延迟,拖慢推理速度。类似的困境也出现在模型常用的向量数据库上。
MX1的解决思路相当直接:将最多2TB的DRAM与数千个CPU核心集成到单块芯片上。这样一来,KV缓存和向量数据库可以直接驻留在这个设备中,彻底绕开传统内存方案带来的性能损耗。实测推理效率获得实质性提升。
另一层优势:大幅削减冗余计算。许多大模型在每个用户请求结束后会清空KV缓存,下一个请求必须从头计算。MX1支持在多个请求间复用同一份KV缓存,处理开销自然显著下降。
值得注意,这款芯片不仅服务于大模型加速,还可用于Apache Spark这类分析工具。分析任务运行时,数据需要频繁在CPU与内存之间移动。MX1将这一距离大幅缩短,数据传输时间被有效压缩。
芯片架构也值得一提。MX1的CPU核心基于开源RISC-V设计,每四个核心组成一个集群,每个集群配备专用L1缓存。多个集群进一步组合成更大单元,同样集成有内存池。这种设计带来极高的灵活性。
面向开发者,XCENA提供API接口,允许现有AI工作负载在基本不改动的情况下快速迁移至MX1。若需更细粒度的控制,还有一套底层API可供选用。此外,仿真工具已开放,便于软件可靠性测试。
量产方面,XCENA计划采用三星4纳米工艺生产MX1。据TechCrunch报道,今年年底前启动批量生产,预计2027年开始产生收入。新融资金将用于开发更多计算内存产品,并加速市场拓展,重点与超大规模云服务商等关键客户建立合作。
Q&A
Q1:XCENA的MX1计算内存控制器是什么?
A:MX1是XCENA研发的一款计算内存控制器,它将最多2TB的DRAM与数千个CPU核心集成,专门加速AI推理过程中的数据管理任务。该设备能容纳大语言模型的KV缓存和向量数据库,有效化解传统内存设备面临的性能瓶颈。
Q2:MX1如何提升大语言模型的推理性能?
A:MX1通过两种机制提升性能:一是解决KV缓存和向量数据库因无法装入显卡内置内存而被迫迁往慢速外部DRAM所导致的延迟问题;二是支持在多个请求间重用同一份KV缓存,避免许多大语言模型在每次用户请求后刷新缓存带来的重复计算开销。
Q3:XCENA公司什么时候开始量产MX1芯片?
A:据媒体报道,XCENA计划在2025年年底前启动MX1芯片的批量生产,该芯片采用三星4纳米工艺制造,公司预计2027年开始实现收入。
