AMD苹果押注闪存替代DRAM:内存成本直降55倍

2026-06-19阅读 0热度 0
DRAM

AI推理对高价DRAM的依赖正经历一场底层架构的悄然转变。

AMD近日宣布完成对内存优化公司MEXT的收购,正式将AI驱动的闪存优化技术部署至数据中心。驱动这项交易的核心数字只有一组:闪存的每比特成本仅为DRAM的五十五分之一。

周一,AMD以未公开金额完成对MEXT的收购。后者开发了AI预测内存技术,核心目标是让NAND闪存在性能和效率上逼近DRAM,同时将可用内存容量提升至全新层级。

AMD在公告中表示,这笔收购将扩充其AI产品矩阵,助力数据中心客户优化性能、降低总拥有成本并加速工作负载部署。AMD声明强调:“内存需求正渗透至每一个企业计算品类。”

消息公布后,AMD股价周一飙升7.7%,收报550.75美元,市值直逼9000亿美元。当日标普500仅上涨1.8%,而AMD年内累计涨幅已达323%。花旗上周五将AMD评级从中性上调至买入,目标价从460美元提升至575美元。

值得注意的是,苹果早在2024年便启动了“LLM in a Flash”端侧方案。这一布局折射出不断加剧的DRAM供应危机。TrendForce数据显示,高带宽内存(HBM)已消耗约四分之一的DRAM晶圆产能,而DRAM合约价格在2026年Q1环比暴涨约90%。

Citrini Research指出,AI存储需求已庞大到需要多层架构协同承载——闪存并非取代HBM,而是从容量层面承接溢出需求。这一架构重构正重塑整个AI存储产业链的定价逻辑。

内存税危机:AI瓶颈扩散至整体经济

摩根士丹利分析师Shawn Kim团队本月直言:内存价格暴涨与供应短缺正演变为数字经济的系统性风险——影响从AI基础设施瓶颈一路扩散至硬件利润率、设备价格、云服务成本、通胀乃至政策制定。

具体案例印证了这一压力。Xbox CEO Asha Sharma上周透露,内存成本两年内上涨约五倍,导致公司无法满足消费者的游戏主机需求。

HBM对DRAM产能的持续侵占是危机的核心驱动力。TrendForce及三星、SK海力士、美光数据显示,HBM在DRAM晶圆产能占比已从2020年的2%跃升至2026年预计的25%。超大规模云厂商通过多年期合同锁定未来晶圆产出,进一步挤压了手机与PC标准芯片的可用产能。

新增DRAM产能面临结构性瓶颈。扩产需依赖EUV光刻机实现更精细线宽,单台设备售价约2亿美元,新建晶圆厂投资动辄数百亿美元,即便顺利也需数年才能投产。这种供给刚性是本轮短缺持续的根本原因。

55倍成本差:闪存替代的经济逻辑

Citrini Research测算显示,闪存每比特成本约为DRAM的五十五分之一——QLC NAND约0.05美元/GB,DDR5 DRAM约2.75美元/GB,HBM3E更高达15美元/GB。

如此巨大的价差能被利用,关键在于AI推理中最大的单一内存消耗者——KV缓存(记录每次生成步骤中所有先前标记的上下文,长对话可达数百GB)——对读取速度的要求远低于模型权重的解码路径。对于这类顺序读取数据,DRAM的速度优势明显收窄,而闪存的容量优势得以充分释放。

闪存的扩容路径与DRAM存在本质差异。闪存通过垂直堆叠更多单元层提升容量,仅需现有工厂的沉积与刻蚀工艺,无需新光刻节点或不占用EUV资源。闪存控制器基于成熟的6/7nm制程,避开了先进制程的瓶颈节点。

苹果研究人员此前发表的“LLM in a Flash”论文提供了方法论基础:将大语言模型参数存储在设备闪存,按需加载至DRAM,从而在DRAM受限设备上运行超出其容量上限的模型,并在CPU和GPU上分别实现比朴素加载方式快4-5倍和20-25倍的推理速度。

两条路径:数据中心与端侧同步演进

AMD的收购聚焦数据中心场景。将MEXT技术整合至AMD数据中心产品组合后,旨在帮助企业客户在AI工作负载部署中提升资源利用效率并降低成本。

摩根士丹利Shawn Kim团队认为,尽管内存短缺持续,AMD在云端市场仍具结构性优势——“代理式AI驱动的CPU需求在结构上有利于AMD云端市场份额扩张。”花旗对AMD的乐观预期则更多源于其GPU与英伟达的直接竞争。

苹果路径则聚焦端侧。“LLM in a Flash”方案将模型推理对昂贵云端内存的依赖部分转移至设备本地闪存,在降低云端计算成本的同时,为端侧AI应用提供可行的内存架构。

Citrini Research指出,两条路径指向相同结论:AI推理的内存层级正在重构,低频KV缓存、模型权重及端侧数据将逐步从高价HBM/DRAM下沉至NAND Flash/SSD层,形成多层级存储架构。

这一架构转变沿产业链产生多层级传导效应。最直接受益的是NAND原厂——高容量NAND、企业级SSD及QLC NAND是最纯粹的方向,涵盖SanDisk、西部数据、美光及铠侠。

SSD控制器层被认为持续性最强——闪存接近内存体验的关键在于控制器、固件与NVMe架构优化,涉及Silicon Motion、Marvell等。CXL/PCIe高速互联层同样受益。

免责声明

本网站新闻资讯均来自公开渠道,力求准确但不保证绝对无误,内容观点仅代表作者本人,与本站无关。若涉及侵权,请联系我们处理。本站保留对声明的修改权,最终解释权归本站所有。

相关阅读

更多
欢迎回来 登录或注册后,可保存提示词和历史记录
登录后可同步收藏、历史记录和常用模板
注册即表示同意服务条款与隐私政策