AMD掌门访华揭示:AI时代CPU性能瓶颈与解决方案深度解析

2026-05-20阅读 0热度 0
其他

“过去的大语言模型,你问它答,确实挺酷。但这个阶段,恐怕要翻篇了。”5月19日,AMD董事会主席兼CEO苏姿丰在上海的AI开发者日活动上,给出了这样一个判断。

在半导体圈,CEO们总有些亲切的绰号。英伟达的黄仁勋被称作“黄教主”,而带领AMD从濒临破产走到如今近7000亿美元市值的苏姿丰,则被大家称为“苏妈”。她此次带来的核心观点很明确:AI正在迈入“智能体”(Agent)时代,而这一转变,正在彻底改变数据中心里算力的配比逻辑。

苏姿丰解释道,真正的Agent需要自主拆解任务、规划步骤、调用工具、处理数据并检查结果。这一整套复杂的“编排调度”工作,几乎全部由CPU承担。GPU呢?它只负责其中“调用模型做推理”这一个环节。工作量此消彼长之下,数据中心里CPU与GPU的配比,正从过去的1:4甚至1:8,快速向1:1靠拢。

“苏妈”上海行:Agent时代CPU不够用了

这个趋势并非空谈,已经反映在财报里。就在两周前的5月6日,AMD发布了2026年第一季度业绩,营收同比增长38%至约103亿美元。其中,数据中心业务收入达57.75亿美元,同比猛增57%,这个数字已经超过了老对手英特尔当季51亿美元的数据中心收入。

市场研究机构Mercury Research的数据佐证了这一点:2026年第一季度,AMD在全球服务器CPU市场的营收份额达到了46.2%,创下历史新高。基于如此强劲的需求信号,AMD在业绩交流会上直接将2030年全球服务器CPU市场规模预期年复合增速,从去年11月预测的18%大幅上调至超过35%,对应市场规模将超过1200亿美元。

从1:4到1:1

需求增速预期为何在短短半年内几乎翻倍?关键在于对需求结构的重新审视。

按照AMD的分析,当前服务器CPU的需求可以拆解为三类:一是传统的通用计算,增长温和;二是作为GPU“头节点”的管理调度型CPU;第三类,也是增长最快的,正是专门为Agent工作流服务的CPU。

“未来,每个人可能同时拥有5个、10个甚至100个Agent,想想效率能提升多少。”苏姿丰在上海这样描述前景。每个活跃的Agent,都是一个持续消耗CPU资源的进程。它的工作流程大致是:分解目标、规划步骤、调用模型(这一步用GPU)、搬运数据、访问外部工具(如数据库或搜索引擎)、汇总检查结果,若不合格则重新规划。

可见,除了“调用模型”那一下,其余所有步骤——任务分配、数据搬运、工具调用、结果校验、循环重试——全是CPU的活儿。任务越复杂,步骤越繁琐,CPU的负载就越高。

零一万物CEO李开复在与苏姿丰的对话中,也印证了这一演进路径:2024年行业关心AI能否通过考试,2025年关注能否完成工作流,而2026年,焦点已经转向AI能否替代一个完整的职能部门。他认为,Agent经济的本质是“推理经济”,其对延迟极其敏感,多Agent协作时响应需控制在100毫秒内才流畅。真正的未来在于多智能体分工协作,像“委员会”一样运转。李开复还留下一个犀利的观点:如果AI部署没能改变公司财报上的某个数字,那可能只是在运营一个AI实验室。

需求结构的转变,直接推动了产品结构的升级。Mercury Research的数据显示,AMD EPYC服务器CPU的营收份额(46.2%)远高于其出货量份额(33.2%),这13个百分点的差距,正是由面向AI和云计算的高端EPYC CPU占比提升所拉动的。AMD预计,第二季度服务器CPU收入同比增速将超过70%,且这一势头将延续至2026年下半年乃至2027年。

值得注意的是,看好CPU需求增长的并非只有AMD。英特尔CEO陈立武也在其2026年一季度业绩会上表示,CPU与GPU的比例正从1:8走向1:4,并会继续向1:1发展。尽管GPU仍是AI算力的焦点,但CPU无疑正成为AI基础设施中增速最快的明星品类之一。

中国机会

除了全球性的技术趋势,中国市场独特的土壤,也为AMD带来了差异化机遇。

李开复在对话中指出,中国开发者和大模型公司往往难以承受美国闭源模型所需的巨额算力成本,“出于绝对的必要性,找到了一条路”——即通过极致的工程效率和开源协作,来弥补硬件资源的相对不足。更重要的是,中国企业对数据主权极为看重,不愿将核心业务数据发送至云端,这使得AMD的本地化部署方案“精准契合了中国企业的需求”。

对此,苏姿丰强调“中国是驱动我们产品路线图的核心部分”。AMD在中国拥有超过4000名工程师,上海研发中心是其全球最大研发基地之一。目前,EPYC处理器为国内主要云服务商的超过700个云实例提供支撑。此次上海AI开发者日,是AMD首次在北美以外地区举办该活动,吸引了超过2000名开发者到场。

活动中,AMD宣布了多项针对中国市场的举措:推出免费的GPU开发者计划,并与阿里云旗下的魔搭社区(ModelScope)合作。魔搭社区是中国领先的开源AI模型平台,合作意味着开发者可以直接在社区环境中便捷地使用AMD GPU运行AI任务,无需自行配置环境。

国内头部大模型公司阶跃星辰的亮相也备受关注。该公司CTO朱亦博分享了与AMD的合作成果:其今年2月发布的、专为Agent优化的Step 3.5模型(约2000亿参数),经过压缩后,已能在一台搭载AMD Ryzen AI Max处理器、配备128GB统一内存的笔记本电脑上完整运行,推理速度可达每秒约100个token。

每秒100个token是什么水平?这几乎媲美许多云端大模型在线服务的响应速度,而它却运行在一台可随身携带的笔记本上。朱亦博描绘的未来方向是“端云协同”:日常的、对隐私敏感的任务在本地处理(token成本趋近于零),只有极端复杂的任务才需调用云端。

AMD工程师刘畅在现场做了更生动的演示:在一台未联网的AMD笔记本上,用本地部署的通义千问模型运行了一个三Agent协同的医疗问诊辅助系统。他还展示了一个能为开发者自动生成“晨间简报”的Agent,可在夜间自动抓取GitHub、掘金等平台的重要信息并排序。刘畅算了一笔账:同样的任务若调用云端API,日成本至少25元软妹币,而本地运行的成本是零。

发力GPU

在CPU需求前景日益明朗的同时,AMD在GPU战场上的进击也在加速。

尽管英伟达仍占据数据中心GPU市场超过90%的份额,但AMD正在赢得越来越多重量级客户的订单。其面向数据中心的GPU品牌为Instinct,对应英伟达的A100、H100等产品线;服务器CPU品牌则是EPYC(霄龙)。

今年2月,Meta与AMD签署了一份覆盖多代产品、总计6吉瓦算力的大单,包含基于下一代MI450架构的定制GPU和第六代EPYC CPU。此前,AMD已分别与OpenAI、甲骨文达成大规模算力部署合作,其中甲骨文已明确将部署MI450 GPU。按计划,MI450将于今年第三季度开始交付客户,第四季度进入大规模出货阶段。

对于未来,苏姿丰在业绩会上信心十足,表示对2027年数据中心AI业务“实现数百亿美元年收入充满信心”。她还透露,AMD计划在下半年启动名为“Helios”的机架级AI计算系统的量产。这套系统将自家的Instinct AI芯片与EPYC CPU集成于同一机架内统一调度,直接对标英伟达顶级的NVL72机架方案。

显然,在AI算力竞赛的下半场,AMD正凭借CPU与GPU的协同路线,试图在由英伟达主导的战场上,开辟一条新的增长航道。

免责声明

本网站新闻资讯均来自公开渠道,力求准确但不保证绝对无误,内容观点仅代表作者本人,与本站无关。若涉及侵权,请联系我们处理。本站保留对声明的修改权,最终解释权归本站所有。

相关阅读

更多
欢迎回来 登录或注册后,可保存提示词和历史记录
登录后可同步收藏、历史记录和常用模板
注册即表示同意服务条款与隐私政策