阿里云Agent化升级全解析:平头哥芯片路线图与云服务新战略
AI云与AI Native云的概念已讨论多年,但2025年的风向标指向了更具体的落地形态。在5月20日的阿里云峰会上,“Agentic Native云”被提升至与“AI Native”同等重要的战略高度。这不仅是术语的迭代,更标志着一场贯穿“芯片-云-模型-推理”的全栈Agent化变革。一系列密集发布——包括全新AI产品“千问云”、搭载自研真武M890芯片的超节点服务器,以及旗舰模型Qwen3.7-Max——都共同指向了这一核心演进。
变革的本质在于,Agent正在成为云资源的新型“消费者”。它不再是被动调用的工具,而是能够自主开通沙箱、部署服务、独立调度算力的智能主体。阿里云资深副总裁刘伟光在与媒体交流时举例:如Minimax这类客户,过去需要人力耗时两周完成的云资源开通流程,现在通过Agent可在一天内完成。这或许预示着,云计算正步入一个由Agent主导的“自动驾驶”阶段。
值得注意的是,几乎同期举办的谷歌I/O大会同样将焦点置于Agent与基础设施的重构上。头部厂商的思路呈现出一种战略默契:Agent将定义下一代计算范式,而构建全栈AI能力,已成为行业心照不宣的共识。
自以“龙虾”为代表的AI Agent热潮兴起以来,云厂商的演进速度远超以往。数据显示,过去五个月内,阿里云大模型MaaS(模型即服务)市场的日均Token收入增长了约15倍。同期,阿里最新财报披露,包含百炼MaaS平台在内的AI模型与应用服务ARR(年度经常性收入)已突破80亿元,并预计在年底跨越300亿元门槛。
刘伟光对此的判断是,当智能体突破特定临界点后,其对AI与云资源的需求将接近无限。云厂商必须为此做好充分的前置准备。
阿里云长期强调“云芯模”一体化,而在本次云峰会上,其全栈协同策略得到了更清晰的呈现。刘伟光解释,客户最终获得的是模型能力、芯片能力与云能力的组合体,三者必须深度融合。若缺乏芯片层的支撑,空谈性价比与开放的云服务,其根基是不稳固的。
为此,阿里旗下半导体公司平头哥首次公布了未来两年的芯片路线图,明确了两代芯片的性能提升方向,核心目标直指提升大模型的训练与推理效率。新发布的真武M890 AI芯片,具备144GB显存与800GB/s的片间互联带宽,性能据称是上一代的三倍。按规划,2027年将推出V900,2028年推出J900,保持一年一代的迭代节奏。
平头哥副总裁高慧进一步阐释了芯片与Agent时代的关系:一个Agent在执行任务时,可能在毫秒内发起数十次模型调用,这要求CPU、GPU、网络与存储等核心部件实现前所未有的紧密协同。平头哥构建全栈自研芯片矩阵,核心目标正是实现算力、网力、存力的系统级协同,确保每一个Agent都能流畅、稳定地运行。高慧同时透露,截至今年4月,平头哥真武系列AI芯片累计出货量已达56万片,服务超过20个行业的400多家客户。
当前,全球AI需求爆发与出口管制等因素交织,为国产算力提供了一个关键的发展窗口。国际调研机构IDC数据显示,2025年中国加速服务器(AI芯片)市场总出货量预计约为400万张。其中,英伟达仍以约220万张的出货量位居第一,但国产芯片出货量已达165万张,市场份额持续提升至41%。在国产厂商中,平头哥已位列第二。
国产芯片快速增长的内在逻辑是清晰的:当前算力市场已转变为强卖方市场,而国产厂商通过算法创新与工程优化,有机会实现更高的综合性价比。刘伟光特别向记者强调,这里的“性价比”并非简单的价格对比,而是指在同等集群、同等芯片上,能否产出更多高质量Token。他的判断是,其他平台使用千问开源模型运行,其效率必然无法超越阿里云的百炼平台,因为阿里云的工程团队与模型团队本属一体,每日进行深度协同优化。这种软硬一体的协同壁垒,在短期内很难被复制。
这场激进升级的背后,是清晰的商业图景。由Agent驱动的MaaS收入,预计将取代传统的ECS(弹性计算服务),成为阿里云未来最大的产品线。有接近阿里云的人士透露,阿里云在中国大语言模型市场的MaaS收入已位居首位。
收入增长的根源,在于Token价值的根本性转变。刘伟光回顾去年底拜访数百家客户的经历时指出,前两年模型能力有限,企业不愿为AI支付过高费用。但到了2025年,编码(Coding)能力的成熟成为一个关键分水岭。模型不再仅是提效工具,而是开始承担人类难以完成的工作。当AI从“成本项”转变为“生产资料”时,企业便愿意为其单独设立预算,Token支出的占比自然随之攀升。
刘伟光分析,对于AI原生创业公司,模型调用支出占比可能已接近100%;对于大型互联网企业,目前大约在15%到20%之间;而传统企业虽仍在5%以下,但增速非常显著。
关于市场关注的利润率问题,刘伟光确认MaaS业务已实现盈利,并且从定价首日就是盈利的。展望未来,阿里云的收入与利润增长将主要依赖三大引擎:
一是MaaS服务本身,即基于模型调用的公共云收入,其利润率高于单纯售卖算力卡。
二是私有部署市场,为企业客户提供本地化模型部署方案,开拓增量空间。
三是由Agent Cloud带动的传统云业务增长。每一个Token消耗的背后,都对应着等比例的CPU、存储、网络资源的使用,形成“1个GPU带动1个CPU”的联动效应,从而拉动整体云收入。
为适应这场变革,阿里云内部的考核指标也在同步调整。公司不再仅关注绝对Token调用量,而是重点聚焦三个新指标:付费Token客户数的日增长、核心业务系统接入模型的数量与效率,以及智能体在企业内部自主完成任务的闭环效率。
指标变化的背后,是销售体系面临的紧迫转型。刘伟光坦言,过去阿里云销售主要与客户的IT部门对接,售卖服务器、数据库、存储等标准产品,一线销售通过客户线下服务器数量即可大致估算收入。但现在做MaaS,答案是不确定的。销售需要深入客户的业务部门,甚至与CEO对话,了解他们的编程方式、市场营销策略与生产线优化需求。阿里云数千人的销售团队,都需要打破过去的作业模式,去挖掘客户自身尚未清晰意识到的潜在需求。为此,阿里云已在组织架构上设立了专门的MaaS销售岗位。
去年底,刘伟光曾提出一个目标:阿里云要拿下2026年中国AI云市场增量的80%。他认为,在大语言模型推理市场,阿里云已获取了大部分增量。过去在金融、汽车、政务、运营商等领域积累的存量客户,以及覆盖全国的销售网络,是实现这一目标的坚实基础。
当然,这场雄心勃勃的全栈重构能否被市场完全接纳,仍需时间验证。有行业信息显示,由于性能差距客观存在,且供应链上游持续涨价,目前许多国产芯片从芯片成本到Token收入的“经济模型”仍未完全跑通。阿里云所强调的“性价比”如何持续提升,仍有大量的工程优化工作要做。
此外,从行业反馈看,不仅是阿里云,整个市场的算力供给都处于供不应求的状态。这些宝贵的算力资源应如何分配,优先满足哪些业务与客户的需求,仍然是所有头部厂商内部需要耗费大量精力权衡与平衡的难题。这场由Agent驱动的云革命,序幕才刚刚拉开。
