阿里云Agent化升级全解析：平头哥芯片路线图与云服务新战略

2026-05-22阅读 0热度 0

路线图

AI云与AI Native云的概念已讨论多年，但2025年的风向标指向了更具体的落地形态。在5月20日的阿里云峰会上，“Agentic Native云”被提升至与“AI Native”同等重要的战略高度。这不仅是术语的迭代，更标志着一场贯穿“芯片-云-模型-推理”的全栈Agent化变革。一系列密集发布——包括全新AI产品“千问云”、搭载自研真武M890芯片的超节点服务器，以及旗舰模型Qwen3.7-Max——都共同指向了这一核心演进。

变革的本质在于，Agent正在成为云资源的新型“消费者”。它不再是被动调用的工具，而是能够自主开通沙箱、部署服务、独立调度算力的智能主体。阿里云资深副总裁刘伟光在与媒体交流时举例：如Minimax这类客户，过去需要人力耗时两周完成的云资源开通流程，现在通过Agent可在一天内完成。这或许预示着，云计算正步入一个由Agent主导的“自动驾驶”阶段。

值得注意的是，几乎同期举办的谷歌I/O大会同样将焦点置于Agent与基础设施的重构上。头部厂商的思路呈现出一种战略默契：Agent将定义下一代计算范式，而构建全栈AI能力，已成为行业心照不宣的共识。

自以“龙虾”为代表的AI Agent热潮兴起以来，云厂商的演进速度远超以往。数据显示，过去五个月内，阿里云大模型MaaS（模型即服务）市场的日均Token收入增长了约15倍。同期，阿里最新财报披露，包含百炼MaaS平台在内的AI模型与应用服务ARR（年度经常性收入）已突破80亿元，并预计在年底跨越300亿元门槛。

刘伟光对此的判断是，当智能体突破特定临界点后，其对AI与云资源的需求将接近无限。云厂商必须为此做好充分的前置准备。

阿里云长期强调“云芯模”一体化，而在本次云峰会上，其全栈协同策略得到了更清晰的呈现。刘伟光解释，客户最终获得的是模型能力、芯片能力与云能力的组合体，三者必须深度融合。若缺乏芯片层的支撑，空谈性价比与开放的云服务，其根基是不稳固的。

为此，阿里旗下半导体公司平头哥首次公布了未来两年的芯片路线图，明确了两代芯片的性能提升方向，核心目标直指提升大模型的训练与推理效率。新发布的真武M890 AI芯片，具备144GB显存与800GB/s的片间互联带宽，性能据称是上一代的三倍。按规划，2027年将推出V900，2028年推出J900，保持一年一代的迭代节奏。

平头哥副总裁高慧进一步阐释了芯片与Agent时代的关系：一个Agent在执行任务时，可能在毫秒内发起数十次模型调用，这要求CPU、GPU、网络与存储等核心部件实现前所未有的紧密协同。平头哥构建全栈自研芯片矩阵，核心目标正是实现算力、网力、存力的系统级协同，确保每一个Agent都能流畅、稳定地运行。高慧同时透露，截至今年4月，平头哥真武系列AI芯片累计出货量已达56万片，服务超过20个行业的400多家客户。

当前，全球AI需求爆发与出口管制等因素交织，为国产算力提供了一个关键的发展窗口。国际调研机构IDC数据显示，2025年中国加速服务器（AI芯片）市场总出货量预计约为400万张。其中，英伟达仍以约220万张的出货量位居第一，但国产芯片出货量已达165万张，市场份额持续提升至41%。在国产厂商中，平头哥已位列第二。

国产芯片快速增长的内在逻辑是清晰的：当前算力市场已转变为强卖方市场，而国产厂商通过算法创新与工程优化，有机会实现更高的综合性价比。刘伟光特别向记者强调，这里的“性价比”并非简单的价格对比，而是指在同等集群、同等芯片上，能否产出更多高质量Token。他的判断是，其他平台使用千问开源模型运行，其效率必然无法超越阿里云的百炼平台，因为阿里云的工程团队与模型团队本属一体，每日进行深度协同优化。这种软硬一体的协同壁垒，在短期内很难被复制。

这场激进升级的背后，是清晰的商业图景。由Agent驱动的MaaS收入，预计将取代传统的ECS（弹性计算服务），成为阿里云未来最大的产品线。有接近阿里云的人士透露，阿里云在中国大语言模型市场的MaaS收入已位居首位。

收入增长的根源，在于Token价值的根本性转变。刘伟光回顾去年底拜访数百家客户的经历时指出，前两年模型能力有限，企业不愿为AI支付过高费用。但到了2025年，编码（Coding）能力的成熟成为一个关键分水岭。模型不再仅是提效工具，而是开始承担人类难以完成的工作。当AI从“成本项”转变为“生产资料”时，企业便愿意为其单独设立预算，Token支出的占比自然随之攀升。

刘伟光分析，对于AI原生创业公司，模型调用支出占比可能已接近100%；对于大型互联网企业，目前大约在15%到20%之间；而传统企业虽仍在5%以下，但增速非常显著。

关于市场关注的利润率问题，刘伟光确认MaaS业务已实现盈利，并且从定价首日就是盈利的。展望未来，阿里云的收入与利润增长将主要依赖三大引擎：

一是MaaS服务本身，即基于模型调用的公共云收入，其利润率高于单纯售卖算力卡。

二是私有部署市场，为企业客户提供本地化模型部署方案，开拓增量空间。

三是由Agent Cloud带动的传统云业务增长。每一个Token消耗的背后，都对应着等比例的CPU、存储、网络资源的使用，形成“1个GPU带动1个CPU”的联动效应，从而拉动整体云收入。

为适应这场变革，阿里云内部的考核指标也在同步调整。公司不再仅关注绝对Token调用量，而是重点聚焦三个新指标：付费Token客户数的日增长、核心业务系统接入模型的数量与效率，以及智能体在企业内部自主完成任务的闭环效率。

指标变化的背后，是销售体系面临的紧迫转型。刘伟光坦言，过去阿里云销售主要与客户的IT部门对接，售卖服务器、数据库、存储等标准产品，一线销售通过客户线下服务器数量即可大致估算收入。但现在做MaaS，答案是不确定的。销售需要深入客户的业务部门，甚至与CEO对话，了解他们的编程方式、市场营销策略与生产线优化需求。阿里云数千人的销售团队，都需要打破过去的作业模式，去挖掘客户自身尚未清晰意识到的潜在需求。为此，阿里云已在组织架构上设立了专门的MaaS销售岗位。

去年底，刘伟光曾提出一个目标：阿里云要拿下2026年中国AI云市场增量的80%。他认为，在大语言模型推理市场，阿里云已获取了大部分增量。过去在金融、汽车、政务、运营商等领域积累的存量客户，以及覆盖全国的销售网络，是实现这一目标的坚实基础。

当然，这场雄心勃勃的全栈重构能否被市场完全接纳，仍需时间验证。有行业信息显示，由于性能差距客观存在，且供应链上游持续涨价，目前许多国产芯片从芯片成本到Token收入的“经济模型”仍未完全跑通。阿里云所强调的“性价比”如何持续提升，仍有大量的工程优化工作要做。

此外，从行业反馈看，不仅是阿里云，整个市场的算力供给都处于供不应求的状态。这些宝贵的算力资源应如何分配，优先满足哪些业务与客户的需求，仍然是所有头部厂商内部需要耗费大量精力权衡与平衡的难题。这场由Agent驱动的云革命，序幕才刚刚拉开。

阿里云Agent化升级全解析：平头哥芯片路线图与云服务新战略

相关阅读

最新教程

最新资讯