阿里云MaaS收入激增15倍:Token商业模式深度解析与增长策略

2026-05-25阅读 0热度 0
AI新闻

在AI的竞技场上,Token的争夺战早已超越了单纯的数量比拼,进入了追求“含金量”的新阶段。

一个最新的数据印证了这一点:阿里云MaaS业务的Token收入,在2026年前五个月里增长了惊人的15倍,月度收入已达数亿元级别。这背后最直接的驱动力,指向了一个关键词——Agent。

就在5月20日,阿里云紧锣密鼓地发布了新一代旗舰模型Qwen 3.7 Max等一系列产品。要知道,距离其前代Qwen 3.6 Max的亮相,仅仅过去了一个月。为何如此急切?

原因很直接。自今年2月OpenClaw引爆市场以来,各大模型厂商都开始全力押注Agent,尤其是提升模型的代码生成能力。这场围绕Coding的军备竞赛日趋白热化,阿里必须拿出一款在代码能力上足够能打的模型,以捍卫其MaaS业务的竞争力。用阿里云公共云总裁刘伟光的话说,“未来是Agent Cloud的时代。”

无独有偶,同一天在大洋彼岸的硅谷,Google I/O大会的主题也聚焦于Agent Cloud。从新发布的芯片、模型到应用,几乎所有的产品线都围绕着Agent展开。

一个全球性的AI共识已然清晰:Agent Coding,是当前战局的核心。

狠狠做Agent

阿里云这次发布会的第一个“前菜”,是一个名为“千问云”的独立官网。这可不是一个普通的网站,它是阿里云成立17年来,首次为单一业务线设立的独立官网。其特别之处在于,它的设计初衷并非服务于人类,而是为Agent量身打造。

这个决策源于阿里云内部在2024年底的一个关键判断:未来云计算产品的主要使用者,将逐渐从人类工程师转变为Agent。

回想一下传统的云服务使用流程:开发者需要注册、登录,面对成百上千的产品分类,自己挑选机型、配置网络、开通实例、安装环境、调试API……每一步都需要人类的专业判断,门槛不低。

而“千问云”试图碘伏这一流程。其背后的逻辑是,未来的动线将彻底反转:Agent会首先寻找合适的模型,然后匹配所需的工具和技能,最后才去调度底层的云资源。顺序完全调了个个儿。

一个现实的例子已经发生。在内部代号“龙虾”的项目上线后,阿里云发现,Agent可以在一天内自动完成云计算资源的开通。同样的工作,过去需要人类工程师花费两周时间。刘伟光对此的描述很形象:“未来不需要人来开通了,Agent自动就在后台把云计算资源激活了。”

官网只是序幕。实际上,阿里云从上层的模型、中间的Infra到底层的芯片,完成了一次围绕Agent的全面重构。

首当其冲的,便是新一代旗舰模型Qwen 3.7 Max的闪电发布。距离上一代发布仅一个月就推出重大升级,其紧迫性可见一斑。

尽管阿里在开源领域积累了深厚的影响力,但相较于国内智谱GLM、Kimi等对手,其旗舰模型并未完全享受到上一轮Agent热潮的最大红利。

因此,Qwen 3.7 Max的推出,被视为阿里在代码能力战场上一次关键的“扳回一城”。

根据目前业界最权威的代码能力基准测试,Qwen 3.7 Max已经追平了DeepSeek的最强版本。而在难度更高的复杂工程任务测试中,它更是拿下了第一的位置。

△Qwen3.7-Max可独立执行长达35小时的长程复杂任务,工具调用数量也在各大模型中位于前列,图源:阿里云

与Qwen 3.6 Max Preview相比,Qwen 3.7 Max最核心的升级在于长周期任务能力的飞跃。这意味着Agent能够自主执行跨越数十小时、涉及上千个步骤的复杂任务,全程无需人类干预。

长程任务能力越强,Agent能独立处理的业务复杂度就越高,人类需要插手的地方就越少。这也正是Claude Code、Gemini Deep Research等顶级Agent产品的核心竞争力所在。

阿里云CTO周靖人举了一个生动的例子:在平头哥的新芯片平台上,Qwen3.7-Max通过自主编程和超过1000次的工具调用,实现了平台关键内核的自我进化,最终将推理速度提升了10倍。

这标志着,模型已经能够像一位经验丰富的工程师那样,独立排查代码中的深层缺陷,或协助开发复杂功能。当然,这一切的实现,也离不开底层芯片和基础设施的适配。

在芯片层面,阿里云新一代训推一体AI芯片“真武M890”以及自研互联芯片ICN Switch 1.0,都被集成到超节点服务器中,专门针对Agent所需的大规模并发场景进行了优化。

目前,阿里平头哥的PPU芯片出货量已超过54万片,并已在“悟空”、“秒悟”等AI应用中提供推理服务。

怎么把Token生意越做越大

Agent的爆发,直接带来了Token消耗量的指数级增长。毕竟,Agent的本质是代码生成,完成一次任务所调用的Token量,往往是普通对话场景的十倍甚至百倍。

于是,围绕Agent的共识,迅速演变为模型市场一场“明牌”战争:谁的模型在Agent场景下被调用得越多,谁就能更快地收割收入。目前的全球最大赢家无疑是Anthropic,据《华尔街日报》报道,其营收预计将在第二季度增长一倍以上,达到109亿美元。

△图源:华尔街日报

阿里云同样是这波红利的受益者。2025年,阿里云全年营收超过1466亿元,其中28.6%的增速主要得益于AI产品的贡献。阿里巴巴CEO吴泳铭在上周的财报电话会上进一步透露,包含百炼MaaS平台在内的AI模型与应用服务,其年化经常性收入(ARR)将在6月份季度突破100亿元,并计划在年底达到300亿元。

不过,在这场Token战争中,阿里和字节跳动选择了两种截然不同的路径。

“Token收入主要来自两大块:一块是以Coding为代表的大语言模型,另一块是视频模型。但过去一段时间,很多人把这两个市场的增长混为一谈了,这其实不太准确。”刘伟光特别强调。

字节跳动牢牢占据了视频模型市场。有研究机构测算,自Seedance 2.0爆火后,字节在视频模型市场的日均Token消耗量已占据整个市场的80%。火山引擎曾在2025年底立下“2026年MaaS服务收入超100亿”的目标,而在Seedance 2.0之后,这个目标已经被再次上调。

相比之下,阿里云则将优势押注在大语言模型,尤其是Coding领域。“有开发者的公司,才需要云。所以阿里云现有的存量客户,几乎天然就是Coding的潜在用户。”刘伟光解释道。

2025年底,阿里云曾喊出“拿下2026年AI云市场增量80%”的目标。如今,其业务火力高度集中于Coding领域。“今年前5个月,我们可以说,阿里云已经拿到了LLM模型市场增量的80%。”

为了配合这一战略,阿里云甚至调整了销售团队的考核方式——核心不再是比拼谁卖出的Token数量最多,而是看谁卖出的Token“最值钱”。

道理很简单。单纯聊天产生的Token消耗,其单价早已跌至地板价,并非理想的收入来源。

因此,阿里云如今关注一个更关键的指标:模型接入客户核心业务系统的数量。他们希望销售的Token,是被客户用来写代码、做业务决策、跑核心流程的。一旦模型深度嵌入企业的生产流程,Token的消耗量将呈指数级上升,单价更高,客户粘性更强,对应的收入质量也截然不同。

这源于Coding与视频在Token消耗逻辑上的根本差异。视频模型的消耗是一次性的——生成一段视频,任务结束,消耗停止。

而代码场景则是一个自我强化的飞轮:模型写出代码,代码部署成应用,应用在云上运行,运行过程中又需要持续调用模型来优化或生成新代码……循环往复,生生不息。

时至今日,大模型的竞争早已演变为一场系统工程的综合较量。芯片、基础设施与大模型之间的深度耦合,决定了训练和推理的效率;而商业场景的快速落地与验证,则为模型的持续进化反哺智能。

“芯片、模型和云,现在就像三个必须严丝合缝咬合在一起、共同螺旋上升的齿轮。”刘伟光表示。未来的胜负手或许在于,“如果比拼的是每一块芯片都能比竞争对手跑出更多、更高质量的Token,那胜利就属于我们。”

在后续的分享中,刘伟光进一步阐述了阿里云对Agent趋势和Token之战的理解:

1. 云计算的天花板被Agent再度撬开

传统云计算商业模式相对简单,但有个长期痛点:企业IT预算中,用于内部软件开发和人力外包的那部分,云厂商很难触及。现在情况反过来了,这部分预算恰恰是AI Coding能够100%覆盖的。

数据显示,互联网企业的Token支出已占其IT总支出的15%~20%,而传统企业还在5%以下,增长空间巨大。阿里云今年的目标是,在每个客户的收入中,Token收入的占比不低于20%。

以汽车行业为例,过去云厂商能做的主要是ERP上云,后来是智能驾驶算力,再后来是大模型对话。现在,连广告营销都能用AI来做了。汽车行业最大的IT投入领域,正从传统的ERP转向AI。

金融领域也是如此。以前做券商客户,很难切入对方的业务系统,那是专业壁垒很高的领域。现在则是客户主动找上门,因为头部机构的投研、量化、私募等核心业务场景,都必须与大模型深度结合。

可以说,Agent已经成为带动模型市场、乃至盘活存量云市场的最大引擎。因此,Token业务和云业务在阿里云内部是天然绑定的。这也是为什么Coding被定为最重要的方向——它几乎适用于一切(for everything)。

2. Agent天然是云业务的增长飞轮

Token消耗和GPU使用量之间存在换算关系。实际数据揭示了一个有趣的现象:Agent爆发后,每产生100元的GPU推理消耗,往往会同时带动约200元的GPU+CPU云资源消耗。因为Agent生成的应用需要部署、运行、弹性扩容,这些都会消耗额外的云资源。

这意味着,如果一家厂商没有强大的CPU云资源池,就根本无法有效服务这些Agent客户。这也是“Agent Cloud”概念的核心所在——它形成了一个真实的、可闭环的商业增长飞轮。

3. 销售体系需要快速变革

为了抓住机会,阿里云正在为大型客户单独配置纯MaaS销售,让他们与传统的IaaS销售协同作战。即便在一个客户身上出现两三个销售重叠,这个代价也可以接受,核心是绝不能错失市场窗口。

坦白说,在云产业经营太久,每个人都会有思维惯性。过去卖云,市场版图很清晰——客户线下有多少台服务器,迁移上云大概需要多少预算,答案八九不离十。但做MaaS完全不同,进去之后可能发现市场潜力远超想象。而且,MaaS销售需要直接与客户的业务部门甚至CEO对话,而不是传统的IT部门,这本身就是巨大的挑战。

一个有意思的现象是,越传统的企业,有时反而越容易拥抱AI,因为AI实实在在地简化了他们的一些复杂工作。现在,连畜牧行业的企业都在大规模引入AI,这在过去是不可想象的。

4. Token之战:质量重于数量

调用量可以通过简单的对话堆砌出来,但这没有意义。阿里云关注三个更本质的指标:付费Token客户数是否持续增长;客户是否将模型接入核心系统解决刚需;Agent自主完成任务闭环的效率。美国的行业共识也是如此——目标是用最少的Token完成最有效的任务,而不是用更多的Token完成更多的任务。

正因为追求高质量、高价值的Token,MaaS业务从第一天起就应该是一门有利润的生意。目前,阿里云的百炼平台(基础设施)和模型团队紧密协作,每天都在对推理框架进行极致优化。

尽管中国市场目前仍以按量计费为主,但行业的终极目标,无疑是让客户为最终的业务结果和价值付费。

免责声明

本网站新闻资讯均来自公开渠道,力求准确但不保证绝对无误,内容观点仅代表作者本人,与本站无关。若涉及侵权,请联系我们处理。本站保留对声明的修改权,最终解释权归本站所有。

相关阅读

更多
欢迎回来 登录或注册后,可保存提示词和历史记录
登录后可同步收藏、历史记录和常用模板
注册即表示同意服务条款与隐私政策