阿里Agent扛旗榜单:2025最佳推荐盘点
在集团所有AI工具里,QoderWork的日活、周活和Token用量都排在第一。
上周五,阿里巴巴CEO吴泳铭在QoderWork团队会上透露了这个内部口径。吴泳铭在会上提到,QoderWork正在成为“打通大模型和整个数字世界的接口”,未来要帮助所有办公室白领,成为一个类似OS的存在。
这个时间点很有意思。
差不多同一时间,钉钉经历了一场人员风波。CEO无招、副总裁马锐拉相继离职,一篇关于钉钉内部管理和ONE项目的长文,把过去一年积累的问题推到了台前。
管理问题之外,阿里在B端Agent路线上的分歧开始被摆到桌面上。
从时间线来看,悟空和QoderWork几乎是同时起步的。一个成长于钉钉,背靠阿里最重要的企业协同入口;一个来自阿里云,起初更像一个低调的桌面Agent。但在阿里内部的使用声量上,QoderWork明显跑得更快。
有阿里员工表示,自己现在基本只用QoderWork,很少再打开悟空。
从用户视角看,两者能力虽有重叠,但QoderWork用起来更顺手,悟空则更像一个被塞进钉钉里的AI机器人。
行业竞争也在加速。OpenAI把Codex和Agent推到了ChatGPT的前台,腾讯WorkBuddy开始把DAU和留存写进财报,字节火山引擎在MaaS调用量上拿下了接近一半的份额,并推动TRAE Work、扣子企业版等Agent平台持续迭代。
阿里并不缺模型、云和企业入口。Qwen、百炼、阿里云、钉钉、QoderWork和悟空,都在各自的位置上,构成了阿里AI版图的一部分。
问题在于,在冲击行业顶点的路上,阿里需要一个能把所有这些能力串起来、并且在内部用户和外部市场都能被看见的B端Agent产品。
现在看,这个答案还没真正浮出水面。
悟空曾经拥有很高的内部优先级。
据接近阿里的人士透露,悟空成立后,无招团队曾在集团内部强力推进落地。无招会亲自与多个业务一号位沟通,推动业务团队把相关能力接到悟空上。
这符合钉钉过去一年想要转向原生AI的方向。
悟空被定义为企业级AI原生工作平台。尽管也有独立的客户端,但其在阿里生态最大的价值是可以接入钉钉的企业账号、权限和应用系统,调用钉钉的能力完成文档、会议、表格、协同等任务。
在阿里的B端版图中,钉钉原本是最天然的前台。它有企业组织、通讯录、审批流、会议和文档等内部应用,在Agent接入工作场景的命题上,似乎有着天然优势。
但从内部使用反馈来看,悟空并没有完全兑现这种入口优势。
一些来自阿里内部的声音反馈称,悟空在处理钉钉文档时,会出现分不清是在原文档后追加内容,还是覆盖已有内容的情况;在文档修改中,偶尔会出现图片被删除、内容变成“加载中”的状况。
还有员工提到,自己让悟空在群里发一句话并@指定同事,最终只是普通文本,并没有形成真正的@提醒。
要知道,这些都算不上什么特别复杂的Agent任务。这似乎表明,办公协同和通用Agent之间本身就存在一种天然的张力。
通用Agent追求的是“一句话完成任务”,悟空也采取了类似的CLI路线。但企业办公里,很多动作不能只追求快。流程上的节点繁多且复杂,想让AI驱动工作流并不是一件容易的事。
更关键的是,钉钉里的大量工作也不是标准化的SOP,而是人与人之间的琐碎沟通:催进度、确认信息、拉群、对齐口径、转发文件、临时协调。
Agent带来的自动化,必须建立在办公协同的即时性和准确性这两个核心指标上。
这种割裂感,在你打开当前钉钉的一瞬间就能感受到。首先映入眼帘的是AI对话页面,而原本最核心的消息页面,却被放到了一级菜单的第二项。
可以理解,这是钉钉和悟空团队希望提升AI优先级的设定。但一个办公协同软件,却失去了第一时间触及工作消息的便捷性,这本身就有点本末倒置。
相比之下,QoderWork的优势,就在于它是一个通用生产力Agent。
有阿里内部人士提到,让悟空画流程图,得到的往往是Markdown;让QoderWork处理类似任务,却更容易直接得到图片或更接近交付物的结果。
另有内部人士称,悟空在浏览器自动化时会打开多个页面,任务执行失败后的反馈链路也不够清晰,使用感更像“在钉钉里遥控一个机器人”。
这类反馈不能代表所有用户,但说明一个问题:当阿里内部已经出现QoderWork这样的通用生产力Agent时,悟空很难只靠钉钉入口获得天然优势。
办公协同的土壤里,可以长出AI助手、数字员工和流程自动化,但未必适合直接长出一个通用Agent总入口。
对阿里来说,这不是钉钉一个产品的问题,而是B端Agent路线的分工问题:最靠近企业组织和工作流的入口,未必能最先跑出通用Agent能力;而那个最先在内部跑出使用数据的产品,又还没有站到阿里最核心的企业入口上。
阿里和钉钉近期在业务和组织上的激变,开始把这个问题推到了台前。
回到悟空刚发布的时候,外界一度把它视为阿里B端Agent的扛旗角色。
今年3月,悟空以企业级AI原生工作平台形态正式亮相。随后,阿里成立了Alibaba Token Hub,整合了通义实验室、MaaS、Qwen、悟空等AI相关业务,悟空也被放到了更高层级的AI商业化体系中。
彼时,阿里需要一个能把模型、云和企业场景连接起来的产品。
Qwen提供模型能力,百炼提供模型服务和开发平台,阿里云承接企业客户,钉钉负责组织入口。如果悟空能跑通,它就能成为这条链路上最靠近企业日常工作的前台。
但B端Agent的竞争已经越过了发布会阶段,开始进入指标竞争。
OpenAI给出的方向是,把Agent推到用户最高频的前台。ChatGPT正在承接Codex、Agent、图像生成和第三方服务的入口。它的逻辑很直接:模型能力要变成收入,就必须进入用户的工作入口。
这也是AI行业正从模型竞争进入产品竞争的一个信号。早期厂商比的是模型参数、榜单和API价格;进入Agent阶段后,竞争开始转向用户在哪里发出指令、任务在哪里被执行、结果在哪里被交付。
国内厂商也在快速分路。
腾讯走了一条轻前端的路径。WorkBuddy通过桌面Agent、消息入口和MCP连接器进入用户已有的工具链。与此同时,腾讯云还有ADP这样的开放Agent生态平台,深入对接企业AI场景。
更值得注意的是,腾讯已经开始把Agent产品写进财报叙事。
腾讯在一季度财报中称,WorkBuddy按DAU计在中国生产力AIAgent服务中领先;CodeBuddy和WorkBuddy仍处早期采用阶段,但实现了自然增长和较高留存,其中活跃用户留存率超过60%,付费用户留存率超过80%。
腾讯没有披露WorkBuddy的具体DAU和收入,但它给出了资本市场可以理解的产品指标:DAU、留存、付费用户留存。
这对阿里构成了直接参照。
过去,企业软件的竞争更多体现在客户数、合同额和生态伙伴。现在,Agent产品正在被用互联网产品的方式衡量:日活、留存、付费转化和使用频次。
字节走的是另一条路径。
火山引擎、豆包模型、扣子企业版、TRAE Work等产品,构成了从模型服务到Agent平台再到开发者工具的完整链路。这些产品更靠近模型、云和Agent基础设施团队,也更容易获得模型、多模态、工具调用、MCP和开发框架的资源。
在模型调用量层面,IDC数据显示,2025年中国企业级MaaS调用量达到1944万亿Tokens,火山引擎的份额达到了49.5%,而阿里云则为28%。
在企业MaaS调用量上,字节已经取得了国内厂商的主导地位。
另一方面,Agent和AI云之间的关系正在变得越来越直接。
模型能力如果只停留在API里,就需要企业自己去找到应用场景;但Agent产品如果能跑出来,它就能直接创造调用需求。
谁拥有高频的Agent入口,谁就更容易把模型能力转化为Token消耗、云收入和客户粘性。
阿里清楚自己需要一个扛旗产品,但眼下,它的优势分散在不同的板块里。
模型在Qwen,云在阿里云,企业入口在钉钉。它们共同构成了阿里的AI版图,却还没有汇成一个外部市场能清晰识别的B端Agent产品。
没有广受市场认可的Agent生态成绩单,正是阿里现在的压力所在。吴泳铭上周面对QoderWork团队的鼓励发言,似乎也正是这种压力的真实写照。
QoderWork在阿里内部跑出了日活、周活和Token用量第一,但这还远远不够。
资本市场关心的只有一件事:阿里的AI投入能不能变成外部客户、Token调用、付费收入,以及一条更清晰的增长曲线。
阿里股价的波动,背后正是这种期待的不断回收。
股价层面,市场已经给过阿里AI重估,但这轮重估并没有稳定延续。
年初以来,阿里曾因Qwen、云和AI基建投入获得一轮快速上涨。2月,当阿里宣布未来三年在云和AI基础设施上投入至少3800亿元时,股价年内涨幅一度超过68%。
但到6月中旬,阿里美股已经回落至112美元附近。上周以来,阿里美股连续七个交易日下跌,6月11日收于112.69美元,较52周高点192.67美元低了逾四成。
这说明,市场并非没有给过阿里AI溢价,只是这轮正向预期没有稳定延续下去。
财报数据同样能解释这种压力。
此前披露的一季度财报显示,阿里云智能集团收入同比增长38%,达到416.26亿元,外部商业化收入同比增长40%;AI相关产品收入达到89.71亿元,占外部收入比重首次突破30%。
但同一季度,阿里集团收入同比增长3%,为2433.8亿元,经营亏损8.48亿元。云和AI正在增长,但集团利润端承压,也让市场继续追问这轮AI投入的回报路径。
钱已经花下去了,市场接下来要看的,是这些投入能不能换来更多外部客户、更多Token调用和更多收入。
这也是阿里的“SOTA焦虑”。
这里的SOTA,不只是模型榜单上的第一名,而是市场认知里的第一产品。
阿里站在中国AI公司的绝对第一梯队,但它还没有一个在关键战场上跑到绝对意义第一的产品。
C端,阿里有千问。
QuestMobile数据显示,2026年一季度,豆包、千问、DeepSeek位列国内AI原生App前三,月活分别为3.45亿、1.66亿和1.27亿。千问能稍微压制住元宝,进入C端AI应用第一梯队,但它前面仍然是领跑全行业的豆包。
B端Agent,腾讯正在加速跟进。
腾讯已经在一季度财报中披露了WorkBuddy的进展:按DAU计,WorkBuddy在中国生产力AIAgent服务中领先;CodeBuddy和WorkBuddy保持自然增长,活跃用户留存率超过60%,付费用户留存率超过80%。
阿里的财报中,却很难捕捉到QoderWork和悟空的真实市场表现。
这才是阿里SOTA焦虑的核心。
阿里不是没有模型更新,也不是没有产品动作。6月,QoderWork中国版推出了AI生产力计划,免费发放百亿积分,并上线了设计工作台、幻灯片工作台、写作工作台等垂直工作台。新一代的Qwen也在强化代码、调试、办公流程自动化和多模态Agent能力。
这个动作很关键,因为企业用户不缺AI问答入口,缺的是能直接交付结果的工具。
写作工作台对应方案、纪要、周报和文档,幻灯片工作台对应汇报和展示,设计工作台则试图承接图片和视觉物料的需求。这些都是互联网企业的高频工作,也是最容易衡量AI使用价值的场景。
这也是QoderWork区别于悟空的一点:它不是从企业组织关系切入,而是从个人生产力切入。
如果说悟空要解决的是“AI如何进入企业工作流”,那QoderWork要解决的则是“AI如何变成员工的生产力工具”。
前者更依赖组织权限,而后者更容易先跑出个人用户规模。
但在眼下,这些都还只是面向外部市场的起步动作。
对阿里来说,SOTA焦虑最终要靠产品来缓解。虽然模型能力稳定在第一梯队,但只有产品层面的开拓,才能证明这些能力正在被真实地使用。
QoderWork和悟空,现在就站在这个位置上。
谁能先获得市场认可,谁就是阿里AI在商业化领域最清晰的产品锚点。
而在那之前,阿里都只能埋头打磨产品,等待这个答案的出现。





