阿里Agent扛旗榜单：2025最佳推荐盘点

2026-06-16阅读 0热度 0

人工智能

在集团所有AI工具里，QoderWork的日活、周活和Token用量都排在第一。

上周五，阿里巴巴CEO吴泳铭在QoderWork团队会上透露了这个内部口径。吴泳铭在会上提到，QoderWork正在成为“打通大模型和整个数字世界的接口”，未来要帮助所有办公室白领，成为一个类似OS的存在。

这个时间点很有意思。

差不多同一时间，钉钉经历了一场人员风波。CEO无招、副总裁马锐拉相继离职，一篇关于钉钉内部管理和ONE项目的长文，把过去一年积累的问题推到了台前。

管理问题之外，阿里在B端Agent路线上的分歧开始被摆到桌面上。

从时间线来看，悟空和QoderWork几乎是同时起步的。一个成长于钉钉，背靠阿里最重要的企业协同入口；一个来自阿里云，起初更像一个低调的桌面Agent。但在阿里内部的使用声量上，QoderWork明显跑得更快。

有阿里员工表示，自己现在基本只用QoderWork，很少再打开悟空。

从用户视角看，两者能力虽有重叠，但QoderWork用起来更顺手，悟空则更像一个被塞进钉钉里的AI机器人。

行业竞争也在加速。OpenAI把Codex和Agent推到了ChatGPT的前台，腾讯WorkBuddy开始把DAU和留存写进财报，字节火山引擎在MaaS调用量上拿下了接近一半的份额，并推动TRAE Work、扣子企业版等Agent平台持续迭代。

阿里并不缺模型、云和企业入口。Qwen、百炼、阿里云、钉钉、QoderWork和悟空，都在各自的位置上，构成了阿里AI版图的一部分。

问题在于，在冲击行业顶点的路上，阿里需要一个能把所有这些能力串起来、并且在内部用户和外部市场都能被看见的B端Agent产品。

现在看，这个答案还没真正浮出水面。

悟空曾经拥有很高的内部优先级。

据接近阿里的人士透露，悟空成立后，无招团队曾在集团内部强力推进落地。无招会亲自与多个业务一号位沟通，推动业务团队把相关能力接到悟空上。

这符合钉钉过去一年想要转向原生AI的方向。

悟空被定义为企业级AI原生工作平台。尽管也有独立的客户端，但其在阿里生态最大的价值是可以接入钉钉的企业账号、权限和应用系统，调用钉钉的能力完成文档、会议、表格、协同等任务。

在阿里的B端版图中，钉钉原本是最天然的前台。它有企业组织、通讯录、审批流、会议和文档等内部应用，在Agent接入工作场景的命题上，似乎有着天然优势。

但从内部使用反馈来看，悟空并没有完全兑现这种入口优势。

一些来自阿里内部的声音反馈称，悟空在处理钉钉文档时，会出现分不清是在原文档后追加内容，还是覆盖已有内容的情况；在文档修改中，偶尔会出现图片被删除、内容变成“加载中”的状况。

还有员工提到，自己让悟空在群里发一句话并@指定同事，最终只是普通文本，并没有形成真正的@提醒。

要知道，这些都算不上什么特别复杂的Agent任务。这似乎表明，办公协同和通用Agent之间本身就存在一种天然的张力。

通用Agent追求的是“一句话完成任务”，悟空也采取了类似的CLI路线。但企业办公里，很多动作不能只追求快。流程上的节点繁多且复杂，想让AI驱动工作流并不是一件容易的事。

更关键的是，钉钉里的大量工作也不是标准化的SOP，而是人与人之间的琐碎沟通：催进度、确认信息、拉群、对齐口径、转发文件、临时协调。

Agent带来的自动化，必须建立在办公协同的即时性和准确性这两个核心指标上。

这种割裂感，在你打开当前钉钉的一瞬间就能感受到。首先映入眼帘的是AI对话页面，而原本最核心的消息页面，却被放到了一级菜单的第二项。

可以理解，这是钉钉和悟空团队希望提升AI优先级的设定。但一个办公协同软件，却失去了第一时间触及工作消息的便捷性，这本身就有点本末倒置。

相比之下，QoderWork的优势，就在于它是一个通用生产力Agent。

有阿里内部人士提到，让悟空画流程图，得到的往往是Markdown；让QoderWork处理类似任务，却更容易直接得到图片或更接近交付物的结果。

另有内部人士称，悟空在浏览器自动化时会打开多个页面，任务执行失败后的反馈链路也不够清晰，使用感更像“在钉钉里遥控一个机器人”。

这类反馈不能代表所有用户，但说明一个问题：当阿里内部已经出现QoderWork这样的通用生产力Agent时，悟空很难只靠钉钉入口获得天然优势。

办公协同的土壤里，可以长出AI助手、数字员工和流程自动化，但未必适合直接长出一个通用Agent总入口。

对阿里来说，这不是钉钉一个产品的问题，而是B端Agent路线的分工问题：最靠近企业组织和工作流的入口，未必能最先跑出通用Agent能力；而那个最先在内部跑出使用数据的产品，又还没有站到阿里最核心的企业入口上。

阿里和钉钉近期在业务和组织上的激变，开始把这个问题推到了台前。

回到悟空刚发布的时候，外界一度把它视为阿里B端Agent的扛旗角色。

今年3月，悟空以企业级AI原生工作平台形态正式亮相。随后，阿里成立了Alibaba Token Hub，整合了通义实验室、MaaS、Qwen、悟空等AI相关业务，悟空也被放到了更高层级的AI商业化体系中。

彼时，阿里需要一个能把模型、云和企业场景连接起来的产品。

Qwen提供模型能力，百炼提供模型服务和开发平台，阿里云承接企业客户，钉钉负责组织入口。如果悟空能跑通，它就能成为这条链路上最靠近企业日常工作的前台。

但B端Agent的竞争已经越过了发布会阶段，开始进入指标竞争。

OpenAI给出的方向是，把Agent推到用户最高频的前台。ChatGPT正在承接Codex、Agent、图像生成和第三方服务的入口。它的逻辑很直接：模型能力要变成收入，就必须进入用户的工作入口。

这也是AI行业正从模型竞争进入产品竞争的一个信号。早期厂商比的是模型参数、榜单和API价格；进入Agent阶段后，竞争开始转向用户在哪里发出指令、任务在哪里被执行、结果在哪里被交付。

国内厂商也在快速分路。

腾讯走了一条轻前端的路径。WorkBuddy通过桌面Agent、消息入口和MCP连接器进入用户已有的工具链。与此同时，腾讯云还有ADP这样的开放Agent生态平台，深入对接企业AI场景。

更值得注意的是，腾讯已经开始把Agent产品写进财报叙事。

腾讯在一季度财报中称，WorkBuddy按DAU计在中国生产力AIAgent服务中领先；CodeBuddy和WorkBuddy仍处早期采用阶段，但实现了自然增长和较高留存，其中活跃用户留存率超过60%，付费用户留存率超过80%。

腾讯没有披露WorkBuddy的具体DAU和收入，但它给出了资本市场可以理解的产品指标：DAU、留存、付费用户留存。

这对阿里构成了直接参照。

过去，企业软件的竞争更多体现在客户数、合同额和生态伙伴。现在，Agent产品正在被用互联网产品的方式衡量：日活、留存、付费转化和使用频次。

字节走的是另一条路径。

火山引擎、豆包模型、扣子企业版、TRAE Work等产品，构成了从模型服务到Agent平台再到开发者工具的完整链路。这些产品更靠近模型、云和Agent基础设施团队，也更容易获得模型、多模态、工具调用、MCP和开发框架的资源。

在模型调用量层面，IDC数据显示，2025年中国企业级MaaS调用量达到1944万亿Tokens，火山引擎的份额达到了49.5%，而阿里云则为28%。

在企业MaaS调用量上，字节已经取得了国内厂商的主导地位。

另一方面，Agent和AI云之间的关系正在变得越来越直接。

模型能力如果只停留在API里，就需要企业自己去找到应用场景；但Agent产品如果能跑出来，它就能直接创造调用需求。

谁拥有高频的Agent入口，谁就更容易把模型能力转化为Token消耗、云收入和客户粘性。

阿里清楚自己需要一个扛旗产品，但眼下，它的优势分散在不同的板块里。

模型在Qwen，云在阿里云，企业入口在钉钉。它们共同构成了阿里的AI版图，却还没有汇成一个外部市场能清晰识别的B端Agent产品。

没有广受市场认可的Agent生态成绩单，正是阿里现在的压力所在。吴泳铭上周面对QoderWork团队的鼓励发言，似乎也正是这种压力的真实写照。

QoderWork在阿里内部跑出了日活、周活和Token用量第一，但这还远远不够。

资本市场关心的只有一件事：阿里的AI投入能不能变成外部客户、Token调用、付费收入，以及一条更清晰的增长曲线。

阿里股价的波动，背后正是这种期待的不断回收。

股价层面，市场已经给过阿里AI重估，但这轮重估并没有稳定延续。

年初以来，阿里曾因Qwen、云和AI基建投入获得一轮快速上涨。2月，当阿里宣布未来三年在云和AI基础设施上投入至少3800亿元时，股价年内涨幅一度超过68%。

但到6月中旬，阿里美股已经回落至112美元附近。上周以来，阿里美股连续七个交易日下跌，6月11日收于112.69美元，较52周高点192.67美元低了逾四成。

这说明，市场并非没有给过阿里AI溢价，只是这轮正向预期没有稳定延续下去。

财报数据同样能解释这种压力。

此前披露的一季度财报显示，阿里云智能集团收入同比增长38%，达到416.26亿元，外部商业化收入同比增长40%；AI相关产品收入达到89.71亿元，占外部收入比重首次突破30%。

但同一季度，阿里集团收入同比增长3%，为2433.8亿元，经营亏损8.48亿元。云和AI正在增长，但集团利润端承压，也让市场继续追问这轮AI投入的回报路径。

钱已经花下去了，市场接下来要看的，是这些投入能不能换来更多外部客户、更多Token调用和更多收入。

这也是阿里的“SOTA焦虑”。

这里的SOTA，不只是模型榜单上的第一名，而是市场认知里的第一产品。

阿里站在中国AI公司的绝对第一梯队，但它还没有一个在关键战场上跑到绝对意义第一的产品。

C端，阿里有千问。

QuestMobile数据显示，2026年一季度，豆包、千问、DeepSeek位列国内AI原生App前三，月活分别为3.45亿、1.66亿和1.27亿。千问能稍微压制住元宝，进入C端AI应用第一梯队，但它前面仍然是领跑全行业的豆包。

B端Agent，腾讯正在加速跟进。

腾讯已经在一季度财报中披露了WorkBuddy的进展：按DAU计，WorkBuddy在中国生产力AIAgent服务中领先；CodeBuddy和WorkBuddy保持自然增长，活跃用户留存率超过60%，付费用户留存率超过80%。

阿里的财报中，却很难捕捉到QoderWork和悟空的真实市场表现。

这才是阿里SOTA焦虑的核心。

阿里不是没有模型更新，也不是没有产品动作。6月，QoderWork中国版推出了AI生产力计划，免费发放百亿积分，并上线了设计工作台、幻灯片工作台、写作工作台等垂直工作台。新一代的Qwen也在强化代码、调试、办公流程自动化和多模态Agent能力。

这个动作很关键，因为企业用户不缺AI问答入口，缺的是能直接交付结果的工具。

写作工作台对应方案、纪要、周报和文档，幻灯片工作台对应汇报和展示，设计工作台则试图承接图片和视觉物料的需求。这些都是互联网企业的高频工作，也是最容易衡量AI使用价值的场景。

这也是QoderWork区别于悟空的一点：它不是从企业组织关系切入，而是从个人生产力切入。

如果说悟空要解决的是“AI如何进入企业工作流”，那QoderWork要解决的则是“AI如何变成员工的生产力工具”。

前者更依赖组织权限，而后者更容易先跑出个人用户规模。

但在眼下，这些都还只是面向外部市场的起步动作。

对阿里来说，SOTA焦虑最终要靠产品来缓解。虽然模型能力稳定在第一梯队，但只有产品层面的开拓，才能证明这些能力正在被真实地使用。

QoderWork和悟空，现在就站在这个位置上。

谁能先获得市场认可，谁就是阿里AI在商业化领域最清晰的产品锚点。

而在那之前，阿里都只能埋头打磨产品，等待这个答案的出现。

阿里Agent扛旗榜单：2025最佳推荐盘点

相关阅读

最新教程

最新资讯