全球Token消耗榜首:Hermes Agent超越OpenClaw的权威性能测评
最近,全球AI智能体赛道出现了一个标志性事件:来自硅谷的Hermes Agent,在OpenRouter平台的月度Token消耗量排行榜上,首次超越了老牌劲旅OpenClaw,登顶榜首。
更有意思的是,支撑Hermes Agent本月登顶的主力模型阵容,清一色来自国内大厂:小米的MiMo-V2-Pro、MiniMax的M2.7、英伟达的Nemotron 3 Super、阶跃星辰的Step 3.5 Flash以及腾讯的Hy3 preview。这或许暗示了,国内顶尖模型的能力,正在通过这类前沿的智能体框架,快速转化为实际的生产力。
关于 Hermes Agent
Hermes Agent,这个由硅谷AI研究机构Nous Research开发并开源的自主智能体框架,自2026年2月开源以来,势头可谓迅猛。短短几个月,就在GitHub上狂揽超过10万星标,被不少开发者称为“数字员工”。因其发音,在中文社区里还多了个“爱马仕”的戏称。
项目方最新将其定位为“The agent that grows with you”——一个能伴随你使用时长不断学习、进化的数字助手。最关键的是,它在宽松的MIT协议下完全开源。
那么,它到底有何过人之处?
首先,它是一套“自进化”的技能系统。这可不是简单的脚本调用。Hermes Agent在完成任务后,会自动分析整个执行轨迹,从中提取出高频的操作模式,并将其封装成可复用的“技能”。这意味着,同类任务它会越做越快。有测试数据显示,连续运行三个月后,高达65%的新任务可以直接调用已有的技能库来完成,效率提升肉眼可见。
其次,它拥有持久的跨会话记忆。基于SQLite和FTS5构建的四层记忆机制,确保了即使设备重启或切换平台,你的智能体依然记得你的偏好、历史任务和长期目标,无需每次都从头交代背景。
在架构设计上,它允许主智能体“一对一”地拉起子智能体去完成专项任务(比如性能压测或漏洞扫描)。这些子智能体拥有独立的对话上下文、终端和Python RPC环境,确保主流程不受干扰,思路清晰。
安全方面也考虑周详。它支持包括本地沙箱、Docker容器、SSH远程、Singularity镜像包以及按需启动的云环境(如Modal)在内的6种执行环境,能将敏感任务与宿主机的文件系统有效隔离。
对于日常使用,它的接入方式非常友好。Telegram、Discord、Slack、WhatsApp、Signal,以及国内的钉钉、飞书、企业微信等主流IM平台都已集成,扫码即可接入。
还有一个对开发者极其贴心的功能:在修改文件前,它会自动保存工作目录的快照。一旦操作出错,一句简单的/rollback命令就能一键恢复现场。这个“后悔药”机制,是目前OpenClaw尚未原生提供的。
Hermes Agent 与 OpenClaw 对比
说到OpenClaw,大家可能更熟悉一些。作为开源的Gateway型智能体平台,它由Peter Steinberger创立后移交独立基金会维护,核心哲学是“连接一切”。
OpenClaw的优势在于其广度和成熟度。它已经接入了超过50个下游渠道,从Telegram、WhatsApp到微信、钉钉,功能开箱即用。更重要的是,它拥有一个极为丰富的社区技能商店,从上万种自动化插件中,你可以找到从打理GitHub issue到管理智能家居的几乎所有需求。其原生的“母智能体管子智能体”架构,让每个子智能体都能拥有独立的通讯渠道、名字和人设,对于需要同时运营多个自动化身份的用户来说,几乎是刚需。
在运行逻辑上,OpenClaw不依赖大模型的“自主意识”,而是严格按照人类预设的Crontab语法来精准触发任务。这种高度可控的模式,非常适合定时生成报表、定期系统巡检等对稳定性要求极高的场景。
然而,两者的设计哲学从根子上就不一样。
OpenClaw是“Gateway‑first”(网关优先)。它将网关作为唯一的真相源和控制中心,所有会话、技能、路由和渠道配置都在这个单点上完成。这种设计开发简单,全局调控力强,但代价是:单点组件一旦出现漏洞,影响面会非常大。
Hermes则是“Agent‑first”(智能体优先)。它将“自进化学习循环”作为内核,各种通讯网关(如Telegram、微信)更像是挂载在这个内核外面的接口。它的设计更像是一个会不断进化的运行时,无论你在哪个平台与它对话,背后都是同一个持续学习和成长的“大脑”。
这就带来了动态性上的差异。Hermes的跨会话记忆不仅能记住信息,更能从交互中提炼可复用的技能。比如,它帮你解决了一个Python编码规范问题,之后就会把整个过程封装成技能存档,下次遇到同类请求直接调用。配合快照回滚功能,试错成本极低。
而OpenClaw追求的是极致的可控性。它采用静态的“技能商店”模式,所有上架的插件都经过人工审核,保证了行为的绝对可预测。虽然牺牲了动态生成技能的能力,但插件的更新有严格的版本管理,这对于金融、医疗等强合规场景来说,反而是巨大优势。
不过,OpenClaw极快的版本迭代速度,也使其安全暴露面更大。历史上,它曾因沙箱time-of-check等漏洞被披露多个CVE(如CVE-2026-44112、CVE-2026-43574等)。有安全报告显示,在Shodan上能搜出超过10万台暴露在公网且配置不当的OpenClaw实例。社区中也时常能看到关于“Docker容器频繁罢工、Bug常修常新”的讨论。
相比之下,作为新锐工具的Hermes,目前尚未有相关的CVE记录。但正因为它年轻,许多潜在的缺陷可能还未在真实的攻防对抗中被充分发现。当然,Hermes从设计上就更注重“出厂安全”,默认就配置了本地或Docker隔离沙箱。
最后,在用户体验上,两者门槛不同。OpenClaw部署复杂度较高,Linux下的Docker和SSH配置常常让新手望而却步。而且,面对长对话中的重复请求,其API Token的消耗成本容易快速膨胀。
Hermes则提供了更简洁的安装方式和交互式向导,显著降低了上手成本。其技能复用机制,也从根源上节省了重复任务的Token开销。因此,对于追求“开箱即用”的个人用户和小型团队而言,Hermes的吸引力目前看来更胜一筹。
这场榜首易主,或许不仅仅是一次简单的排名变化,更可能预示着智能体框架的发展重心,正在从“广泛连接”向“深度智能与自主进化”悄然倾斜。

