Hermes Agent 评测:6种后端如何抢走83K Star用户

2026-06-02阅读 0热度 0
OpenClaw

2026年2月25日,Nous Research在GitHub上很低调地发布了一个新仓库:hermes-agent。

没有Product Hunt首发,没有YC Demo Day,也没有KOL们集体造势。就一个README文件和一行安装命令。

然后,事情就开始失控了。

第一周,Star数破1万。社区的普遍反应是:“又一个Agent框架?”第二周,Star数破3万。反应变成了:“等等,这东西怎么越用越聪明?”第六周,Star数破6万。网络上开始出现“从OpenClaw迁移到Hermes”的教程。截至4月13日,这个项目已经积累了83.3K Star,424位贡献者,以及4113次提交。

做个对比,OpenClaw用了将近一年时间才站稳247K Star(现在涨到了355K)。Claude Code的开源替代品Claw Code两小时破5万,但那更多靠的是事件驱动——源码泄露带来的热度爆炸。

Hermes Agent的增长曲线完全不同——它是被实打实用出来的,而不是被炒起来的。

这一点,很罕见。


PART 2:为什么要写这篇文章

先谈一下背景。目前,整个工作流深度绑定在Claude Code和OpenClaw这个生态里。从晨间港股监控到日常研究,OpenClaw是核心引擎。所以当看到越来越多开发者从OpenClaw迁移到Hermes Agent时,第一个反应跟大家一样:这东西到底比OpenClaw强在哪里?

花了两天时间研究后,得出的结论是——它并不是“比OpenClaw强”。它根本就是另一种生物。

如果非要打个比方,OpenClaw像一个功能极其强大的工具箱,装满了扳手和螺丝刀,拿来就能用;而Hermes Agent则更像一个会成长的实习生。实习生刚来的时候什么都不会,但三个月后,它可能比你自己还懂你的项目。

这不是好坏之争。这是路线之争。


PART 3:三层记忆——Hermes Agent的核心武器

先说最关键的差异点:记忆系统。

OpenClaw的路线:全量持久化 + 向量检索

OpenClaw的记忆策略是“什么都存”。所有对话、上下文、文件操作记录,全部灌进向量数据库。需要回忆时,就用embedding做语义检索,拉出最相关的几条。

这个做法的优点显而易见:不丢信息,上下文窗口理论上无限大。

但在实际使用中,会遇到一个非常具体的问题:用到第三个月,噪音就太大了。你让它回忆“我上周对股票分析系统做了什么修改”,它可能把三个月前一次完全无关的调试记录也拉出来,只因为语义上沾了点边。向量检索的精度会随着数据量增加而线性下降——这不是bug,这是架构的天生缺陷。

Hermes Agent的路线:有限记忆 + 主动压缩

Hermes Agent的设计哲学正好相反。

它的记忆系统分为三层:

层级容量类比机制
会话记忆当前上下文窗口短期记忆标准LLM上下文
持久记忆MEMORY.md + USER.md ≈ 1300 tokens长期记忆主动压缩、合并、淘汰
技能记忆SKILL.md 文件集合肌肉记忆从经验中自动生成

注意那个数字:1300 tokens的硬上限。

这不是限制。这是刻意的设计。

Hermes Agent的设计者认为:对LLM来说,少量精准的记忆,远比大量模糊的记忆更有价值。当记忆接近上限时,Agent会自动做三件事:合并相似条目、删除过时信息、将多条记录压缩成一条摘要。

讽刺的是,自己在WorkBuddy里用的MEMORY.md机制,跟这个设计理念几乎一模一样。MEMORY.md不超过1KB,记的都是“港股自选股列表”、“企业微信Webhook Key”、“养虾系列存放路径”这类高复用信息。日志文件则按日存,30天后蒸馏。这套机制是在实践中自己摸索出来的——而Hermes Agent把它做成了产品级的内置能力。

这说明了一个问题:好的Agent记忆系统,应该是有限的、可压缩的、主动管理的。全量存储,反过来可能是懒惰的做法。


PART 4:自学习循环——最值得警觉的功能

记忆系统是基础设施。真正让Hermes Agent从“又一个Agent框架”升级为“有点东西”的,是它的闭环自学习机制。

它的运作原理是这样的:

  1. 触发条件:完成一个需要5次以上工具调用的复杂任务。
  2. 自动产出:生成一份SKILL.md——包含操作步骤、踩过的坑、验证方法。
  3. 自检机制:每15次工具调用,Agent会主动暂停并做一次自检(“我做到哪了?有没有偏离目标?”)。
  4. 持续迭代:下次遇到类似任务时,调用已有的Skill,用完后根据新经验更新它。

有用户实测数据显示:一个月后,同类任务的平均工具调用次数从25次降到了8-10次。

这个数字背后意味着三件事:成本下降70%(LLM API调用量直接打三折)、延迟降低(更少的tool call = 更快的响应)、准确率上升(因为它记住了哪些路走不通)。

作为对比,OpenClaw也有技能系统——ClawHub上有超过13000个社区共建的技能。但那是“通用教材”:写好了给所有人用,覆盖面广,但不一定适配你的具体环境。

Hermes Agent的技能是“私人笔记”:从你的操作中长出来的,包含了你的项目结构、你的工具链偏好、你踩过的坑。

一个是标准化的SOP,一个是个性化的经验沉淀。两种路线没有对错,但Hermes Agent的路线有一个碾压级优势——它的技能与你的使用时长正相关。用得越久,差距越大。

这就是为什么早期用户很难下定决心迁移出去。


PART 5:为什么Hermes Agent能爆火——三个结构性原因

回到那个最核心的问题:凭什么是它?

AI Agent框架在2026年不下百个。AutoGPT、CrewAI、LangGraph、MetaGPT……为什么Hermes Agent能在6周内冲到83K Star?

原因1:卡位精准——OpenClaw太重,Claude Code太专

Claude Code只在终端/IDE里存活,不碰消息平台,不做定时任务,不持久化记忆。它是最好的编码助手,但你一关掉终端它就“死”了。

OpenClaw走的是另一个极端——22个消息平台、13000个技能、全量持久化。功能极度丰富,但配置复杂度也极高。很多人用OpenClaw的前两周,80%的时间都花在调配置和排错上。

Hermes Agent恰好卡在了中间:比Claude Code多了持久记忆和消息平台支持(不用守着终端),比OpenClaw轻得多(一行curl安装,五步配置),比AutoGPT实用(它不是“自主运行”的表演,而是真正能干活的工具)。

不做最强的,做最趁手的。这种产品感觉非常Nous Research——他们做Hermes系列大模型也是这个路线:不追SOTA榜单,追“开发者用起来最舒服”。

原因2:可感知的成长性

大多数AI产品的能力曲线是这样的:第一天很惊艳,到第三天就“也就那样了”。

Hermes Agent的曲线是反过来的:第一天啥也不会,到第三十天已经能独立处理你80%的常规任务。

这种“越用越好”的体验在消费品领域叫用户粘性。在AI Agent领域,它创造了一种前所未有的锁定效应——你不是因为沉没成本不想走,而是因为你的Agent真的比别人的Agent更懂你。

OpenClaw的锁定靠生态(插件、技能、MCP服务器)。Hermes Agent的锁定靠经验积累(你用得越久,它学得越多)。后者更可怕,因为生态可以迁移,经验不可以。

原因3:Nous Research的信任背书 + MIT协议

Nous Research不是一家刚成立的创业公司。他们训练的Hermes系列大模型(Hermes 1/2/3)是开源社区里最受信赖的模型系列之一。Hermes 3的技术报告在arXiv上的引用量排在了开源模型前五。

MIT协议意味着:零商业限制、零遥测、数据全本地。在Anthropic封杀OpenClaw的大背景下,“不被卡脖子”变成了一个非常有吸引力的卖点。


PART 6:几个判断

分析到这里,可以给出几个自己的判断。

判断1:Hermes Agent和OpenClaw不是替代关系

文章写到这里,可能有人会以为要“叛变”——从OpenClaw转投Hermes。

不会。

因为两个产品解决的问题根本不同:OpenClaw解决的是“我需要一个中枢来调度多个AI Agent协作”的问题。多渠道、多模型、多工具、多人协作——这是OpenClaw的领地。Hermes Agent解决的是“我需要一个长期陪伴的私人Agent”的问题。自学习、持久记忆、个性化技能——这是Hermes的领地。Claude Code解决的是“我需要最好的代码生成质量”的问题。SWE-bench榜首不是白来的。

三者完全可以共存。事实上,社区已经有人在做混合方案——用Claude Code写代码,用OpenClaw做多渠道分发,用Hermes Agent做个人知识管理。

判断2:自学习是2026年Agent赛道的分水岭

2023年的Agent赛道,核心比的是“能调用多少工具”。2024年的Agent赛道,核心比的是“上下文能塞多长”。2025年的Agent赛道,核心比的是“能接入多少平台”。到了2026年,核心比的将是“能不能自己变强”。

Hermes Agent是第一个把自学习做成产品级体验的框架。它不是学术Demo,不是“理论上可以”,而是真的实现了一个月后tool call从25次降到8次。

如果OpenClaw不跟进类似的自学习机制,它在个人Agent场景下会被Hermes越拉越远。如果Claude Code不做持久记忆,每次开新会话都要重新解释项目背景,开发者迟早会感到厌烦。

自学习机制不是nice-to-ha ve。它是接下来三年的主战场。

判断3:警惕“养宠物”心理

最后一个判断,算是泼一盆冷水。

“越用越懂你”的另一面,是“越用越离不开”。

当你的Hermes Agent积累了半年的技能和记忆,你切换到另一个框架的成本就会变得极高。这不是技术壁垒——hermes claw migrate能搬走SOUL.md和配置——但那些从你日常操作中自动生成的SKILL.md、从你的反馈中精炼的记忆压缩策略,这些都是不可迁移的隐性知识。

某种程度上,这比OpenClaw的生态锁定更可怕。生态锁定至少你看得见(13000个技能摆在那里),而经验锁定是无形的。

所以建议是:用Hermes Agent,但保持方法论的可迁移性。你的核心认知——怎么拆解任务、怎么做质量验证、怎么设计工作流——必须存在于你自己的脑子里,而不是Agent的SKILL.md里。这条建议其实对所有AI工具都适用。


最后

从OpenClaw被封杀,到Claw Code四天重写,再到今天Hermes Agent的83K Star——2026年AI Agent赛道的节奏已经快到不讲道理了。

但节奏越快,越要抓住不变的东西。

OpenClaw教会我们“接入一切”的能力。Hermes Agent教会我们“记住一切”的价值。Claude Code教会我们“执行一切”的底线。

三种哲学,三条路线,最终都指向同一个问题:你要建造的到底是一个工具,还是一个伙伴?

答案是两者都要。但如果只能选一个——选伙伴。工具会被淘汰,伙伴会成长。

免责声明

本网站新闻资讯均来自公开渠道,力求准确但不保证绝对无误,内容观点仅代表作者本人,与本站无关。若涉及侵权,请联系我们处理。本站保留对声明的修改权,最终解释权归本站所有。

相关阅读

更多
欢迎回来 登录或注册后,可保存提示词和历史记录
登录后可同步收藏、历史记录和常用模板
注册即表示同意服务条款与隐私政策