Hermes Agent 评测：6种后端如何抢走83K Star用户

2026-06-02阅读 0热度 0

OpenClaw

2026年2月25日，Nous Research在GitHub上很低调地发布了一个新仓库：hermes-agent。

没有Product Hunt首发，没有YC Demo Day，也没有KOL们集体造势。就一个README文件和一行安装命令。

然后，事情就开始失控了。

第一周，Star数破1万。社区的普遍反应是：“又一个Agent框架？”第二周，Star数破3万。反应变成了：“等等，这东西怎么越用越聪明？”第六周，Star数破6万。网络上开始出现“从OpenClaw迁移到Hermes”的教程。截至4月13日，这个项目已经积累了83.3K Star，424位贡献者，以及4113次提交。

做个对比，OpenClaw用了将近一年时间才站稳247K Star（现在涨到了355K）。Claude Code的开源替代品Claw Code两小时破5万，但那更多靠的是事件驱动——源码泄露带来的热度爆炸。

Hermes Agent的增长曲线完全不同——它是被实打实用出来的，而不是被炒起来的。

这一点，很罕见。

PART 2：为什么要写这篇文章

先谈一下背景。目前，整个工作流深度绑定在Claude Code和OpenClaw这个生态里。从晨间港股监控到日常研究，OpenClaw是核心引擎。所以当看到越来越多开发者从OpenClaw迁移到Hermes Agent时，第一个反应跟大家一样：这东西到底比OpenClaw强在哪里？

花了两天时间研究后，得出的结论是——它并不是“比OpenClaw强”。它根本就是另一种生物。

如果非要打个比方，OpenClaw像一个功能极其强大的工具箱，装满了扳手和螺丝刀，拿来就能用；而Hermes Agent则更像一个会成长的实习生。实习生刚来的时候什么都不会，但三个月后，它可能比你自己还懂你的项目。

这不是好坏之争。这是路线之争。

PART 3：三层记忆——Hermes Agent的核心武器

先说最关键的差异点：记忆系统。

OpenClaw的路线：全量持久化 + 向量检索

OpenClaw的记忆策略是“什么都存”。所有对话、上下文、文件操作记录，全部灌进向量数据库。需要回忆时，就用embedding做语义检索，拉出最相关的几条。

这个做法的优点显而易见：不丢信息，上下文窗口理论上无限大。

但在实际使用中，会遇到一个非常具体的问题：用到第三个月，噪音就太大了。你让它回忆“我上周对股票分析系统做了什么修改”，它可能把三个月前一次完全无关的调试记录也拉出来，只因为语义上沾了点边。向量检索的精度会随着数据量增加而线性下降——这不是bug，这是架构的天生缺陷。

Hermes Agent的路线：有限记忆 + 主动压缩

Hermes Agent的设计哲学正好相反。

它的记忆系统分为三层：

层级	容量	类比	机制
会话记忆	当前上下文窗口	短期记忆	标准LLM上下文
持久记忆	MEMORY.md + USER.md ≈ 1300 tokens	长期记忆	主动压缩、合并、淘汰
技能记忆	SKILL.md 文件集合	肌肉记忆	从经验中自动生成

注意那个数字：1300 tokens的硬上限。

这不是限制。这是刻意的设计。

Hermes Agent的设计者认为：对LLM来说，少量精准的记忆，远比大量模糊的记忆更有价值。当记忆接近上限时，Agent会自动做三件事：合并相似条目、删除过时信息、将多条记录压缩成一条摘要。

讽刺的是，自己在WorkBuddy里用的MEMORY.md机制，跟这个设计理念几乎一模一样。MEMORY.md不超过1KB，记的都是“港股自选股列表”、“企业微信Webhook Key”、“养虾系列存放路径”这类高复用信息。日志文件则按日存，30天后蒸馏。这套机制是在实践中自己摸索出来的——而Hermes Agent把它做成了产品级的内置能力。

这说明了一个问题：好的Agent记忆系统，应该是有限的、可压缩的、主动管理的。全量存储，反过来可能是懒惰的做法。

PART 4：自学习循环——最值得警觉的功能

记忆系统是基础设施。真正让Hermes Agent从“又一个Agent框架”升级为“有点东西”的，是它的闭环自学习机制。

它的运作原理是这样的：

触发条件：完成一个需要5次以上工具调用的复杂任务。
自动产出：生成一份SKILL.md——包含操作步骤、踩过的坑、验证方法。
自检机制：每15次工具调用，Agent会主动暂停并做一次自检（“我做到哪了？有没有偏离目标？”）。
持续迭代：下次遇到类似任务时，调用已有的Skill，用完后根据新经验更新它。

有用户实测数据显示：一个月后，同类任务的平均工具调用次数从25次降到了8-10次。

这个数字背后意味着三件事：成本下降70%（LLM API调用量直接打三折）、延迟降低（更少的tool call = 更快的响应）、准确率上升（因为它记住了哪些路走不通）。

作为对比，OpenClaw也有技能系统——ClawHub上有超过13000个社区共建的技能。但那是“通用教材”：写好了给所有人用，覆盖面广，但不一定适配你的具体环境。

Hermes Agent的技能是“私人笔记”：从你的操作中长出来的，包含了你的项目结构、你的工具链偏好、你踩过的坑。

一个是标准化的SOP，一个是个性化的经验沉淀。两种路线没有对错，但Hermes Agent的路线有一个碾压级优势——它的技能与你的使用时长正相关。用得越久，差距越大。

这就是为什么早期用户很难下定决心迁移出去。

PART 5：为什么Hermes Agent能爆火——三个结构性原因

回到那个最核心的问题：凭什么是它？

AI Agent框架在2026年不下百个。AutoGPT、CrewAI、LangGraph、MetaGPT……为什么Hermes Agent能在6周内冲到83K Star？

原因1：卡位精准——OpenClaw太重，Claude Code太专

Claude Code只在终端/IDE里存活，不碰消息平台，不做定时任务，不持久化记忆。它是最好的编码助手，但你一关掉终端它就“死”了。

OpenClaw走的是另一个极端——22个消息平台、13000个技能、全量持久化。功能极度丰富，但配置复杂度也极高。很多人用OpenClaw的前两周，80%的时间都花在调配置和排错上。

Hermes Agent恰好卡在了中间：比Claude Code多了持久记忆和消息平台支持（不用守着终端），比OpenClaw轻得多（一行curl安装，五步配置），比AutoGPT实用（它不是“自主运行”的表演，而是真正能干活的工具）。

不做最强的，做最趁手的。这种产品感觉非常Nous Research——他们做Hermes系列大模型也是这个路线：不追SOTA榜单，追“开发者用起来最舒服”。

原因2：可感知的成长性

大多数AI产品的能力曲线是这样的：第一天很惊艳，到第三天就“也就那样了”。

Hermes Agent的曲线是反过来的：第一天啥也不会，到第三十天已经能独立处理你80%的常规任务。

这种“越用越好”的体验在消费品领域叫用户粘性。在AI Agent领域，它创造了一种前所未有的锁定效应——你不是因为沉没成本不想走，而是因为你的Agent真的比别人的Agent更懂你。

OpenClaw的锁定靠生态（插件、技能、MCP服务器）。Hermes Agent的锁定靠经验积累（你用得越久，它学得越多）。后者更可怕，因为生态可以迁移，经验不可以。

原因3：Nous Research的信任背书 + MIT协议

Nous Research不是一家刚成立的创业公司。他们训练的Hermes系列大模型（Hermes 1/2/3）是开源社区里最受信赖的模型系列之一。Hermes 3的技术报告在arXiv上的引用量排在了开源模型前五。

MIT协议意味着：零商业限制、零遥测、数据全本地。在Anthropic封杀OpenClaw的大背景下，“不被卡脖子”变成了一个非常有吸引力的卖点。

PART 6：几个判断

分析到这里，可以给出几个自己的判断。

判断1：Hermes Agent和OpenClaw不是替代关系

文章写到这里，可能有人会以为要“叛变”——从OpenClaw转投Hermes。

不会。

因为两个产品解决的问题根本不同：OpenClaw解决的是“我需要一个中枢来调度多个AI Agent协作”的问题。多渠道、多模型、多工具、多人协作——这是OpenClaw的领地。Hermes Agent解决的是“我需要一个长期陪伴的私人Agent”的问题。自学习、持久记忆、个性化技能——这是Hermes的领地。Claude Code解决的是“我需要最好的代码生成质量”的问题。SWE-bench榜首不是白来的。

三者完全可以共存。事实上，社区已经有人在做混合方案——用Claude Code写代码，用OpenClaw做多渠道分发，用Hermes Agent做个人知识管理。

判断2：自学习是2026年Agent赛道的分水岭

2023年的Agent赛道，核心比的是“能调用多少工具”。2024年的Agent赛道，核心比的是“上下文能塞多长”。2025年的Agent赛道，核心比的是“能接入多少平台”。到了2026年，核心比的将是“能不能自己变强”。

Hermes Agent是第一个把自学习做成产品级体验的框架。它不是学术Demo，不是“理论上可以”，而是真的实现了一个月后tool call从25次降到8次。

如果OpenClaw不跟进类似的自学习机制，它在个人Agent场景下会被Hermes越拉越远。如果Claude Code不做持久记忆，每次开新会话都要重新解释项目背景，开发者迟早会感到厌烦。

自学习机制不是nice-to-ha ve。它是接下来三年的主战场。

判断3：警惕“养宠物”心理

最后一个判断，算是泼一盆冷水。

“越用越懂你”的另一面，是“越用越离不开”。

当你的Hermes Agent积累了半年的技能和记忆，你切换到另一个框架的成本就会变得极高。这不是技术壁垒——hermes claw migrate能搬走SOUL.md和配置——但那些从你日常操作中自动生成的SKILL.md、从你的反馈中精炼的记忆压缩策略，这些都是不可迁移的隐性知识。

某种程度上，这比OpenClaw的生态锁定更可怕。生态锁定至少你看得见（13000个技能摆在那里），而经验锁定是无形的。

所以建议是：用Hermes Agent，但保持方法论的可迁移性。你的核心认知——怎么拆解任务、怎么做质量验证、怎么设计工作流——必须存在于你自己的脑子里，而不是Agent的SKILL.md里。这条建议其实对所有AI工具都适用。

最后

从OpenClaw被封杀，到Claw Code四天重写，再到今天Hermes Agent的83K Star——2026年AI Agent赛道的节奏已经快到不讲道理了。

但节奏越快，越要抓住不变的东西。

OpenClaw教会我们“接入一切”的能力。Hermes Agent教会我们“记住一切”的价值。Claude Code教会我们“执行一切”的底线。

三种哲学，三条路线，最终都指向同一个问题：你要建造的到底是一个工具，还是一个伙伴？

答案是两者都要。但如果只能选一个——选伙伴。工具会被淘汰，伙伴会成长。