腾讯云开源Agent Memory技术深度解析:Token消耗降低61%的权威评测
腾讯云数据库团队近期开源了TencentDB Agent Memory,这是一个基于MIT协议的分层记忆引擎,专门为AI Agent处理长周期任务而设计。该方案通过“上下文卸载”与“Mermaid任务画布”两项核心技术,在连续多会话测试中,成功将Token消耗最高降低了61.38%,并将任务成功率相对提升了51.52%。项目已实现对OpenClaw、Hermes等主流Agent框架的适配,支持一键集成。
长周期任务下,传统记忆方案的三个核心瓶颈
目前,多数AI Agent采用将对话历史压缩为摘要并注入后续上下文的方式处理记忆。这种方案在简短交互中尚能运行,但在真实的长周期、多步骤任务中,会暴露出三个根本性缺陷。
首先是会话连续性断裂。Agent无法跨会话维持记忆,导致每个新会话都近乎从零开始,之前确立的任务上下文与用户指令需要重复确认。
其次是信息价值混淆。用户的关键事实性陈述(如技术栈偏好)与临时性指令(如查询请求)被不加区分地压缩,致使高价值长期信息被大量瞬时信息稀释。
最后是上下文窗口膨胀。随着任务推进,不断累积的历史信息会迅速占满上下文,不仅推高Token成本,更会干扰模型对当前关键指令的注意力分配,直接影响任务执行的精准度。
核心技术突破:从静态摘要到动态可执行记忆
TencentDB Agent Memory旨在系统性地解决上述问题。其创新性在于通过两项关键技术,将记忆从被动的文本压缩,转变为主动的、结构化的可操作资产。
Mermaid任务画布:实现记忆的结构化与可视化
第一项核心技术是“Mermaid任务画布”。系统会将Agent的任务执行轨迹,自动组织成一张结构化的流程图。这张基于Mermaid语法的图表,清晰可视化了任务状态、步骤摘要与执行依赖关系。
这意味着Agent的记忆不再是一段模糊的文本摘要,而是一张可导航的“任务地图”。Agent能够快速定位关键信息节点,并按需展开回溯具体细节。记忆实现了“折叠收纳”与“按需展开”的平衡,在极大压缩体积的同时,保证了信息的保真度与可用性。
上下文卸载:实现记忆的分层存储与精准回溯
第二项核心技术是“上下文卸载”。在每次工具调用(如代码执行、API返回)结束后,产生的原始结果(如网页内容、日志、代码块)会被完整地存储至外部文件。上下文窗口中仅保留一行精炼摘要及其索引路径。
当需要回顾细节时,Agent可依据清晰的四层结构进行递进式回溯:从L2/L3的轻量摘要,到L1的结构化JSONL记录,最终可追溯至L0的完整原始证据。整个过程确保任何层级的压缩都是可逆的,原始数据得以完整保留,为审计与调试提供了坚实基础。
实测数据:效率与准确性的显著提升
在超长会话的基准测试中,将TencentDB Agent Memory作为插件集成至OpenClaw框架后,取得了量化验证的显著效果:Token消耗最高降低61.38%,任务通过率相对提升51.52%。
更关键的是,在衡量个性化记忆准确率的PersonaMem指标上,得分从基准的48%大幅跃升至76%,优化幅度接近60%。这直接证明了该方案在持续理解并记忆用户长期偏好方面的有效性。
另一项深度洞察显示:单独应用“上下文卸载”技术,可带来约15%的Token节省;而当结合“Mermaid任务画布”后,节省率跃升至31%-33%。这明确揭示了任务结构化本身对消除上下文噪声、聚焦模型注意力具有独立的、显著的贡献。
四层记忆架构与部署灵活性
为支撑上述能力,TencentDB Agent Memory设计了职责清晰的四层记忆架构:
- 底层(L0):存储所有原始对话与工具调用证据,确保完全可追溯性。
- 中间层(L1-L2):对原始信息进行逐步提炼,形成场景化归纳与原子记忆单元。
- 顶层(L3):抽象生成持续演进的用户画像与长期偏好。
各层之间通过提取、聚合与蒸馏管道连接,模块化设计使得单层升级或替换成为可能,保障了系统的长期可演进性。
在部署层面,项目注重开箱即用与扩展性。默认采用本地SQLite作为存储后端,实现零外部API依赖,所有中间产物均为可读的Markdown与Mermaid文件,极大降低了开发调试门槛。对于需要高性能检索的进阶场景,可无缝接入腾讯云向量数据库TCVDB,利用BM25与向量混合检索提升复杂记忆的召回效率。系统同时支持跨Agent、跨框架的记忆导入导出与实时迁移,为团队协作与记忆持久化提供了便利。
从内部实践到全面开源
事实上,TencentDB Agent Memory的长期记忆核心能力已于今年4月初上线并免费开放。当时在PersonaMem测试集上,就已将OpenClaw的回答准确率从48%提升至76.10%。
本次5月14日的正式开源,则完整释放了其在短期记忆压缩与管理方面的产品级能力。目前,项目在GitHub已获超1300个Star。开发者可通过OpenClaw插件或Hermes Gateway一键接入,通常仅需一条命令即可完成极简安装,快速体验其带来的效率提升。
