腾讯开源Agent记忆方案实测：Token消耗最高降61%，性能对比榜单

2026-05-14阅读 0热度 0

腾讯开源

5月14日，腾讯云正式开源TencentDB Agent Memory。该项目直指当前AI智能体在长序列任务中的记忆管理瓶颈，通过创新的记忆压缩与外部存储方案，旨在显著优化Token使用效率并提升任务完成的可靠性。

随着智能体在代码生成、信息检索与数据分析等复杂场景中的深度应用，任务链条不断延长。一个核心挑战随之凸显：每次工具调用产生的大量中间数据——如网页内容、代码日志——会迅速占满有限的上下文窗口，导致Token成本激增，并可能中断任务执行的逻辑连贯性。

常见的应对策略，如简单扩展上下文窗口或对历史进行摘要压缩，在面临多步骤、强依赖的长任务时往往效果有限。上下文膨胀、关键状态信息丢失或混乱仍是高频问题。

腾讯云数据库团队开源的TencentDB Agent Memory提出了不同的架构思路。其核心设计哲学是“外存内精”：将完整的细节数据卸载到外部存储系统，而在执行上下文中仅保留任务的核心状态骨架与逻辑关系。

该方案依托两大关键技术组件。

第一是“Mermaid任务画布”。该组件将任务执行过程动态构建为一个结构化的任务图谱，可视作智能体的“思维导图”或“项目甘特图”。图中清晰定义了每个子步骤的状态、摘要以及步骤间的依赖关系。这使得智能体仅凭上下文中保存的这份轻量级“地图”，就能精准定位当前进度、明确后续动作及前置条件，从而维持清晰的任务执行脉络。

第二是“上下文卸载”。具体而言，当智能体调用工具（例如执行一次网络搜索）后，生成的冗长原始结果和日志不会持续占据宝贵的上下文空间。它们会被自动转移到外部文件系统进行归档，上下文中仅保留一份精炼的摘要和用于快速检索的元数据索引。只有当智能体后续需要回溯具体细节时，才按需将相关数据动态加载回来。这相当于为智能体配备了一个高效的“外部记忆库”，极大缓解了主工作内存的压力。

实际效能如何？测试数据提供了有力佐证。根据腾讯云公布的基准测试结果，采用该记忆管理方案后：

在网页搜索任务中，Token消耗峰值降低61%，任务成功率相对提升52%；
在代码调试与修复场景中，Token消耗最高减少33%，任务完成率相对提高10%；
在复杂长文档分析与处理任务中，Token消耗最高削减31%，分析准确率相对增长8%。

除了优化单次任务的短期记忆管理，该项目还集成了一套长期个性化记忆模块。该模块使智能体能够在跨对话场景中持续学习并记忆用户的偏好与历史背景信息。在PersonaMem基准测试中，该模块将智能体对用户画像的理解准确率从48%显著提升至76%。据悉，此个性化记忆能力已作为一项免费服务先行对外开放。

目前，TencentDB Agent Memory已在GitHub上开源，并兼容OpenClaw、Hermes等主流智能体开发框架。其对开发者极为友好，仅需一行命令即可完成安装集成，无需额外配置数据库或外部服务。所有智能体的任务记录与记忆内容均以标准文件格式保存，便于开发者直接审查、分析与调试，确保了高度的操作透明度。

此次开源是腾讯近期在智能体技术生态布局中的关键一步。就在上月，腾讯云刚刚开源了智能体执行底座Cube，其在GitHub上的Star数量在两周内便突破5000。这一系列举措表明，腾讯正在持续加强并开放其智能体底层基础设施的建设，旨在为开发更复杂、更实用的AI智能体应用奠定坚实的技术基础。

腾讯开源Agent记忆方案实测：Token消耗最高降61%，性能对比榜单

相关阅读

最新教程

最新资讯