腾讯开源Agent Memory:虾马一键部署全攻略与性能对比评测
5月14日,腾讯云正式开源了TencentDB Agent Memory。这个动作,瞄准的是当前Agent应用的一个核心痛点:长任务场景下的记忆管理。
其实,这项技术的长期记忆功能在上个月就已经开放免费使用了。而本次开源的重头戏,则是与之配套的“短期记忆压缩”能力。为什么这个功能如此关键?
很简单,随着Agent在代码开发、网页搜索、深度研究分析等场景中承担的任务越来越复杂,任务链路也越拉越长。在这个过程中,大量的工具调用记录、抓取的网页内容、以及海量的中间结果,会像滚雪球一样迅速填满模型的上下文窗口。后果是什么?Token成本直线飙升不说,更棘手的是任务状态容易丢失,推理的稳定性也会大打折扣。
那么,腾讯云开源的Agent Memory是如何破局的呢?它的核心技术可以概括为“上下文卸载(Context Offloading)配合Mermaid任务画布”。简单来说,就是把完整、冗长的任务信息从昂贵的上下文窗口中“卸载”到外部存储中暂存起来。同时,利用结构化的任务流程图,精准保留住任务执行过程中的关键状态和决策路径。
这样一来,Agent在运行长任务时,就能始终保持一个轻量、高效的上下文环境。而当需要回溯细节或恢复某一步骤的原始信息时,又能像查档案一样,逐层追溯、按需恢复,确保了任务的连贯性与可解释性。
根据腾讯云披露的实验数据,在多任务连续会话的场景下,这项技术最高能降低61%的Token消耗。更重要的是,它显著提升了长链任务的最终成功率,让Agent处理复杂工作的能力更加可靠。
目前,Agent Memory已经完成了对OpenClaw、Hermes等主流Agent框架的适配。对于开发者而言,集成过程相当便捷,通过“虾马”平台可以轻松实现一键部署,快速应用到现有的Agent项目中去。