Agent上下文爆了?死机与失忆修复指南
Agent 开发者几乎都踩过这几个坑:
调试了几个小时,Agent 突然崩溃,当场把进度条归零……
上下文撑到 3 万 token 之后,输出质量断崖式下跌,逻辑开始打结……
套餐额度用完换了模型,新 Agent 开口就是“你好,我是你的新助手”——用户前面聊的全白费了……
说实话,踩坑踩多了,自然能琢磨出解法。今天拆解一个我们在生产环境验证过的精巧架构:临终备忘录机制。
01 三个“死亡场景”,每个都够头疼
01 Agent 崩溃
正重构一个复杂的代码模块,十几轮对话、数百次工具调用,刚完成关键步骤——进程突然崩了。
然后弹出一句:“你好,我是你的 AI 助手,有什么可以帮你?”
刚才在做什么任务?配置参数是什么?进展到哪一步了?——全部遗失。
02 上下文窗口撑爆
长任务执行到一半,输出开始不稳定——决策前后矛盾、工具调用重复执行、模型开始编造内容。
上下文占用超过 40% 的质量阈值后,模型逐渐丢失早期关键信息。压缩哪一段信息?压缩后如何保证衔接顺畅?处理不好,比直接崩溃更混乱。
03 模型切换后断层
当前模型的 API 套餐配额用尽,切换到另一个模型。新模型登场的反应是:
“你好,我是新模型,请告诉我你需要什么帮助”
项目背景不记得、方案决策不记得、用户偏好不记得。每切换一次,就得从头调教一遍。
02 我们的解法:临终备忘录
核心理念
人临终前要立遗嘱,Agent 在“挂掉”之前,为什么不能留一份“临终备忘录”?
当 Agent 检测到自己即将“死亡”(重启、压缩或切换)时,主动撰写一份备忘录,把当前执行的任务、进展状态、下一步计划,全部记录下来。下一次启动时,优先读取这份备忘录,然后无痕衔接。
| 触发方式 | 场景 |
|---|---|
| 主动指令 | 用户说“我要重启了” / “保存进度” / “写临终备忘录” |
| 自动标记 | 工具调用 ≥20 时,提示用户“是否保存 checkpoint?” |
03 备忘录写什么?
临终备忘录 (Death Note)
# 生成时间: 2026-04-10 20:33 | 状态: ? 待恢复
## 1. 身份信息
- Agent类型: Hermes
- 用户: 律麟
- 当前项目: 半导体产线智能体
## 2. 临终前正在做的事
- 任务: 调试大盘产出预测模型
- 当前步骤: 第3轮参数调优,已跑通baseline
- 已完成: 数据清洗 / 特征工程 / baseline模型
- 阻塞点: 预测误差率偏高,怀疑是X特征缺失
- 下一步: 补充X特征,重新训练
## 3. 核心约束
- 用户偏好: 直击重点,不要废话
- 项目规则: 先读源码再动手
## 4. 关键配置
- 模型: MiniMax-M2.5
- memoria相关记忆ID: [019d7759...]
状态: ? 待恢复 — 下一Agent启动时读取此文件共享路径(跨 Agent 通用):
/tmp/death-note/death-note.md
所有 Agent 共享同一个路径,备忘录写完存放于此,下一个 Agent 启动时自动读取。恢复成功后立即删除,防止重复执行恢复逻辑。
04 恢复流程
- Agent 启动
- 检查临终备忘录是否存在
/tmp/death-note/death-note.md
- 存在? → 读取 → 执行恢复 → 删除备忘录
不存在? → 正常启动
- 连接 memoria 验证连通性
检索相关记忆(上次做到哪、踩过什么坑)
- 开始工作
无缝衔接,上下文完整
05 临终备忘录 vs 其他方案
06 三大适用场景
A Agent 崩溃恢复
崩溃前:临终备忘录写入(当前任务 + 上下文快照)
↓ (或:自动触发长任务 checkpoint)
重启后:读备忘录 → 恢复上下文 → 继续工作
原本 30 分钟的恢复工作,变成 <1 分钟自动完成
B 上下文窗口压缩
检测到:上下文 >40% 阈值
↓ 临终备忘录写入(精华摘要 + 当前任务状态)
压缩:保留最近对话 + 备忘录摘要作为新上下文开头
继续:模型“记得”之前在做什么,只是丢了细节
压缩不再是“截断”,而是“有准备的交接”
C 模型切换
原模型:临终备忘录写入(完整状态 + 配置 + 偏好)
↓ 套餐达上限 → 切换新模型
新模型:读取备忘录 + 读取 memoria 历史记忆
“你好,我是新模型。你目前在做半导体项目的大盘预测,上一步在调参,下一步补充 X 特征——继续?”
切换模型不再是“失忆重启”,而是“换人不换岗”
07 和 memoria 的配合
瞬时状态 + 长期经验 = 完整恢复
- 临终备忘录:解决瞬时状态保存——重启/压缩/切换前,把当前正在做的事、上下文快照全部写入备忘录
- memoria:解决长期经验积累——教训/配置/记忆跨 session 持久化,语义检索随时召回
新 Agent 既知道“刚才在干啥”,也知道“以前踩过什么坑”——完整上下文恢复
08 后续优化方向
- 自动化触发更智能:目前靠规则(≥20 工具调用),未来让 AI 自己判断“这个时刻值得记录”
- 压缩和备忘录联动:上下文压缩时自动生成摘要备忘录,而不是等到“死亡”才写
- 多级 checkpoint:不只是“临终”,任务关键节点都可以打 checkpoint,形成版本链
- 跨 Agent 接力标准化:临终备忘录路径和格式开放成行业标准,任何 Agent 都能读写
总结
临终备忘录的本质是——给 Agent 装一个“濒死自觉”。它知道自己可能要“死”了,所以在最后一刻把所有关键信息塞进一份备忘录里,放在一个共享位置,下一个 Agent 来的时候先读一下,无缝接手。Agent 不再害怕“死”,因为它知道自己会“复活”。
