AI Agent自学习记忆系统置信度排行榜评测

2026-06-15阅读 0热度 0
ai

说实话,市面上这些 AI 编码 Agent——无论是 Claude Code、Cursor 还是 GitHub Copilot——在单次对话中的表现确实抢眼,但一旦开启新会话,一切归零。没有上下文延续,也缺乏那种“之前遇到过类似情况”的洞察力。这就好比每次走进同一个房间,都要重新认出每一件家具。

当前主流应对方案是什么?CLAUDE.md 文件、系统提示词、手工维护的规则列表——说到底,都是把人当成记忆载体。你来观察模式、记录规则、维护文件,Agent 只负责执行指令。但问题在于:记忆本应是 Agent 在反复实践中自行习得的能力,而不该是人手分发的标准化配置。

核心理念:置信度驱动的自学习

多数 AI Agent 的记忆系统走显式建模路线——人类编写规则,Agent 照做。但 instinct 另辟蹊径,借鉴了大脑中习惯形成的基本机制:

观察 → 重复 → 成熟 → 建议

Agent 第一次执行某个操作时,instinct 将其记录为一条 raw 观察,初始置信度设为 1。同一模式再次出现,置信度加 1。当置信度突破第一道阈值,模式进入 mature 状态,自动出现在建议列表;如果继续积累到更高的阈值,模式晋升为 rule,可自动应用。

 Confidence 1-4:   raw      (observed, not actionable)
 Confidence 5-9:   mature   (ready to suggest)
 Confidence 10+:   rule     (strong enough to auto-apply)

那么何时一个模式才算“做好准备”?不需要人工判断,数据说了算。

工作原理

1、观察

只要发现某个模式反复出现——比如一组工具调用序列、特定的编码偏好、某类频繁的修复操作——就立刻将其记录下来:

 instinct observe "seq:lint->fix->test"
 instinct observe "pref:style=black" --cat preference
 instinct observe "fix:missing-import" --cat fix_pattern

命名约定通过前缀区分模式类别,清晰可辨:

 seq:   → Action sequence     (e.g. seq:lint->fix->lint)
 pref:  → User preference     (e.g. pref:stdlib-first)
 fix:   → Recurring fix       (e.g. fix:missing-import)
 combo: → Tools used together (e.g. combo:pytest+coverage)

每次观察都是一次 upsert 操作:模式已存在则置信度加 1,不存在则新建一条置信度为 1 的记录。一条命令完成积累。

2、合并

会话结束时(或定期),运行 consolidate 触发自动晋升:

 instinct consolidate
 # Promoted to mature: 3
 # Promoted to rule: 1
 # Total instincts: 12

学习的核心步骤在这里完成。累积观察次数达标的模式自动晋升,无需人工介入,也无需手动审核。

3、建议

下一次会话开启时,Agent 向系统请求建议:

 instinct suggest
 #   seq:test->fix->test    conf=8  [mature]  sequence
 #   pref:stdlib-first      conf=12 [rule]    preference
 # 2 suggestions

只有 mature 和 rule 级别的模式才会返回。Raw 观察始终静默,直到置信度积累到位——不会在 Agent 还“不确定”时给出不成熟的建议。

架构

三个核心组件无需复杂的外部依赖(仅依赖 MCP SDK),且 SQLite 直接内置于 Python 标准库;MCP 服务器基于 FastMCP 实现。

为什么选择 SQLite?

备选方案评估过 JSON 文件、Redis、简单的键值存储,最终选择了 SQLite,原因有四:可用 SQL 按置信度、类别、项目任意查询;ACID 事务保证状态一致性;无需守护进程、无需额外配置,整个存储就是一个文件;迁移学习历史只需复制这个文件。

核心的 upsert 查询把创建和更新合并到一条语句中:

 INSERT INTO instincts (pattern, category, confidence, ...)
 VALUES (?, ?, 1, ...)
 ON CONFLICT(pattern) DO UPDATE SET
     confidence = confidence + 1,
     last_seen = excluded.last_seen

首次观察建行,重复观察加分。一条查询搞定所有状态更新。

为什么选择 MCP?

Model Context Protocol 是一个将 AI Agent 与外部工具连接的开放标准。instinct 实现为 MCP 服务器后,天然兼容所有支持该协议的 Agent——Claude Code、Cursor、Goose,或者任何其他 MCP 客户端。

 {
   "mcpServers": {
     "instinct": {
       "command": "instinct",
       "args": ["serve"]
     }
   }
 }

配置文件中加上这几行,任意 MCP Agent 就能接入自学习记忆。

项目感知的学习

并非所有模式都具有普适性。“用 black 格式化”也许适用于某个 Python 项目,换到 Go 项目就不适用了。所以 instinct 用项目指纹来划定作用域:

 def project_fingerprint(path=None):
     p = Path(path or Path.cwd()).resolve()
     return hashlib.sha256(str(p).encode()).hexdigest()[:12]

每个项目依据其目录路径生成一个稳定的 12 字符 SHA256 指纹。模式分为两类:项目级模式只在对应项目中生效;全局模式(project 字段为空)在所有项目中可见。

Agent 调用 suggest 时,返回结果同时包含全局模式和当前项目的专属模式。Python 项目的格式化偏好不会渗透到 Go 项目中,干净利落。

衰减:遗忘过时的模式

人的习惯长期不用会逐渐淡化,instinct 中的模式也遵循同样的逻辑。

 instinct decay --days 90

超过 90 天未被观察到的模式,置信度减 1。减到零的模式自动删除。系统以此避免积累过时的建议,保持记忆库的时效性。

实际使用

以下是与 Claude Code 集成的典型场景。在 MCP 服务器的指令中,instinct 对 Agent 说:

Use 'observe' to record patterns you notice. Use 'suggest' to get mature patterns that should guide your behavior. Run 'consolidate' periodically to auto-promote high-confidence patterns.

几次会话之后,Agent 开始形成自己的操作手册:

 seq:test->fix->test          conf=8   [mature]   — Always re-run tests after fixes
 pref:stdlib-first            conf=12  [rule]     — Prefer stdlib over third-party
 fix:missing-init             conf=6   [mature]   — Check for __init__.py in new packages
 combo:pytest+coverage        conf=5   [mature]   — Always run coverage with tests

没有人显式地教过 Agent 这些内容——它从跨会话的重复行为中自行归纳出来。到第五次会话,Agent 对工作流的熟悉程度已经超过一个新加入的团队成员。

深入底层:数据库 Schema

完整的 SQLite schema 如下:

 CREATE TABLE instincts (
    pattern    TEXT PRIMARY KEY,
    category   TEXT NOT NULL DEFAULT 'sequence',
    confidence INTEGER NOT NULL DEFAULT 1,
    first_seen TEXT NOT NULL,
    last_seen  TEXT NOT NULL,
    source     TEXT NOT NULL DEFAULT '',
    project    TEXT NOT NULL DEFAULT '',
    promoted   INTEGER NOT NULL DEFAULT 0,
    metadata   TEXT NOT NULL DEFAULT '{}'
 )

一张表,构成完整的数据模型。promoted 字段对应成熟度等级:0 = raw,1 = mature,2 = rule。metadata 列存储任意 JSON,用于在不做 schema 迁移的前提下扩展功能。

Python API

CLI 和 MCP 服务器之外,instinct 也提供了 Python API:

 from instinct.store import InstinctStore

store = InstinctStore()  # 默认: ~/.instinct/instinct.db

# 观察模式
store.observe("seq:test->fix->test", source="claude-code")
store.observe("seq:test->fix->test")  # 置信度现在 = 2

# 查询
suggestions = store.suggest()           # 获取成熟模式
store.list(min_confidence=3)            # 按置信度筛选
store.search("test")                    # 全文搜索

# 生命周期
store.consolidate()                     # 自动提升
store.decay(days_inactive=90)           # 减少过时模式
stats = store.stats()                   # 汇总统计

# 导出
rules = store.export_rules()            # 仅置信度 >= 10

 store.close()

借助该 API,instinct 可以方便地嵌入自定义工具链、CI 流水线或数据分析面板。

本地测试

 pip install instinct-mcp
 # 记录你的第一个模式
 instinct observe "seq:your->first->pattern"
 # 查看系统学到了什么
 instinct suggest

 # 启动 MCP 服务器用于 Agent 集成
 instinct serve

代码完全开源,包已发布在 PyPI 上。

免责声明

本网站新闻资讯均来自公开渠道,力求准确但不保证绝对无误,内容观点仅代表作者本人,与本站无关。若涉及侵权,请联系我们处理。本站保留对声明的修改权,最终解释权归本站所有。

相关阅读

更多
欢迎回来 登录或注册后,可保存提示词和历史记录
登录后可同步收藏、历史记录和常用模板
注册即表示同意服务条款与隐私政策