知识库为谁而建?深度用户画像与定位指南

2026-05-30阅读 0热度 0
其他

你的公司一定有过这样的经历:花了不少钱搭建知识库,NAS 网盘、企业云盘、Notion、语雀、Confluence,各种方案都试过。员工上传文档、整理分类、建立标签体系。半年后没人更新了,一年后搜索出来的内容已经过时,两年后它变成了数字坟场。

所有知识库都是这个宿命。

但从2025年开始,随着 Agent 的逐步广泛应用,知识库的使用者正在从人变成 Agent。 知识库的设计逻辑、维护方式、甚至存在的意义,都需要重新思考。

人是最慢的节点

在 Agent 时代,知识库给人“用”这件事本身,就是效率瓶颈。

围绕“人的使用习惯”设计知识库,你得到的是一个需要人来维护、人来检索、人来整理的系统。而人恰好是这个系统里最慢、最贵、最容易厌倦的环节。

  • 整理文档需要人。分类、打标签、写摘要,全是人工。
  • 检索信息需要人。你得知道关键词是什么,你得在搜索结果里一条一条翻。
  • 更新维护需要人。旧文档过时了谁来改?新文档产生了谁来关联?跨文档的矛盾谁来发现?

维护负担的增长速度永远快于价值的增长速度。 每个公司的知识库最终变成数字坟场,维护成本是主因。

换一种思路:如果知识库的主要使用者是 AI Agent,那个 7x24 不休息、不会厌倦、一次能读 15 个文件、永远记得更新交叉引用的“员工”呢?

围绕 Agent 重新设计知识库

围绕 Agent 来设计知识库,逻辑完全不同:

  • 组织方式: 给人用的是文件夹 + 标签 + 搜索框,给 Agent 用的是结构化 Markdown + 交叉引用 + 索引。
  • 维护者: 给人用的靠人维护(所以没人维护),给 Agent 用的由 Agent 维护(成本趋近于零)。
  • 检索方式: 给人用的是关键词搜索、人翻结果,给 Agent 用的是索引定位 + 按需钻取。
  • 更新频率: 给人用的是想起来才更新,给 Agent 用的是每次新资料进来自动更新。
  • 知识形态: 给人用的是原始文档堆在一起,给 Agent 用的是预编译的结构化知识网络。
  • 积累性: 给人用的是文档越来越多但没人整理,给 Agent 用的是每加入一份资料,整个知识库都变强。

你不需要直接操作知识库。你问 Agent 一个问题,它去知识库里查、去综合、去推理,把结论给你。查询、检索、更新、交叉引用,全部在背后完成。

人从繁琐的系统操作中解放出来,去做策展、判断、思考。这些是 Agent 做不了的。

那么,要让 Agent 更懂你、更智能,给它提供什么样的知识库?

知识库的三次进化

知识库技术正在经历第三次范式变迁。

第一代:传统智能知识库(2016-2022)。 以阿里云智能客服为典型代表。知识由人工分类、打标、归档,形成树状或标签体系,检索靠关键词匹配。问题是维护成本极高,灵活性差,一旦产品迭代或业务变更,知识库就迅速过时。而且,“按产品维度分类还是按问题场景分类”这类问题根本没有标准答案——简单的树状结构无法刻画知识间的网状关系。

第二代:RAG(2023-2024)。 大模型兴起后,RAG 成为主流。前置小模型检索 + 后置大模型生成,解决了海量知识的存储和召回。但小模型语义理解有限,每次交互独立检索不积累,知识无法沉淀。

第三代:Agent 时代(2025-)。 知识被大模型提前编译、结构化、关联好,形成持久可用的知识网络。代表性方案包括 LLM Wiki、GBrain 等。

这次变迁改变的是知识的存在形态:从存原材料,到存编译后的知识。

当前主流方案:RAG

RAG(Retrieval-Augmented Generation,检索增强生成)是目前绝大多数 Agent 系统的知识库方案。RAGFlow、Dify、FastGPT、Coze,几乎所有主流平台都内置了 RAG 知识库模块。

工作方式:

上传文档 → 切片(按段落/字数切成小块)→ 向量化入库
用户提问 → 语义检索 + 关键词检索 → 重排序 → 返回最相关的片段给 Agent

RAG 让 Agent 能够参考外部知识回答问题,简单场景下够用。

但 RAG 有一个根本性的缺陷:它不积累。

你问一个问题,RAG 去检索相关片段,Agent 生成答案。你问一百个问题,每次都是同样的流程,从零开始检索,从零开始拼凑答案。RAG 库里永远是那些原始文档的切片,不会因为你的提问而变得更聪明。

三个结构性问题:

第一,没有交叉引用。 RAG 根据语义相似度去找文本块。文档 A 和文档 B 之间有矛盾吗?概念 X 在三个文档里分别被提到,综合起来意味着什么?这些关系没有被保存,每次查询时 Agent 需要临时发现、临时综合。对于复杂问题,回答质量不稳定。

第二,没有知识编译。 RAG 存储的是原始文档的切片——“原材料”。但人类专家的知识不是原材料的堆砌,而是经过综合、提炼、建立联系的结构化网络。RAG 缺的就是这一步“编译”。

第三,没有自我进化。 你用了一年,RAG 库还是那个样子。新文档加进来了,但旧的矛盾没有解决,过时的内容没有标记,缺失的交叉引用没有补上。知识库不会因为你用得越多就越好用。

RAG 是一个“只读”的知识库,被动等着被检索,从不主动进化。

让 Agent 自己维护知识库

2026 年初,Andrej Karpathy(前 Tesla AI 总监、OpenAI 联合创始人)提出了 LLM Wiki:让 LLM 增量构建和维护一个结构化的 wiki,一组互相链接的 Markdown 文件,位于你和原始资料之间。

原始资料(不可变)
↓ Agent 阅读、提取、整合
Wiki(结构化知识,持续维护)
↓ 指导 Agent 行为
Schema(组织约定和工作流定义)

当你加入一份新资料时,RAG 只是把它切片、向量化、丢进数据库。而 LLM Wiki 会:

  1. 阅读整份资料,提取关键信息
  2. 更新相关的概念页、实体页、摘要页
  3. 发现新信息与旧知识的矛盾,标记出来
  4. 建立新的交叉引用,强化知识网络
  5. 更新索引和日志,让后续检索更精准

一份新资料可能触达 10-15 个 wiki 页面。 整个知识网络被强化了一次。

Agent 需要的知识分两种。经验性知识是编码习惯、命名规范、“先跑通 Demo 再重构”这类隐性策略。事实性知识是概念定义、FAQ、技术文档这类客观信息。RAG 对两者都只能存原始切片,LLM Wiki 会把两者都“编译”:经验性知识被转化为可执行的策略步骤,事实性知识被组织成有交叉引用的结构化网络。

用 Karpathy 的话说:

人放弃 wiki 是因为维护负担的增长速度超过了价值的增长速度。LLM 不会厌倦,不会忘记更新交叉引用,一次可以修改 15 个文件。维护成本趋近于零,所以知识库得以持续维护。

RAG 是每次查询从零开始推导。LLM Wiki 是编译一次,持续维护,知识随时间复利。

这就像编程中“解释执行”和“编译执行”的区别。RAG 每次都重新“解释”原始文档,LLM Wiki 把知识“编译”成结构化网络,然后在此基础上高效查询。

LLM Wiki 生态的几种工程化方案

Karpathy 的 LLM Wiki 本身只是一个 Markdown 文件,一篇思想实验。社区在此基础上做了多种工程化实现:

  1. Obsidian-Wiki 。在 LLM Wiki 的三层架构上增加了几个关键能力:Delta 追踪(用 SHA-256 哈希跟踪哪些资料已处理、哪些有更新,避免重复劳动)、溯源标记(每条知识标注“直接提取”还是“推断所得”,让人和 Agent 都知道信息可信度)、以及跨 Agent 历史摄入,自动从 Claude、Codex、Hermes 等不同 Agent 的会话记录中提取隐性知识,打破 Agent 间的数据孤岛。
  2. GBrain 。走的是更“重”的工程化路线。核心创新是混合检索架构:先用向量语义搜索快速筛选相关候选(找得快),再加载完整页面让大模型深度阅读(答得准)。同时引入轻量级知识图谱,通过规则自动抽取实体关系、强制建立反向链接。在 240 页的测试语料上,带图谱的检索准确率从 17.7% 提升到 49.1%。GBrain 还有一个架构哲学:Thin Harness, Fat Skills,把编排层做薄,主要精力放在丰富知识上。以及“潜在空间 vs 确定性”的分工:让 LLM 负责判断和决策(“这条信息属于哪个页面”),让代码负责确定性操作(构建交叉引用、验证格式)。“最差的 Agent 系统总是把错误的工作放在错误的一边”。

这些方案都在实践同一个理念:Skillify,把 Skill 从固定格式的指令集泛化为知识组织形态。知识可以是任何格式的 Markdown、笔记、文档片段,通过元数据定义“在什么场景下调用哪些知识”,实现渐进式披露。Agent 按需查阅,而非一次性加载。

一个具体的例子

用一个正在运行的知识库来说明。

假设维护一个关于“AI Agent 工程化”的个人知识库,里面有上百篇来自不同来源的素材,技术文章、访谈、产品文档、创业方法论。

当加入一篇关于“高德地图 AI 自主增长系统”的技术文章时,Agent 做了什么?

  • 提取核心技术概念(状态机编排、上下文隔离、元评估 Benchmark 等)
  • 为每个新概念创建独立页面
  • 发现这些概念与已有的“Agent Harness 架构”页面高度相关,建立交叉引用
  • 发现高德团队的实战验证了之前从另一份访谈中得出的同一个结论,在两个页面间建立关联
  • 更新索引,追加操作日志

一次摄入,更新了 10 个页面。 下次问“有哪些团队验证了 Harness Engineering?”,答案已经在 wiki 里了,交叉引用已经建好了,Agent 不需要临时去原始文章里翻。

编译和检索的区别就在这里。

怎么把 LLM Wiki 接入你的 Agent?

知识库建好了,怎么让你的 Agent 按需调用?

最简单的方式:Skill 封装。 把知识库的操作封装成一组 Skill(技能),Agent 在需要时自动调用。可以写一个 Skill 接入知识库平台,支持自然语言查询、文件导入、wiki 页面管理、健康检查等全套操作。装好之后对 Agent 说“帮我查一下知识库里有没有关于 XX 的内容”,它就会自动选择最合适的 Agent 模式(wiki 问答、快速问答、智能推理等)去检索和回答。

这个 Skill 里有一个细节值得注意:File Back 机制。当 Agent 做了一次跨页面的综合分析或对比研究后,它会把有价值的结论写回 wiki,而不是一次性消耗。这就是“知识复利”在工程上的实现。

更灵活的方式:MCP 协议。 通过 MCP(Model Context Protocol)将知识库暴露为 Agent 的原生工具,Agent 可以像调用文件读写一样自然地查询知识库。

最轻量的方式:直接读文件。 对于中小规模的知识库,Agent 直接读索引文件定位相关页面,再读具体页面获取详情。不需要向量数据库,不需要嵌入模型,就是读 Markdown 文件。这在数百页规模下效果出奇地好。

选择哪种方式取决于你的规模和场景。核心原则:让 Agent 自己管理知识库,人不直接操作。

规模天花板和混合架构

LLM Wiki 这类“渐进式披露”方案有一个明显的代价:响应速度比 RAG 慢。Agent 需要多次文件读取和工具调用来逐步加载知识,RAG 是一次性返回所有相关片段。在规模较小时(数百页以内),这个延迟可以接受。一旦知识库膨胀到上千页,纯靠 index.md + 文件读取的定位方式就会显著变慢。

另一个限制是弱结构化。LLM Wiki 用 wikilink 做交叉引用,只能表达“页面 A 提到了页面 B”,无法表达“A 投资了 B”或“C 在 D 公司工作”这类语义关系。对于需要多跳推理的复杂场景(比如“找出所有由张三投资且李四任职的公司”),纯 Markdown 链接力不从心。

GBrain 的混合检索解决规模问题,知识图谱解决语义关系问题。企业级生产环境中,混合架构往往是最佳实践:

  • 向量检索 + 关键词索引做快速初筛,解决“找得快”
  • 渐进式披露 + 离线迭代做深度阅读和知识编译,解决“答得准”和“记得牢”

兼顾 RAG 的速度和 LLM Wiki 的准确性、知识复利,各取所长。

写到这里,真是忍不住感叹一下,开源社区的发展速度真的是非常非常快,各种方案层出不穷。真是应了那句话,只要你学得慢,你就不用学。

知识库不是目的,知识才是

回到最开始的问题:企业知识库是给谁来用的?

知识库是 Agent 的“领域专长”,让 Agent 更懂你的业务、技术栈、决策历史。最终受益的当然是人。

实现路径变了:

旧路径:人 → 整理文档 → 存入知识库 → 人检索使用
新路径:人 → 策展原始资料 → Agent 编译维护知识库 → Agent 按需调用 → 人获取结论

在新的路径里,人只做两件事:策展判断。哪些资料值得收录?哪些结论是对的?哪些方向值得深挖?

整理、分类、交叉引用、更新、矛盾检测、过时标记,全部交给 Agent。

人不维护知识库,人通过 Agent 获取知识。知识库自己进化。

如果你正在考虑为企业构建 AI Agent 系统,第一个该想清楚的问题是:我的知识库应该为谁设计、由谁维护、如何进化?

免责声明

本网站新闻资讯均来自公开渠道,力求准确但不保证绝对无误,内容观点仅代表作者本人,与本站无关。若涉及侵权,请联系我们处理。本站保留对声明的修改权,最终解释权归本站所有。

相关阅读

更多
欢迎回来 登录或注册后,可保存提示词和历史记录
登录后可同步收藏、历史记录和常用模板
注册即表示同意服务条款与隐私政策