扣子知识引用溯源功能配置实战指南

2026-06-14阅读 0热度 0

扣子知识引用溯源功能配置实战

想让大模型在回答中输出类似“根据《药品生产质量管理规范》第3.2条”的引用信息吗？核心一步不容跳过——必须激活知识引用溯源功能，同时完成结构化元数据和引用规则的配置。否则，无论模型多强，给出的内容都是无根可循的“空话”，缺乏出处标注，在专业合规场景中根本没法落地。

先明确一点：这套配置仅对对话流场景有效。如果你跑的是工作流模式，哪怕所有参数调通，引用溯源也不会生效。所以，我们直接拆解对话流的配置链路，逐层说清。

启用知识引用溯源开关

操作路径很直接：进入智能体编辑页 → 点击左侧「知识」区域 → 找到已关联的知识库卡片 → 点击右上角「⋯」→ 选择「编辑配置」→ 在弹出面板中勾选「启用引用溯源」。

这一步是真正的“地基”。不勾选这个开关，后续所有配置都等于白做。系统默认关闭，即便你已经上传完知识库、打开了自动调用，它依然不会生成任何引用标记。记住这一点，绝大多数配置不生效的问题都出在这里。

引用能否准确“落地”，关键看知识入库时是否携带可识别的来源字段。换句话说，上传数据阶段就决定了引用质量。目前有三种主流方式：

方法一：上传PDF或DOCX时，在文档内部嵌入标准标题层级。例如，一级标题写“GMP-2023”，二级标题写“第三章人员管理”，正文段落前加“第3.2.1条：”。这样扣子会自动提取这些层级，分别填入source_name和section字段。

方法二：自定义内容导入，直接在文本框内按JSON格式粘贴带元数据的内容片段。格式如下：
{"content":"洁净区工作人员应定期接受微生物学基础知识培训。","source_name":"《药品生产质量管理规范（2023年修订）》","section":"第三章第二节","page":42}。

方法三：从飞书文档或Notion导入时，在源文档中用特定注释语法打标。例如在段落末尾添加「#source:《XX手册》v2.1#section:附录A#page:7」——扣子的解析器能识别这种模式并提取为元数据。

这三种方式本质一致：为每条知识贴上唯一的“身份证”，让大模型清楚它来自哪份文件、哪个章节。

元数据就位后，接下来要告诉模型如何生成引用。这一步分四个环节：

第一步：在知识库配置页 → 「引用生成」模块 → 开启「自动插入引用标记」。

第二步：选择引用格式。两种常见模式：
• 简洁格式：直接显示“（《规范》第3.2条）”，轻量直观。
• 完整格式：生成脚注式标记，比如“¹”，并在回复末尾自动追加“¹《药品生产质量管理规范》，第三章第二节”。适合正式报告或文档输出场景。

第三步：设定最小匹配置信度阈值，建议在0.65～0.75之间。低于该值的召回片段不参与引用生成，防止低相关性内容强行打标造成误导。

第四步：勾选「仅对显式引用内容启用」。这个选项很关键——它确保模型仅在明确复述或转述知识库原文时才加引用标记，避免泛泛而谈时胡乱挂靠。

配置完成后，必须做一轮验证。进入智能体调试窗口，输入测试问题，例如：“洁净区人员培训要求有哪些？”

观察返回结果：如果看到括号内标注（《药品生产质量管理规范》第三章第二节），说明配置成功。如果没有任何标记，就要回头检查「启用引用溯源」开关是否真的勾选了，以及知识片段中source_name字段是否非空。

最后再强调一次：工作流中调用知识节点时，引用溯源功能不生效。它只适用于智能体对话流场景。很多人踩过这个坑——以为配置好了却没效果，其实是用错了场景。