扣子知识引用溯源功能配置实战指南
想让大模型在回答中输出类似“根据《药品生产质量管理规范》第3.2条”的引用信息吗?核心一步不容跳过——必须激活知识引用溯源功能,同时完成结构化元数据和引用规则的配置。否则,无论模型多强,给出的内容都是无根可循的“空话”,缺乏出处标注,在专业合规场景中根本没法落地。
先明确一点:这套配置仅对对话流场景有效。如果你跑的是工作流模式,哪怕所有参数调通,引用溯源也不会生效。所以,我们直接拆解对话流的配置链路,逐层说清。
启用知识引用溯源开关
操作路径很直接:进入智能体编辑页 → 点击左侧「知识」区域 → 找到已关联的知识库卡片 → 点击右上角「⋯」→ 选择「编辑配置」→ 在弹出面板中勾选「启用引用溯源」。
这一步是真正的“地基”。不勾选这个开关,后续所有配置都等于白做。系统默认关闭,即便你已经上传完知识库、打开了自动调用,它依然不会生成任何引用标记。记住这一点,绝大多数配置不生效的问题都出在这里。
配置召回内容的结构化元数据
引用能否准确“落地”,关键看知识入库时是否携带可识别的来源字段。换句话说,上传数据阶段就决定了引用质量。目前有三种主流方式:
方法一:上传PDF或DOCX时,在文档内部嵌入标准标题层级。例如,一级标题写“GMP-2023”,二级标题写“第三章 人员管理”,正文段落前加“第3.2.1条:”。这样扣子会自动提取这些层级,分别填入source_name和section字段。
方法二:自定义内容导入,直接在文本框内按JSON格式粘贴带元数据的内容片段。格式如下:
{"content":"洁净区工作人员应定期接受微生物学基础知识培训。","source_name":"《药品生产质量管理规范(2023年修订)》","section":"第三章 第二节","page":42}。
方法三:从飞书文档或Notion导入时,在源文档中用特定注释语法打标。例如在段落末尾添加「#source:《XX手册》v2.1#section:附录A#page:7」——扣子的解析器能识别这种模式并提取为元数据。
这三种方式本质一致:为每条知识贴上唯一的“身份证”,让大模型清楚它来自哪份文件、哪个章节。
设置引用生成规则
元数据就位后,接下来要告诉模型如何生成引用。这一步分四个环节:
第一步:在知识库配置页 → 「引用生成」模块 → 开启「自动插入引用标记」。
第二步:选择引用格式。两种常见模式:
• 简洁格式:直接显示“(《规范》第3.2条)”,轻量直观。
• 完整格式:生成脚注式标记,比如“¹”,并在回复末尾自动追加“¹《药品生产质量管理规范》,第三章第二节”。适合正式报告或文档输出场景。
第三步:设定最小匹配置信度阈值,建议在0.65~0.75之间。低于该值的召回片段不参与引用生成,防止低相关性内容强行打标造成误导。
第四步:勾选「仅对显式引用内容启用」。这个选项很关键——它确保模型仅在明确复述或转述知识库原文时才加引用标记,避免泛泛而谈时胡乱挂靠。
验证引用是否生效
配置完成后,必须做一轮验证。进入智能体调试窗口,输入测试问题,例如:“洁净区人员培训要求有哪些?”
观察返回结果:如果看到括号内标注(《药品生产质量管理规范》第三章第二节),说明配置成功。如果没有任何标记,就要回头检查「启用引用溯源」开关是否真的勾选了,以及知识片段中source_name字段是否非空。
最后再强调一次:工作流中调用知识节点时,引用溯源功能不生效。它只适用于智能体对话流场景。很多人踩过这个坑——以为配置好了却没效果,其实是用错了场景。
