扣子智能体知识库挂载与问答调优全攻略
想让你的扣子Bot告别随意编造,转而严格依据上传文档给出精准答复?关键在于知识库的正确挂载与检索逻辑的精细调优。核心原则:文档上传是基础,真正决定成败的是调用策略的配置与持续迭代优化。
直接讲实操。要让Bot准确解答客户关于产品参数、内部流程或最新政策的问题,必须正确绑定知识库,并针对检索与生成逻辑做针对性调优。
创建并上传知识库文件
操作入口位于扣子平台左侧导航栏的【知识库】模块,点击【创建知识库】。
设置一个唯一且能清晰标识内容的名称(例如“2026版售后政策V3”),附加简要描述,确认后进入内容上传页。
选择【本地文档】,将PDF、DOCX或TXT格式文件直接拖入上传区。请注意,单个文件不得超过20MB,一次最多上传10个。
上传完成后,系统自动进入分段配置。这里有个建议:若文档是常规文本内容,优先选择【自动分段与清洗】。该模式会删除URL、邮箱、多余空格和换行,并按语义自动切片。但若文档包含大量表格或代码块,则切换为【自定义】模式,将分段标识符设为“###”或“nn”,分段最大长度调整为512字符,以此保留结构完整性。
在Bot中绑定知识库
返回项目开发页,打开目标Bot的编辑界面,在左侧【知识】区域点击【+】图标。
从弹出列表中勾选刚创建的知识库,点击确认完成绑定。
需要留意:单个Bot最多可绑定150个知识库,但实际建议控制在5个以内。这不是限制,而是基于效果考量——知识库数量越多,召回噪声越大,关键信息权重反而被稀释。
配置知识库调用策略
第一步:开启【自动调用】开关,确保每轮对话强制检索知识库。此举让模型不再凭空猜测,必须从文档中寻找依据。
第二步:将【搜索策略】设为【混合】。该模式同时启用关键词匹配与向量相似度检索,对“催发货”“怎么还没发”“物流卡在哪了”等口语化提问,召回率显著提升。
第三步:调整【召回数量】为3~5条,召回分数阈值设为0.38。低于该值的碎片内容不会参与生成,有效过滤低相关片段;但阈值设置过高,可能遗漏表述差异大但答案准确的片段。
第四步:在Bot的提示词中加入强约束指令。例如:“所有回答必须严格基于知识库召回内容,未提及的信息一律回答‘暂无相关信息’。” 这能让Bot变得极其严谨。
优化问答效果的三个实操技巧
方法一:在知识库文档标题前添加业务标签。比如将《退货流程》改为【售后】【退货】退货流程。系统会将“售后”“退货”作为元数据强化索引,用户提问“售后怎么退东西”时命中率更高。
方法二:手动补充高频问法变体到文档末尾。在上传的PDF末页新增一段,例如:“用户也可能这样问:‘寄回去的钱啥时候到账?’‘退款能原路返回吗?’‘退的钱少了怎么办?’”。这些自然语言变体能显著提升向量检索覆盖度,是简单却高效的小技巧。
方法三:用插件动态注入实时数据。当知识库需要对接库存、订单状态等动态信息时,不要反复重传文件。换个思路:创建API插件,在提示词中写明:“若用户询问订单物流,请先调用【物流查询】插件获取实时数据,再结合知识库中《异常物流处理规范》作答。” 这样既保证数据实时性,又维持知识库的稳定性。
