扣子安全合规敏感词过滤机制配置指南:零基础到精通全攻略
先说几个核心判断:扣子(Coze)平台的敏感词过滤和安全合规机制,如果只配置了基础词库,基本上等于没配。很多人在搭建公众号或企微客服时,用户输入“加微信”“转账”“稳赚不赔”这类词,系统毫无反应,或者没能按预设话术重写——多数情况下,是因为三层配置没有全部到位。缺一不可,分别是:基础词库加载、语义校验开关开启、响应策略绑定。
这三步,缺哪一步都不行。
第一步,先把内置的敏感词过滤引擎激活。进入 Bot 编辑页,点击右上角的「设置」,找到「安全与合规」标签页,然后打开「敏感词过滤」总开关。这一步是基础中的基础——如果这个开关没开,后面无论上传什么词库、设置什么规则,所有用户输入都会直接绕过过滤,直通模型。必须警惕的是,很多人忽略了这个总开关,导致后续所有配置都成了摆设。
接着,点击「管理敏感词库」,选择「自定义词库」,把关键词列表粘贴进去,一行一个。典型的词包括:加微信、私聊我、扫码进群、稳赚不赔、保本保息。如果你需要匹配更复杂的模式,比如手机号,可以配合正则表达式来写,例如匹配11位手机号时用b1[3-9]d{9}b。注意正则中的特殊字符,比如括号和点号,需要用反斜杠转义。
配置语义级风险识别与AI重写
基础关键词匹配只能挡掉最直接的违规表达,但像“这个肯定回本”“闭眼买都行”这类隐性话术,关键词列表根本抓不住。这就需要启用语义校验模块。
有两种办法。第一种是在「安全与合规」页中找到「语义风险检测」,开启开关,然后把风险阈值设在0.75到0.85之间,默认是0.8。数值设得越低,系统越敏感,但误判率也会跟着上升。第二种办法是绑定本地小模型——前提是你的Bot已经接入了类似Qwen3-4B-Instruct-2507或同级别的模型。在「高级设置」中填写模型ID,启用「AI重写响应」功能,然后上传一个名为 rewrite_rules.json 的文件。文件内容格式很简单,比如:{"input": "肯定能回本", "output": "根据《私募投资基金监督管理暂行办法》,投资有风险,过往业绩不预示未来表现"}。注意这个文件的权限必须设为600,路径要和Bot后台配置中的 rewrite_config_path 完全一致,否则绑定会失败。
绑定拦截响应策略
认证是基础,但真正决定系统如何行动的是响应策略。在「安全与合规」的「响应策略」页面,点击「新建策略」。
根据不同风险等级,设定不同的动作:
- 高风险(语义分 ≥ 0.85,或命中强敏感词)→ 选择「阻断发送 + 返回提示语」,提示语可以写:“该内容涉及违规信息,无法继续对话。”
- 中风险(语义分在 0.75 到 0.84 之间)→ 选择「记录日志 + 替换为合规表述」,系统会自动从
rewrite_rules.json中匹配并输出替换内容。 - 低风险(仅命中弱敏感词,比如“群”“聊”)→ 选择「仅记录审计日志」,不干预用户可见的对话内容。
策略配置完成后,记得把它绑定到目标 Bot,并点击「发布生效」。策略会立即加载,不需要重启服务。最后,在测试面板里输入一句测试用例,比如“你加我微信,我发你稳赚不赔的产品”,观察系统是否触发了阻断或重写。如果一切正常,你的安全合规配置才算真正跑通。
