2025扣子多通道信息聚合与过滤Agent开发实战指南
MultiChannelFilter Agent需要依次完成四通道接入、三层过滤(去重→广告识别→语义聚类)、结构化卡片输出、知识库/API动态规则更新,并通过四通道测试验证连通性。
多通道信息聚合与过滤Agent开发指南
坦白说,面对来自微信公众号、飞书群消息、企业微信客服和API推送的这四类文本流,最头大的不是信息太多,而是怎么把它们统一收进一个入口。想象一下,如果能把它们自动去重、过滤广告话术、合并同类咨询、标记出高优线索——而且这一切都是Agent在后台默默完成,最后只输出一份结构化摘要——那得省多少盯屏的力气。
第一步:创建基础Agent并配置多通道接入
打开扣子平台(coze.cn),进入工作空间,点击右上角的【创建应用】按钮。选择【Bot】类型,命名为“MultiChannelFilter”。注意,在【触发方式】这一步,要一次性把“微信公众号”、“飞书机器人”、“企业微信应用”、“Webhook API”这四个通道全都勾选上。系统会自动为每个通道生成独立的接入凭证,但有一点必须提醒:每个通道的回调地址和Token必须单独配置,漏掉一个,那一整路消息就彻底进不来了。
创建完成后会自动跳转到编辑页,先别急着写提示词。确认一下左侧导航栏是不是已经出现了“插件”、“知识库”、“变量”、“Flow”这四个模块,缺一个都不行。
第二步:设计三层过滤逻辑(顺序不能乱)
点击顶部的【Flow】进入可视化编排页,这一步是核心。
先做第一层:去重过滤。拖一个【条件节点】进来,判断字段设置成“原始消息哈希值”。用内置函数hash_md5(content)生成唯一指纹——这个指纹如果在72小时内的数据库记录里已经存在,那就直接终止流程,不让它进入后续处理。
接着是第二层:广告识别。插入一个【插件节点】,选择预置插件“文本风险检测”,把“营销话术”、“联系方式泛滥”、“诱导点击”这三项规则都打开。只要有一条命中,系统会自动打上“AD_SPAM”标签,并且路由到归档分支,不再生成摘要。
最后是第三层:语义聚类。添加一个【技能节点】,新建自定义技能“TopicCluster”。在代码区粘贴Python脚本(平台支持Py3.9),调用sentence-transformers/all-MiniLM-L6-v2模型对清洗后的文本做向量化处理,然后计算余弦相似度。相似度超过0.85的,归到同一个主题簇里。每个簇只保留最早的那条原始消息,同时合并一下时间戳范围。
第三步:构建结构化输出模板
在Flow的末尾添加一个【回复节点】。这里不要用默认的自由格式,一定要选择【结构化卡片】模板。
标题栏填入:「{date} 多通道聚合简报(共{count}条)」
正文分成三个区块:
• 【高优线索】——展示那些带有“urgent”或“callback”关键词,并且包含手机号或邮箱的条目,记得加粗显示;
• 【主题聚合】——以「▶ {topic_name}({cluster_size}条)」开头,接着放第一条原文,后面加上「…+{cluster_size-1}条同类」;
• 【待人工介入】——列出所有被标记为“AD_SPAM”的消息ID以及拦截原因。
这一步有个关键细节:手动关闭“自动换行”选项。否则卡片在飞书端会出现错位变形,排版就全毁了。
第四步:绑定实时知识库做动态规则更新
有两种方法可选。
方法一:上传Excel规则表。在【知识库】模块点击【新建知识库】,命名为“FilterRules”。上传一个包含三列的Excel文件:关键词、所属类别(比如“竞品名”、“黑产话术”)、生效状态。上传后勾选【启用实时检索】,然后在Flow中“广告识别”插件后面追加一个【知识库检索】节点,检索字段设为“消息全文”,匹配阈值调到80%。
方法二:对接内部风控API。在【插件】→【自定义插件】中新建一个HTTP插件,URL填写你们公司风控中台的/v1/check接口。请求体传入{"text": "{content}"},响应字段映射为boolean型的“is_blocked”。需要注意的是,这个插件要放在“语义聚类”之前执行,确保高危内容在进入过滤阶段之前就被截停。
这两个方法不能同时启用,否则规则冲突可能会导致漏判。从实际效果来看,更推荐方法二,响应速度更快,也不用每天去维护Excel表。
第五步:发布并验证四通道连通性
点击右上角的【发布】,选择【全部通道】,等待状态变成“已上线”。
发布完之后立刻做通道验证:用微信公众号发送“测试1”,飞书发“测试2”,企业微信发“测试3”,再用curl向Webhook地址POST一条JSON,内容为{"content":"测试4"}。不出五秒,检查【调试日志】页,看看是不是出现了四条独立的trace_id,并且每一条都完整走完了三层过滤和结构化输出的流程。
如果某个通道没有日志,马上返回【触发方式】页,复制那个通道的Webhook URL,在浏览器新标签页里打开。如果返回{"status":"ok"},说明通道正常;返回404,说明凭证没生效,需要重新生成Token并粘贴到对应平台的后台。
