微信PDF自动总结:OpenClaw接收文档并生成核心观点摘要
一、配置微信消息监听通道
想让OpenClaw自动处理微信里的PDF,第一步得先让它“听得到”。这需要配置一个稳定的微信消息监听通道。简单来说,就是让系统通过微信的官方API接入,能够准确识别并捕获用户发来的文件,尤其是PDF附件。
具体操作上,你需要确保网关已经绑定了有效的微信企业号或机器人Token,并且开启了文件类型的过滤规则。这套配置是后续所有自动化流程的触发器。
1. 首先,登录微信开放平台,创建一个企业微信应用(或者使用已有的),拿到关键的AgentId和Secret。
2. 接着,找到OpenClaw的配置目录(通常是~/.openclaw/),编辑里面的wechat.json文件,把获取到的CorpID、AgentID、Secret和Token这些字段填进去。
3. 然后,在命令行执行openclaw gateway restart,重启网关服务,让新的配置生效。
4. 最后,发条测试消息验证一下。给你的企业微信机器人发一句“上传PDF”,看看控制台日志里有没有出现wechat-received这样的事件标记。有的话,通道就算打通了。
二、启用PDF文本提取与结构化技能
通道有了,接下来得解决“看不懂”的问题。PDF文件里的内容对大模型而言,就像一本上了锁的书,必须先把文字“提取”出来,并恢复其原有的“结构”(比如章节、列表),模型才能进行有效理解。
OpenClaw依靠两个核心技能协同完成这项工作:pdf-text-extractor负责基础的文字抽取,而pdf-structure-enhancer则致力于还原文档的语义结构,比如区分标题和正文、识别表格等。
1. 打开命令行,运行clawhub install pdf-text-extractor来安装文本提取技能。
2. 同样地,运行clawhub install pdf-structure-enhancer来安装结构增强技能。
3. 安装完成后,可以检查一下~/.openclaw/skills/目录,确认这两个技能的子目录已经存在,并且里面包含了valid.yaml和processor.js等关键文件。
4. 最直观的确认方式,是登录OpenClaw的Web控制台,在“技能管理”页面里,确保这两项技能的状态显示为已启用。
三、绑定Qwen3-32B或GLM-4.7-Flash本地模型
文本准备好了,谁来“消化”并“提炼”呢?这就轮到语言模型上场了。摘要生成的质量,很大程度上取决于底层模型的理解能力和上下文处理长度。这里有两个主流选择:Qwen3-32B适合处理篇幅较长的教材或报告,而GLM-4.7-Flash在对中文学术文献进行要点提炼时,往往表现得更精准。关键一点,它们都部署在本地,能有效避免敏感文档内容外泄。
1. 如果选择Qwen3-32B,需要在~/.openclaw/openclaw.json配置文件中,添加一个qwen-local的提供方,并将其baseUrl指向你本地模型服务的地址,例如http://localhost:8080/v1。
2. 如果选择GLM-4.7-Flash,则需要确保Ollama服务正在运行,然后配置一个ollama-glm提供方,baseUrl通常为http://localhost:11434。
3. 配置好后,执行openclaw models list命令,验证一下目标模型ID(比如qwen3-32b或glm-4.7-flash)是否已经出现在可用模型列表中。
4. 最后,别忘了在摘要生成技能的配置里,将默认模型显式地设置为qwen3-32b或glm-4.7-flash,这样系统才知道该调用谁。
四、设置微信PDF自动触发规则
组件都齐备了,但怎么让它们自动串联起来工作呢?这就需要定义清晰的“触发规则”。OpenClaw支持灵活的匹配策略,你可以根据文件扩展名、发送者身份甚至消息中的关键词来设定条件,确保只有符合要求的PDF才会启动处理流水线,而不是对每一条消息都“大动干戈”。
1. 在~/.openclaw/rules/目录下,新建一个规则文件,比如命名为wechat-pdf-auto-summarize.yaml。
2. 在文件里编写匹配逻辑。例如,可以设定当消息来自某个特定联系人、附件后缀是.pdf、并且消息正文里包含“总结”或“摘要”这类关键词时,才触发后续动作。
3. 在actions字段中,按顺序定义要执行的动作链。一个典型的流程是:extract-pdf-text(提取文本) → clean-noise(清洗噪音) → generate-summary(生成摘要) → send-to-wechat(发回微信)。
4. 保存文件后,执行openclaw rules reload命令,让新规则立即生效。
五、验证摘要生成与微信回传
所有配置完成后,最后一步就是验收成果了。你需要验证整个流程是否畅通无阻:从接收文件、处理内容,到最终将一份格式友好的摘要准确送回微信对话窗口。OpenClaw通常会将摘要转换为Markdown格式,并渲染成微信支持的图文卡片样式,让阅读体验更佳。
1. 找一个PDF文件,发送给已经配置好的微信机器人,记得在消息正文里带上“请总结”这样的触发词。
2. 迅速查看OpenClaw的运行日志,观察是否按顺序出现了pdf-received(收到PDF)、text-extracted(文本已提取)、summary-generated(摘要已生成)、wechat-sent(微信已发送)这些关键事件。
3. 回到微信对话界面,检查是否收到了一条以【AI摘要】为前缀的回复消息。点开看看,里面应该包含了加粗的关键结论和清晰的分点陈述。
4. 如果摘要末尾有“查看原文定位”之类的链接,不妨点一下,确认它能否正确跳转到PDF原文的对应位置,并高亮相关段落。能做到这一步,就说明整个“收-处理-回”的闭环已经完美跑通了。