GLM5开源微信机器人OpenClaw开发实战

2026-06-05阅读 0热度 0
OpenClaw

OpenClaw,GitHub 上 18 万 Star 的开源项目,大家应该都不陌生。它能接飞书、钉钉、企业微信、QQ、Discord……唯独最多人用的微信个人号,始终是个空白。

社区里能找到的方案,要么是企业微信绕一圈,要么是用微信 Web 协议逆向,结果动不动就封号。正因如此,有人决定自己动手,爆肝 2 天,把 OpenClaw 接入了微信个人号,并且已经完全开源。

这个项目被命名为“苍何的狗腿子”——它看起来就是个普通微信好友,但背后是一个真正能帮你干活的 AI Agent。

当你随手把一篇文章丢给它,OpenClaw 会自动帮你总结,并存放到你的个人 Notion 知识库中。

现在看到好文章直接转发给它,还能随时让它去知识库中查找任何想要的收藏——说实话,比收藏夹好用一万倍。

把这个家伙拉进群聊,还能随时 @它总结上下文,堪称群聊利器。

此外,可以指挥它自动搜集全网资讯并汇总发送;也可以设置日程提醒,比如让它提醒 2 分钟后喝水。更有趣的是,这个 OpenClaw 实例里还装了一个 18 岁的 AI 女友 Clawra——她有独立人格和人设,当问她在干嘛时,她会甩一张自拍过来。

当然还有更多场景待探索,但核心体验是:在微信上用 OpenClaw 显得格外丝滑,因为微信本身就是每天离不开的沟通工具。

注意事项:

  1. 建议先用小号测试。虽然 iPad 协议比 Web 协议稳定得多,但毕竟是第三方接入,谨慎为上。
  2. 不要用来搞群发、营销之类的骚操作,腾讯的风控不是吃素的。
  3. 建议部署在有固定 IP 的服务器上,频繁换 IP 容易触发风控。

整个系统架构如下:

全程使用的是 OpenRouter 上的神秘模型 Pony Alpha 配合 Claude Code。

这个神秘模型后来终于揭晓了谜底——确认就是智谱的 GLM 5 模型。

GLM 5 上线 bigmodel 后直接切换,干了不少 token。

几个 agent 一顿狂干,直接就干到了限额。

果断再开 Max 套餐,可以说是大出血了。

关于 GLM 5,官方说法是:“在全球权威的 Artificial Analysis 榜单中,GLM-5 位居全球第四、开源第一”。从官方及各大媒体报道来看,GLM 5 是面向复杂系统工程与长程 Agent 任务的开源基座模型。

接下来,这篇文章会把与 GLM 5 协作开发的过程分享出来,看看这个模型在处理实际工程级项目中究竟能有几斤几两。

先说说 OpenClaw 是啥

如果你还不知道 OpenClaw,简单说一下。

它原名叫 Clawdbot,是奥地利开发者 Peter Steinberger 搞出来的开源 AI Agent 项目。

后来因为跟 Anthropic 的商标冲突,改名 Moltbot,又改名 OpenClaw。名字换了三个,但丝毫不影响它火到离谱——3 周时间,GitHub Star 从 0 干到 18 万+。

这什么概念?React 花了 8 年才到 10 万,Linux 花了 12 年,它 3 周就超了。

它的核心能力就一句话:让 AI 不只是回答你问题,而是真正替你干活。

你跟它说“帮我查一下明天的天气,然后发到群里”,它就真的会去查、然后发。不是那种假装理解你然后输出一坨文字的“AI 助手”,是真的有手有脚能操作的 Agent。

它支持接入各种大模型——Claude、GPT、DeepSeek 都行,还支持多 Agent 协作,搞一个虚拟开发团队都不在话下。

为啥微信这么难接?

讲真的,这事不能怪 OpenClaw。

微信是出了名的“封闭生态”,个人号压根没有官方 Bot API。你想搞自动化,要么走企业微信(需要公司认证),要么用第三方协议逆向(随时封号)。

之前社区有一些方案,比如用 wechatbot-webhook 基于微信 Web 协议来搞,Docker 一键部署倒是方便。但问题是:

  1. 稳定性堪忧——微信 Web 协议说封就封
  2. 功能受限——很多高级功能用不了
  3. 安全风险——你的微信账号等于裸奔

试了几个,要么跑不起来,要么跑起来半天就掉线。说白了,这些方案都是在微信的安全策略上“走钢丝”。

是怎么搞的

既然现有方案都不太行,那就自己撸一个。

核心思路是:不走微信 Web 协议,走 iPad 协议 + 消息中转服务。

核心架构分三层:

  1. 消息接收层:基于 iPad 协议稳定接收微信消息,比 Web 协议靠谱得多
  2. 中转网关层:做消息格式转换、会话管理、限流熔断
  3. OpenClaw 对接层:通过 Webhook 把消息推给 OpenClaw Gateway,再把 AI 回复转发回微信

整个架构用 TypeScript 写的,跟 OpenClaw 原生技术栈一致。

说起来简单,但这毕竟是个系统工程——协议对接、消息队列、网关路由、多模型调度,涉及的模块还挺多的。2 天能搞定,离不开一个关键帮手:GLM-5。

为什么用 GLM-5?

可能有人会问,市面上 Coding 模型那么多,为啥选它?

一开始也没抱太大期望,主要是先跑的神秘模型 Pony Alpha。但实际跑下来,对于有些场景还行。

这个项目不是那种“一句 Prompt 搓个网页”的活儿。消息中转网关要处理并发、去重、限流,OpenClaw 对接层要搞 Webhook 协议适配和会话状态管理,还有各种边界情况要兜底。这是正儿八经的系统工程,不是写个前端页面的事。

现在大模型圈子其实有个很明显的趋势:Opus 4.6、GPT Codex 5.3 这些顶级模型都在强调自己的 Agentic 能力,不再吹“一句话出活”了,而是卷谁能扛住长任务、复杂系统开发。GLM-5 刚好也走的这条路。

这次开发全程让 GLM-5 跑 Agent 模式,把任务拆成多个子任务,让它自己规划、自己执行、自己调试。

遇到问题,它能够自己修,找出对比项。

原始需求是要在 openclaw 中添加微信插件。

一开始的版本觉得不够合理,就让模型重构了一下,它能给出合理的架构设计。

给的重构指令及整体过程大概花费了 25 分钟,解决了重构的所有问题。

整个过程基本就是在旁边看着,偶尔给点方向性的反馈。

而且 GLM-5 还有一点让人挺舒服的——它是开源的。不过对于一些稍微深一些的 bug,GLM 5 也并非万能的,这个时候会让它切换到 GPT-5.3-codex 和 Claude 4.6 来解决。

接下来聊聊开发过程中踩的坑,这才是重头戏。

踩坑实录

坑一:消息去重

微信的消息推送机制很迷,同一条消息有时候会推两三次。如果不做去重,AI 就会回复两三遍,对面以为你是复读机。

解决方案是让 GLM 搞了一个基于消息 ID + 时间窗口的去重缓存,用 LRU 策略自动淘汰过期记录。

坑二:上下文管理

OpenClaw 的 Agent 是有记忆的,但微信的对话场景比较特殊。群聊里一堆人说话,你不能把所有消息都当作是给 AI 的指令。

所以做了一个“@触发 + 私聊直连”的机制:

  • 私聊:所有消息直接转给 OpenClaw 处理
  • 群聊:只有 @机器人 的消息才会触发 AI 回复

这样就不会出现 AI 在群里疯狂刷屏的社死场面了。

坑三:回复速度

大模型的回复是有延迟的,特别是复杂问题可能要想好几秒。但微信那边,对面看你一直不回,以为你已读不回呢。

加了一个“思考中...”的状态提示,AI 在生成回复的时候先发一个提示,生成完了再替换成正式回复。用户体验直接拉满。

坑四:多模型切换

OpenClaw 支持多个大模型,但不同场景其实适合不同模型。比如日常闲聊用 DeepSeek 就够了,写代码分析问题上 Claude,省钱又高效。

在中转层做了一个简单的路由策略,根据消息内容自动选择最合适的模型。

能干啥?

接入之后,你的微信就变成了一个 AI 超级助手。举几个正在用的场景:

1. 智能群聊助手

在技术群里 @机器人,直接问代码问题,它会结合上下文给出解答。再也不用忍受群里那些“百度一下”的回复了。

2. 个人知识管家

把文章、链接丢给它,它帮你总结归纳,还能存到你的知识库里。比收藏夹好用一万倍。

3. 日程提醒

跟它说“明天下午 3 点提醒我开会”,到点它就会在微信上戳你。比手机自带的提醒好用,因为你一定会看微信。

4. 自动回复

设置好规则,一些常见问题它自动回复。比如有人加你好友问“在吗”,它直接回“在的,有什么事吗?”再也不用被“在吗”两个字烦死了。

怎么用?

项目已经开源,可以自己部署。核心就三步:

第一步:克隆项目

git clone https://github.com/canghe/openclaw-wechat.git
cd openclaw-wechat

第二步:配置环境变量

出于安全考虑,这里的 apikey 是袋里服务做了一层,目前还在优化中。

# Set API Key (required)
openclaw config set channels.wechat.apiKey "wc_live_xxxxxxxxxxxxxxxx"
# Set proxy URL (required)
openclaw config set channels.wechat.proxyUrl "http://your-proxy-server:3000"
# Set webhook host (required for cloud deployment)
openclaw config set channels.wechat.webhookHost "your-server-ip"
# Enable the channel
openclaw config set channels.wechat.enabled true

第三步:openclaw 服务中添加 openclaw-wechat

openclaw plugins install @canghe/openclaw-wechat

这里需要等一下,还没来得上到插件市场去,后面会上,可以先本地代码的方式安装。

然后用微信扫码登录,完事。整个过程 5 分钟搞定,不需要公司认证,不需要企业微信,普通个人号直接用。

后续计划

目前这个项目还在持续迭代,后面计划加这些功能:

  • 语音消息支持:目前只支持文字,后续会接入语音转文字 + 文字转语音
  • 图片理解:接入多模态模型,让 AI 能看懂你发的图片
  • OpenClaw Skills 市场对接:直接在微信里调用 OpenClaw 的 700+ 技能
  • 多账号管理面板:Web 端可视化管理多个微信号的接入

如果你有好的想法,欢迎来 GitHub 上提 Issue 或者 PR。

写在最后

说实话,OpenClaw 这波开源 AI Agent 的浪潮,真的让人看到了 AI 落地的另一种可能。

以前我们说 AI,总觉得是那种高高在上的东西,要么在实验室里,要么在大公司的服务器上。但现在,你自己部署一个 OpenClaw,接上微信,AI 就真的成了你口袋里的助手。这种感觉,说不出的爽。

不过也要提醒一下,OpenClaw 的 Skills 生态最近爆出了一些安全问题,有超过 230 个恶意插件被上传到了社区。所以大家在用 OpenClaw 的时候,一定要注意只安装可信来源的 Skills,别什么都往上装。

另外,智谱也出了 AutoGLM 版本的 OpenClaw,支持官网一键完成 OpenClaw 与飞书机器人的一体化配置,帮助用户从数小时缩短到几分钟,极速部署 OpenClaw。

项目已开源,感兴趣的可以直接去 GitHub 上看看。

免责声明

本网站新闻资讯均来自公开渠道,力求准确但不保证绝对无误,内容观点仅代表作者本人,与本站无关。若涉及侵权,请联系我们处理。本站保留对声明的修改权,最终解释权归本站所有。

相关阅读

更多
欢迎回来 登录或注册后,可保存提示词和历史记录
登录后可同步收藏、历史记录和常用模板
注册即表示同意服务条款与隐私政策