微信支付AI工具箱2.0评测：Mermaid图亮点解析

2026-06-16阅读 0热度 0

人工智能

前几天在琢磨一件事：微信支付发了AI工具箱1.0，核心思路是用AI帮你接支付。逻辑上挺顺——你告诉AI“我要接小程序支付”，AI自己去读文档、写代码、调通接口，全程你不需要翻一页文档。

但问题来了：AI到底怎么读文档？

微信支付的文档里有大量时序图、状态图，都是图片或者HTML渲染的图表。大多数模型，尤其是那些没有多模态能力的，根本看不懂。它们看到的不是“图”，而是一堆alt标签或者乱码。

所以1.0的实际体验是：AI能读文字，但读不懂图。到了状态流转、回调时序这些核心逻辑，AI大概率开始“猜”，猜错了你还得自己回去翻文档。

然后今天，微信支付发了2.0。

仔细看了升级点，发现有一个改动特别小、但特别聪明——把文档里所有时序图和状态图全部转成了Mermaid格式。

这个改动，比它听起来重要得多。

Mermaid是什么？一种用代码画图的格式，长这样：

任何模型都能读懂这段代码，因为它就是文本。不需要多模态能力，不需要看图，按行读就行。

原来的HTML图表呢？对模型来说是一团节点嵌套，它得先把HTML渲染成“图”这个概念，才能理解时序关系。没有多模态能力的模型，这一步直接卡死。

转成Mermaid之后，整体Token消耗比原始HTML降低50%。原因有两个：Mermaid格式本身比HTML精简得多；模型理解Mermaid需要的Token也比理解一张图片少得多。

这个设计思路其实挺反直觉的。大多数人做AI友好文档，第一反应是“加多模态支持，让模型能看图”。微信支付选了另一条路——把图变成文本，让所有模型都能读。

说回正题，这个改动解决了1.0时代一个非常真实的痛点：你有了一个Skill，Skill能读文档，但文档里的关键逻辑藏在图里，模型读不懂，Skill的输出就只能靠猜。猜错了，你还是得自己看文档。

2.0把这个问题的源头堵上了。

知识库从两棵大树变成整片森林

1.0的Skill，知识库只覆盖了支付和券两个方向。坦白说，对大多数开发者来说够用了——支付接完接券，核心流程就通了。

但微信支付的产品线远不止这两个。分账、退款、账单下载、投诉处理、经营能力……这些产品在1.0里是没有专属知识的，AI答不上来，或者答得很泛。

2.0把知识库扩展到了微信支付全线产品。

这个扩展的意义不只是“能回答更多问题”，而是让AI真正成为一个可用的接入助手。你在接支付的过程中，大概率会顺带碰到分账怎么接、退款状态怎么查、账单怎么下载这些问题。如果Skill只懂支付，你每遇到一个边缘问题就得切回人工，那这个AI助手的体验就断裂了。

全线覆盖之后，至少理论上，你可以从头到尾用自然语言走完整个接入流程。

还有一个细节：工具箱支持中文、日语、韩语等9种语言，并且针对“微信支付收银台”这类原生概念体系做了翻译适配。

说实话，这个“原生概念翻译适配”比支持9种语言更值得说。机器翻译一个技术文档最大的问题不是语法错误，而是概念走样。比如“收银台”直接译成cashier，英语读者完全不知道这是什么。专门适配之后，概念的对齐度会高很多。

但也要说一句：翻译质量这件事，覆盖9种语言不等于9种语言都好用。中日韩可能还行，小语种的质量得实际用起来才知道。

两个AI专家，一个排障一个审查

2.0新增了两个AI专家能力——技术专家和金融级研发专家。

分工是这样的：技术专家负责排障问答，“为什么报这个错”“这个错误码是什么意思”；金融级研发专家负责代码质量审查，“这段代码有没有安全隐患”“上线前还有什么没接”。

这个分工其实反映了微信支付对自己用户的理解。用Skill的开发者分两种：一种在接的过程中，碰到报错卡住了，需要快速定位问题；另一种已经接完了，准备上线，需要有人帮他把一遍关。

两种需求的思维模式不一样。排障需要的是“快速定位→给方案”，审查需要的是“全面扫描→分级输出”。一个追求速度，一个追求覆盖度。

让同一个AI做两件事不是不行，但专长分工之后，输出的质量会更高。

这部分还没有实际测试过，所以不好说这两个专家的准确度到底怎样。但从设计思路上来说，比1.0只提供通用Skill进步了不少。

CLI排障，不打断心流

这个功能是今天看下来最戳中我的。

新增的CLI动态排障，支持开发者在终端用自然语言直接查询支付单和退款单状态。不用登录商户后台，不用切窗口，在终端里直接问“这笔支付单为什么失败了”就行。

开发者最讨厌的事情之一就是：正在写代码，突然要查一个问题，得切去网页登录、找菜单、查数据，查完回来发现思路断了。

CLI排障把这个过程压缩到不离开终端。心流不断，这才是真正的效率提升。

说到这里又想到一个点：这个功能看起来简单，其实背后需要微信支付把查询接口和自然语言理解打通，而且要在终端环境下工作。不是所有的AI功能都适合做在IDE里，CLI是一个被低估的入口。

Skill自动同步，解决版本地狱

还有一个升级点：Skill在启动时会自动比对官网和本地知识库的版本，发现不一致就自动同步更新。

这个解决的是什么问题？微信支付的文档是会更新的——接口参数会调整，错误码会增加。你本地装的Skill如果是两个月前拉的，知识库可能就已经过时了。

过时会发生什么？AI基于旧文档给你写的代码，可能用了已经废弃的参数，或者漏掉了新的必填字段。你按代码接完，一跑报错，然后才发现是Skill的知识库没更新。版本问题永远是最容易被忽略的那个。

自动同步把这个坑填了。

但有一个问题值得注意：自动同步是直接覆盖本地的Skill，还是提示你有更新？如果是直接覆盖，那你本地的自定义修改（如果有的话）就没了。这个细节官方没有说清楚，实际使用的时候需要注意一下。

1.0到2.0，方向没变，细节变了

把2.0的所有升级点放在一起看，有一个规律：全部都是在解决“AI能用，但用起来不够顺”的问题。

Mermaid解决的是“AI读不懂图”。多语言适配解决的是“AI说的概念对不上”。全线产品覆盖解决的是“AI只知道支付和券，别的一问三不知”。双专家解决的是“排障和审查是两种思维模式”。CLI排障解决的是“切窗口打断心流”。自动同步解决的是“Skill版本落后导致生成的代码过时”。

没有一个是碘伏性的大功能，但每一个都打在1.0实际使用中的真实痛点上。

这个节奏挺好的。1.0先把框架搭起来，证明“让AI接支付”这条路能走通。2.0再回来补细节，把那些“能跑但不顺畅”的地方一个个修掉。

如果你正在用或者打算用微信支付的Skill接支付，2.0值得升。不是因为多了什么炫酷功能，而是因为Mermaid和CLI排障这两个改动，实际用起来就是能感觉到差别。

说实话，把图表全部转成Mermaid这个事，别的AI友好文档是不是也该学一下？

微信支付 Skills：

https://github.com/wechatpay-apiv3/wechatpay-skills

微信支付AI工具箱2.0评测：Mermaid图亮点解析

知识库从两棵大树变成整片森林

两个AI专家，一个排障一个审查

CLI排障，不打断心流

Skill自动同步，解决版本地狱

1.0到2.0，方向没变，细节变了

微信支付 Skills：

相关阅读

最新教程

最新资讯