微信支付AI工具箱2.0评测:Mermaid图亮点解析

2026-06-16阅读 0热度 0
人工智能

前几天在琢磨一件事:微信支付发了AI工具箱1.0,核心思路是用AI帮你接支付。逻辑上挺顺——你告诉AI“我要接小程序支付”,AI自己去读文档、写代码、调通接口,全程你不需要翻一页文档。

但问题来了:AI到底怎么读文档?

微信支付的文档里有大量时序图、状态图,都是图片或者HTML渲染的图表。大多数模型,尤其是那些没有多模态能力的,根本看不懂。它们看到的不是“图”,而是一堆alt标签或者乱码。

所以1.0的实际体验是:AI能读文字,但读不懂图。到了状态流转、回调时序这些核心逻辑,AI大概率开始“猜”,猜错了你还得自己回去翻文档。

然后今天,微信支付发了2.0。

仔细看了升级点,发现有一个改动特别小、但特别聪明——把文档里所有时序图和状态图全部转成了Mermaid格式。

这个改动,比它听起来重要得多。

Mermaid是什么?一种用代码画图的格式,长这样:

任何模型都能读懂这段代码,因为它就是文本。不需要多模态能力,不需要看图,按行读就行。

原来的HTML图表呢?对模型来说是一团节点嵌套,它得先把HTML渲染成“图”这个概念,才能理解时序关系。没有多模态能力的模型,这一步直接卡死。

转成Mermaid之后,整体Token消耗比原始HTML降低50%。原因有两个:Mermaid格式本身比HTML精简得多;模型理解Mermaid需要的Token也比理解一张图片少得多。

这个设计思路其实挺反直觉的。大多数人做AI友好文档,第一反应是“加多模态支持,让模型能看图”。微信支付选了另一条路——把图变成文本,让所有模型都能读。

说回正题,这个改动解决了1.0时代一个非常真实的痛点:你有了一个Skill,Skill能读文档,但文档里的关键逻辑藏在图里,模型读不懂,Skill的输出就只能靠猜。猜错了,你还是得自己看文档。

2.0把这个问题的源头堵上了。

知识库从两棵大树变成整片森林

1.0的Skill,知识库只覆盖了支付和券两个方向。坦白说,对大多数开发者来说够用了——支付接完接券,核心流程就通了。

但微信支付的产品线远不止这两个。分账、退款、账单下载、投诉处理、经营能力……这些产品在1.0里是没有专属知识的,AI答不上来,或者答得很泛。

2.0把知识库扩展到了微信支付全线产品。

这个扩展的意义不只是“能回答更多问题”,而是让AI真正成为一个可用的接入助手。你在接支付的过程中,大概率会顺带碰到分账怎么接、退款状态怎么查、账单怎么下载这些问题。如果Skill只懂支付,你每遇到一个边缘问题就得切回人工,那这个AI助手的体验就断裂了。

全线覆盖之后,至少理论上,你可以从头到尾用自然语言走完整个接入流程。

还有一个细节:工具箱支持中文、日语、韩语等9种语言,并且针对“微信支付收银台”这类原生概念体系做了翻译适配。

说实话,这个“原生概念翻译适配”比支持9种语言更值得说。机器翻译一个技术文档最大的问题不是语法错误,而是概念走样。比如“收银台”直接译成cashier,英语读者完全不知道这是什么。专门适配之后,概念的对齐度会高很多。

但也要说一句:翻译质量这件事,覆盖9种语言不等于9种语言都好用。中日韩可能还行,小语种的质量得实际用起来才知道。

两个AI专家,一个排障一个审查

2.0新增了两个AI专家能力——技术专家和金融级研发专家。

分工是这样的:技术专家负责排障问答,“为什么报这个错”“这个错误码是什么意思”;金融级研发专家负责代码质量审查,“这段代码有没有安全隐患”“上线前还有什么没接”。

这个分工其实反映了微信支付对自己用户的理解。用Skill的开发者分两种:一种在接的过程中,碰到报错卡住了,需要快速定位问题;另一种已经接完了,准备上线,需要有人帮他把一遍关。

两种需求的思维模式不一样。排障需要的是“快速定位→给方案”,审查需要的是“全面扫描→分级输出”。一个追求速度,一个追求覆盖度。

让同一个AI做两件事不是不行,但专长分工之后,输出的质量会更高。

这部分还没有实际测试过,所以不好说这两个专家的准确度到底怎样。但从设计思路上来说,比1.0只提供通用Skill进步了不少。

CLI排障,不打断心流

这个功能是今天看下来最戳中我的。

新增的CLI动态排障,支持开发者在终端用自然语言直接查询支付单和退款单状态。不用登录商户后台,不用切窗口,在终端里直接问“这笔支付单为什么失败了”就行。

开发者最讨厌的事情之一就是:正在写代码,突然要查一个问题,得切去网页登录、找菜单、查数据,查完回来发现思路断了。

CLI排障把这个过程压缩到不离开终端。心流不断,这才是真正的效率提升。

说到这里又想到一个点:这个功能看起来简单,其实背后需要微信支付把查询接口和自然语言理解打通,而且要在终端环境下工作。不是所有的AI功能都适合做在IDE里,CLI是一个被低估的入口。

Skill自动同步,解决版本地狱

还有一个升级点:Skill在启动时会自动比对官网和本地知识库的版本,发现不一致就自动同步更新。

这个解决的是什么问题?微信支付的文档是会更新的——接口参数会调整,错误码会增加。你本地装的Skill如果是两个月前拉的,知识库可能就已经过时了。

过时会发生什么?AI基于旧文档给你写的代码,可能用了已经废弃的参数,或者漏掉了新的必填字段。你按代码接完,一跑报错,然后才发现是Skill的知识库没更新。版本问题永远是最容易被忽略的那个。

自动同步把这个坑填了。

但有一个问题值得注意:自动同步是直接覆盖本地的Skill,还是提示你有更新?如果是直接覆盖,那你本地的自定义修改(如果有的话)就没了。这个细节官方没有说清楚,实际使用的时候需要注意一下。

1.0到2.0,方向没变,细节变了

把2.0的所有升级点放在一起看,有一个规律:全部都是在解决“AI能用,但用起来不够顺”的问题。

Mermaid解决的是“AI读不懂图”。多语言适配解决的是“AI说的概念对不上”。全线产品覆盖解决的是“AI只知道支付和券,别的一问三不知”。双专家解决的是“排障和审查是两种思维模式”。CLI排障解决的是“切窗口打断心流”。自动同步解决的是“Skill版本落后导致生成的代码过时”。

没有一个是碘伏性的大功能,但每一个都打在1.0实际使用中的真实痛点上。

这个节奏挺好的。1.0先把框架搭起来,证明“让AI接支付”这条路能走通。2.0再回来补细节,把那些“能跑但不顺畅”的地方一个个修掉。

如果你正在用或者打算用微信支付的Skill接支付,2.0值得升。不是因为多了什么炫酷功能,而是因为Mermaid和CLI排障这两个改动,实际用起来就是能感觉到差别。

说实话,把图表全部转成Mermaid这个事,别的AI友好文档是不是也该学一下?


  • 微信支付 Skills:

https://github.com/wechatpay-apiv3/wechatpay-skills

免责声明

本网站新闻资讯均来自公开渠道,力求准确但不保证绝对无误,内容观点仅代表作者本人,与本站无关。若涉及侵权,请联系我们处理。本站保留对声明的修改权,最终解释权归本站所有。

相关阅读

更多
欢迎回来 登录或注册后,可保存提示词和历史记录
登录后可同步收藏、历史记录和常用模板
注册即表示同意服务条款与隐私政策