Claude Code Skills源码深度解析与性能优化指南
前言
某种程度上,Skills成了2025年LLM应用领域最受追捧的新概念——但要说准它到底是什么,还真没那么简单。从字面翻译看是"技能",可它承载的东西远不止于此。今天这篇,就先从历史脉络梳理LLM的几个发展阶段,再讲清楚Skills能做什么、给它下个定义,最后结合代码解析,分享一些尚不成熟的思考。
刀耕火种
2022年底,ChatGPT一夜爆火。那时候大家热情高涨,核心议题就是"怎么说才能让它听话"。Prompt怎么写、角色怎么定义、怎么把需求和指令加上约束全塞进一句话——一时间,Prompt工程师这个岗位都冒出来了。这个阶段的知识高度碎片化、难以复用,但它确实改变了程序的逻辑:从"按代码执行"变成了"靠自然语言沟通"。
开始规模化
到了2023年初,Anthropic发布Constitutional AI,OpenAI也推出了官方Prompt工程指南。大家开始把有效的prompt沉淀成模板库和系统提示规范,诸如Prompt-Engineering、awesome-chatgpt-prompts-zh这些有名的仓库就是那个时期的产物。但问题也随之暴露:模板难以维护、跨任务迁移困难、模型一更新就得大量重新调试。Prompt开始尝试"函数化",但从工程角度看,依然脆弱——Prompt的管理仍是个老大难。
有标准
2023年6月是个转折点,OpenAI正式推出Function Calling,模型第一次有了结构化调用外部系统的标准接口。到2024年,Anthropic提出MCP(Model Context Protocol),试图统一工具调用的协议层,生态开始走向标准化。当模型具备了调用外部工具的能力后,"让模型做什么"和"模型怎么做"这两件事终于可以分开了。Prompt不再需要硬编码所有逻辑,只需要描述意图,执行交给工具。思路从此打开了——从纯粹的"语言生成"迈向了"决策+调度"。
推出Skill
2025年10月中旬,Anthropic正式发布了Claude Skills。Skills本质上是一套可复用的、带有文档的能力单元。它把"如何完成某类任务的最佳实践"封装到了一起——比如怎么生成docx、怎么读取PDF——模型在需要时直接查阅并遵循,不用靠Prompt里的临时指令。带来的优势很直接:
- 知识可维护:最佳实践集中在SKILL.md和相关文件夹里,更新一处即可;
- 按需加载:模型判断需要时才读取内容,不随意污染上下文;
- 人机协作:人只负责打磨Skill文档,模型负责执行;
- 可复用:别人获取编写好的Skills,得到的结果基本一致。
可以把Skills理解成"公司规章制度"加"工具箱"的组合体。
规章制度告诉AI:遇到某类任务时该怎么做、分几步、每一步用什么工具。工具箱里装着它需要用的脚本和参考资料。
展开来说,一个Skill就是一个文件夹,里面包含三样东西:
第一,SKILL.md文件。这是"指令",用自然语言写成的。告诉AI这个Skill是干什么的、什么情况下该用、怎么用、有什么注意事项。
第二,脚本。可以是Python、Ja vaScript或其他语言写的代码,当AI需要"动手"时就执行这些脚本。
第三,资源文件。比如参考文档、模板、配置文件,AI在执行任务时可以查阅。
所以,Skills可以视作高阶Prompt与工具调用的综合体,再结合Claude Hub之类的发布平台,就有了Skills的发布、查询、安装、版本管理——之前那些麻烦事基本都解决了。
打个比方。函数调用像是给你一把锅铲、一口锅、再加一些调料,你得自己知道什么时候倒油、什么时候下菜、怎么颠勺。而Skills则像是给AI一本《中国八大菜系菜谱》加十八般工具——菜谱里不只告诉AI炒菜步骤,还写明了每个阶段该用哪个工具。AI只管照着做,做完就是一盘菜。哪怕一个从来没炒过菜的人,只要跟AI说"我要个土豆丝",得到的成品和五星级大厨做的基本一样。
所以,根据上面的叙述,Skills可以简单定义为:可被语义触发的能力包,它包含领域知识、执行步骤、输出规范与约束条件。
Skills是如何实现的
Skill的本质,是将磁盘上一段人类可读的Markdown(SKILL.md),在调用瞬间编译成模型能消化的Prompt Blocks,然后注入对话上下文。因此可以把Skill分为两个大阶段:一个是加载阶段,一个是注入调用阶段。下面从Claude Code的源代码视角,看看这两个阶段是怎么实现的。
加载
一、启动入口:从命令行到main()
当在命令行输入claude时,下面这条流程就启动了。
关键代码位置:src/main.tsx:1918-1932
// 同步注册:必须在 getCommands 之前完成
if (process.env.CLAUDE_CODE_ENTRYPOINT !== 'local-agent') {
initBuiltinPlugins();
initBundledSkills();
}
// 并行启动
const setupPromise = setup(preSetupCwd, ...);
const commandsPromise = worktreeEnabled ? null : getCommands(preSetupCwd);
这样设计的原因在于:initBundledSkills()是纯内存的数组push操作(bundledSkills.push(skill)),耗时不到1毫秒。它必须在getCommands()启动前完成,否则getBundledSkills()返回空数组,技能就丢了。
二、技能加载
当在.claude/skills/目录或项目目录等位置放置Skills时,系统会通过IO方式读取。
loadAllCommands的合并顺序(优先级从高到低):
// 如果有重复的,会进行去重处理
return [
...bundledSkills, // 内嵌技能
...builtinPluginSkills, // 内置插件技能
...skillDirCommands, // 磁盘上的技能(用户/项目/管理)
...workflowCommands, // 工作流命令
...pluginCommands, // 插件命令
...pluginSkills, // 插件技能
...COMMANDS(), // 内置命令(非技能类型)
]
三、磁盘技能加载:getSkillDirCommands
关键代码位置:getSkillDirCommands。这是最核心的技能加载逻辑,负责从文件系统读取SKILL.md文件。
3.1 目录搜索范围
getSkillDirCommands(cwd)搜索以下目录:
├── Managed Skills ←── /etc/claude/.claude/skills/ (企业策略管理)
├── User Skills ←── ~/.claude/skills/(用户全局技能)
├── Project Skills ←── .claude/skills/(项目级技能,沿目录树向上搜索)
├── Additional Skills ←── --add-dir 指定的目录/.claude/skills/
└── Legacy Commands ←── .claude/commands/(旧格式,向后兼容)
3.2 并行加载策略
所有目录的加载是并行的(Promise.all),因为它们互不依赖:
const [managedSkills, userSkills, projectSkills, additionalSkills, legacyCommands] =
await Promise.all([
loadSkillsFromSkillsDir(managedSkillsDir, 'policySettings'),
loadSkillsFromSkillsDir(userSkillsDir, 'userSettings'),
Promise.all(projectSkillsDirs.map(dir => loadSkillsFromSkillsDir(dir, 'projectSettings'))),
Promise.all(additionalDirs.map(dir => loadSkillsFromSkillsDir(join(dir, '.claude/skills'), ...))),
loadSkillsFromCommandsDir(cwd),
]);
3.3 单个技能目录的加载过程
loadSkillsFromSkillsDir(basePath, source)
│
├── 1. fs.readdir(basePath) ←── 读取目录列表
│
└── 2. 对每个 entry 并行处理:
│
├── 跳过非目录项(只支持 skill-name/SKILL.md 格式)
├── 读取 skill-name/SKILL.md 文件内容
├── parseFrontmatter(content) ←── 解析 YAML frontmatter
│ 输入: "---\ndescription: ...\n---\n# Skill body"
│ 输出: { frontmatter: {...}, content: "# Skill body" }
├── parseSkillFrontmatterFields(...) ←── 提取结构化字段
│ 提取: description, allowedTools, model, hooks, paths, effort...
│
└── createSkillCommand(...) ←── 构建 Command 对象
闭包捕获 markdownContent,延迟到调用时再编译
3.4 去重机制
加载完成后,使用realpath解析文件的真实路径进行去重:
// 通过 realpath 检测符号链接和重复的父目录
const fileIds = await Promise.all(allSkillsWithPaths.map(({ filePath }) => getFileIdentity(filePath)));
// 先到先得:优先级由合并顺序决定
// managed > user > project > additional > legacy
for (entry of allSkillsWithPaths) {
if (seenFileIds.has(fileId)) continue; // 跳过重复
seenFileIds.set(fileId, skill.source);
deduplicatedSkills.push(skill);
}
3.5 条件技能(Conditional Skills)
带有paths frontmatter的技能不会立即激活,而是存储在conditionalSkills Map中:
---
description: React 组件开发助手
paths: src/components/**, src/pages/**
---
当用户操作的文件路径匹配paths模式时,技能被激活并加入动态技能列表。激活流程:activateConditionalSkillsForPaths(filePaths, cwd) → 使用ignore库做gitignore风格匹配。
四、SKILL.md 文件解析
4.1 Frontmatter 字段格式
---
# 基础信息
name: 显示名称(可选,默认取目录名)
description: 技能描述
argument-hint: <参数提示文本>
arguments: [arg1, arg2]
# 模型和行为控制
model: claude-sonnet-4-6 # 指定使用的模型
effort: high # low | medium | high | 整数
context: fork # fork = 独立子进程执行,inline = 主线程
agent: agent-name # 指定 agent 定义
# 权限控制
allowed-tools: [Bash, Read, Write]
user-invocable: true # 用户是否可通过 /name 调用
disable-model-invocation: false # 模型是否可通过 SkillTool 调用
# 条件激活
paths: src/**/*.tsx # 匹配文件路径时自动激活
# 钩子
hooks:
PreToolUse:
- command: "eslint $FILE"
matcher: "Write|Edit"
# Shell 执行环境
shell: bash
# 版本
version: "1.0"
---
4.2 解析为 Command 对象
parseSkillFrontmatterFields()将YAML映射为结构化字段,然后createSkillCommand()组装成Command对象:
{
type: 'prompt', // 技能都是 prompt 类型
name: 'skill-name', // 目录名(唯一标识)
description: '...', // 从 frontmatter 或正文第一行提取
source: 'projectSettings', // 来源:userSettings / projectSettings / policySettings
loadedFrom: 'skills', // 加载方式:skills / bundled / plugin / mcp
allowedTools: ['Bash'], // 额外允许的工具
model: 'claude-sonnet-4-6', // 模型覆盖
effort: 'high', // 努力程度
userInvocable: true, // 用户可调用
context: 'fork', // 执行上下文
hooks: {...}, // 钩子配置
paths: ['src/**/*.tsx'], // 条件路径
contentLength: 1234, // SKILL.md 内容长度
skillRoot: '/path/to/skill', // 技能目录路径
// 核心:延迟加载闭包
getPromptForCommand: async (args, toolUseContext) => {...}
}
五、延迟加载机制:getPromptForCommand
技能内容在启动时只解析frontmatter,SKILL.md的正文内容通过闭包捕获,仅在用户调用/skill-name时才执行完整的"编译"过程。
这里的设计权衡是:启动时只解析frontmatter(用于技能列表展示),正文编译延迟到调用时。好处是启动速度快,同时支持动态内容——shell命令可以在每次调用时执行获取最新结果。
六、动态技能发现
除了启动时加载,系统还支持在会话过程中动态发现新技能。
6.1 文件操作触发发现
当用户读写文件时,系统会沿文件路径向上搜索.claude/skills/目录:
discoverSkillDirsForPaths(filePaths, cwd)
│
├── 对每个 filePath:
│ 从文件父目录开始,向上遍历到 cwd(不含 cwd)
│ 每级检查是否存在 .claude/skills/ 目录
│ 记录到 dynamicSkillDirs(去重用)
│
└── 返回新发现的目录列表(按深度降序排列)
6.2 激活流程
addSkillDirectories(dirs)
│
├── 对每个目录调用 loadSkillsFromSkillsDir()
├── 深层路径覆盖浅层路径(同名技能)
├── 存入 dynamicSkills Map
└── skillsLoaded.emit() ←── 通知缓存失效
6.3 缓存失效
动态技能加载后,需要清除相关的memoization缓存:
clearCommandMemoizationCaches() {
loadAllCommands.cache?.clear?.()
getSkillToolCommands.cache?.clear?.()
getSlashCommandToolSkills.cache?.clear?.()
clearSkillIndexCache?.() // 技能搜索索引
getCommands()本身不被缓存(因为需要每次重新检查a vailability和isEnabled),但它内部的loadAllCommands被memoize了,所以清除内层缓存即可。
七、技能优先级总览
优先级从高到低:
1. managed skills ←── 企业策略目录 /etc/claude/.claude/skills/
2. user skills ←── 用户全局 ~/.claude/skills/
3. project skills ←── 项目目录 .claude/skills/(最近的优先)
4. additional skills ←── --add-dir 指定目录
5. legacy commands ←── 旧格式 .claude/commands/
6. bundled skills ←── 代码内嵌技能
7. builtin plugin skills ←── 内置插件技能
8. plugin skills ←── 第三方插件技能
同名技能:先注册者胜出(由合并顺序决定)
文件去重:realpath 相同的文件只保留第一个
八、关键数据流图
调用
加载阶段将所有Skills加载到Command[]数组中等待调用。梳理Claude Code的源码来看,用户总共有9个入口可以调用Skills:
| # | 入口 | 触发方式 | 执行模式 |
|---|---|---|---|
| 1 | 用户斜杠命令 | 用户输入 /skill-name | inline / fork |
| 2 | 立即命令 | 查询进行中输入 /config等 | local-jsx 直接执行 |
| 3 | SkillTool.call() | 模型调用 Skill工具 | inline / fork / remote |
| 4 | MCP Skill | 通过 SkillTool 或 /server:skill | fork(强制) |
| 5 | Cron/定时任务 | scheduled_tasks.json 或 /loop | 队列 → processUserInput |
| 7 | Agent 预加载 | Agent 定义中的 skills:字段 | 预注入初始消息 |
| 8 | Ultraplan 关键字 | 输入包含魔法关键字 | 重写为 /ultraplan |
| 9 | 初始 prompt | -p "/skill ..."或 agent initialPrompt | onSubmit → processSlashCommand |
限于篇幅,9种调用方式都讲一遍显然不现实,今天主要讲第一种——用户用斜杠命令行来调用Skills。
代码的调用流程图
详细代码调用流程
第1层 REPL.onSubmit() — 入口把关
详细代码位置:REPL.tsx:3142
当在Claude Code中输入/commit并按下回车,PromptInput组件调用onSubmit回调。这是整条链路的入口。
// 1. 检测是否是 immediate 命令(immediate: true 的 local-jsx 命令)
// 这些命令可以在 AI 正在处理时立即执行,不用排队
if (!speculationAccept && input.trim().startsWith('/')) {
const commandName = /* 从 input 提取命令名 */
const matchingCommand = commands.find(...)
const shouldTreatAsImmediate = queryGuard.isActive && (matchingCommand?.immediate || options?.fromKeybinding)
if (matchingCommand && shouldTreatAsImmediate && matchingCommand.type === 'local-jsx') {
// 直接执行,跳过队列 — return early
}
}
对于大多数/skill-name(type为prompt),不会命中immediate快速通道,而是继续往下走。后续处理包括:清空输入框、加入历史记录、调用handlePromptSubmit()。
第2层:handlePromptSubmit() — 队列化
详细代码位置:handlePromptSubmit.ts:120
这个模块的核心职责是决定输入是立即执行还是排队等待。
// 如果 AI 正在处理中(queryGuard.isActive),新的输入进入队列
if (queryGuard.isActive || isExternalLoading) {
enqueue({ value: finalInput.trim(), mode, pastedContents })
return // 不执行,等 AI 空闲后 dequeue
}
// 否则立即执行
await executeUserInput({ queuedCommands: [cmd], ... })
executeUserInput是实际执行的核心函数,其内部调用processUserInput()。
第3层:processUserInput() — 模式路由
详细代码位置:processUserInput.ts:533
这个函数是一个大型路由器,根据输入模式分发给不同处理器:
// Bash 模式 → processBashCommand()
if (mode === 'bash') { ... }
// Slash command → processSlashCommand()
if (inputString !== null && !effectiveSkipSlash && inputString.startsWith('/')) {
const { processSlashCommand } = await import('./processSlashCommand.js')
const slashResult = await processSlashCommand(inputString, ...)
return slashResult
}
// 普通文本 → processTextPrompt()
// ...
/commit以/开头,自然命中slash command分支。
第4层:processSlashCommand() — 命令解析与分发
详细代码位置:processSlashCommand.tsx:309
这是整条链路中最关键的分发层。
Step 4.1:解析命令名
const parsed = parseSlashCommand(inputString)
// 如果输入的是 /commit fix: 修复bug
// 那么经过 parseSlashCommand 函数转化成: { commandName: 'commit', args: 'fix: 修复bug', isMcp: false }
parseSlashCommand函数的解析规则:去掉/前缀,第一个空格前为命令名,同时支持MCP命令格式(/mcp:tool (MCP) args)。
Step 4.2:查找命令注册表
if (!hasCommand(commandName, context.options.commands)) {
// 命令不存在 → 判断是文件路径还是未知命令
if (looksLikeCommand(commandName) && !isFilePath) {
return { messages: [...], shouldQuery: false, resultText: 'Unknown skill: xxx' }
}
// 可能是文件路径(如 /var/log)→ 当普通文本发给模型
return { messages: [...], shouldQuery: true }
}
Step 4.3:按type分发
Claude Code有三种命令类型,不同的命令执行不同动作:
| type | 行为 | 示例 |
|---|---|---|
| prompt | 展开为文本,发送给AI模型 | /commit, skill 类命令 |
| local | 本地执行,返回文本结果 | /compact |
| local-jsx | 渲染交互式UI组件 | /config, /model |
对于/skill-name(type = prompt),进入getMessagesForPromptSlashCommand()。
第5层:getMessagesForPromptSlashCommand() — 技能内容加载
processSlashCommand.tsx:827
这是Skill的核心——将SKILL.md的内容加载为prompt。
Step 5.1:检查context === 'fork'
if (command.context === 'fork') {
return await executeForkedSlashCommand(...)
// 在独立子 agent 中执行,有自己的上下文和 token 预算, 默认不是 fork
}
Step 5.2:加载技能内容
const result = await command.getPromptForCommand(args, context)
getPromptForCommand在技能注册时定义(loadSkillsDir.ts:344),它做了以下事情:
- 变量替换:将
$ARGUMENTS、${CLAUDE_SKILL_DIR}、${CLAUDE_SESSION_ID}替换为实际值; - Shell执行:如果SKILL.md中有
!command格式的shell注入,会先执行; - 返回ContentBlockParam[]:包含最终展开后的文本内容。
Step 5.3:构造消息列表
const messages = [
createUserMessage({ content: metadata }), // 命令元数据:名称、参数
createUserMessage({ content: skillContent, isMeta: true }), // SKILL.md 内容(对用户隐藏)
...attachmentMessages, // 附件消息
createAttachmentMessage({ // 权限声明:allowedTools
type: 'command_permissions',
allowedTools: additionalAllowedTools,
}),
]
return {
messages,
shouldQuery: true, // ← 关键:告诉上层需要调用 AI 模型
allowedTools: additionalAllowedTools,
model: command.model,
effort: command.effort,
command,
}
第6层:onQuery() — 发送给AI
详细代码位置:handlePromptSubmit.ts:560
await onQuery(
newMessages, // 包含 skill 内容的消息列表
abortController,
shouldQuery, // true → 需要调用模型
allowedTools ?? [], // skill 声明的额外工具权限
model ?? mainLoopModel,
onBeforeQuery,
primaryInput,
effort,
)
onQuery将这些消息追加到对话历史,然后调用Claude API。此时SKILL.md的全部内容作为一条user message发送给模型,模型根据技能指令执行相应操作。
不成熟的思考
一、Skill 在解决什么问题?
LLM目前的三个缺陷,构成了Skill系统存在的全部理由:
| 缺陷 | 本质 | Skill 的对抗手段 |
|---|---|---|
| 输出不一致性 | 同一输入产生不同输出 | Prompt 模板 + 参数化注入 → 固定行为边界 |
| 结构漂移 | 长对话中偏离初始意图 | Frontmatter 约束 + hooks 校验 → 结构护栏 |
| 瞎猜问题 | 缺乏上下文时产生幻觉 | when_to_use + paths 条件激活 → 精确触发域 |
但这只是表层观察。深层的问题是:为什么Prompt模板能收敛概率模型?
答案在代码里。看createSkillCommand的getPromptForCommand闭包:
async getPromptForCommand(args, toolUseContext) {
let finalContent = baseDir
? `Base directory for this skill: ${baseDir}\n\n${markdownContent}`
: markdownContent
finalContent = substituteArguments(finalContent, args, true, argumentNames)
finalContent = finalContent.replace(/${CLAUDE_SKILL_DIR}/g, skillDir)
finalContent = finalContent.replace(/${CLAUDE_SESSION_ID}/g, getSessionId())
finalContent = await executeShellCommandsInPrompt(finalContent, ...)
return [{ type: 'text', text: finalContent }]
}
这不是简单的"给LLM一个模板"。这是一套编译管线——把声明式的Markdown编译成确定性的运行时上下文。每一层转换都在缩小LLM的决策空间:
- Base directory注入:锚定文件系统上下文,消除路径猜测;
- 参数替换:将用户输入映射到预定义槽位,限制输入域;
- 环境变量注入:运行时状态确定性绑定;
- Shell命令执行:动态注入实时数据,避免LLM凭记忆猜测;
- 返回ContentBlockParam[]:结构化输出,消除格式不确定性。
所以,Skill的本质不是"模板",而是一个Prompt编译器——把高熵的人的意图,通过多层转换,编译成低熵的结构化指令。
二、它不是一个,而是三个系统
从代码中可以识别出三个正交的子系统,各有不同的设计目标和权衡:
2.1 声明层:SKILL.md 作为 DSL
SKILL.md不是Markdown文档,而是一个领域特定语言(DSL):
---
name: ... # 标识符
description: ... # 语义描述(用于模型路由)
when_to_use: ... # 触发条件(用于模型自主调用)
paths: ... # 文件路径守卫(用于条件激活)
allowed-tools: ... # 权限边界
model: ... # 计算资源分配
effort: ... # 推理深度控制
context: fork # 隔离级别
hooks: ... # 生命周期钩子
shell: ... # 执行环境
---
每一行frontmatter都在回答一个问题:这个Skill需要什么样的运行时保证?
| 字段 | 回答的问题 | 设计意图 |
|---|---|---|
paths | 何时激活? | 延迟加载,减少上下文污染 |
allowed-tools | 能做什么? | 最小权限原则 |
model | 用什么脑子? | 成本-质量权衡 |
effort | 想多深? | 推理预算控制 |
context: fork | 隔离吗? | 故障爆炸半径 |
hooks | 谁来校验? | 外部护栏注入 |
不过梳理时也发现一个问题:目前的DSL缺少一个depends_on或composes字段。Skill之间的组合目前只能通过SkillTool在Prompt层面隐式实现,没有声明式的依赖关系。这意味着Skill的组合是"调用时发现"而非"设计时保证"。当然,如果设计了depends_on,也可能变成类似node_modules那样可怕的依赖地狱。而且从Skills开放以来,各种带"毒"的Skills层出不穷,如果加上依赖,这些"毒"会藏得更深。
2.2 编译层:getPromptForCommand 作为编译管线
延迟编译是一个精妙的设计。启动时只解析frontmatter(estimateSkillFrontmatterTokens只估算元信息的token),正文编译推迟到调用时。这意味着:
- 启动速度不受Skill内容大小影响;
- Shell命令每次调用获取最新结果(而非启动时的快照);
- 代价是每次调用的首次延迟(需执行编译管线)。
这是经典的延迟求值(Lazy Evaluation)策略在Prompt工程中的应用,很有意思——pi在pi-mono中也用了同样的设计。
2.3 运行时层:Command 对象作为运行时表示
createSkillCommand返回的Command对象是一个闭包——捕获了markdownContent和所有frontmatter字段,但不执行任何计算。直到getPromptForCommand被调用时,编译管线才启动。
这个设计有一个重要的推论:Skill的内容在内存中只有一份拷贝(闭包捕获引用),但每次调用会产生新的编译结果。这意味着:
- 内存效率:N个Skill只占用N份Markdown的空间;
- CPU效率:只有被调用的Skill才消耗编译时间;
- 一致性代价:同一个Skill的两次调用,如果中间Shell命令结果变了,输出会不同(这个可以测试一下,挺有意思的)。
三、Skill 系统解决不了什么?
3.1 组合爆炸问题
当前Skill的组合是隐式的——一个Skill可以通过SkillTool调用另一个Skill,但:
- 没有声明式的组合关系(
A composes B, C); - 没有组合后的token预算管理;
- 没有组合冲突检测(两个Skill对同一文件给出矛盾指令);
- 没有DAG调度(Skill A的输出作为Skill B的输入)。
如果引入声明式组合,Skill系统会从一个"Prompt模板库"进化为一个"Prompt计算图"。每个Skill是一个节点,composes定义边,运行时按拓扑序执行,每层的输出作为下一层的输入。这能解决:
- Token预算:DAG调度可以精确计算每层预算;
- 冲突检测:编译期静态分析DAG的输出冲突;
- 可观测性:每层的输入输出可独立审查。
但复杂度也随之上升,孰好孰坏,还是要看这个痛点对用户来说是否足够痛。
3.2 验证闭环缺失
从代码看,Skill的执行路径是单向的:
SKILL.md → parseFrontmatter → createSkillCommand → getPromptForCommand → LLM → 输出
没有反馈回路。如果LLM的输出偏离了Skill的预期,系统无法:
- 自动检测偏离;
- 回退到上一个检查点;
- 动态调整Prompt参数。
hooks是一个部分解决方案——PostToolUse可以校验工具调用的输出,但它只能拦截工具调用,不能拦截LLM的纯文本输出。
理想的结构是:
SKILL.md → 编译 → 执行 → 校验 → { 通过 → 输出 | 失败 → 回退 + 重新编译 }
这需要为Skill引入output_schema或validation字段,定义期望的输出结构。否则,我们写Skill没法写用例去测试,都只能边写边调,结果也没法量化。
3.3 版本和演进问题
Frontmatter有version字段,但代码中并不用它做任何版本控制逻辑。它只是一个标签。
当Skill A依赖Skill B的v1行为,而B升级到v2时,没有机制保证兼容性。这在团队协作中尤其危险——一个人的Skill升级可能悄悄破坏另一个人的工作流。
四、从产研流程视角重新审视 Skill
4.1 当前的现实
Skill目前自动化的都是原子操作:/commit、/review、/test等。这些是产研流程中的"叶节点"——它们不依赖其他操作的输出。
需求 → 技术方案 → 编码 → 测试 → 上线
│ │ │ │ │
│ │ ├─/commit ├─/deploy
│ │ ├─/review │
│ │ └─/test │
│ │ │
└─────────────── 尚未有 Skill 介入 ─┘
4.2 Skill 能覆盖的范围(理论最大值)
如果把产研流程的每个阶段映射到Skill的能力:
| 阶段 | 当前状态 | Skill 理论上能做的 | 需要的额外基础设施 |
|---|---|---|---|
| 需求分析 | 无 | 从PRD提取关键需求,识别模糊点,生成问题清单 | 需求文档的结构化输入 |
| 技术方案 | 趋势(/ultraplan等) | 架构建议、依赖分析、风险评估、方案对比 | 项目依赖图、历史方案库 |
| 编码 | /commit, /review, TDD skill | 按方案自动编码、增量校验 | 方案到代码的映射规则 |
| 测试 | 部分覆盖 | 自动生成测试、覆盖率分析、边界探测 | 测试策略模板、覆盖率基础设施 |
| 上线 | 无 | 变更影响分析、回滚方案、灰度策略 | CI/CD 集成、部署配置 |
所以在Skills上的探索,可以以各个节点为基准点,通过领域内的专家编写Skills,然后通过自动化或人工的方式,走通整个产研流程。
4.3 关键约束:Skill 不等于自动化
正如上面产研覆盖范围的分析,用Skills嵌入产研流程时,一定要放弃惯性思维——整个过程可能并不一定是提效,而是更好地提高整个研发的质量。更深入一点说,Skill的核心价值不在于自动化(用机器替代人),而在于与AI交互的标准化——让不同的人产出相同质量的工作。
标准化带来的是:
- 降低随机性:没有Skill时,代码审查质量取决于审查者的经验和状态;有Skill时,审查流程由Skill保证最低质量;
- 知识传递:高级工程师的方法论可以编码为Skill,而非仅存在于他们的脑子里;
- 可审计性:Skill的执行路径是确定性的,可以回溯和审查。
但这有一个隐含假设:Skill编写者的方法论是正确的。如果方法论本身有缺陷,Skill会以工业化的速度传播这个缺陷。所以,归根结底,不在于要不要AI贯穿整个产研流程,也不在于要不要使用Skill,而在于团队或编写Skill的人的方法论是正确的、适合团队和个人的——否则方向会越走越偏。




