开源Skill精简指南:顶级开发者教你高效优化技能库
Skill描述写得像本书?这事儿,连“龙虾之父”Peter都看不下去了。
他直接在社区喊话:各位,别把Skill描述写得像本书一样,什么乱七八糟的都往上下文里塞。
为了解决这个普遍问题,他干脆写了个给所有Skill做“体检”的专用Skill,并且开源了出来。
这个观点迅速在评论区引发了共鸣。有开发者提到,自己写了个90多词的描述,Agent反而不会调用技能了;把描述砍到40词以内,Agent一次就选对了。看来,问题比想象中更普遍。
那么,你的Skill库是不是也该做一次彻底的“体检”了?
给Skill来一次大扫除:思路与工具
Skill提示词冗长,表面是文案问题,实际影响的却是真金白银的运行成本。多加一句描述,Agent每次调用就要多付一笔token账单。更关键的是,Agent看到的信息越多,决策时的“噪声”也越多,直接影响响应速度、准确性和注意力分配。
Peter的核心主张很明确:Skill描述应该像路标。它的唯一目的是让Agent快速、准确地“找到路”,而不是把整本道路说明书都挂在上面。他开源的“skill-cleaner”就是这个理念的完美示范。
来看看这个示范:它的Skill.md提示词文件只有区区56行,清晰简洁。
而真正实现复杂功能的调用脚本,却有近千行代码。这正好印证了那个比喻:Skill.md是路标,背后庞大的代码库才是真正的说明书。
这个“体检”工具主要提供五大核心功能:
1. 技能提示词预算审计
计算技能占用的上下文令牌空间,分析预算占用比例,并给出优化方案,从根本上避免技能占用过多关键资源。
2. 重复技能检测
跨Codex内置库、插件缓存、代码库及个人技能根目录进行全面扫描,标记出同名或描述/内容高度相似的冗余技能。
3. 未使用技能筛查
基于历史运行日志,识别那些长期未被调用、提及或留下任何使用痕迹的“僵尸技能”,提供清晰的清理候选清单。
4. 技能根目录审计
统计所有技能的来源根目录,清晰标注其启用或禁用状态,帮你梳理混乱的技能加载链路。
5. 描述精简优化
自动找出冗长的技能描述,并通过简化语法、替换标准化词组等方式推荐压缩方案,直接节省提示词预算。
运行一次测试,你大概会得到这样一份全面的审计报告:
整个工具的工作流程设计得非常清晰,分为三步:
第一步,执行分析。在技能目录或仓库根目录运行提供的Node.js脚本,支持自定义时间范围、日志深度、预算阈值等参数。
第二步,查看报告。按顺序阅读核心审计报告:从技能预算分析开始,接着是描述优化建议、重复技能列表、未使用技能标记,最后是根目录汇总。
第三步,安全清理。遵循安全优先原则:优先保留Codex内置技能,删除本地重复副本;保留仓库核心运维技能;对于未确认的无关目录,在修改前会验证文件有效性,避免误删。
脚本里还有一些值得品味的细节。例如,它采用了与Codex官方源码同款的提示词预算核算逻辑。它会优先读取本地模型缓存配置来获取上下文窗口参数(例如GPT-5.5默认的272k token),并严格遵循Codex的计费规则进行核算。
工具以模型上下文的2%作为默认的技能预算基数,结合技能优先级规则(系统技能 > 内置技能 > 插件技能 > 仓库自定义技能),核算全部技能的令牌占用情况。它甚至能模拟真实运行场景,计算预算不足时的描述截断字符数和被省略的技能数量,精准输出预算使用率、剩余预算等核心指标,让你对技能体系的资源负载一目了然。
具体到精简Skill描述,其操作也分为三步:
- 文本预处理:统一格式,全部转为小写,剔除标点符号等干扰项。
- 场景识别:利用内置的预设场景关键词库,自动识别技能所属的业务领域。
- 描述替换:匹配到场景后,调用预设的标准化短动作词组替换原有的冗长描述。
例如:
调试类 → debug, inspect, fix
部署发布类 → deploy, release, verify
检索归档类 → search, sync, summarize
优化后的效果立竿见影,描述变得极其精炼:
更有趣的是,Peter本人在帖子评论区也彻底贯彻了这种“极简风”,开始用类似“xue居人”风格的短句交流:
这真是把“省token”的理念刻进骨子里了。安装技能,Agent变聪明,用户更开心——效率提升,就是这么直接。






