技能自我改进循环:高效构建与持续优化指南

2026-06-20阅读 0热度 0
ai 人工智能

通过「内循环+外循环」双轨架构,AI Agent能够自主迭代技能,形成持续优化的自反馈闭环。

核心要点:

  1. 自我改进循环的核心理念与双循环结构设计
  2. 内循环执行任务、外循环审查反馈的具体运作流程
  3. 基于GitHub Actions与云端Agent的实战部署案例
自我改进循环流程示意:内循环处理新问题归类,外循环依据反馈迭代技能资产

导读

近期「循环(loop)」驱动Agent的讨论热度很高,但一个关键追问随之而来——「循环」到底指什么?

无法代表所有使用该术语的观点,但可以展示一套具体实践:借助Skills和云端Agent构建一种极具实用价值的循环——自我改进循环

其核心在于:Agent能够根据外部反馈,持续提升自身Skills的质量。下文的例子引入了一个人工审查环节,但如果评估标准明确且无需人工介入,完全可以用自动化评分器(automated grader)替代。

为了更具体,假设这个Skill负责Issue分诊(issue triage),将收到的Issue划分为三类:可实施(ready-to-implement)、重复(duplicate)、需补充信息(needs-info)。同样的方法也可复用到代码审查Skill、Bug修复Skill、事件响应Skill等场景。

Triage Issue技能文档——包含技能描述、版本号与操作步骤

需要搭建以下两个循环:

内循环(inner agent loop):这是Skill实际投入使用的环节。对于Issue分诊,可以手动触发,但更常见的做法是集成到任务追踪器中,每次新建Issue时自动调用该Skill。每次与Skill的交互记录都会被持久化——写入文件、Agent执行日志,或是Slack、GitHub等外部系统的交互历史。

外循环(outer agent loop):这是一个按计划运行的Agent,负责监控内循环中Skill的使用情况。针对Issue分诊器,通常会部署一个云端Agent,定期拉取每条分诊Agent的执行记录。它的核心职责是审查内循环Agent的所有运行记录,并根据这些表现数据调整Skill。由于Skills本质上是文件,这意味着外循环Agent需要基于历史运行中的用户反馈生成一个diff,从而改进Skill。

接下来用Warp和Oz(Warp的云端Agent平台)来演示具体实现,当然也有多种其他可行方案。这里选用GitHub Issues作为Issue追踪器。示例仓库中包含了可直接操作的Skills和GitHub Workflows。

第一步:搭建内循环

内循环通过一个GitHub Action来实现,每次创建新Issue时自动触发。

GitHub Actions工作流配置文件,用于新建Issue时触发分类
GitHub Actions机器人将Issue标记为ready-to-implement并请求用户反馈

该GitHub Action通过Oz(Warp的云端Agent平台)调用一个云端Agent。云端Agent会同步仓库、从GitHub拉取Issue内容,然后尝试对其进行分类。具体的配置代码位于下方链接的仓库中。

现在,每次有新Issue进入,云端Agent就会执行内循环的分诊Skill,并打上标签,表明有一个新的功能请求已具备实施条件。

第二步:搭建用于自我改进的外循环

假设人工审核者不认同Agent的分类结果。作为审核者,将Issue的标签从「可实施」改为「需补充信息」,并在讨论串中评论分类错误的原因——例如,该新功能是否需要添加设置项尚存歧义。

这正是外循环的亮点所在。外循环Agent每天运行一次,检查所有已完成分诊的Issue。运行时,它会发现人工调整了标签并附带了原因说明。

人工审核者评论:是否需要添加设置项以及模糊情况的处理方式
Improve Triage Skill技能文档——介绍如何改进问题分类技能的步骤

由于外循环Agent的Skill本身也是通过编程Agent运行的,它会根据收到的反馈生成一个diff,从而更新分诊Skill的内容。

代码编辑界面展示triage-issue技能从v1到v2的修改差异

一旦这个diff被合并入库,它便会反馈到驱动内循环Agent的Skill中。下一次Agent运行时,Skill的表现自然会提升。

内循环与外循环完整流程图:从新问题到技能更新的闭环

非常期待知道这种做法是否对你有帮助。我们正用自我改进循环来管理Warp的开源仓库,并将背后的框架提炼出来供他人采用。早期版本已经发布。

免责声明

本网站新闻资讯均来自公开渠道,力求准确但不保证绝对无误,内容观点仅代表作者本人,与本站无关。若涉及侵权,请联系我们处理。本站保留对声明的修改权,最终解释权归本站所有。

相关阅读

更多
欢迎回来 登录或注册后,可保存提示词和历史记录
登录后可同步收藏、历史记录和常用模板
注册即表示同意服务条款与隐私政策