OpenAI Codex自我蒸馏实战指南:三步自动化消除重复代码任务

2026-05-26阅读 0热度 0
OpenAI

最近,Codex团队内部的一位程序员,直接把自己日常使用的“效率秘籍”给公开了。这个秘籍的核心,就是让Codex自己审视你的工作习惯,实现“自我蒸馏”。

操作简单到不可思议:你只需要把一段特定的提示词,复制粘贴进Codex的对话框。

接下来,Codex就会主动去翻看你近期的历史会话记录,从中找出那些你一直在手动重复的操作。然后,它会像一个贴心的助手,帮你把这些重复性的工作流打包、封装成可以直接复用的工具或技能。

这位名叫Vaibha v Srivasta v(下文简称VB)的Codex成员相当慷慨。在第一条推文发布后,他迅速收集了网友的反馈,当天就迭代出了一个功能更强的2.0版本。

这效率,不得不让人感叹内部人员的行动力。更引人注目的是,OpenAI的总裁Greg Brockman也亲自转发了这条推文并点赞。

有意思的是,Brockman在转发时还附带了一条冷知识:Codex是开源的。这似乎也在暗示,社区完全可以基于这个思路进行更多的探索和创造。

Codex自我蒸馏,怎么做到的?

我们来仔细拆解一下VB发布的这两个版本提示词,看看它们是如何一步步进化的。

第一版的提示词非常精炼,只有9行:

看看我最近的会话,找出重复的工作流或重复的请求。

对于我一直在手动做的事,给我建议:

如果是可复用工作流,创建一个skill;2. 如果是有边界的角色或调查任务,创建一个custom subagent。

重点关注CI失败、PR审查、changelog、文档更新、发版准备、调试、测试分诊这类实际工作。

只创建有用的,保持简洁。

它的逻辑很直接:让Codex扫描最近的会话历史,识别出重复操作,然后根据任务性质给出建议——可重复的工作流就打包成Skill(技能),有明确边界的调查任务则建议创建Custom Subagent(自定义子智能体)。

不过,这个初版提示词里提到的“CI失败”、“PR审查”等术语,让它看起来更像是一份为程序员量身定制的效率工具。果然,推文发布后,评论区涌入了大量反馈,希望它能覆盖更广泛的使用场景。

VB的反应很快,当天就发布了第二版。这一版可谓是大升级,数据源和覆盖范围都得到了显著扩展,提示词也从9行增加到了35行。

为了方便理解,这里附上中文核心指令:

  • 数据源更广:从“最近会话”扩展到过去30天的记录,并优先使用Codex会话、任务摘要、Memories(记忆)和汇总记录来发现跨会话的重复模式。如果用户开启了Chronicle(编年史)功能,它甚至能发现Codex之外的重复工作。
  • 覆盖范围更全:不再局限于编码,而是将写作、调研、规划、沟通、运营、分析乃至个人事务都纳入考察范围。
  • 判断逻辑更严谨:设定了明确的打包条件,比如任务至少发生过两次,或者重做代价很高;需要有稳定的输入、可重复的流程和明确的输出;能实质提升速度、质量或可靠性;且现有工具尚未覆盖。
  • 输出结果更智能:它会先输出一个候选清单,然后对高置信度的项目直接动手创建,最后清晰地汇报创建了什么、跳过了什么、以及哪些还需要更多证据。

最终,它会将识别出的工作流打包成四种形式:固定流程做成Skill,专门调查任务派给Subagent,定时检查类任务做成Automation(自动化),而那些只发生一次或边界模糊的,则直接跳过(Skip)。

评论区的反应相当热烈。有网友当场提议:“把它做成一个叫‘/dream’的插件,然后给我版税。” VB本人也在回复中承认,做成正式插件是个好主意,只是对“dream”这个名字不太感冒。

当然,也有质疑的声音。最现实的顾虑就是成本:回看30天的历史记录,这得消耗多少token?这确实是所有用户都会关心的问题。VB没有直接回应,或许作为内部人员,在资源方面有更多保障。不过,考虑到OpenAI近期一直在积极调整Codex的速率限制,感兴趣的用户不妨大胆尝试一下。

还有用户分享了实践中的“踩坑”经验:他发现Codex自动生成的Skill中,有一半是基于“在输入格式还未稳定时就重复了两次”的任务。结果,后期维护这些抽象工具的成本,比直接重做还要高。这就引出了一个更深层的问题:到底该完全信任AI的判断,还是需要人工进行最终把关?

它依赖哪些Codex新功能

细看这条提示词就会发现,它的强大并非无源之水,而是深度依赖了Codex近两个月密集推出的几项新功能。

最晚登场的是Chronicle(编年史),于4月20日上线,目前仍处于预览阶段。

它的作用类似于屏幕活动记录器。开启后,Codex可以“看到”你在浏览器、Slack、邮件等应用中的操作,从而发现更广泛的、发生在Codex之外的重复性工作。不过需要注意,该功能目前仅对macOS上的ChatGPT Pro订阅用户开放,且记录未加密存储在本地,可能会快速消耗API调用限额,并存在一定的提示词注入风险。

Memory(记忆)功能则随4月16日的大更新一同推出。它允许Codex记住用户的偏好、修正记录和特定项目的知识,并在未来的会话中自动调用这些信息,让AI助手更了解你的上下文和工作习惯。

更早一些,在3月份正式上线的Subagent(子智能体)功能,为复杂任务分解提供了基础设施。它通过一个管理智能体来协调多个专注于特定领域(如编码)的子智能体,每个子智能体在独立的云端沙盒中运行,适合处理需要多步骤协作的任务。

VB,一个爱整活的OpenAI员工

最后,不妨认识一下这位“秘籍”的发布者——Vaibha v Srivasta v,他本人的经历也很有意思。

他是OpenAI Codex团队的成员,此前曾在HuggingFace担任机器学习开发者布道师和开发者体验与社区负责人。可以说,他是目前Codex生态中最活跃的内容创作者和实践者之一。

翻看他的社交账号,几乎就是一部使用Codex处理各种事务的“生活实录”。就在最近,他还在尝试用Codex配置树莓派,以实现设备接入家庭WiFi后的远程访问。

更早一些,在5月22日,他宣称自己“已经超过一个月没有打开过IDE了”,仅靠Codex就足以完成所有开发工作,并兴奋地表示“一个 App统治一切!”

这堪称是Codex的“头号粉丝”了。除了这条自我蒸馏提示词,从他的分享中,还能挖掘出不少Codex的有趣玩法。

例如,他详细演示过Codex的/goal 命令。这个功能的思路是,你只需要给Codex定义一个最终的“完成状态”,告诉它成功是什么样子,它就会自主规划步骤并持续运行,直到达成目标。

其背后有一个验证机制,在每一步完成后判断目标是否达成,若未达成,则主模型继续执行下一步。这个功能特别适合代码库大规模重构、长期数据迁移实验,或者那些理论上只要不停就能做完的开放性任务。该功能自Codex 0.128.0版本起,可通过 /goal 命令触发。

从这些分享可以看出,Codex正在从一个被动的问答工具,向一个能理解上下文、记忆习惯、并主动优化工作流的智能伙伴演进。而像VB这样的深度用户,正在通过他们的实践,为所有人探索着人机协作的新边界。

参考链接:

[1]https://x.com/reach_vb/status/2058538305872949490

[2]https://x.com/reach_vb/status/2052805243268718803

免责声明

本网站新闻资讯均来自公开渠道,力求准确但不保证绝对无误,内容观点仅代表作者本人,与本站无关。若涉及侵权,请联系我们处理。本站保留对声明的修改权,最终解释权归本站所有。

相关阅读

更多
欢迎回来 登录或注册后,可保存提示词和历史记录
登录后可同步收藏、历史记录和常用模板
注册即表示同意服务条款与隐私政策