OpenAI Codex自我蒸馏实战指南：三步自动化消除重复代码任务

2026-05-26阅读 0热度 0

OpenAI

最近，Codex团队内部的一位程序员，直接把自己日常使用的“效率秘籍”给公开了。这个秘籍的核心，就是让Codex自己审视你的工作习惯，实现“自我蒸馏”。

操作简单到不可思议：你只需要把一段特定的提示词，复制粘贴进Codex的对话框。

接下来，Codex就会主动去翻看你近期的历史会话记录，从中找出那些你一直在手动重复的操作。然后，它会像一个贴心的助手，帮你把这些重复性的工作流打包、封装成可以直接复用的工具或技能。

这位名叫Vaibha v Srivasta v（下文简称VB）的Codex成员相当慷慨。在第一条推文发布后，他迅速收集了网友的反馈，当天就迭代出了一个功能更强的2.0版本。

这效率，不得不让人感叹内部人员的行动力。更引人注目的是，OpenAI的总裁Greg Brockman也亲自转发了这条推文并点赞。

有意思的是，Brockman在转发时还附带了一条冷知识：Codex是开源的。这似乎也在暗示，社区完全可以基于这个思路进行更多的探索和创造。

Codex自我蒸馏，怎么做到的？

我们来仔细拆解一下VB发布的这两个版本提示词，看看它们是如何一步步进化的。

第一版的提示词非常精炼，只有9行：

看看我最近的会话，找出重复的工作流或重复的请求。

对于我一直在手动做的事，给我建议：

如果是可复用工作流，创建一个skill；2. 如果是有边界的角色或调查任务，创建一个custom subagent。

重点关注CI失败、PR审查、changelog、文档更新、发版准备、调试、测试分诊这类实际工作。

只创建有用的，保持简洁。

它的逻辑很直接：让Codex扫描最近的会话历史，识别出重复操作，然后根据任务性质给出建议——可重复的工作流就打包成Skill（技能），有明确边界的调查任务则建议创建Custom Subagent（自定义子智能体）。

不过，这个初版提示词里提到的“CI失败”、“PR审查”等术语，让它看起来更像是一份为程序员量身定制的效率工具。果然，推文发布后，评论区涌入了大量反馈，希望它能覆盖更广泛的使用场景。

VB的反应很快，当天就发布了第二版。这一版可谓是大升级，数据源和覆盖范围都得到了显著扩展，提示词也从9行增加到了35行。

为了方便理解，这里附上中文核心指令：

数据源更广：从“最近会话”扩展到过去30天的记录，并优先使用Codex会话、任务摘要、Memories（记忆）和汇总记录来发现跨会话的重复模式。如果用户开启了Chronicle（编年史）功能，它甚至能发现Codex之外的重复工作。
覆盖范围更全：不再局限于编码，而是将写作、调研、规划、沟通、运营、分析乃至个人事务都纳入考察范围。
判断逻辑更严谨：设定了明确的打包条件，比如任务至少发生过两次，或者重做代价很高；需要有稳定的输入、可重复的流程和明确的输出；能实质提升速度、质量或可靠性；且现有工具尚未覆盖。
输出结果更智能：它会先输出一个候选清单，然后对高置信度的项目直接动手创建，最后清晰地汇报创建了什么、跳过了什么、以及哪些还需要更多证据。

最终，它会将识别出的工作流打包成四种形式：固定流程做成Skill，专门调查任务派给Subagent，定时检查类任务做成Automation（自动化），而那些只发生一次或边界模糊的，则直接跳过（Skip）。

评论区的反应相当热烈。有网友当场提议：“把它做成一个叫‘/dream’的插件，然后给我版税。” VB本人也在回复中承认，做成正式插件是个好主意，只是对“dream”这个名字不太感冒。

当然，也有质疑的声音。最现实的顾虑就是成本：回看30天的历史记录，这得消耗多少token？这确实是所有用户都会关心的问题。VB没有直接回应，或许作为内部人员，在资源方面有更多保障。不过，考虑到OpenAI近期一直在积极调整Codex的速率限制，感兴趣的用户不妨大胆尝试一下。

还有用户分享了实践中的“踩坑”经验：他发现Codex自动生成的Skill中，有一半是基于“在输入格式还未稳定时就重复了两次”的任务。结果，后期维护这些抽象工具的成本，比直接重做还要高。这就引出了一个更深层的问题：到底该完全信任AI的判断，还是需要人工进行最终把关？

它依赖哪些Codex新功能

细看这条提示词就会发现，它的强大并非无源之水，而是深度依赖了Codex近两个月密集推出的几项新功能。

最晚登场的是Chronicle（编年史），于4月20日上线，目前仍处于预览阶段。

它的作用类似于屏幕活动记录器。开启后，Codex可以“看到”你在浏览器、Slack、邮件等应用中的操作，从而发现更广泛的、发生在Codex之外的重复性工作。不过需要注意，该功能目前仅对macOS上的ChatGPT Pro订阅用户开放，且记录未加密存储在本地，可能会快速消耗API调用限额，并存在一定的提示词注入风险。

Memory（记忆）功能则随4月16日的大更新一同推出。它允许Codex记住用户的偏好、修正记录和特定项目的知识，并在未来的会话中自动调用这些信息，让AI助手更了解你的上下文和工作习惯。

更早一些，在3月份正式上线的Subagent（子智能体）功能，为复杂任务分解提供了基础设施。它通过一个管理智能体来协调多个专注于特定领域（如编码）的子智能体，每个子智能体在独立的云端沙盒中运行，适合处理需要多步骤协作的任务。

VB，一个爱整活的OpenAI员工

最后，不妨认识一下这位“秘籍”的发布者——Vaibha v Srivasta v，他本人的经历也很有意思。

他是OpenAI Codex团队的成员，此前曾在HuggingFace担任机器学习开发者布道师和开发者体验与社区负责人。可以说，他是目前Codex生态中最活跃的内容创作者和实践者之一。

翻看他的社交账号，几乎就是一部使用Codex处理各种事务的“生活实录”。就在最近，他还在尝试用Codex配置树莓派，以实现设备接入家庭WiFi后的远程访问。

更早一些，在5月22日，他宣称自己“已经超过一个月没有打开过IDE了”，仅靠Codex就足以完成所有开发工作，并兴奋地表示“一个 App统治一切！”

这堪称是Codex的“头号粉丝”了。除了这条自我蒸馏提示词，从他的分享中，还能挖掘出不少Codex的有趣玩法。

例如，他详细演示过Codex的/goal 命令。这个功能的思路是，你只需要给Codex定义一个最终的“完成状态”，告诉它成功是什么样子，它就会自主规划步骤并持续运行，直到达成目标。

其背后有一个验证机制，在每一步完成后判断目标是否达成，若未达成，则主模型继续执行下一步。这个功能特别适合代码库大规模重构、长期数据迁移实验，或者那些理论上只要不停就能做完的开放性任务。该功能自Codex 0.128.0版本起，可通过 /goal 命令触发。

从这些分享可以看出，Codex正在从一个被动的问答工具，向一个能理解上下文、记忆习惯、并主动优化工作流的智能伙伴演进。而像VB这样的深度用户，正在通过他们的实践，为所有人探索着人机协作的新边界。

参考链接：

[1]https://x.com/reach_vb/status/2058538305872949490

[2]https://x.com/reach_vb/status/2052805243268718803

OpenAI Codex自我蒸馏实战指南：三步自动化消除重复代码任务

Codex自我蒸馏，怎么做到的？

它依赖哪些Codex新功能

VB，一个爱整活的OpenAI员工

相关阅读

最新教程

最新资讯