顶尖CEO效率指南:省时比省Token更重要的生产力法则
“一个决定性的问题是:你掌控自己的工具,还是你的工具掌控你?”Y Combinator CEO Gary Tan的这句发问,直指AI时代生产力变革的本质。过去几个月,他亲自实践,利用Claude Code和OpenClaw等工具编写了数十万行代码,并提出了一个颠覆性的“Token Maxing”理念。他断言,我们正处在“个人AI革命”的爆发前夜。这篇编译自Y Combinator博客的深度访谈,完整揭示了他如何从“13年不写代码”的状态,转型构建出一套宣称能实现“400倍效率”的AI驱动工作流。
重返编程:一个现实的效率解决方案
Gary Tan的“重返编程”,并非源于技术炫耀,而是为了解决一个具体的公共议题。长期关注加州公共事务的他,对教育系统的问题深感忧虑——例如,旧金山公立学校七八年级的学生竟难以正常学习代数。这对一位出身东湾公校、凭借扎实的早期数学教育进入斯坦福并成为工程师的人来说,不仅是教育争议,更是一种切身的系统不公。为了凝聚共识、推动公共讨论,他创建了Gary‘s List。
然而,Gary‘s List绝非传统博客。它表面是内容发布平台,内核却是一套自动化知识生产系统:不仅能发布文章,更能自动抓取网络信息、进行深度资料检索、整合社交媒体线索、执行交叉验证,最终生成具备调查性质的报道。在他看来,过去需要人类研究员耗费数周完成的知识密集型劳动,如今已被压缩至数美元级别的模型调用成本。
这里的核心洞察在于,AI写作的价值远超“辅助排版”或“创意激发”,它实现了对高强度知识工作核心环节——研究、整理、归纳、引用与比对——的直接系统化和软件化。软件,正从被动使用的工具,演变为高质量知识工作的主动执行引擎。
Token Maxing:优化时间,而非节省Token
访谈中,Gary Tan反复强调一个核心理念:Token Maxing。其核心目标并非“让模型更聪明”,而是将上下文、信息密度、验证流程和工作负载全面推向极限。传统研究模式下,人类受限于时间与精力,往往只能妥协:查阅少量文献,追踪有限线索,进行浅层比对。而智能体系统的根本性变革在于,它能执行“煮沸海洋”式的操作——不是查看1个信源,而是并行分析20个;不是简单总结,而是将相互矛盾的证据并置,驱动系统进行深度对比与逻辑推理。
当下,许多人仍以旧时代的成本框架审视新工具,将token视为需要严格控制的API开销。然而,如果一个核心任务原本需要你投入一周甚至一个月的时间,那么花费几百美元换取大规模并行研究、测试与执行能力,成本非但不高,反而极具性价比。他使用了一个典型的YC式类比:这就像创业者初到旧金山觉得房租昂贵,但真正的成本并非住在旧金山,而是不住在旧金山。对今天的构建者而言,真正的奢侈不是消耗token,而是未能将模型潜力用到极致,从而继续浪费自己最宝贵且不可再生的时间资产。
他的第二个关键项目GStack,正是这一理念的实践产物。它并非预先设计的完整产品,而是从一系列高频复用的提示词中自然演化而来。最初的场景很简单:在使用Claude Code时,他发现自己不断重复输入类似的指令序列——规划、评审、测试、人工确认。于是,他将这些高频操作流程整理进Apple Notes,逐渐沉淀为一组结构化的标准工作流,进而抽象为可复用的“技能”,最终形成一个系统化的框架,即GStack。
这个过程本身揭示了当前智能体工程的发展趋势:竞争焦点正从单一的提示词文案技巧,转向构建“可组合的认知流程”。Gary Tan特别指出,他后期愈发依赖的并非某句“魔法提示”,而是一整套严谨的工作顺序:先让模型绘制ASCII架构图,厘清数据流、状态机、依赖关系和错误路径;接着进行架构审查;然后是代码质量检查;补充测试用例;最后才进入代码执行阶段。
他分享了一个关键观察:许多人抱怨“氛围编程”产出的是“垃圾代码”,其根源并非模型能力不足,而是工程约束的缺失。尤其在AI编程时代,测试覆盖率变得空前重要。一旦代码生成速度远超人类审查速度,若没有扎实的单元测试、集成测试和端到端验证作为质量护栏,系统便会迅速从“高效”滑向“脆弱”。换言之,AI并未取消软件工程,而是将其重心从“手写实现”转移到了“流程设计、质量管控与系统验证”。
架构哲学:薄Harness,胖Skills
Gary Tan用“薄Harness,胖Skills”来概括智能体时代的工程架构思想。
所谓“Harness”,可理解为最底层的执行循环:接收用户输入、调用模型、触发工具、执行命令、返回结果。Claude Code、OpenClaw这类系统,本质上都是一种Harness。他的判断是,这一基础设施层无需每个团队重复构建,真正的竞争力和精力应投入在上层的“Skills”——即如何将任务流程、领域经验、决策策略、质量标准和审查机制,用自然语言和结构化文档清晰地定义与表达出来。
这也解释了他为何坚持“Markdown也是代码”。在智能体时代,大量过去需要硬编码的业务逻辑与判断规则,其实更适合写在Markdown文档中:例如,如何分解复杂任务、定义完成标准、评估十倍价值机会、在QA前进行风险检查、从CEO、设计师或开发者体验负责人的不同视角审视同一功能。用传统代码编写这些逻辑会异常僵化且难以维护,但写入技能文档,模型反而能更灵活地理解意图、处理边界案例、覆盖复杂场景。
这意味着软件开发正在形成新的分层:确定性高、可验证、必须稳定执行的动作,仍应写在传统代码里;而大量高层的策略逻辑、模糊决策和流程经验,则越来越适合沉淀在“可被模型理解与执行的文本协议”中。人类工程师的核心工作,正从组织函数和类,转向定义与维护“潜在空间”与“确定性代码”之间的清晰边界。
OpenClaw:一辆需要自己维修的法拉利
Gary Tan将使用OpenClaw比作驾驶一辆法拉利:性能惊人,体验震撼,其强大能力常超乎想象;但同时,它也像一辆你必须自己会修的法拉利——会在最关键的时刻抛锚,迫使你掀开发动机盖,拿起扳手亲自调试。这个比喻背后,包含了两层深刻的行业判断。
第一,能力上限已足够惊艳。 OpenClaw所代表的远非简单的代码补全,它更接近一个能独立探索、调用工具、跨任务完成复杂工作的自主智能体。对于熟悉Claude Code的用户而言,这意味着一大步跨越:从“我问你答,我来复制粘贴”的交互模式,迈向“系统自动规划、执行、修复并串联多个步骤”的自动化工作流。
第二,工程成熟度远未完成。 当前的OpenClaw虽然强大,但依然脆弱、耗费大量上下文、容易出错,需要人类持续介入进行修复与引导。Gary Tan提到,很多时候甚至是另一个智能体(比如Claude Code)在帮他调试和修复OpenClaw本身。也就是说,今天的智能体体系已进入一种颇具早期PC时代风格的“发烧友”状态:它并非打磨完毕的消费级产品,而更像一套“手工组装的赛车”,一个由技术先驱者亲手搭建、能够真正跑起来、但也需要随时维护与调校的系统。
正因如此,他将当下类比为“家酿计算机俱乐部”的关键时刻:人们已经清晰窥见未来的轮廓,但未来尚未被封装到人人皆可无门槛使用的成熟产品形态。
编程的基本单位正在重构
Gary Tan还专门回应了一个在社交媒体上引发争议的话题:几个月写出几十万行代码,究竟意味着什么? 他承认,单纯用代码行数衡量程序员价值是片面的,但在智能体编程的语境下,这个指标也不应被全然否定。原因并非“代码行数越多越好”,而是今天生产力评估的基本单位已然改变:关键不是你独自在IDE前敲击了多少行,而是你能否有效调度多个智能体,让它们并行开发功能、修复漏洞、补充测试、运行质量保证,并将结果高效组织成可部署上线的完整系统。
他描述自己当前的工作方式,已很像一个微型软件组织的调度中心:不同窗口中排列着不同的代码分支和拉取请求,功能开发、测试执行、人工验收同步推进。对人类而言,瓶颈不再是“能不能写”,而是“能否准确规划、及时检查、快速判断”。在这个意义上,AI并非让程序员失业,而是将优秀程序员的判断力与架构能力,放大为一个更高吞吐量的生产系统。因此,更值得关注的不是“模型替代人写了多少”,而是人类的战略能动性被放大了多少。如果你具备清晰的判断力、良好的工程品味和明确的目标,今天的工具就如同为你插上翅膀;如果没有,再强大的智能体也只能生成一堆你无法真正理解、掌控与负责的代码产物。
核心分水岭:个人AI,还是平台AI?
讨论从“如何写代码”进一步延伸至一个更宏大的命题:个人AI的所有权与控制权问题。Gary Tan预测,明年此时,几乎每个人都会拥有自己的个人AI助手。但关键在于,这将呈现为何种形态?它可能是用户自己掌握提示词、完全控制数据、管理集成接口、清晰知晓系统在做什么的“个人主权工具”;也可能是一个由平台托管、算法黑箱、商业动机不透明、如同社交媒体信息流般被公司控制的“伪个人AI”。
在他看来,这正是当下最值得警惕的技术分水岭。许多人将AI视为一个统一的产品类别来讨论,但未来的核心差异,很可能不在于模型的参数规模,而在于控制权的归属。你是自己编写提示词、定义工作流、决定智能体访问哪些数据;还是永远生活在某个产品经理或平台设计好的功能边界与推荐逻辑之内?
这也是为何Gary Tan如此强调构建者应尽早亲手深度使用这些底层工具。因为一旦你不亲自掌握它们,便只能使用他人包装好的、功能受限的成品;而一旦这场变革像当年的个人电脑革命一样真正扩散,控制权决定的将不仅是你做事的效率,更是你思考的自主性,乃至你理解与塑造现实世界的方式。
这场访谈虽聚焦于Gary Tan的个人项目,却也精准回应了创业者最现实的焦虑:这些工具是否太贵?是否不稳定?是否只有顶尖工程师才能驾驭?他的回答相当直接:这些问题目前都存在,但它们并非最核心的障碍。真正的问题是,你是否愿意承认,一种全新的、杠杆效应巨大的生产方式已然出现,并主动将自己的工作流向那种范式迁移。
今天的智能体编程,确实昂贵、脆弱、混乱,远未达到大众产品的成熟度;但它已经足够强大,强大到可以将一个人从“执行者”升级为“指挥者”,将原本需要一个团队数周完成的知识密集型任务,压缩到更短的时间周期内。许多人看到的是它的不稳定性,而Gary Tan看到的则是它带来的指数级杠杆。他说过最具冲击力的一句话,其实无关代码,而是关于时间的本质:人类无法凭空获得更多时间,但可以借用机器的时间。 一旦你接受这一点,就会理解为何token花费不应再被视为成本中心,而是一种对个人最稀缺资本——时间——的战略性投资行为。

