GStack 26种专家角色深度测评:一人成军是否可行?
GStack 是什么?
先说说这个项目的背景。GStack 是由 Y Combinator 现任 CEO Garry Tan 亲自创建并维护的开源项目,目标很直接——把 Claude Code 从一个通用的 AI 助手,变成一支可以随时调用的专业开发团队。
Github 地址:github.com/garrytan/gs…
Stars 数:68.8k
定位:AI 驱动的「虚拟软件工厂」,不是提示词集合,而是完整工程流程
原理:把大模型拆成各司其职的专家角色,每个角色有固定职责、流程、输出
效果:单人开发效率 ≈20 人传统团队
实际数据是:有人用它在 60 天内写出了 60 万行生产代码(其中 35% 是测试代码),日均产出 1–2 万行。这个数字听起来有点夸张,但确实说明了这套方法的潜力。
为什么叫一人成军
GStack 特色
从几个维度来看它的设计思路:
- 角色覆盖度:26 个技能对应 26 个不同专业角色,从 CEO、设计师、工程师到 QA、安全官、技术文档,覆盖完整的产品团队
- 流程闭环:从需求探索(
/office-hours)→ 规划(plan-*)→ 设计 → 开发 → 测试 → 发布 → 复盘,形成完整闭环 - 决策分层:不是简单的自动化,而是模拟真实团队的决策流程(CEO 定方向、设计师控体验、工程师保质量)
- 多智能体协作:
/pair-agent甚至支持多个 AI 同时工作,真正实现"团队"协作
传统 AI 编码 vs GStack 的"一人成军"
对比之下,差异就非常明显了:
- 传统方式是一个通用助手,思维模式混杂;GStack 是 26 个专业角色,各司其职
- 传统方式靠提示词即兴发挥,质量不稳定;GStack 是结构化工作流,可重复、可预期
- 传统方式只是单点辅助(只写代码);GStack 是端到端覆盖(需求→设计→开发→测试→发布)
- 传统方式是个人的效率工具;GStack 模拟的是完整的创业团队
核心定位
说白了,GStack 的本质是一组基于 Claude Code 的角色化工作流——在项目里被称为"skills"。它的核心价值在于解决了传统 AI 编码工具中那个老毛病:思维模式混杂。每个命令对应一个特定的专业角色,让 AI 在特定任务中采用相应的认知模式,而不是一个声音干所有事。
需要特别强调的是,GStack 是一个过程,而不是工具的集合。技能的运行顺序就是冲刺的顺序:
Think → Plan → Build → Review → Test → Ship → Reflect
每个技能都会衔接下一个。/office-hours 会写一份设计文档,/plan-ceo-review 会阅读它。/plan-eng-review 编写测试计划,/QA 会接收它。/review 发现了 bug,/ship 验证已修复。没有任何遗漏,因为每一步都知道之前发生过什么。
安装 GStack
安装过程其实很简单,打开 Claude Code,输入以下命令即可自动安装:
git clone --single-branch --depth 1 https://github.com/garrytan/gstack.git ~/.claude/skills/gstack && cd ~/.claude/skills/gstack && ./setup
不过有个坑需要特别留意:安装过程中需要先安装 bun,我测试时发现 bun 经常安装失败。可以试着切换下网络再次安装,或者在别的命令行里单独安装 bun。装完后还得记得加到环境变量里才能生效。
安装完成后,在 ~/.claude/skills/gstack 目录下可以看到多个 skill。比如进入 office-hours 目录,里面有个 SKILL.md 文件,内容很长,定义了完整的角色行为。
主要功能
GStack 提供了 30+ 个斜杠命令(slash commands),覆盖从规划到发布的完整开发流程。每个命令都对应一个具体的专业角色和任务场景。
测试 GStack
office-hours 产品经理
这个技能类似 CEO/产品经理进行头脑风暴,对产品进行构思和需求梳理。它通过提问的方式,把模糊的需求转化为可执行的方案。
这个名字源自硅谷创业文化中的"办公室时间"——创始人或投资人每周固定开放的时间段,供创业者预约咨询、讨论想法。GStack 用这个名字,强调这是一个低门槛、对话式的入口,适合在正式规划前进行头脑风暴和需求梳理。
如果有一个模糊的产品想法却不知道如何开始,这个就是第一个应该运行的命令。在这个角色下,Claude 不会直接给答案,而是通过连续提问,帮你把模糊的想法转化为清晰、可执行的产品需求。
实际操作中,它会和用户对话,整理出多个草案供选择。选定草案后,再一步一步完善方案。
image-20260410204125744
plan-design-review 设计负责人
角色定位
设计负责人(Design Lead)是 GStack 规划阶段的关键角色之一,专注于从用户体验和视觉设计角度审查功能规划,确保产品不仅技术可行,而且易用、美观、符合设计规范。
主要职责
执行 /plan-design-review 命令时,会重点关注这些方面。比如它会先给一份设计文档打分,刚开始可能只有 3 分,然后通过不断修改,最终达到 10 分。
GStack 技术架构
技能系统:基于 Markdown 提示文件,通过 Claude Code 的自定义命令功能集成
浏览器自动化:基于 Playwright 构建持久化 Chromium 会话,支持 Cookie 导入和真实环境测试
多平台支持:除 Claude Code 外,还支持 OpenAI Codex CLI、Cursor、OpenCode 等 8 种 AI 编码工具
团队模式:支持全局安装和项目级安装,可配置自动更新,确保团队成员使用一致版本
GStack 适用人群
从官方文档来看,GStack 特别适合这几类人:
创始人和 CEO——尤其是希望亲自参与交付的技术型创始人
首次使用 Claude Code 的用户——提供结构化角色,而非空白提示
技术负责人和资深工程师——对每个 PR 进行严格审查、QA 和发布自动化
GStack 项目信息
GitHub 地址:github.com/garrytan/gs…
开源协议:MIT License
最新版本:截至 2026 年 3 月约为 v0.4.3
安装方式:30 秒快速安装,通过 Git 克隆到 Claude Code 的 skills 目录即可
GStack 的核心理念其实就一句话:通过结构化的角色分工和审查流程,将 AI 辅助开发从模糊的通用对话升级为专业的工程工作流,帮助个人开发者或小型团队实现"一人成军"的开发效率。
附录 GStack 角色定位
规划阶段
|命令|角色|功能|
|--- | --- | --- |
| /office-hours |CEO/产品经理|起始点。通过 6 个强制性问题,在写代码前重新定义产品。挑战你的前提假设,提出替代方案。输出的设计文档会流向所有下游技能。|
| /plan-ceo-review |首席执行官/创始人|重新思考问题,找到隐藏在需求中的"10 星产品"。四种模式:扩展、选择扩展、保持范围、缩减。|
| /plan-eng-review |工程经理|锁定架构、数据流、图表、边界情况和测试。将隐藏的假设暴露出来。|
| /plan-design-review |高级设计师|给每个设计维度打 0-10 分,解释 10 分是什么样的,然后修改计划以达到目标。AI 低质内容检测。交互式——每个设计选择只问一个用户问题。|
| /plan-devex-review |开发体验负责人|交互式 DX 评估:探索开发者画像,对比竞品的 TTHW(首次上手时间),设计你的"魔法时刻",逐步追踪摩擦点。三种模式:DX 扩展、DX 打磨、DX 分诊。20-45 个强制性问题。|
| /autoplan |评审流程|一个命令,生成完整审核过的计划。自动运行 CEO → 设计 → 工程评审,仅将品味相关的决策提交你批准。|
设计阶段
|命令|角色|功能|
|--- | --- | --- |
| /design-consultation |设计合作伙伴|从零构建完整的设计系统。研究市场环境,提出创意风险,生成逼真的产品模型。|
| /design-review |会写代码的设计师|执行与 /plan-design-review 相同的审核,然后修复发现的问题。原子提交,附带前后对比截图。|
| /design-shotgun |设计探索器|"给我看选项"。生成 4-6 个 AI 模型变体,在浏览器中打开对比板,收集反馈并迭代。品味记忆会学习你的偏好。重复直到满意,然后交给 /design-html。|
| /design-html |设计工程师|将模型转化为真正能用的生产级 HTML。预计算布局:文本重排、高度自适应、动态布局。30KB,零依赖。自动检测 React/Svelte/Vue。针对设计类型(落地页/仪表盘/表单)智能路由 API。输出可直接上线,不是演示稿。|
开发审查阶段
|命令|角色|功能|
|--- | --- | --- |
| /review |资深工程师|找出那些能通过 CI 但在生产环境爆炸的 bug。自动修复明显的问题。标记完整性缺口。|
| /investigate |调试器|系统化的根因调试。铁律:不调查就不修复。追踪数据流,验证假设,修复失败 3 次后停止。|
| /devex-review |DX 测试员|实时开发者体验审计。实际测试你的 onboarding:浏览文档,尝试入门流程,计时 TTHW,截图错误。与 /plan-devex-review 的评分对比——检验计划与现实的差距。|
测试与质量保证
|命令|角色|功能|
|--- | --- | --- |
| /qa |QA 负责人|测试应用,发现 bug,用原子提交修复,重新验证。为每个修复自动生成回归测试。|
| /qa-only |QA 记录员|与 /qa 方法相同,但只报告不修复。纯 bug 报告,不改动代码。|
| /browse |QA 工程师|给 AI 装上眼睛。真实的 Chromium 浏览器,真实的点击,真实的截图。每条约 100ms。/open-gstack-browser 启动带侧边栏、反机器人隐身和自动模型路由的 GStack 浏览器。|
| /setup-browser-cookies |会话管理器|从真实浏览器(Chrome/Arc/Bra ve/Edge)导入 Cookie 到无头会话。用于测试需要登录的页面。|
安全与合规
|命令|角色|功能|
|--- | --- | --- |
| /cso |首席安全官|OWASP Top 10 + STRIDE 威胁建模。零噪音:17 类误报排除,8/10+ 置信度门槛,独立发现验证。每个发现都包含具体的利用场景。|
发布与部署
|命令|角色|功能|
|--- | --- | --- |
| /ship |发布工程师|同步主分支,运行测试,审计覆盖率,推送,开启 PR。如果没有测试框架,自动初始化。|
| /land-and-deploy |发布工程师|合并 PR,等待 CI 和部署,验证生产环境健康。一个命令从"已批准"到"生产环境已验证"。|
| /canary |SRE|部署后监控循环。监控控制台错误、性能回退和页面故障。|
| /benchmark |性能工程师|基线化页面加载时间、Core Web Vitals 和资源大小。对比每个 PR 的前后表现。|
| /document-release |技术文档工程师|更新所有项目文档以匹配刚发布的版本。自动识别过时的 README。|
协作与多智能体
|命令|角色|功能|
|--- | --- | --- |
| /pair-agent |多智能体协调员|与任何 AI 智能体共享浏览器。一个命令,一次粘贴,即可连接。支持 OpenClaw、Hermes、Codex、Cursor 等。每个智能体独立标签页。自动启动有头模式以便观察。自动开启 ngrok 隧道供远程智能体使用。令牌作用域隔离、标签隔离、速率限制、活动归因。|
复盘与学习
|命令|角色|功能|
|--- | --- | --- |
| /retro |工程经理|团队感知的每周复盘。人均细分、连续发布 streak、测试健康趋势、成长机会。/retro global 跨所有项目和 AI 工具(Claude Code、Codex、Gemini)运行。|
| /learn |记忆|管理 GStack 在会话间学到的内容。审核、搜索、修剪并导出项目特定的模式、陷阱和偏好。学习会跨会话累积,让 GStack 随着时间更懂你的代码库。|