GStack 26种专家角色深度测评：一人成军是否可行？

2026-06-01阅读 0热度 0

其他

GStack 是什么？

先说说这个项目的背景。GStack 是由 Y Combinator 现任 CEO Garry Tan 亲自创建并维护的开源项目，目标很直接——把 Claude Code 从一个通用的 AI 助手，变成一支可以随时调用的专业开发团队。

Github 地址：github.com/garrytan/gs…

Stars 数：68.8k

定位：AI 驱动的「虚拟软件工厂」，不是提示词集合，而是完整工程流程

原理：把大模型拆成各司其职的专家角色，每个角色有固定职责、流程、输出

效果：单人开发效率 ≈20 人传统团队

实际数据是：有人用它在 60 天内写出了 60 万行生产代码（其中 35% 是测试代码），日均产出 1–2 万行。这个数字听起来有点夸张，但确实说明了这套方法的潜力。

为什么叫一人成军

GStack 特色

从几个维度来看它的设计思路：

角色覆盖度：26 个技能对应 26 个不同专业角色，从 CEO、设计师、工程师到 QA、安全官、技术文档，覆盖完整的产品团队
流程闭环：从需求探索（/office-hours）→ 规划（plan-*）→ 设计 → 开发 → 测试 → 发布 → 复盘，形成完整闭环
决策分层：不是简单的自动化，而是模拟真实团队的决策流程（CEO 定方向、设计师控体验、工程师保质量）
多智能体协作：/pair-agent 甚至支持多个 AI 同时工作，真正实现"团队"协作

传统 AI 编码 vs GStack 的"一人成军"

对比之下，差异就非常明显了：

传统方式是一个通用助手，思维模式混杂；GStack 是 26 个专业角色，各司其职
传统方式靠提示词即兴发挥，质量不稳定；GStack 是结构化工作流，可重复、可预期
传统方式只是单点辅助（只写代码）；GStack 是端到端覆盖（需求→设计→开发→测试→发布）
传统方式是个人的效率工具；GStack 模拟的是完整的创业团队

核心定位

说白了，GStack 的本质是一组基于 Claude Code 的角色化工作流——在项目里被称为"skills"。它的核心价值在于解决了传统 AI 编码工具中那个老毛病：思维模式混杂。每个命令对应一个特定的专业角色，让 AI 在特定任务中采用相应的认知模式，而不是一个声音干所有事。

需要特别强调的是，GStack 是一个过程，而不是工具的集合。技能的运行顺序就是冲刺的顺序：

Think → Plan → Build → Review → Test → Ship → Reflect

每个技能都会衔接下一个。/office-hours 会写一份设计文档，/plan-ceo-review 会阅读它。/plan-eng-review 编写测试计划，/QA 会接收它。/review 发现了 bug，/ship 验证已修复。没有任何遗漏，因为每一步都知道之前发生过什么。

安装 GStack

安装过程其实很简单，打开 Claude Code，输入以下命令即可自动安装：

git clone --single-branch --depth 1 https://github.com/garrytan/gstack.git ~/.claude/skills/gstack && cd ~/.claude/skills/gstack && ./setup

不过有个坑需要特别留意：安装过程中需要先安装 bun，我测试时发现 bun 经常安装失败。可以试着切换下网络再次安装，或者在别的命令行里单独安装 bun。装完后还得记得加到环境变量里才能生效。

安装完成后，在 ~/.claude/skills/gstack 目录下可以看到多个 skill。比如进入 office-hours 目录，里面有个 SKILL.md 文件，内容很长，定义了完整的角色行为。

主要功能

GStack 提供了 30+ 个斜杠命令（slash commands），覆盖从规划到发布的完整开发流程。每个命令都对应一个具体的专业角色和任务场景。

测试 GStack

office-hours 产品经理

这个技能类似 CEO/产品经理进行头脑风暴，对产品进行构思和需求梳理。它通过提问的方式，把模糊的需求转化为可执行的方案。

这个名字源自硅谷创业文化中的"办公室时间"——创始人或投资人每周固定开放的时间段，供创业者预约咨询、讨论想法。GStack 用这个名字，强调这是一个低门槛、对话式的入口，适合在正式规划前进行头脑风暴和需求梳理。

如果有一个模糊的产品想法却不知道如何开始，这个就是第一个应该运行的命令。在这个角色下，Claude 不会直接给答案，而是通过连续提问，帮你把模糊的想法转化为清晰、可执行的产品需求。

实际操作中，它会和用户对话，整理出多个草案供选择。选定草案后，再一步一步完善方案。

image-20260410204125744

plan-design-review 设计负责人

角色定位

设计负责人（Design Lead）是 GStack 规划阶段的关键角色之一，专注于从用户体验和视觉设计角度审查功能规划，确保产品不仅技术可行，而且易用、美观、符合设计规范。

主要职责

执行 /plan-design-review 命令时，会重点关注这些方面。比如它会先给一份设计文档打分，刚开始可能只有 3 分，然后通过不断修改，最终达到 10 分。

GStack 技术架构

技能系统：基于 Markdown 提示文件，通过 Claude Code 的自定义命令功能集成
浏览器自动化：基于 Playwright 构建持久化 Chromium 会话，支持 Cookie 导入和真实环境测试
多平台支持：除 Claude Code 外，还支持 OpenAI Codex CLI、Cursor、OpenCode 等 8 种 AI 编码工具
团队模式：支持全局安装和项目级安装，可配置自动更新，确保团队成员使用一致版本

GStack 适用人群

从官方文档来看，GStack 特别适合这几类人：

创始人和 CEO——尤其是希望亲自参与交付的技术型创始人
首次使用 Claude Code 的用户——提供结构化角色，而非空白提示
技术负责人和资深工程师——对每个 PR 进行严格审查、QA 和发布自动化

GStack 项目信息

GitHub 地址：github.com/garrytan/gs…
开源协议：MIT License
最新版本：截至 2026 年 3 月约为 v0.4.3
安装方式：30 秒快速安装，通过 Git 克隆到 Claude Code 的 skills 目录即可

GStack 的核心理念其实就一句话：通过结构化的角色分工和审查流程，将 AI 辅助开发从模糊的通用对话升级为专业的工程工作流，帮助个人开发者或小型团队实现"一人成军"的开发效率。

附录 GStack 角色定位

规划阶段

|命令|角色|功能| |--- | --- | --- | | /office-hours |CEO/产品经理|起始点。通过 6 个强制性问题，在写代码前重新定义产品。挑战你的前提假设，提出替代方案。输出的设计文档会流向所有下游技能。| | /plan-ceo-review |首席执行官/创始人|重新思考问题，找到隐藏在需求中的"10 星产品"。四种模式：扩展、选择扩展、保持范围、缩减。| | /plan-eng-review |工程经理|锁定架构、数据流、图表、边界情况和测试。将隐藏的假设暴露出来。| | /plan-design-review |高级设计师|给每个设计维度打 0-10 分，解释 10 分是什么样的，然后修改计划以达到目标。AI 低质内容检测。交互式——每个设计选择只问一个用户问题。| | /plan-devex-review |开发体验负责人|交互式 DX 评估：探索开发者画像，对比竞品的 TTHW（首次上手时间），设计你的"魔法时刻"，逐步追踪摩擦点。三种模式：DX 扩展、DX 打磨、DX 分诊。20-45 个强制性问题。| | /autoplan |评审流程|一个命令，生成完整审核过的计划。自动运行 CEO → 设计 → 工程评审，仅将品味相关的决策提交你批准。|

设计阶段

|命令|角色|功能| |--- | --- | --- | | /design-consultation |设计合作伙伴|从零构建完整的设计系统。研究市场环境，提出创意风险，生成逼真的产品模型。| | /design-review |会写代码的设计师|执行与 /plan-design-review 相同的审核，然后修复发现的问题。原子提交，附带前后对比截图。| | /design-shotgun |设计探索器|"给我看选项"。生成 4-6 个 AI 模型变体，在浏览器中打开对比板，收集反馈并迭代。品味记忆会学习你的偏好。重复直到满意，然后交给 /design-html。| | /design-html |设计工程师|将模型转化为真正能用的生产级 HTML。预计算布局：文本重排、高度自适应、动态布局。30KB，零依赖。自动检测 React/Svelte/Vue。针对设计类型（落地页/仪表盘/表单）智能路由 API。输出可直接上线，不是演示稿。|

开发审查阶段

|命令|角色|功能| |--- | --- | --- | | /review |资深工程师|找出那些能通过 CI 但在生产环境爆炸的 bug。自动修复明显的问题。标记完整性缺口。| | /investigate |调试器|系统化的根因调试。铁律：不调查就不修复。追踪数据流，验证假设，修复失败 3 次后停止。| | /devex-review |DX 测试员|实时开发者体验审计。实际测试你的 onboarding：浏览文档，尝试入门流程，计时 TTHW，截图错误。与 /plan-devex-review 的评分对比——检验计划与现实的差距。|

测试与质量保证

|命令|角色|功能| |--- | --- | --- | | /qa |QA 负责人|测试应用，发现 bug，用原子提交修复，重新验证。为每个修复自动生成回归测试。| | /qa-only |QA 记录员|与 /qa 方法相同，但只报告不修复。纯 bug 报告，不改动代码。| | /browse |QA 工程师|给 AI 装上眼睛。真实的 Chromium 浏览器，真实的点击，真实的截图。每条约 100ms。/open-gstack-browser 启动带侧边栏、反机器人隐身和自动模型路由的 GStack 浏览器。| | /setup-browser-cookies |会话管理器|从真实浏览器（Chrome/Arc/Bra ve/Edge）导入 Cookie 到无头会话。用于测试需要登录的页面。|

安全与合规

|命令|角色|功能| |--- | --- | --- | | /cso |首席安全官|OWASP Top 10 + STRIDE 威胁建模。零噪音：17 类误报排除，8/10+ 置信度门槛，独立发现验证。每个发现都包含具体的利用场景。|

发布与部署

|命令|角色|功能| |--- | --- | --- | | /ship |发布工程师|同步主分支，运行测试，审计覆盖率，推送，开启 PR。如果没有测试框架，自动初始化。| | /land-and-deploy |发布工程师|合并 PR，等待 CI 和部署，验证生产环境健康。一个命令从"已批准"到"生产环境已验证"。| | /canary |SRE|部署后监控循环。监控控制台错误、性能回退和页面故障。| | /benchmark |性能工程师|基线化页面加载时间、Core Web Vitals 和资源大小。对比每个 PR 的前后表现。| | /document-release |技术文档工程师|更新所有项目文档以匹配刚发布的版本。自动识别过时的 README。|

协作与多智能体

|命令|角色|功能| |--- | --- | --- | | /pair-agent |多智能体协调员|与任何 AI 智能体共享浏览器。一个命令，一次粘贴，即可连接。支持 OpenClaw、Hermes、Codex、Cursor 等。每个智能体独立标签页。自动启动有头模式以便观察。自动开启 ngrok 隧道供远程智能体使用。令牌作用域隔离、标签隔离、速率限制、活动归因。|

复盘与学习

|命令|角色|功能| |--- | --- | --- | | /retro |工程经理|团队感知的每周复盘。人均细分、连续发布 streak、测试健康趋势、成长机会。/retro global 跨所有项目和 AI 工具（Claude Code、Codex、Gemini）运行。| | /learn |记忆|管理 GStack 在会话间学到的内容。审核、搜索、修剪并导出项目特定的模式、陷阱和偏好。学习会跨会话累积，让 GStack 随着时间更懂你的代码库。|