GStack 拆解：把 Claude Code 变成一支 AI 交付小队

最近 Claude Code 周围冒出来不少工作流框架，Garry Tan 开源的 GStack 我觉得思路蛮不一样的。它没有在"怎么写出更好的 Prompt"上下功夫，而是把 AI 开发过程拆成了角色协作——CEO、工程经理、设计师、QA 各管一段，你负责拍板就行。

GStack 是什么

GStack 是一组 Claude Code 技能，每个技能扮演一个角色，按软件交付流程依次干活。

Think → Plan → Build → Review → Test → Ship → Reflect

和别的 Claude 增强工具比，GStack 不追求让一个 AI 什么都干。它靠分工和流程约束，让每一步的输出质量更可控。

能力一览

GStack 把交付链路的每个环节都做成了 Skill，从需求到上线后观察都有对应入口：

阶段	Skill	干什么	什么时候用
需求澄清	`office-hours`	像 YC Office Hours 一样追问你到底要解决什么问题	动手写代码之前
产品评审	`plan-ceo-review`	从 founder 视角看需求值不值得做、范围对不对	有初步方案后
工程评审	`plan-eng-review`	审架构、数据流、边界条件、测试方案	方案准备进入开发
设计评审	`plan-design-review`	揪出 AI Slop，补交互和视觉质量	有界面方案时
设计咨询	`design-consultation`	给出设计方向、风格和 mockup 思路	前端或视觉探索阶段
代码审查	`review`	找生产风险、缺失点、明显 bug，能修就直接修	写完代码准备提交
问题排查	`investigate`	先查后修，不让 AI 乱猜着改	遇到 bug 或测试挂了
浏览器操作	`browse`	真实 Chromium 里浏览、截图、点击、抓内容	需要网页交互或验证
QA 修复	`qa`	在真实浏览器里测、报 bug、修、回归	联调或提测前
QA 只报告	`qa-only`	只报 bug 不动代码	想测但不想自动改
安全审查	`cso`	OWASP Top 10 + STRIDE 安全检查	上线前或高风险功能写完后
发版提交	`ship`	跑测试、补检查、推分支、开 PR	准备发布
合并部署	`land-and-deploy`	合并 PR、等 CI、部署、验活	PR 通过后
金丝雀观察	`canary`	部署后盯错误率、性能、页面健康	刚上线
性能基线	`benchmark`	测页面性能、体积、Core Web Vitals	性能优化或 PR 前后对比
发布文档	`document-release`	更新发布相关文档	发完版补文档
复盘	`retro`	做交付复盘	迭代结束

一个功能的完整流程

用 GStack 开发一个功能，走下来很像一个小团队的协作节奏：

1. /office-hours       → 把问题想清楚，别急着写代码
2. /plan-ceo-review    → 看值不值得做，范围对不对
3. /plan-eng-review    → 锁定技术方案和边界
4. /plan-design-review → 补设计质量，干掉 AI 味
5. 写代码
6. /review             → 代码审查
7. /qa                 → 真实浏览器跑一遍
8. /ship               → 跑测试、提 PR
9. /land-and-deploy    → 合并部署
10. /retro             → 回头看看这轮做得怎么样

你要做的就是在每个节点上做判断和拍板，标准化的活 GStack 接了。

设计上的几个选择

为什么拆角色而不是做一个万能 Agent？ 让一个 AI 同时当产品经理、设计师、开发、测试，我试过，效果不太行。产品判断和工程判断需要的思维模式差太远，塞在一个 Prompt 里互相干扰。GStack 的做法是每个阶段切一个角色 Prompt，各管各的。我自己用下来，工程评审和代码审查这两步的输出比单 Agent 靠谱不少，产品评审那步有时候还是会说一些正确的废话。

真实浏览器撑起了好几个能力。 GStack 的 /browse 让 AI 操作真实的 Chromium，不只是截个图看看。qa、design-review、benchmark 都依赖这个能力，没有它这几个 Skill 就是空架子。AI 写的页面看着没问题但跑起来一堆 bug，这事我踩过不止一次，有了浏览器 QA 之后好了很多，虽然也不是什么都能抓到。

覆盖链路比多数工具长。 多数 AI 开发工具只管写代码，GStack 从需求到复盘都有入口。金丝雀观察、性能监控、文档更新这些上线后容易忘的事也给了固定 Skill，省得每次自己想着补。

和 Superpowers 比

同样是 Claude Code 工作流框架，两者定位不太一样：

Superpowers 更偏通用开发纪律，强调结构化、TDD、子 Agent 并行，适合各种开发场景
GStack 更偏创始人视角的完整交付流程，浏览器 QA 能力更强，发版和上线后观察做得更细，角色感更明确

什么时候适合用

做 Web 产品，尤其有前端界面的项目
小团队高频迭代，想把精力集中在核心决策上
项目需要真实浏览器验证，不想只靠 AI 说"应该没问题"
想让 AI 不只帮你写代码，而是帮你跑交付流程

写在最后

如果你在一个人做 Web 项目，GStack 能帮你把流程跑得更完整，但"AI 团队"这个说法别太当真——它更像是一套让你不容易漏事的检查清单。