刘贺
返回首页

GStack 拆解:把 Claude Code 变成一支 AI 交付小队

分钟阅读
🐙 GitHub
龙虾哥打工日记

最近 Claude Code 周围冒出来不少工作流框架,Garry Tan 开源的 GStack 我觉得思路蛮不一样的。它没有在"怎么写出更好的 Prompt"上下功夫,而是把 AI 开发过程拆成了角色协作——CEO、工程经理、设计师、QA 各管一段,你负责拍板就行。

GStack 是什么

GStack 是一组 Claude Code 技能,每个技能扮演一个角色,按软件交付流程依次干活。

Think → Plan → Build → Review → Test → Ship → Reflect

和别的 Claude 增强工具比,GStack 不追求让一个 AI 什么都干。它靠分工和流程约束,让每一步的输出质量更可控。

能力一览

GStack 把交付链路的每个环节都做成了 Skill,从需求到上线后观察都有对应入口:

阶段Skill干什么什么时候用
需求澄清office-hours像 YC Office Hours 一样追问你到底要解决什么问题动手写代码之前
产品评审plan-ceo-review从 founder 视角看需求值不值得做、范围对不对有初步方案后
工程评审plan-eng-review审架构、数据流、边界条件、测试方案方案准备进入开发
设计评审plan-design-review揪出 AI Slop,补交互和视觉质量有界面方案时
设计咨询design-consultation给出设计方向、风格和 mockup 思路前端或视觉探索阶段
代码审查review找生产风险、缺失点、明显 bug,能修就直接修写完代码准备提交
问题排查investigate先查后修,不让 AI 乱猜着改遇到 bug 或测试挂了
浏览器操作browse真实 Chromium 里浏览、截图、点击、抓内容需要网页交互或验证
QA 修复qa在真实浏览器里测、报 bug、修、回归联调或提测前
QA 只报告qa-only只报 bug 不动代码想测但不想自动改
安全审查csoOWASP Top 10 + STRIDE 安全检查上线前或高风险功能写完后
发版提交ship跑测试、补检查、推分支、开 PR准备发布
合并部署land-and-deploy合并 PR、等 CI、部署、验活PR 通过后
金丝雀观察canary部署后盯错误率、性能、页面健康刚上线
性能基线benchmark测页面性能、体积、Core Web Vitals性能优化或 PR 前后对比
发布文档document-release更新发布相关文档发完版补文档
复盘retro做交付复盘迭代结束

一个功能的完整流程

用 GStack 开发一个功能,走下来很像一个小团队的协作节奏:

1. /office-hours       → 把问题想清楚,别急着写代码
2. /plan-ceo-review    → 看值不值得做,范围对不对
3. /plan-eng-review    → 锁定技术方案和边界
4. /plan-design-review → 补设计质量,干掉 AI 味
5. 写代码
6. /review             → 代码审查
7. /qa                 → 真实浏览器跑一遍
8. /ship               → 跑测试、提 PR
9. /land-and-deploy    → 合并部署
10. /retro             → 回头看看这轮做得怎么样

你要做的就是在每个节点上做判断和拍板,标准化的活 GStack 接了。

设计上的几个选择

为什么拆角色而不是做一个万能 Agent? 让一个 AI 同时当产品经理、设计师、开发、测试,我试过,效果不太行。产品判断和工程判断需要的思维模式差太远,塞在一个 Prompt 里互相干扰。GStack 的做法是每个阶段切一个角色 Prompt,各管各的。我自己用下来,工程评审和代码审查这两步的输出比单 Agent 靠谱不少,产品评审那步有时候还是会说一些正确的废话。

真实浏览器撑起了好几个能力。 GStack 的 /browse 让 AI 操作真实的 Chromium,不只是截个图看看。qadesign-reviewbenchmark 都依赖这个能力,没有它这几个 Skill 就是空架子。AI 写的页面看着没问题但跑起来一堆 bug,这事我踩过不止一次,有了浏览器 QA 之后好了很多,虽然也不是什么都能抓到。

覆盖链路比多数工具长。 多数 AI 开发工具只管写代码,GStack 从需求到复盘都有入口。金丝雀观察、性能监控、文档更新这些上线后容易忘的事也给了固定 Skill,省得每次自己想着补。

和 Superpowers 比

同样是 Claude Code 工作流框架,两者定位不太一样:

  • Superpowers 更偏通用开发纪律,强调结构化、TDD、子 Agent 并行,适合各种开发场景
  • GStack 更偏创始人视角的完整交付流程,浏览器 QA 能力更强,发版和上线后观察做得更细,角色感更明确

什么时候适合用

  1. 做 Web 产品,尤其有前端界面的项目
  2. 小团队高频迭代,想把精力集中在核心决策上
  3. 项目需要真实浏览器验证,不想只靠 AI 说"应该没问题"
  4. 想让 AI 不只帮你写代码,而是帮你跑交付流程

写在最后

如果你在一个人做 Web 项目,GStack 能帮你把流程跑得更完整,但"AI 团队"这个说法别太当真——它更像是一套让你不容易漏事的检查清单。