跳到主要内容
Superpowers 与 gstack:AI 编程 Agent 技能与角色架构对比 | 极客日志
编程语言 AI 大前端
Superpowers 与 gstack:AI 编程 Agent 技能与角色架构对比 综述由AI生成 深度对比了 Superpowers 和 gstack 两款 AI 编程工具。Superpowers 基于技能(Skills)驱动,强调工程化工作流、自动触发和 TDD 纪律,适合关注执行质量的开发者。gstack 基于角色(Roles)驱动,模拟虚拟工程团队(CEO、QA 等),强调决策视角和浏览器自动化能力,适合关注团队协作和 Web 应用的场景。两者分别代表了能力编排和组织流程两种 Agent 设计哲学,可互补使用以提升 AI 编程的结构化和质量。
宁静 发布于 2026/4/6 更新于 2026/5/20 30 浏览深度拆解:Superpowers 与 gstack
过去一年,AI 编程工具最大的变化,不是模型更强了,而是大家逐渐意识到一件事:
真正决定 AI 写代码质量的,往往不是模型本身,而是你如何组织它的工作方式。
也就是说,问题已经从'用哪个模型'慢慢转向了:
怎么让 AI 不要一上来就胡乱写代码?
怎么让它先想清楚需求、边界、测试和设计?
怎么让它像一个靠谱的工程团队,而不是一个情绪不稳定的实习生?
最近两个很有代表性的开源项目,正好走了两条不同但都很值得研究的路径:
obra/superpowers :把 AI 编程流程建立在 skills(技能) 之上,强调可组合、可复用、可自动触发的工程化工作流。官方将它定义为'一个基于可组合 skills 的完整软件开发工作流'。
garrytan/gstack :把 AI 编程流程建立在 roles(角色) 之上,用'CEO、工程经理、设计师、QA、发布经理'等角色,把 Claude Code 组织成一个'虚拟工程团队'。README 里明确写的是:它把 Claude Code 变成了一个 virtual engineering team。
这篇文章旨在回答四个更本质的问题:
Superpowers 和 gstack 到底分别在解决什么问题?
它们的核心差别,不只是 skills vs roles 这么简单,到底差在哪里?
为什么这两个项目会在 AI Coding Agent 时代变得重要?
如果你真的想用,应该怎么选、怎么落地?
一、先说结论:它们不是同类竞品,而是两种不同的 Agent 设计哲学
如果让我先给一句总结:
Superpowers 是'能力编排系统',gstack 是'组织流程系统'。
再直白一点:
Superpowers 关心的是:
AI 该按照什么方法做事。
gstack 关心的是:
AI 该以什么角色做判断。
表面上它们都在增强 Claude Code / Codex 一类 coding agent,但底层思路非常不同。
二、Superpowers 是什么:它不是一组 prompt,而是一套'技能驱动'的开发方法论
根据项目 README,Superpowers 的核心定义是:
它是一套完整的软件开发工作流,建立在一组可组合的 skills 之上,并通过初始指令确保 agent 会去使用这些 skills。
这句话非常关键,因为它意味着 Superpowers 不是'多写几个系统提示词'那么简单,而是在做三件事:
1. 它把开发过程拆成一系列可触发的技能
Superpowers 官方 README 给出的基础流程包括这些环节:brainstorming、using-git-worktrees、writing-plans、subagent-driven-development / executing-plans、test-driven-development、requesting-code-review、finishing-a-development-branch。
你会发现,这不是单纯的'问答式助手',而是在模拟一个相对完整的软件开发流水线:
先讨论需求和设计
再进入工作区隔离和分支管理
再把任务切成细粒度计划
再由子 agent 分步骤执行
执行过程中强制 TDD
每个阶段之间插入 code review
最后再做分支收尾和提交选择 也就是说,Superpowers 的真正价值,不是某一个 skill 本身,而是 skill 之间形成了一个工程闭环。
2. 它尽量让这些技能'自动触发' README 明确提到,Superpowers 的目标之一,是让这些技能在合适的时机自动生效,而不是每一步都要用户显式调用;'because the skills trigger automatically, you don't need to do anything special.'
这点很重要。因为很多人以为 AI 工作流增强,就是记住一堆 /command。但 Superpowers 的设计更接近:
3. 它强调'先设计,后实现;先测试,后代码' README 里写得非常明确:在设计确认后,agent 会先给出 implementation plan,并强调 true red/green TDD、YAGNI、DRY 。
这其实暴露了 Superpowers 的工程立场:
它不相信'先写点代码看看'
它不鼓励一上来就全局重构
它希望 agent 像受过训练的工程师一样,先澄清设计、写测试、再推进实现
所以,Superpowers 本质上不是在强化'生成能力',而是在强化 工程纪律 。
三、gstack 是什么:它不是技能库,而是一套'角色驱动'的 AI 工程组织 gstack README 对自己的定位非常鲜明:它把 Claude Code 变成一个'虚拟工程团队',其中包括 CEO、工程经理、设计师、Reviewer、QA、Security Officer、Release Engineer 等角色。
很多 AI 写代码的问题,不是不会写,而是没有'站在正确角色视角上'思考。
你让 AI 设计功能,它可能直接跳进实现细节
你让 AI 改 UI,它可能只会做'能运行',但没有设计判断
你让 AI review 代码,它可能只检查语法,却没想到线上风险
你让 AI 做 QA,它可能压根不会真的打开浏览器验证交互
gstack 的解决方案是:不要让同一个 agent 用一种模糊的统一人格做所有事,而是给不同任务绑定不同角色。
1. gstack 的核心不是'命令多',而是'角色明确' README 里的 quick start 建议非常直接:
/office-hours:先描述你在做什么
/plan-ceo-review:从产品 / 业务视角重想一遍这个功能
/review:对当前分支进行代码审查
/qa:对 staging URL 做测试
/plan-eng-review
/plan-design-review
/ship
/browse
/retro
/autoplan
/setup-browser-cookies
/cso 等
把软件团队中的'分工'映射成 Claude Code 中的'操作入口'。
你不再是对一个模糊的'AI 助手'说话,而是在调用某个明确职能的角色。
2. gstack 很强调真实开发中的'组织流程'
/plan-ceo-review 用 CEO 视角重构产品想法
/plan-eng-review 用工程经理视角锁定架构、数据流、边界条件与测试
/plan-design-review 会对设计维度打分并提出修改建议
/review 做偏资深工程师式的代码审查
/ship 面向发布和 PR
/retro 做团队复盘
这里最值得注意的是,gstack 并不试图'隐藏流程'。相反,它把流程显式地摆到用户面前。
所以它不像 Superpowers 那样偏'自动内化',而更像:
把工程组织的方法论外显出来,让你像管理团队一样管理 agent。
3. gstack 非常看重浏览器能力和持久会话 gstack 的 ARCHITECTURE 文档有一个很重要的点:它认为浏览器自动化是'硬问题',其他很多东西只是 Markdown。为了获得 亚秒级延迟和持久状态 ,它采用了一个 long-lived Chromium daemon ,让 CLI 通过 localhost HTTP 与之通信,从而避免每次工具调用都冷启动浏览器,也能保留 cookies、tabs 和登录状态。
为什么 gstack 不只是'几个 slash commands 的集合'。
CLI
本地 server
持久化 headless Chromium
会话状态管理
因此,当 gstack 在 README 里强调 /browse、/qa、/setup-browser-cookies 这些能力时,它不是停留在 prompt 层,而是已经把浏览器操作当成了一等公民。
四、Superpowers 和 gstack 的相同点:它们都在试图解决'AI 编程失控'问题
都在反对'直接对 AI 说一句:帮我把这个功能写了'。
不澄清需求
不先写测试
不主动拆解任务
不区分设计问题、架构问题、实现问题、验证问题
最后生成一堆'看起来很忙,实际上不可维护'的代码
Superpowers 和 gstack 都在做的,是把这种混乱过程重新结构化 。
1. AI 需要流程,不只是 prompt 从 README 可以看出,两者都不是单条提示工程,而是流程工程。Superpowers 提供的是从 brainstorming 到 development branch finishing 的完整链路;gstack 提供的是从 office hours、plan、review、qa 到 ship / retro 的组织化步骤。
2. AI 需要角色或技能约束,而不是自由发挥 Superpowers 用 skills 约束行为。gstack 用 roles 约束判断。
本质上都在做一件事:
3. AI 编程的关键不是'生成',而是'决策质量' 很多开发者把 AI 编程理解成'自动写代码'。
但真正成熟的工程实践里,更有价值的是:
什么时候该先问问题
什么时候该停下来设计
什么时候该拆任务
什么时候该 review
什么时候该用真实浏览器验证
什么时候该拒绝继续推进
Superpowers 和 gstack,都在增强 agent 的'决策过程',而不只是'代码输出'。
五、两者最本质的区别:不是 skills vs roles,而是'控制粒度'不同
Superpowers = skills
gstack = roles
Superpowers 控制的是'任务执行粒度',gstack 控制的是'决策视角粒度'。
1. Superpowers 更像'工程操作系统' Superpowers 的 skill 设计更接近一个可以不断扩展的操作层。
当前应该进入 brainstorming 还是 implementation?
任务是否已经被拆成足够小的 steps?
是否应该切换到 git worktree?
是否应该启用 subagent-driven-development?
是否符合 TDD?
是否该触发 code review?
是否该 finish 当前分支?
这意味着 Superpowers 的抽象层更'底层',更靠近工程动作本身。
gstack 更像面向对象中的'角色接口'
Superpowers 更像底层 runtime + workflow engine
2. gstack 更像'AI 版软件组织架构' gstack 的高明之处,是它并不试图把每一步隐藏起来。
CEO 看价值和产品方向
Eng Manager 看架构与测试
Designer 看体验和视觉质量
QA 看真实页面行为
Reviewer 看代码风险
Release Engineer 看交付和上线
所以 gstack 的抽象层更'高层',更偏组织与决策分工。
3. 一个是'能力内嵌',一个是'流程外显'
Superpowers: 把工程最佳实践尽量内嵌到 agent 行为默认值里。
你触发一个任务,agent 自动进入更合理的 skill 链条。
gstack: 把工程流程显式展现在你面前。
你需要有意识地调用某个角色,让它从对应立场进行分析和执行。
Superpowers:让 AI 自己变得更像一个训练有素的工程师
gstack:让 AI 看起来像一个组织良好的工程团队
六、从技术落地看,它们分别适合什么样的开发者?
适合 Superpowers 的人 如果你是下面这些情况,Superpowers 往往更对味:
1. 你更关注'执行质量'
后端系统
基础设施
编译器 / 内核 / 推理引擎
大模型训练 / serving / benchmark
大型重构
这些场景里,最怕的是 AI 乱改、跳步、没测试、没计划。
Superpowers 通过 planning、TDD、subagent、review、branch finishing 等机制,天然更偏向'把执行流程做稳'。
2. 你希望 agent 自动遵循流程 如果你不想手动记很多命令,更想让 AI 自己进入合适流程,那 Superpowers 的'自动触发 skill'思路更适合你。
3. 你想把方法论复用到不同 agent 平台 Superpowers 不只面向 Claude Code。当前文档显示它还支持 Cursor、Codex、OpenCode、Gemini CLI 等平台。
这意味着它更像一个跨平台的工作流层,而不是只绑定某个单一工具。
适合 gstack 的人
1. 你更关注'团队式决策'
创业者
技术负责人
产品 / 设计 / 工程混合角色
独立开发者但想模拟团队协作
那么 gstack 会很有吸引力,因为它把你平时脑子里要切换的多重视角拆成了显式角色。
2. 你需要强浏览器测试与 QA gstack 的 /browse、/qa、/setup-browser-cookies,加上它为浏览器持久状态专门设计的 daemon 架构,使它在'真实网页操作、登录态保持、页面验证'这条链路上明显更重。
Web 应用
SaaS 产品
管理后台
带复杂交互的前端
需要真实页面测试的产品
3. 你愿意显式管理工作流 gstack 很适合喜欢'把过程看清楚'的人。
它不是把一切都自动化,而是让你在关键节点明确选择:
现在先做产品复盘?
先做架构 review?
先 review 代码?
先 QA?
还是直接 ship?
七、怎么安装和使用:别只知道它们'很强',你得知道它们是怎么落地的
Superpowers 怎么用? Superpowers 当前支持多平台。以 Claude Code 为例,README 给出的安装方式包括:
官方 Claude marketplace:
/plugin install superpowers@claude-plugins-official
或先添加 marketplace 再安装:
/plugin marketplace add obra/superpowers-marketplace /plugin install superpowers@superpowers-marketplace
如果是 Cursor,可以通过插件市场安装;如果是 Codex,则文档提供了通过 ~/.agents/skills/ 暴露 skills 的方式,并说明 Codex 会在启动时扫描这些 skills。
Superpowers 的典型使用方式 它最典型的使用姿势不是'背命令',而是直接开始一个开发任务:
'帮我规划这个功能'
'我们来修这个 bug'
'帮我实现这个 feature'
brainstorming
design validation
writing-plans
subagent-driven-development
TDD
review
finish branch
换句话说,Superpowers 更适合这样的交互方式:
gstack 怎么用? gstack 的 quick start 非常直接:
安装 gstack
运行 /office-hours 描述你在做什么
用 /plan-ceo-review 审视功能方向
用 /review 检查当前分支
用 /qa 检查 staging URL
README 还提供了一条非常明确的安装命令:将仓库 clone 到 ~/.claude/skills/gstack,执行 ./setup,再在 CLAUDE.md 中加入 gstack 配置和可用 skills 列表。
gstack 的典型使用路径
/office-hours:先统一上下文
/plan-ceo-review:看这个需求是否值得这样做
/plan-eng-review:锁定架构和测试策略
/plan-design-review:避免界面和交互层面的 AI slop
开始实现
/review:审代码
/qa 或 /browse:做真实页面验证
/ship:发 PR / 发布
gstack 希望你'显式操盘';Superpowers 更倾向于'隐式接管'。
八、如果只能选一个,怎么选?
选 Superpowers,如果你更在意这些:
让 agent 少跳步骤
让实现更规整
更严格的 TDD / plan / review 纪律
更强的 task decomposition
多平台可迁移性
希望流程尽量自动内化
选 gstack,如果你更在意这些:
把 AI 当作'虚拟团队'来协作
明确切换产品 / 架构 / 设计 / QA / 发布视角
真实浏览器测试能力
更适合 Web 产品和创业团队语境
想显式控制每一步流程
九、真正高级的用法:不是二选一,而是组合使用
Superpowers 和 gstack 其实是有互补性的。
用 gstack 做高层决策
/plan-ceo-review:需求是否值得做
/plan-eng-review:架构是否合理
/plan-design-review:设计是否过关
用 Superpowers 做中低层执行
brainstorming 的细化
plan 的任务拆分
subagent-driven-development
TDD
code review
branch finishing
再回到 gstack 做验证与交付
/qa / /browse
/ship
/retro
gstack 负责'想对'
Superpowers 负责'做稳'
gstack 再负责'验真'和'交付'
如果你做的是复杂 Web 产品,这套组合非常有潜力。
十、我对这两个项目的真实判断:它们代表了 AI Coding 的下一阶段 我觉得这两个项目真正有价值的地方,不在于'又出现了两个开源工具'。
AI 编程正在从'单次回答'演进到'结构化协作'。
过去我们说 prompt engineering。
后来我们说 agent。
现在更准确的词,其实是:
workflow engineering
agent orchestration
decision scaffolding
AI-native software process
Superpowers 和 gstack,分别给出了两种可行答案:
一种答案是:
把最佳实践封装成 skills,让 agent 按工程方法论自动执行。
另一种答案是:
把软件团队组织结构映射成 roles,让 agent 在不同职责下做判断。
这两种路径,都比'直接叫 AI 写代码'成熟得多。
十一、最后一句话总结
Superpowers 让 AI 更像工程师,gstack 让 AI 更像团队。
一个偏'能力系统',一个偏'组织系统'。
一个擅长把执行做扎实,一个擅长把流程做清晰。
它们不只是两个项目,更像是 AI 编程进入工程化阶段后,两种非常典型的方法论样本。
相关免费在线工具 RSA密钥对生成器 生成新的随机RSA私钥和公钥pem证书。 在线工具,RSA密钥对生成器在线工具,online
Mermaid 预览与可视化编辑 基于 Mermaid.js 实时预览流程图、时序图等图表,支持源码编辑与即时渲染。 在线工具,Mermaid 预览与可视化编辑在线工具,online
随机西班牙地址生成器 随机生成西班牙地址(支持马德里、加泰罗尼亚、安达卢西亚、瓦伦西亚筛选),支持数量快捷选择、显示全部与下载。 在线工具,随机西班牙地址生成器在线工具,online
Base64 字符串编码/解码 将字符串编码和解码为其 Base64 格式表示形式即可。 在线工具,Base64 字符串编码/解码在线工具,online
Base64 文件转换器 将字符串、文件或图像转换为其 Base64 表示形式。 在线工具,Base64 文件转换器在线工具,online
Markdown转HTML 将 Markdown(GFM)转为 HTML 片段,浏览器内 marked 解析;与 HTML转Markdown 互为补充。 在线工具,Markdown转HTML在线工具,online