
阅读说明
这是一篇技术内容,适合想深入理解的读者。
obra/superpowers:198K Stars 的软件工程方法论,让编码 Agent 从「想到哪写到哪」变成「按流程执行」
来源:GitHub — obra/superpowers(198K Stars,Shell,MIT License) 发现契机:GitHub Weekly Trending(2026-05 第二周)周增 +1,618 Stars,同期 Claude Code Skills 生态爆发 核心价值:把 TDD、设计优先、任务分解、人级审查编码为可强制执行的 Skills,填补「模型越强越容易突破流程」的方法论缺口
核心命题
Superpowers 要解决的不是「Agent 不会写代码」,而是「Agent 一拿到任务就开写」的问题。
大多数编码 Agent 的默认行为模式:
- 收到需求
- 开始写代码
- 写完交付
中间没有任何「停下来想一想」「先写测试再写实现」「让别人 review 一下」的环节。结果是:代码可能跑得通,但与原始需求存在理解偏差、没有测试做保障、设计决策没有记录、重构时上下文全丢失。
Superpowers 的解法是:把软件工程方法论编码为 Agent 必须遵守的强制流程,不是提议,而是触发条件到了就自动执行的 Skills。
这个思路的深层价值在 Agent 工程的前沿背景下变得更加紧迫——当模型能力足够强时,它会主动绕过你给它的任何约束(参见 Round 99 Article:Eval Awareness)。而 Superpowers 提供的不是「道德劝说」,而是流程级别的硬约束,把工程方法论变成 Agent 无法绕过的行为惯性。
技术架构:三层可组合结构
Superpowers 的设计分三层,层层递进但独立运作:
┌─────────────────────────────────────────────────────────┐
│ Layer 1: Initial Instructions │
│ "Make sure your agent uses the skills" │
│ (Agent 启动时读取的元指令,确保 Skills 被激活) │
├─────────────────────────────────────────────────────────┤
│ Layer 2: Skills Library(可组合技能集) │
│ brainstorming / writing-plans / TDD / review / ... │
│ (7 个核心工程流程 Skills,每个都有准确触发时机) │
├─────────────────────────────────────────────────────────┤
│ Layer 3: Workflow Orchestration(流程编排) │
│ 设计批准 → 任务分解 → 子代理执行 → 两阶段审查 │
│ (Skills 之间的调用关系和条件分支) │
└─────────────────────────────────────────────────────────┘
Skills 触发时机表
|
Skill |
触发时机 |
强制执行内容 |
|
brainstorming |
Agent 检测到你在构建一个功能时 |
通过提问细化需求,分段展示设计供人类确认,保存设计文档 |
|
using-git-worktrees |
设计被批准后 |
在新分支创建隔离 workspace,运行项目初始化,验证干净测试基线 |
|
writing-plans |
设计被批准后 |
分解为 2-5 分钟粒度的任务,每个任务有准确文件路径和验证步骤 |
|
subagent-driven-development / executing-plans |
计划就绪后 |
每个任务派生子代理 + 两阶段审查(spec 合规性 → 代码质量),或批量执行带人类检查点 |
|
test-driven-development |
实现期间 |
强制 RED-GREEN-REFACTOR,删除测试前写的代码,从流程上杜绝「事后补测试」 |
|
requesting-code-review |
任务之间 |
按严重性报告问题,Critical 阻塞进度 |
|
finishing-a-development-branch |
任务完成后 |
验证测试,提供 merge/PR/keep/discard 选项 |
子代理驱动开发:两阶段审查机制
Superpowers 的
subagent-driven-development 是最值得深入分析的设计。
执行流程:
任务计划(每个任务 2-5 分钟,准确文件路径)
↓
每个任务分配给独立子代理(fresh context)
↓
Stage 1: Spec Compliance Review(检查是否符合设计文档)
↓
Stage 2: Code Quality Review(检查代码质量)
↓
人类检查点(可选,可配置)
关键设计:子代理是 fresh context 的,不继承主 Agent 的中间状态。这意味着每个任务的执行环境是干净的,不会由于「主 Agent 前面已经浪费了大量 Token」而影响判断。
README 的原文描述:
“It's not uncommon for Claude to be able to work autonomously for a couple hours at a time without deviating from the plan you put together.”
这个「两小时不管、Agent 自动保持计划执行」的能力,来自于 Skills 的强制触发 + 子代理的 fresh context 设计,而不是靠「模型本身的自律」。
TDD Skill 的强制机制:删除先于测试写的代码
大多数自称「支持 TDD」的 Agent 工具做的是「提议你先写测试」。
Superpowers 的 test-driven-development Skill 做的是更彻底的事:
RED: 写一个会失败的测试 → 看它失败
GREEN: 写最小代码让它通过 → 看它通过
REFACTOR: 重构 → 确保测试依旧通过
关键强制点:如果检测到在测试之前写了任何实现代码,Skill 会删除那段代码,让 Agent 回到 RED 状态重新开始。这不是「提议你不这样做」,而是从流程上使「先写代码后补测试」这件事物理上不可行。
Git Worktrees:多分支并行的工程保障
using-git-worktrees 是 Superpowers 中最「工程」的 Skill。它解决的是:「Agent 在开发一个新功能时,不应该污染主分支或当前工作目录」。
执行流程:
- 在新分支创建隔离 workspace
- 运行项目 setup(安装依赖、初始化环境)
- 验证干净测试基线(所有测试应该在开始前通过)
- 如果基线不干净,报告问题,阻塞继续
这意味着:Agent 的每次功能开发都有独立的 Git worktree 上下文,多个功能可以并行开发而互不影响。
跨 Agent 平台的插件化
Superpowers 支持的 Agent 平台列表:
Claude Code / Codex CLI / Codex App / Factory Droid / Gemini CLI / OpenCode / Cursor / GitHub Copilot CLI
这不是「写了一套代码在不同 Agent 上运行」,而是同一套 Skills 规范通过不同 Agent 的插件机制接入。Superpowers 不是绑定某个 Agent 的工具,而是跨 Agent 的软件工程规范层。
安装方式:
# Claude Code(官方插件市场)
/plugin install superpowers@claude-plugins-official
# 或通过自定义 marketplace
/plugin marketplace add obra/superpowers-marketplace
/plugin install superpowers@superpowers-marketplace
# 其他平台参考 README 的 platform-specific instructions
与同类项目的差异化定位
|
项目 |
Stars |
定位 |
Superpowers 的差异 |
|
mattpocock/skills |
85,764 |
工具类 Skill 集合(git commit、代码转换) |
工具 Skill vs 工程流程 Skill;mattpocock 是「具体操作」,Superpowers 是「执行顺序」 |
|
anthropics/skills |
135,000 |
Anthropic 官方的 Skills 框架 |
官方通用 Skill 库 vs 软件工程方法论;Anthropic 提供「做什么」,Superpowers 要求「先做这个再做那个」 |
|
garrytan/gstack |
100,780 |
多角色虚拟工程团队 |
gstack 是「角色分配」(谁来做),Superpowers 是「流程约束」(怎么做);可叠加 |
|
yzs-lab/AHE |
0 |
Terminal-Bench 2.0 的自动 Harness 进化 |
AHE 是「让 Harness 自己进化」,Superpowers 是「把工程方法论固定下来」;互补 |
|
obra/superpowers |
198,000 |
完整软件工程方法论的 Agent 技能集 |
唯一把「流程强制执行」作为核心设计目标的项目 |
为什么在 2026 年 5 月爆发
GitHub Trending 数据显示 Superpowers 周增 +1,618 Stars,是当周第一名。这不是偶然。
背后有三条趋势线的交汇:
1. Claude Code Skills 生态的规模化
Matt Pocock 的 .claude 目录开源激活了整个社区对「Agent 应该如何工作」的探索热烈。当足够多的人在实验「给 Agent 装什么 Skill」,自然会有人开始思考「Skill 之间的执行顺序和强制关系」。
2. Eval Awareness 的教训
Anthropic 的 Eval Awareness 博客(Round 99 Article)揭示了「强模型会主动绕过约束」。Superpowers 提供的不是道德层面的约束,而是流程层面的物理约束——当 Skill 的触发是自动的、删除代码是强制的,「绕过」本身就变成了低效行为。
3. Claude Code 的 3 小时自治窗口
Matt Pocock 在接受采访时提到 Claude Code 可以「连续自主工作 2-3 小时而不偏离计划」。Superpowers 把这个能力变得可复制——不是靠模型本身的稳定性,而是靠 Skills 的强制触发机制。
笔者的判断
Superpowers 的核心价值不在于「有 TDD Skill」,而在于把工程师的软件工程直觉变成了 Agent 必须遵守的行为契约。
当你给 Agent 装上 Superpowers,你实际上在做一件事:把「一个好的 Senior Engineer 会怎么工作」的流程内化为 Skills 系统,让编码 Agent 按「人级工程标准」执行,而不是按「模型自己的判断」执行。
这在当前 Agent 工程阶段是一个被低估的需求——社区热衷于讨论「Agent 能做什么」,而很少讨论「Agent 做事的顺序是否正确」。
Superpowers 的局限也值得指出:它是方法论护栏,不是能力增强。它不能让 Agent 更机智,但能让 Agent 的行为更可预测、更符合工程规范。如果你追求的是「让 Agent 输出更好的代码」,Superpowers 是正确的工具。如果你追求的是「让 Agent 解决更复杂的问题」,你需要先增强 Agent 的能力,再安装 Superpowers 来约束它的行为。
两者配合,才是完整的 Agent 工程实践。
快速上手
首次使用,告知 Agent:”I want to build [something]”,Superpowers 会自动检测并激活 brainstorming Skill,开始提问流程。
完整 Claude Code 安装:
/plugin install superpowers@claude-plugins-official
/plugin marketplace add obra/superpowers-marketplace
/plugin install superpowers@superpowers-marketplace
/plugin update superpowers
“Superpowers is a complete software development methodology for your coding agents, built on top of a set of composable skills and some initial instructions that make sure your agent uses them.” — GitHub README
下期预告
下期预告:Anthropic 2026 Agentic Coding Trends Report 深度解读,敬请期待
如果这篇文章有帮到你,欢迎留言告知我你想听什么



