gstack vs Claude Code Skills：AI编程的两种哲学

TL;DR

YC CEO Garry Tan 开源的 gstack 和 Anthropic 官方的 Skills 代表了 AI 编程的两种哲学：流程治理 vs 能力扩展。gstack 通过 15 个 “/命令” 将开发流程拆成 7 个阶段，强调角色分工和流程管控；Skills 通过 9 种类型扩展 Agent 能力边界，强调工具集成和上下文工程。两者并非对立，而是互补——gstack 是”如何组织开发”，Skills 是”如何扩展能力”。

📋 本文结构

背景：两位关键人物
gstack：YC 的流程治理哲学
Claude Code Skills：Anthropic 的能力扩展哲学
核心对比：流程 vs 能力
使用场景：谁适合什么
互补性：1+1>2
未来趋势：融合还是分化

背景：两位关键人物

Garry Tan：YC CEO 的 60 万行代码实验

背景：

Y Combinator 总裁兼 CEO
Palantir 早期设计/logo 设计者
Posterous 联合创始人（卖给 Twitter）
Bookface（YC 内部社交网络）建造者

惊人数据（过去 60 天）：

写了 600,000+ 行生产代码
每天 10,000-20,000 行可用代码
同时履行 YC CEO 的全部职责

核心洞察：

“2026 年——我们正处于某种真实事物的黎明——一个人以过去需要 20 人团队的规模交付。”

Thariq：Anthropic 工程师的 Skill 实践

背景：

Anthropic 工程师
Claude Code 核心开发者
内部使用数百个 Skills

核心洞察：

“Skill 不只是 Markdown 文件，而是包含脚本、资产、数据的完整文件夹。”

gstack：YC 的流程治理哲学

核心理念

gstack 是一个流程，而不是工具的集合。

将 Claude Code 变成一个虚拟工程团队：

CEO（重新思考产品）
工程经理（锁定架构）
设计师（捕捉 AI slop）
偏执的审查员（发现生产 Bug）
QA 主管（打开真实浏览器测试）
发布工程师（发布 PR）

15 个 “/命令” 与 7 个阶段

Think → Plan → Build → Review → Test → Ship → Reflect

阶段	命令	角色	功能
Think	/office-hours	YC Office Hours	6个强制问题重新定义产品
Think	/plan-ceo-review	CEO/创始人	10节审查重新思考问题
Plan	/plan-eng-review	工程经理	ASCII 图、数据流、边界情况
Plan	/plan-design-review	高级设计师	0-10 分评级每个设计维度
Plan	/design-consultation	设计合伙人	从零构建完整设计系统
Build	（Claude Code 原生）	-	代码生成
Review	/review	高级工程师	发现 CI 通过但生产爆炸的 Bug
Review	/investigate	调试器	系统性根因调试
Review	/design-review	会编码的设计师	审计并修复设计问题
Review	/codex	第二意见	OpenAI Codex CLI 独立审查
Test	/qa	QA 主管	真实浏览器点击测试、修复 Bug
Test	/qa-only	QA 报告员	纯报告不修改
Ship	/ship	发布工程师	同步、测试、审计、推送、开 PR
Ship	/document-release	技术写手	更新所有项目文档
Reflect	/retro	工程经理	团队感知的每周回顾

关键特性

1. 流程连贯性

/office-hours 写的文档 → /plan-ceo-review 读取
/plan-eng-review 写的测试计划 → /qa 读取
/review 发现的 Bug → /ship 验证修复

2. 并行 Sprint 能力

一个人同时运行 10-15 个并行 Sprint
不同功能、不同分支、不同 Agent
30 分钟完成一个 Sprint

3. 安全护栏

/careful：破坏性命令前警告
/freeze：限制编辑到单个目录
/guard：/careful + /freeze

4. 浏览器能力

/browse：真实 Chromium 浏览器
/setup-browser-cookies：导入真实浏览器 cookies
100ms 每命令

Claude Code Skills：Anthropic 的能力扩展哲学

核心理念

Skill 是一个文件夹，而不仅仅是 Markdown 文件。

包含：

脚本（scripts/）
资产（assets/）
数据（data/）
配置（config.json）
Hooks（动态拦截）

9 种 Skill 类型

类型	功能	示例
Library & API Reference	库和 API 参考	billing-lib、内部平台 CLI
Product Verification	产品验证测试	signup-flow-driver、checkout-verifier
Data Fetching & Analysis	数据获取与分析	funnel-query、grafana
Business Process Automation	业务流程自动化	standup-post、create-ticket
Code Scaffolding	代码脚手架	new-service、new-migration
Code Quality & Review	代码质量审查	adversarial-review、code-style
CI/CD & Deployment	CI/CD 与部署	babysit-pr、deploy-service
Runbooks	运维手册	service-debugging、oncall-runner
Infrastructure Operations	基础设施操作	resource-orphans、cost-investigation

关键特性

1. 渐进式披露

SKILL.md（概述）
    ↓
references/api.md（详细 API）
references/examples.md（示例）
scripts/utils.py（工具函数）

2. 记忆能力

在 Skill 目录存储数据
支持 SQLite、JSON、日志文件
${CLAUDE_PLUGIN_DATA} 稳定存储

3. Hooks 机制

PreToolUse：工具使用前拦截
/careful：阻止 rm -rf、DROP TABLE
/freeze：限制编辑范围

4. 分发与共享

代码仓库（.claude/skills/）
插件市场（未来）
团队内共享

核心对比：流程 vs 能力

对比维度

维度	gstack	Claude Code Skills
核心哲学	流程治理	能力扩展
组织方式	7 阶段开发流程	9 种能力类型
交互方式	15 个 “/命令”	Skill 描述触发
主要用户	个人开发者、创始人	团队、企业
设计目标	个人效率最大化	团队协作标准化
控制能力	强（流程锁定）	中（能力导向）
扩展能力	中（脚本支持）	强（完整文件夹）

流程 vs 能力的本质差异

gstack 问的是：

“我们现在处于开发流程的哪个阶段？” “这个角色应该做什么？” “下一步是什么？”

Skills 问的是：

“我们需要什么能力？” “这个工具能做什么？” “如何扩展 Agent 的能力边界？”

代码示例对比

gstack 风格（流程导向）：

# 第1步：重新定义问题
/office-hours
"我想构建一个每日简报应用"
→ "你实际上是在构建一个个人 AI 幕僚长"

# 第2步：CEO审查
/plan-ceo-review
→ 10节审查，挑战范围

# 第3步：工程审查
/plan-eng-review
→ ASCII图、数据流、测试矩阵

# 第4步：构建（Claude原生）

# 第5步：审查
/review
→ [AUTO-FIXED] 2个问题

# 第6步：QA
/qa https://staging.myapp.com
→ 打开真实浏览器，发现并修复Bug

# 第7步：发布
/ship
→ 测试：42 → 51，PR已创建

Skills 风格（能力导向）：

# 发现可用的 Skill
skills = await client.discover_tools()
# [
#   {"name": "billing-lib", "description": "内部计费库"},
#   {"name": "deploy-service", "description": "部署服务"}
# ]

# 调用部署 Skill
await client.call_tool(
    "deploy-service",
    {"service": "api", "version": "v1.2.3"}
)

# QA Skill 自动运行测试
# 生成回归测试
# 验证修复

使用场景：谁适合什么

适合 gstack 的场景

1. 个人开发者/创始人

一个人需要完成 20 人团队的工作
需要严格的流程防止混乱
每天 10,000+ 行代码的产出目标

2. 快速原型开发

30 分钟完成一个 Sprint
10-15 个并行实验
快速验证想法

3. 全栈项目

需要产品、设计、工程、QA 全覆盖
没有专业分工的小团队

4. YC 风格创业

快速迭代、快速发布
“先做再说”的文化
创始人亲自编码

适合 Skills 的场景

1. 企业团队

多人协作需要标准化
内部库和工具需要共享
安全和治理要求严格

2. 专业分工

有专门的 QA 团队
有平台工程团队
有运维团队

3. 复杂系统

微服务架构
多团队协作
需要标准化流程

4. 长期维护

代码库长期存在
需要可审计性
需要知识传承

互补性：1+1>2

如何结合使用

理想架构：

gstack（流程层）
    ├── /office-hours → 重新定义问题
    ├── /plan-eng-review → 架构设计
    └── /review → 代码审查
        ↓
Skills（能力层）
    ├── billing-lib Skill → 计费逻辑
    ├── deploy-service Skill → 部署
    └── qa-automation Skill → 测试
        ↓
Claude Code（执行层）
    └── 代码生成与执行

Garry Tan 的 Skill 使用

实际上，gstack 本身也是用 Skill 机制实现的：

# gstack 安装位置
~/.claude/skills/gstack/

# 包含
├── SKILL.md          # 主文档
├── skills/           # 15个命令
│   ├── office-hours/
│   ├── review/
│   ├── qa/
│   └── ...
└── scripts/          # 支持脚本

结论：gstack 是 Skills 的一个具体应用——用 Skill 机制实现流程治理。

组合使用示例

场景：构建新功能

# Step 1: gstack 流程 - 重新定义问题
/office-hours
→ "你想构建 X，但实际上你需要 Y"

# Step 2: gstack 流程 - 架构设计
/plan-eng-review
→ 数据流图、API 设计、测试策略

# Step 3: Skills 能力 - 生成代码
# 调用 new-service Skill 生成脚手架
# 调用 frontend-design Skill 应用设计系统

# Step 4: Claude Code - 实现业务逻辑
# 原生代码生成

# Step 5: gstack 流程 - 审查
/review
→ 发现边界情况

# Step 6: Skills 能力 - 运行测试
# 调用 signup-flow-driver Skill 测试
# 调用 checkout-verifier Skill 验证

# Step 7: gstack 流程 - 发布
/ship
→ 部署、开 PR、更新文档

未来趋势：融合还是分化

两种可能的未来

未来 A：融合

Anthropic 官方支持 gstack 式流程
Skills 增加流程编排能力
一个统一的 Agent 框架

未来 B：分化

gstack 成为 YC/创业生态的标准
Skills 成为企业/团队的标准
两者各自发展，互不干扰

更可能的走向

分层共存：

应用层：gstack（流程）、其他工作流工具
    ↓
能力层：Skills（Anthropic）、Plugins（OpenAI）、Extensions（其他）
    ↓
模型层：Claude、GPT、Gemini 等

给开发者的建议

现在应该做什么：

如果你是一个人快速开发
- 先用 gstack 建立流程
- 逐步添加自定义 Skills
如果你是团队协
- 建立团队 Skills 库
- 参考 gstack 设计自己的流程
如果你是平台工程
- 构建内部 Skills 市场
- 整合 gstack 流程到 CI/CD

结论

核心洞察

gstack 和 Skills 不是竞争关系，而是互补关系：

gstack = 如何组织开发（流程治理）
Skills = 如何扩展能力（能力扩展）

比喻：

gstack 是乐谱——规定了演奏的顺序和节奏
Skills 是乐器——提供了演奏的能力
Claude Code 是演奏家——执行具体的演奏

关键差异

	gstack	Skills
问题	“我们现在该做什么？”	“我们能做什么？”
答案	15 个命令，7 个阶段	9 种类型，无限扩展
价值	防止混乱，保证质量	扩展能力，标准化

最终建议

不要二选一，要两者都用：

用 gstack 建立个人/团队的开发流程
用 Skills 扩展团队的能力边界
用 Claude Code 执行具体的代码生成

这才是 AI-Native 软件工程的完整图景。

参考与延伸阅读

gstack GitHub - Garry Tan 的开源工具集
Claude Code Skills - Anthropic 官方文档
Lessons from Building Claude Code: How We Use Skills - Thariq 的分享

本文基于 gstack 开源代码和 Anthropic 官方文档深度分析。

发布于 postcodeengineering.com

📋 本文结构

背景：两位关键人物

Garry Tan：YC CEO 的 60 万行代码实验

Thariq：Anthropic 工程师的 Skill 实践

gstack：YC 的流程治理哲学

核心理念

15 个 “/命令” 与 7 个阶段

关键特性

Claude Code Skills：Anthropic 的能力扩展哲学

核心理念

9 种 Skill 类型

关键特性

核心对比：流程 vs 能力

对比维度

流程 vs 能力的本质差异

代码示例对比

使用场景：谁适合什么

适合 gstack 的场景

适合 Skills 的场景

互补性：1+1>2

如何结合使用

Garry Tan 的 Skill 使用

组合使用示例

未来趋势：融合还是分化

两种可能的未来

更可能的走向

给开发者的建议

结论

核心洞察

关键差异

最终建议

参考与延伸阅读

🎨 生成分享卡片

📖 相关阅读

💬 评论