Claude Code 五层架构详解:MCP、Skills、Agent、Subagents、Agent Teams 怎么协作

写完 Claude Code Skills 实战 之后,我意识到一个问题:单看 Skills 是很难讲清楚的——Skills 的价值要通过它和 Subagents、MCP、Agent Teams 之间的关系才能体现出来。

5 月初 Anthropic 官方公布了 Claude Code 的”五层架构”——MCP / Skills / Agent / Subagents / Agent Teams。这个分层不是营销话术,每层都有明确的职责边界和协作方向。文章按层拆解定位、配置字段和何时用哪一层,最后用我博客里实际跑的 blog-preflight 案例演示三层是怎么联动的。

五层架构总览

先用一句话概括每层的角色:

角色核心问题
MCP连接层Agent 怎么访问外部世界(API、数据库、私有工具)
Skills任务知识层把”playbook”变成可被自动加载的可复用步骤
Agent主工作者处理你的对话主线,调用工具完成任务
Subagents并行隔离工作者把”会污染上下文的活”派出去做
Agent Teams多 Agent 协调层跨会话、跨独立上下文的 Agent 协作

最容易混淆的是 Skills、Subagents、Agent Teams——它们都和”任务”有关。区分点在上下文隔离粒度

  • Skills:在主对话上下文里执行(除非 context: fork
  • Subagents:每个 Subagent 独立上下文,单会话内协作
  • Agent Teams:每个成员独立会话 + 独立上下文,跨会话协调

第一层:MCP(Model Context Protocol)

MCP 是底层连接器。它解决的问题是:“让 Claude 能访问 GitHub、数据库、Notion、内部 API、Linear,而不需要给每个服务写自定义代码。“

三种使用模式

1. 全局配置(.mcp.json

{
  "mcpServers": {
    "github": {
      "type": "stdio",
      "command": "npx",
      "args": ["-y", "@modelcontextprotocol/server-github"]
    }
  }
}

任何 Claude Code 会话都能用 github 这个服务器。

2. Subagent 内联(仅 Subagent 可见)

---
name: browser-tester
description: 用 Playwright 在真实浏览器里测试功能
mcpServers:
  - playwright:
      type: stdio
      command: npx
      args: ["-y", "@playwright/mcp@latest"]
---

Playwright MCP 只在这个 Subagent 启动时连接,结束时断开。主对话看不到它的工具描述,节省 token

3. 引用全局服务器

mcpServers:
  - github   # 引用 .mcp.json 中已配置的服务器

什么时候用 MCP

  • 需要访问带状态的外部系统(GitHub Issue、Linear ticket、数据库)
  • 工具能力是通用、跨项目复用的(不是某个项目特有逻辑)
  • 不希望工具的实现细节侵入项目代码

如果只是”格式化博客 frontmatter”这种纯本地脚本逻辑,用 Skill 比写一个 MCP server 简单一个量级。

第二层:Skills

Skills 是”任务知识”层——把你重复粘贴的指令变成 Claude 自动加载的资源。这部分细节我在 blog158 写过,这里只补两点和后面层级有关的:

Skill 与 Subagent 的双向关系

这是五层架构里最容易绕晕的点。Skill 和 Subagent 之间存在两个相反方向的协作

方向配置方式谁定 system prompt
Skill 调 Subagent(context: fork)Skill frontmatter 写 context: fork + agent: ExploreSubagent 类型决定 system prompt,Skill 内容作为 task
Subagent 用 Skills(preload)Subagent frontmatter 写 skills: [api-conventions, ...]Subagent 自己的 prompt,Skill 内容注入到 context

两者底层是同一套机制,但触发方向相反

Skill 调 Subagent                    Subagent 预加载 Skill
─────────────────                    ────────────────────
你 → Skill                            你 → Subagent
       ↓ context: fork                       ↓ skills: [...]
     Subagent (Explore/Plan/...)             含 Skill 内容的 Subagent
       ↓ 用 SKILL.md 作为 task               ↓ 自己的 prompt + Skill 知识
     返回结论                                返回结论

决策树:什么时候用哪个

有"指令模板"想固化下来?
  └─ 是 → Skill

       Skill 内容很长 + 会产生大量探索/调试输出?
         └─ 是 → 加 context: fork(让 Subagent 跑这个 Skill)
         └─ 否 → 普通 Skill,主对话执行

需要"专门类型的工作者"反复出现(比如 code-reviewer、db-reader)?
  └─ 是 → Subagent

       这个工作者有反复使用的领域知识?
         └─ 是 → 在 Subagent 里 preload Skills
         └─ 否 → 直接写在 Subagent 的 system prompt 里

第三层:Agent(主工作者)

Agent 是你和 Claude Code 对话的主线。claude 命令启动的就是默认 Agent,使用 Claude Code 默认 system prompt + 你的 CLAUDE.md。

--agent 让整个会话变成专项 Agent

# 启动后整个会话都是 code-reviewer,使用它的 system prompt 和工具限制
claude --agent code-reviewer

或在项目里设默认:

// .claude/settings.json
{
  "agent": "code-reviewer"
}

这是把”专门工作者”提升到主线层级的方式——和 Subagent 的区别是:主 Agent 你能自由对话,Subagent 是被任务驱动跑完一次就结束

主 Agent 能 spawn Subagent,但 Subagent 不能 spawn Subagent

这是个硬约束。从架构图看:

Main Agent (claude 或 claude --agent <name>)
  ├── 可以 spawn Subagent A
  ├── 可以 spawn Subagent B
  └── 可以 spawn Subagent C
        └── ❌ 不能再 spawn 其他 Subagent

如果你需要嵌套委派,用 Skills(Skill 可以 fork 出 Subagent,绕开这个限制)或者 chain subagents(让 Main Agent 顺序调用多个 Subagent)。

第四层:Subagents

Subagent 是单会话内的专项工作者。它的 frontmatter 字段比 Skill 多一些,列几个最关键的:

字段说明
name唯一标识符
descriptionClaude 决定何时委派的关键文本
tools / disallowedTools工具白/黑名单
modelsonnet / opus / haiku / 全 ID / inherit
permissionMode权限模式(default / acceptEdits / auto / bypassPermissions / plan
skills启动时预加载的 Skills 列表
mcpServers仅本 Subagent 可见的 MCP 服务器
memoryuser / project / local — 持久记忆作用域
isolation: worktree在 git worktree 里跑,仓库副本隔离
background: true后台并行执行

完整字段还有 maxTurnshookseffortcolorinitialPrompt 等,参见 官方文档

命名风格提醒:Skill 用 allowed-tools(短横线),Subagent 用 tools / disallowedTools(驼峰)。两套风格不一致,写的时候容易抄错。

Subagent 持久记忆机制(最被低估的特性)

memory: project 后,Subagent 获得一个持久目录:

.claude/agent-memory/<subagent-name>/
├── MEMORY.md     # Claude 启动时读前 200 行
└── 其他笔记文件

Subagent 在每次任务后主动更新自己的记忆——比如 code-reviewer 会记下”这个项目的 React 组件总是用 forwardRef 包装”、“BUG 经常出在 useEffect 没列依赖”。下次它再被调用时,会先读自己的 MEMORY.md,然后把这些累积的洞察用上。

---
name: code-reviewer
description: 审查代码质量。审完总是更新自己的记忆
memory: project
---

You are a code reviewer. Before reviewing, read your MEMORY.md to recall
patterns from past reviews. After reviewing, update MEMORY.md with new
patterns, anti-patterns, and recurring issues you discovered.

三个作用域选择:

  • user~/.claude/agent-memory/<name>/)—— 跨所有项目,比如”我喜欢用 TypeScript 严格模式”这种全局偏好
  • project.claude/agent-memory/<name>/)—— 项目特定,可入 git,团队共享
  • local.claude/agent-memory-local/<name>/)—— 项目特定但不入 git,比如个人调试笔记

内置 Subagent

Claude Code 自带几个:

Subagent模型用途
ExploreHaiku只读探索代码库,找文件、读引用
Planinheritplan mode 下的研究 Agent
general-purposeinherit多步任务,需要探索+修改
statusline-setupSonnet配置 status line(隐藏,自动调用)
claude-code-guideHaiku回答 Claude Code 自身的问题

Explore 用 Haiku 是设计选择——大多数代码搜索任务不需要 Opus 的推理深度,Haiku 快且便宜。

第五层:Agent Teams

Agent Teams 解决的是 Subagent 解决不了的场景——多 Agent 长期并行 + 跨会话协调

Subagent 的限制:

  • 单会话内
  • 任务完成就结束
  • 主 Agent → Subagent 是单向关系

Agent Teams 把每个成员升级为独立会话 + 独立上下文,成员之间通过 SendMessage 工具互相对话,由协调者 Agent 编排。

启用方式:

CLAUDE_CODE_EXPERIMENTAL_AGENT_TEAMS=1 claude

适用场景:

  • 长时间运行的复杂项目(比如完整产品功能开发:设计 → 实现 → 测试 → 文档)
  • 各成员需要长记忆和持续状态
  • 任务能拆解成几个独立但有交互的子任务

如果你的工作流单会话就能跑完,别用 Agent Teams。它的复杂度对单会话场景是负价值。

一个直观对比

Subagent(单会话)                         Agent Teams(多会话协调)
──────────────────                         ────────────────────────
Main Agent                                 Coordinator Agent
  ├── Subagent A 跑完返回                    ├── ← Teammate A(独立会话)
  ├── Subagent B 跑完返回                    │     ↕ SendMessage
  └── 综合结果给你                            ├── ← Teammate B(独立会话)
                                             └── 长期协作

特点:                                      特点:
- 一次性                                    - 持续性
- A 和 B 不互相通讯                          - 成员间直接通讯
- 单上下文树                                 - 每个成员自己的会话

实战:博客发布前自检的三层联动

我博客的 blog-preflight Skill 就是 Skills + Subagents + MCP 三层组合的真实例子。

当前实现(仅 Skill 层)

参见 blog158 — 用 context: fork 把 Skill 跑在 Explore Subagent 里:

---
name: blog-preflight
description: 博客发布前自检。在我说"准备发布"或部署前主动调用
context: fork
agent: Explore
allowed-tools: Read Grep Bash(grep:*) Bash(node:*)
---

# 检查清单
1. frontmatter 完整性
2. 隐私扫描
3. AI 味词汇
...

这只是 Skill + Subagent 联动。

升级为三层联动

如果我想让 Claude 在审查时记住前几次发现的问题模式(比如”上次某篇文章用了’标志着’被我改了,下次写时优先避开”),就需要把 preflight 升级成一个带持久记忆的 Subagent,再让原 Skill 调用它:

第一步:定义 Subagent

# .claude/agents/blog-preflight-checker.md
---
name: blog-preflight-checker
description: 博客发布前自检专家。审查 frontmatter、隐私、AI 痕迹,并积累项目特定的写作问题模式
tools: Read, Grep, Bash
model: sonnet
memory: project
mcpServers:
  - github  # 复用全局 GitHub MCP,用来查 PR 历史
skills:
  - blog-preflight  # 复用已有的检查清单 Skill
---

You are a blog preflight checker. Before reviewing:
1. 读 .claude/agent-memory/blog-preflight-checker/MEMORY.md,回顾以往发现的常见问题
2. 应用 preloaded blog-preflight skill 的检查清单

After reviewing, update MEMORY.md with:
- 这次新发现的问题模式
- 历史问题在新文章里是否仍出现
- 哪些检查项是过度的(被作者反复忽略,可降级)

第二步:触发

你: 用 blog-preflight-checker 检查 blog160 这篇

Main Agent → 委派 Subagent

Subagent 启动:
  - 加载 blog-preflight Skill 内容(preloaded)
  - 读 MEMORY.md 看历史问题
  - 通过 GitHub MCP 查最近几篇文章的修订历史(可选)
  - 跑检查脚本
  - 写报告 + 更新 MEMORY.md

返回主对话: 简短报告("3 个 🔴,2 个 🟡")

这就是五层架构的实际效果:MCP(GitHub 历史)+ Skills(检查清单)+ Subagent(持久记忆 + 隔离上下文)三层各司其职。如果都堆在一个主对话里,会立即把 Claude 的上下文塞满。

说明:上面的 Subagent 配置是设计方案,演示三层组合,实际跑通还要看 memoryskills preload 在你项目里的兼容性,建议先小流量验证。

决策框架

回答”我该用哪一层”的问题:

我有的是什么?

├── 一段重复粘贴的指令 / playbook?
│     → Skill(如果产生大量输出,加 context: fork)

├── 一段需要从外部系统拉数据的逻辑?
│     → MCP server(如果是通用工具)
│       或者 Subagent inline mcpServers(如果只在某场景用)

├── 一类反复出现的工作者(reviewer / debugger / db-reader)?
│     → Subagent
│       └── 需要跨会话累积知识?→ 加 memory: project
│       └── 有领域知识要预先注入?→ 加 skills: [...]

├── 整个会话都用某个专项角色?
│     → claude --agent <name>

└── 多 Agent 长期并行 + 跨会话协调?
      → Agent Teams(experimental,慎用)

常见误解澄清

”Subagent 比 Skill 更高级”

**错。**它们解决的是不同问题:

  • Skills = “把指令固化,可被加载”
  • Subagent = “把工作者隔离,可有独立 context 和工具”

简单的”按某 playbook 做事”用 Skill 就够了。只有当主对话上下文会被这次任务污染时,才考虑用 Subagent

“用了 Subagent 就比 Skill 慢/贵”

部分对。Subagent 启动有 latency(要重新建上下文),但它省 token——大量探索/调试输出留在子上下文里,不会进主对话历史。当任务输出超过 5K token 时,用 Subagent 反而更便宜。

“Subagent 能 spawn 其他 Subagent”

不能。这是硬限制。如果你想嵌套委派,方案是:

  • 用 Skills(Skill 可以 fork Subagent,跨过这个限制)
  • 或者从 Main Agent chain:Subagent A 完成 → Main Agent 拿结果 → 委派 Subagent B

”skills 字段把 Skill 注册给 Subagent,Subagent 能用 / 命令调用”

skills 字段是预加载——把 Skill 内容直接注入 Subagent 的 system prompt。Subagent 看到的是 Skill 的指令文本,不是一个可被 /skill-name 调用的命令。

“User scope memory 会跨项目串味”

会,但这正是它的价值。如果你不想跨项目共享,用 memory: project(仓库内)或 memory: local(不入 git)。

落地建议

如果你刚开始用 Claude Code 的高级功能,按这个顺序学:

  1. 第 1 周:先把所有重复指令变成 Skills,体会”按需加载”的效果
  2. 第 2 周:当某个 Skill 输出爆炸时,加 context: fork,体会上下文隔离
  3. 第 3 周:设计第一个带 memory 的 Subagent,让它跨会话累积知识
  4. 第 4 周:把项目里 GitHub / Linear / 数据库这种”外部状态”接入 MCP
  5. 第 N 周:真正复杂的产品级协作再考虑 Agent Teams

不要一开始就上 Agent Teams——多数场景 Subagent + Skills + MCP 已经够了。“工具不在多,而在用对地方”——这句话在 Claude Code 这套架构上格外贴切。


延伸阅读