Skip to content
陈广亮的技术博客
Go back

AI Agent 开发者工具全景 2026

打开这周的 GitHub Trending,你会发现一个有趣的现象:排行榜上几乎一半的项目都和 AI Agent 有关。

Shannon —— 一个全自动的 AI 黑客,在 XBOW 基准测试上跑出了 96.15% 的漏洞发现成功率。GitHub 官方的 gh-aw(Agentic Workflows)悄然上线。字节跳动的 UI-TARS 把多模态 Agent 搬上了桌面。微软的 RD-Agent 要让 AI 驱动研发全流程。还有一堆围绕 Claude Code 生态的项目 —— claude-memclaude-code-hooks-masteryclaude-skills —— 正在把 Coding Agent 从”能用”推向”好用”。

这不是偶然。2025 年大家忙着验证 Agent 到底能不能用,2026 年一开年,焦点已经转到基础设施建设上了。

这篇文章梳理一下当前 Agent 开发者工具的全貌,帮你理清这个变化很快的生态。

一、Agent 框架:从百花齐放到各据山头

Agent 框架是最早成熟的一层。两年下来,格局基本定了。

LangChain / LangGraph

LangChain 仍然是生态最完整的框架。但真正值得关注的是 LangGraph —— 它用图(Graph)结构来编排 Agent 的执行流程,比起早期 LangChain 的链式调用,表达能力强了几个数量级。

from langgraph.graph import StateGraph

# 定义 Agent 状态机
graph = StateGraph(AgentState)
graph.add_node("research", research_agent)
graph.add_node("write", writing_agent)
graph.add_node("review", review_agent)
graph.add_edge("research", "write")
graph.add_edge("write", "review")
graph.add_conditional_edges("review", quality_check, {
    "pass": END,
    "revise": "write"
})

适合场景:需要精细控制 Agent 执行流程的复杂应用。

CrewAI

如果 LangGraph 是”编程式”的 Agent 编排,CrewAI 就是”声明式”的。你定义角色(Agent)、任务(Task)和流程(Process),框架帮你处理协作细节。2026 年初 CrewAI 已经发展到 v1.x 稳定版,加入了内存管理和工具复用机制。

适合场景:多 Agent 角色扮演协作,比如”研究员 + 写手 + 审稿人”的内容生产流水线。

AutoGen (Microsoft)

微软的 AutoGen 走的是另一条路 —— 对话驱动的多 Agent 协作。Agent 之间通过消息传递来协调,更接近人类团队的协作方式。AutoGen Studio 提供了可视化界面,降低了上手门槛。

适合场景:需要 Agent 之间进行复杂对话和协商的场景。

Dify / Coze

Dify 和 Coze(字节跳动)走低代码/无代码路线。可视化工作流编辑器,不写代码也能搭 Agent 应用。Dify 开源,Coze 商业化,2026 年两者都加了 MCP 协议支持。

适合场景:快速原型、业务人员自建 Agent 应用。

框架层的判断

框架之争基本结束了。开发者选 LangGraph 或 CrewAI 深入就行。产品经理或业务人员,Dify / Coze 更实际。框架本身不再是壁垒,关键看你用框架做了什么。

二、Coding Agent:开发者的第二大脑

Coding Agent 大概是 Agent 领域里最先落地的品类。2026 年初,这个赛道已经卷得不行。

Claude Code

Anthropic 的 Claude Code 是目前终端 Coding Agent 里最好用的。它直接跑在终端里,理解整个代码库,能执行命令、操作 Git、重构代码。

# 安装
curl -fsSL https://claude.ai/install.sh | bash

# 在项目目录直接使用
cd my-project
claude
> 把这个 REST API 改成 GraphQL,保持所有测试通过

Claude Code 真正有意思的地方是它开始有自己的插件生态了。本周 Trending 上就有三个相关项目:

这些社区项目集中冒出来,说明 Claude Code 正在从工具变成平台。

Cursor / Windsurf

Cursor 和 Windsurf 走的是 IDE 路线。Cursor 基于 VS Code,把 AI 深度集成进编辑体验。Windsurf(Codeium 出品)则强调”Flow”模式 —— AI 和你交替编辑,像双人编程一样流畅。

两者共同点:以文件为中心,以编辑器为主场。适合习惯 IDE 工作流的开发者。

OpenAI Codex CLI / GitHub Copilot Agent

OpenAI 的 Codex CLI 走的是和 Claude Code 类似的终端路线,但更强调与 GitHub 生态的整合。本周 Trending 上出现的 openai/skills(Skills Catalog for Codex)就是 OpenAI 在构建 Codex 技能生态的证据。

GitHub Copilot 则在往 Agent 方向进化。github/gh-aw(Agentic Workflows)的出现意味着 Copilot 不再只是自动补全,而是能执行跨文件、跨仓库的复杂工作流。

Coding Agent 的判断

Coding Agent 赛道的竞争焦点已经从”谁的补全更准”转向了:上下文窗口和代码库理解、工具链整合(终端、Git、CI/CD)、生态可扩展性(插件/技能),还有编辑体验本身。

目前的局面:Claude Code 在工具链和生态上领先,Cursor 编辑体验最好,Copilot 靠 GitHub 原生整合吃天然红利。

三、垂直领域 Agent:术业有专攻

本周 Trending 上还冒出几个垂直领域的 Agent,挺有意思:

Shannon —— AI 安全渗透测试

KeygraphHQ/shannon 是一个全自动的 Web 应用安全测试 Agent。96.15% 的漏洞发现率不是靠暴力扫描,而是靠 Agent 像人类黑客一样理解应用逻辑、构造攻击路径。这类 Agent 正在改变安全行业的工作方式。

UI-TARS —— 多模态桌面 Agent

字节跳动的 UI-TARS 做的是”看屏幕操作电脑”。它有两个项目:底层模型(UI-TARS)和桌面应用(UI-TARS-desktop)。后者定位为”开源的多模态 AI Agent 基础设施”,连接前沿 AI 模型和桌面操作。

这个方向挺有意思。Agent 能看懂 GUI 并操作的话,理论上任何软件都能变成 Agent 的工具。

RD-Agent —— 研发自动化

微软的 RD-Agent 做研发流程自动化,用 AI 驱动数据和模型的迭代。

Dexter / TradingAgents-CN —— 金融 Agent

金融是 Agent 落地最积极的垂直领域之一。virattt/dexter 做深度金融研究,TradingAgents-CN 是中文金融交易的多 Agent 框架。

四、Agent 基础设施:真正的战场

框架和应用是上层建筑,基础设施协议才是地基。2026 年这一层正在快速成型。

MCP(Model Context Protocol)

Anthropic 主导的 MCP 协议,我认为是 2025-2026 年 Agent 领域最重要的基础设施。

MCP 要解决的问题很直接:LLM 应用怎么标准化地连接外部数据源和工具?

┌─────────────┐     MCP      ┌─────────────┐
│  LLM 应用    │◄────────────►│  MCP Server  │
│ (Claude Code │   标准协议    │  (GitHub,    │
│  Cursor 等)  │              │   DB, API)   │
└─────────────┘              └─────────────┘

到 2026 年 2 月,MCP 已经有了 10 种语言的 SDK(TypeScript、Python、Java、Kotlin、C#、Go、PHP、Ruby、Rust、Swift),几乎覆盖了所有主流开发语言。这种广泛的语言支持本身就说明了行业的认可度。

MCP 的价值很朴素:以前每个 Agent 框架都自己搞一套工具调用机制,现在有统一标准了。像 HTTP 之于 Web,不性感,但没它不行。

A2A(Agent2Agent Protocol)

如果 MCP 解决的是”Agent 如何使用工具”,那 Google 主导的 A2A 协议解决的是”Agent 如何和 Agent 对话”。

A2A 让不同框架、不同公司的 Agent 能发现彼此的能力,协商交互方式,在长期任务上安全协作,而且不暴露内部状态、记忆或工具。

最后这点我觉得设计得很聪明。A2A 把 Agent 当作”不透明的参与者”,不是能随意翻看内部状态的工具。就像你跟同事合作,不需要读对方的大脑,沟通就够了。

┌─────────┐  A2A  ┌─────────┐  A2A  ┌─────────┐
│ Agent A  │◄────►│ Agent B  │◄────►│ Agent C  │
│(LangGraph)│      │ (CrewAI) │      │  (ADK)   │
└─────────┘       └─────────┘      └─────────┘
     │                 │                 │
     │ MCP             │ MCP             │ MCP
     ▼                 ▼                 ▼
  [Tools]           [Tools]          [Tools]

MCP + A2A 构成了 Agent 基础设施的两根柱子:一个管 Agent 怎么用工具,一个管 Agent 之间怎么对话。

Tool Use 的标准化

除了协议层,Tool Use(工具调用)本身也在标准化。各大模型提供商(Anthropic、OpenAI、Google)的 Function Calling / Tool Use API 已经趋同。这意味着同一套工具定义可以在不同模型之间复用,降低了锁定风险。

五、生态工具:让 Agent “可用”变”好用”

本周 Trending 上还有一类项目值得看看,它们不是 Agent 本身,而是让 Agent 更好用的周边工具。

记忆管理

claude-mem 解决跨会话记忆问题。类似项目在各框架都有。这里说的记忆不是保存聊天记录那么简单,包括自动压缩提取关键信息、按上下文检索相关记忆、区分短期工作记忆和长期知识。

Hooks 和扩展机制

claude-code-hooks-mastery 涨星这么快,说明开发者确实想自定义 Agent 行为。Hooks 让你在 Agent 执行的关键节点插入自己的逻辑,比如提交前自动跑 lint,调 API 前做安全审查。

技能包和知识注入

claude-skillsopenai/skills 走同一个路子:把领域知识打包成可复用的”技能”注入 Agent。比微调模型轻量得多,也更灵活。

本地知识搜索

tobi/qmd 是本地文档搜索引擎,完全离线运行。不是所有数据都适合传到云端,这类工具就派上用场了。

六、趋势判断:Agent 开发正在走向哪里

综合上面这些,我觉得 Agent 开发生态正在发生几个明显的转变:

1. 从”框架竞争”到”协议竞争”

2024-2025 年,大家比的是谁的 Agent 框架更好用。2026 年,竞争焦点转向了基础设施协议。MCP 和 A2A 的出现意味着 Agent 生态开始有了”公共基础设施”。

这很像互联网早期从各种专有协议走向 TCP/IP + HTTP 的过程。协议标准化了,应用层的创新自然就多了。

2. 从”通用 Agent”到”专业 Agent + 协作”

早期大家都想做一个”什么都能干”的通用 Agent。现在的趋势是:做一个领域里最专业的 Agent(安全的 Shannon、金融的 Dexter、研发的 RD-Agent),然后通过 A2A 协议让它们协作。

说白了就是软件工程的老道理:单一职责加松耦合。

3. 从”产品”到”平台”

Claude Code、Codex 都在从产品变成平台。插件系统、Hooks 机制、技能包,这些都是平台化的信号。第三方生态开始围绕你建设的那一刻,你就不只是产品了。

结语:我的预测

站在 2026 年 2 月,说几个我的判断:

  1. MCP 会成为事实标准。10 种语言 SDK 已经形成飞轮效应,后来者很难再搞替代协议了。

  2. Coding Agent 年底会成为多数开发者的日常工具。不一定是 Claude Code 或 Cursor,但某种形式的 Coding Agent 会跟 Git 一样普遍。

  3. 垂直领域 Agent 是下一波创业机会。框架和基础设施成熟之后,商业价值在垂直应用里。安全、金融、医疗、法律,每个领域都会跑出来自己的头部 Agent。

  4. Agent 可观测性会成为新课题。Agent 自主跑复杂任务时,你得能监控、审计、回放它的行为。这可能催生一个全新的工具品类。

Agent 生态今年会快速发展,不是因为某个模型突然变强了,而是围绕 Agent 的基础设施终于在成型。管道铺好了,水自然就流了。


Share this post on:

Previous Post
OpenClaw 入门实战:5分钟搭建你的自托管 AI 助手
Next Post
博客部署流程优化:从服务器构建到本地构建的进化