# Anthropic: Building Effective Agents

> 原文链接：https://www.anthropic.com/engineering/building-effective-agents
> 作者/来源：Anthropic
> 阅读日期：2026-04-02

## 一句话总结
Anthropic 提出构建有效 agent 的核心哲学是**从简单开始，只在确实能改善结果时才增加复杂度**，并系统性地梳理了从 augmented LLM 到 workflow 到 autonomous agent 的渐进式架构模式。

## 核心论点
文章的核心发现是：**最成功的 LLM agent 实现使用"简单、可组合的模式"，而非复杂的 framework**。这是一个对行业"过度工程化"趋势的重要纠偏。

文章首先区分了两种 agentic 系统：**Workflow**（LLM 和工具在预定义代码路径中运行，序列是预设的）和 **Agent**（LLM 动态地指导自身的流程和工具使用，具有自主决策能力）。两者都是有效的架构，选择取决于任务的开放度和可预测性。

文章的基础构建块是 **Augmented LLM**——一个结合了 retrieval、tools 和 memory 的 LLM。在此基础上，文章展示了五种 workflow 模式的渐进序列：Prompt Chaining（顺序链）→ Routing（路由分类）→ Parallelization（并行化）→ Orchestrator-Workers（编排-工作者）→ Evaluator-Optimizer（评估-优化）。每种模式都有明确的适用场景和权衡考量。

对于 autonomous agent，文章建议仅在开放性问题、不可预测的步骤需求、且无法使用固定路径的场景下使用。同时强调了 agent 的成本更高、错误可能复合累积、需要广泛的 sandbox 测试和 guardrails。

## 关键概念
- **Augmented LLM**：基础构建块，LLM + retrieval + tools + memory。所有更复杂的模式都建立在这个基础上。
- **Workflow vs Agent**：关键架构选择。Workflow 有预定义路径，可预测性高；Agent 有动态决策，灵活性高但成本也高。
- **Prompt Chaining**：将任务分解为顺序步骤，每个 LLM 调用处理上一步的输出。适用于固定子任务，用延迟换取准确性。
- **Routing**：对输入分类并导向专门的下游处理。适用于有明确类别的复杂任务。
- **Orchestrator-Workers**：中央 LLM 动态分解任务、委派给工作者 LLM 并综合结果。适用于不可预测的问题空间，如编码任务。
- **Evaluator-Optimizer**：一个 LLM 生成，另一个评估并提供反馈。需要明确的评估标准。
- **Poka-yoke（防错设计）**：工具设计原则，借鉴制造业概念，设计工具时应防止常见的使用错误。
- **Model Context Protocol (MCP)**：Anthropic 推荐的第三方工具集成标准协议。

## 实践建议
1. **从简单开始，逐步增加复杂度**：先优化单个 LLM 调用，再考虑多步 workflow，最后才考虑 autonomous agent。不要一开始就构建复杂系统。
2. **优先使用直接 LLM API 而非 framework**：Framework 虽然简化了标准任务，但通常会遮蔽底层的 prompt 和响应，减少可调性。
3. **像为优秀的初级开发者编写文档那样设计工具**：提供充足的 context、使用自然格式、消除格式化开销、实施防错设计。
4. **让 agent 的思考过程可见**：明确展示规划步骤，保持透明性，这不仅有助于调试，也增强用户信任。
5. **在 sandbox 环境中进行广泛测试**：agent 的错误会复合累积，需要在安全环境中充分测试后再部署。
6. **为 coding agent 利用自动化测试作为反馈**：测试提供了客观的质量度量，是 coding agent 最有效的反馈机制。

## 独到观点
这篇文章最独特的贡献在于它提供了**最完整的 agentic 系统分类法**——从最简单的 augmented LLM 到最复杂的 autonomous agent，形成了一个清晰的渐进序列。这个"复杂度阶梯"为工程师提供了决策框架：不是"该不该用 agent"，而是"该在哪个复杂度层级停下来"。此外，文章强烈的"反复杂度"立场在当前的 agent 热潮中尤为珍贵——"成功不在于构建最复杂的系统，而在于构建适合你需求的系统"。Poka-yoke 概念的引入也展示了制造业思维在 AI 工程中的应用。

## 与其他文章的关联
- 这篇文章是 Anthropic agent 系列的**基础性文章**，为 [Effective Harnesses](02-anthropic-effective-harnesses.md)、[Harness Design](03-anthropic-harness-design-long-running.md)、[Context Engineering](09-anthropic-context-engineering.md) 提供了理论基础。
- Evaluator-Optimizer 模式直接对应 [Anthropic: Harness Design](03-anthropic-harness-design-long-running.md) 中的 Generator-Evaluator 架构。
- "从简单开始"的哲学与 [Inngest: Harness Not Framework](08-inngest-harness-not-framework.md) 中对 framework 过度抽象的批评一致。
- Tool 设计最佳实践与 [LangChain: Anatomy of Harness](04-langchain-anatomy-of-harness.md) 中关于工具和 sandbox 的讨论互补。
- "反 framework"立场为 [Inngest](08-inngest-harness-not-framework.md) 的 "harness not framework" 论点提供了权威背书。
