# HumanLayer: Advanced Context Engineering

> 原文链接：https://www.humanlayer.dev/blog/advanced-context-engineering
> 作者/来源：Dex, HumanLayer
> 阅读日期：2026-04-02

## 一句话总结
HumanLayer 提出 "Frequent Intentional Compaction" 工作流，主张围绕 context window 管理（保持 40-60% 利用率）设计整个开发流程，并将人类介入集中在研究和规划阶段以实现最大杠杆效应。

## 核心论点

文章以一个尖锐的问题开篇：为什么 AI 工具在绿地项目上表现出色，在成熟代码库中却经常导致返工和生产力下降？Stanford 的研究证实了这一现象。作者拒绝"等待更聪明的模型"的被动策略，转而证明**通过策略性的 context 管理，当前模型就能在复杂的生产级代码库中取得显著成果**。

文章的核心框架是 **"Frequent Intentional Compaction"（频繁有意压缩）**——围绕 context window 管理设计整个开发工作流，保持 40-60% 的 context 利用率。这个工作流分为三个阶段：

**Research Phase（研究阶段）**：理解代码库结构，识别相关文件，映射信息流。这一阶段的目标不是写代码，而是建立对问题空间的全面理解。

**Planning Phase（规划阶段）**：制定精确的实施步骤，包括详细的文件修改计划和验证程序。规划文档不仅指导 agent，也成为组织知识的永久载体。

**Implementation Phase（实施阶段）**：按计划增量执行，每次验证后将状态更新压缩回规划文档。

文章最深刻的洞察是关于**人类杠杆效应的层级结构**：研究阶段的错误会产生数千行问题代码；规划阶段的错误会产生数百行；编码阶段的错误仅影响个别行。因此，**将人类审查集中在研究和规划阶段能获得最大的投资回报**。

## 关键概念

- **Frequent Intentional Compaction（频繁有意压缩）**：核心工作流策略——不是偶尔清理 context，而是将 compaction 设计为工作流的有机组成部分。目标是保持 40-60% 的 context 利用率，为新信息和推理留出空间。

- **Three-Phase Workflow（三阶段工作流）**：Research → Planning → Implementation。每个阶段有不同的目标、不同的人类参与程度和不同的 context 管理策略。

- **Human Leverage Hierarchy（人类杠杆层级）**：错误的影响与发现阶段成反比——研究错误 > 规划错误 > 编码错误。这意味着人类的时间应该集中投入在越早的阶段。

- **Spec-First Development（规格先行开发）**：编写详细的规格文档不仅指导 agent 工作，还成为组织知识的持久载体。引用 Blake Smith 的代码审查哲学：**维护团队对代码的理解比完美的代码更重要**。

- **Context Window as Workflow Constraint（context window 作为工作流约束）**：不是将 context 限制视为需要克服的障碍，而是将其视为设计工作流的核心约束，就像内存限制塑造了操作系统的虚拟内存设计。

## 实践建议

1. **设计围绕 context 管理的完整工作流**：不要把 compaction 当作事后补救，而是作为工作流的核心机制。保持 40-60% 的 context 利用率。

2. **将人类审查集中在研究和规划阶段**：这是杠杆效应最大的地方。在研究阶段花费的每分钟可以节省实施阶段的数小时。

3. **编写详细的规格文档**：好的 spec 不仅指导 agent，还成为团队知识的永久载体。这是一举两得的投资。

4. **增量实施，每步验证**：不要让 agent 一次性完成大量工作。小步快走，每一步都验证，失败时回滚到上一个已验证状态。

5. **在研究阶段投入足够的深度**：文章的 Hadoop 依赖移除失败案例表明，研究深度不足会导致级联的依赖冲突。浅层研究比没有研究更危险，因为它会产生虚假的信心。

6. **真正参与整个过程**：没有"单一 prompt 解决复杂问题"的捷径。成功需要在每个阶段的真实投入。

## 独到观点

文章最独特的贡献在于**将 context engineering 从"技术优化"提升为"工作流设计"**。大多数文章将 context 管理视为需要解决的技术问题，而 HumanLayer 将其视为塑造整个开发方法论的核心约束。40-60% 利用率的具体目标也非常实用——它给出了一个可以立即采用的量化标准。

**人类杠杆层级** 是另一个独特贡献。它为"人在哪里参与 AI 开发流程"这个关键问题提供了清晰的框架和经济学分析。研究和规划阶段的错误影响呈指数级放大，这个洞察改变了对"AI 辅助开发中人类角色"的思考方式。

文章的实际成果数据也非常有说服力：在 30 万行 Rust 代码库中 1 小时修复 bug，7 小时交付 3.5 万行功能代码。同时，失败案例（Hadoop 依赖移除）的坦诚分享也增加了可信度。

## 与其他文章的关联

- Frequent Intentional Compaction 是 [Anthropic: Context Engineering](./09-anthropic-context-engineering.md) 中 compaction 概念的工作流级别应用。
- 三阶段工作流与 [Anthropic: Harness Design](./03-anthropic-harness-design-long-running.md) 中 Planner → Generator → Evaluator 三 agent 架构形成有趣的对比——一个是人机协作的工作流，另一个是纯 agent 架构。
- 人类杠杆层级与 [Anthropic: Building Effective Agents](./06-anthropic-building-effective-agents.md) 中关于人类监督（human oversight）的讨论互补。
- Context window 作为工作流约束的理念与 [Manus: Context Engineering](./10-manus-context-engineering.md) 中 KV-cache 驱动设计的思想一致——都是将技术约束转化为设计驱动力。
- Spec-first development 与 [OpenAI: Harness Engineering](./01-openai-harness-engineering.md) 中 repo-native knowledge 和 PLANS.md 的理念相呼应。
- 对大型遗留代码库的关注与 [Fowler: Harness Engineering](./05-fowler-harness-engineering.md) 中 Retrofit vs. Greenfield 的讨论直接相关。
- 与 [HumanLayer: Skill Issue](./07-humanlayer-skill-issue.md) 是同一公司的系列文章，本文更侧重工作流设计，前者更侧重配置杠杆。
