# 当 Agent 开始积累经验：自我进化工程的设计取舍

## 整体立场

AI agent 从"一次性工具"走向"持续学习的系统"，核心工程挑战不是算法创新，而是在自动化程度、安全约束和知识质量之间找到可持续的平衡点。

## 推进逻辑

知识如果没有标准化载体就无法积累（第1篇）→ 积累需要解决"给多少、何时给"的注入难题（第2篇）→ 从积累到改进，需要在多层机制之间建立交接标准（第3篇）→ 改进能力越强，约束设计就越关键（第4篇）→ 约束的边界最终取决于你对自动化的信任程度（第5篇）

## 差异化声明

多数 AI agent 讨论关注模型能力或 prompt 技巧。本系列讨论一个更底层的工程问题：当你决定让 agent 从经验中学习时，会遭遇哪些设计取舍，以及 Hermes 生态的实践为这些取舍提供了什么参考坐标。

## 项目特有概念

- Learning Loop（执行→记忆→提炼→改进）
- agentskills.io（跨 30+ 产品的 skill 标准，progressive disclosure 加载）
- GEPA（精准变异优化，$2-10/cycle）
- Dojo（session log 驱动的夜间自动改进）
- Skill Distillation（真实任务轨迹→训练数据）
- Engram（PLUR 的记忆单元，含 ACT-R 衰减）
- CaMeL（数据流信任边界的安全模型）
- Context Isolation（多 agent 间的上下文隔离原则）

## 文章列表

### 第1篇: 知识载体的标准化问题
- 核心观点: 系统性学习的前提是知识有可移植的载体。agentskills.io 用"文件夹+Markdown"解决了跨平台复用，但自动生成的质量控制仍在早期——标准化的价值在于降低知识投资的锁定风险，而非保证每条知识的质量
- 关键素材: insights/02-skill-system-ecosystem.md, insights/01-hermes-architecture-philosophy.md
- 依赖: 无

### 第2篇: 记忆注入的工程经济学
- 核心观点: 记忆的价值不在于存多少，而在于何时注入多少。上下文窗口有物理极限，超过阈值推理质量下降，因此记忆工程的核心是"注入预算"的分配策略，而非存储容量的扩展
- 关键素材: insights/03-memory-persistence-evolution.md
- 依赖: 第1篇（承接"知识被标准化存储后，如何被高效利用"）

### 第3篇: 自动改进的层间交接问题
- 核心观点: "发现问题→优化配置→生成训练数据"三层递进在概念上清晰，但层间触发标准的缺失是最大的工程负债。多层自动化的难点在于各层使用不同评估标准，无法直接比较改进幅度
- 关键素材: insights/01-hermes-architecture-philosophy.md（Self-evolving 部分）, insights/03-memory-persistence-evolution.md（自我进化部分）
- 依赖: 第2篇（承接"知识积累后如何转化为行为改进"）

### 第4篇: 隔离与共享的零和博弈
- 核心观点: 多 agent 场景暴露了一个根本矛盾：执行质量需要 context isolation，学习效率需要 knowledge sharing。三种编排哲学（竞争/辩论/协同）对这个矛盾给出了不同的折中方案，但 agent 数量存在收益递减的甜点
- 关键素材: insights/04-multi-agent-coordination.md
- 依赖: 第3篇（承接"单 agent 进化扩展到多 agent 时的协调成本"）

### 第5篇: 自动化信任的边界在哪里
- 核心观点: "让 agent 自主改进"与"让工程师精密控制"是同一光谱的两端。Hermes 和 Claude Code 分别占据了这个光谱的不同位置，两者可以通过 bridge 协作。最终的边界设定取决于场景的风险承受度和监督成本
- 关键素材: insights/06-hermes-vs-claude-code-comparison.md, insights/05-deployment-operations.md
- 依赖: 第4篇（承接"进化能力越强，约束设计问题越突出"）