# Gladiator

> 仓库地址：https://github.com/runtimenoteslabs/gladiator
> 作者/组织：RuntimeNotes Labs
> 成熟度：experimental
> 分析日期：2026-04-15

## 一句话总结
一个实验性演示系统，让两个零人类 AI 公司（Blitz 增长型 vs Craft 质量型）竞争改进同一开源产品，展示 agent 自主学习和团队协作能力。

## 项目定位与架构
Gladiator 是一个极具表演性的实验——通过竞争机制验证 AI agent 的自主能力。两个"公司"各有独立的 agent 团队（Blitz 4 agents、Craft 5 agents），在 5-6 分钟内完成 10 个任务的竞赛，星数公式：`(tasks × 8) + (unique skills × 5) + (skill versions × 3)`。

架构四组件：Paperclip（Node.js + PostgreSQL 16，端口 3100，编排层）→ Hermes Agent（Python CLI + Anthropic，agent 执行层）→ FastAPI Dashboard（SSE + vanilla JS，端口 4000，可视化层）→ SQLite（WAL mode，evidence 存储）。

竞赛完成后可执行 merge——跨团队 skill 转移，验证知识共享效果。成本约 $5-6/次（使用 Claude Sonnet/Haiku）。

## 关键技术特性
- **自主竞赛机制**：10 任务 / 5-6 分钟，9 个 agent 并行工作
- **Agent 学习追踪**：SKILL.md 创建、MEMORY.md 快照、cross-session continuity
- **实时 Dashboard**：九区域实时记分板、side-by-side 代码比较、Gantt 图、审计轨迹
- **Post-competition Merge**：跨团队 skill 转移和知识共享
- **Evidence Collection**：量化学习指标（skill usage events、memory growth）
- **Token 优化**：Anthropic prompt caching (5min TTL) + 非代码 agent strip unused skills

## 设计亮点与创新
将 AI agent 能力验证框架化为"公司竞争"的叙事非常有吸引力。关键洞察在于学习能力的量化——通过 SKILL.md 创建和版本追踪，将"agent 是否在学习"变成可观测的指标。Post-competition merge 验证了跨团队知识迁移的可行性。Dashboard 的九区域设计提供了极其丰富的竞赛可视化。

## 局限性与风险
Paperclip adapter v0.1.1 有两个已知 bug 需手动 patch（env variable unwrapping + Anthropic provider）。Dashboard 重启丢失内存状态。600 秒硬性超时可能截断未完成任务。每次竞赛 $5-6 成本限制了频繁实验。依赖 PostgreSQL 16+ 和较复杂的多组件安装流程。

## 与生态系统的关联
展示了 Hermes Agent 的 Skills（自主创建 SKILL.md）、Memory（持久 MEMORY.md）、Sessions（cross-session continuity）等核心能力。与 hermes-council（agent 辩论协商）和 hermes-miniverse（agent 社交化）同属探索 agent 交互模式的实验。使用 Paperclip 作为编排层，展示了第三方 orchestrator 与 Hermes 的集成模式。诞生于 2026 Nous Research Hermes Agent Hackathon。
