# Honcho Self-Hosted

> 仓库地址：https://github.com/elkimek/honcho-self-hosted
> 作者/组织：elkimek
> 成熟度：beta
> 分析日期：2026-04-15

## 一句话总结
将 Plastic Labs 的 Honcho memory 基础设施部署在个人服务器上的自托管方案，三个配置文件即可实现数据主权，无需修改 Hermes Agent 代码。

## 项目定位与架构
Honcho 是一个四层 memory 系统（Deriver 观察提取 → Dialectic 记忆召回 → Summary 上下文压缩 → Dream 记忆合并），官方提供云服务，本项目将其部署到个人服务器实现数据主权。

架构：Hermes Agent → localhost:8000 (self-hosted Honcho API) → PostgreSQL + pgvector (本地存储) + Redis (缓存) + Background workers (Deriver/Dialectic/Dream) → Primary/Backup LLM providers。仅三个配置文件：`docker-compose.yml`、`config.toml`、`.env`。

支持双 LLM provider（primary + backup，自动 failover），可混合不同 provider 到不同 memory 组件（如"快速模型处理高频任务、强推理模型处理低频任务"）。

## 关键技术特性
- **数据主权**：所有数据本地存储，不经第三方云
- **四层 memory 系统**：Deriver（每条消息）→ Dialectic（每个 agent turn）→ Summary（20-60 条消息）→ Dream（每~8小时）
- **双 provider failover**：primary + backup 自动切换
- **组件级 model 配置**：每个 memory 组件可指定不同 provider 和 model
- **一键安装**：`curl | bash` 约 3 分钟完成
- **可选 MCP server**：暴露 memory 工具给 Claude Code 等 MCP 客户端
- **本地推理支持**：Ollama、vLLM、llama.cpp（推荐 32B+ 模型）

## 设计亮点与创新
三个配置文件的极简集成设计值得称赞——不修改 Hermes Agent 代码，仅通过 `honcho-config.json` 将 endpoint 指向 localhost。组件级 model 配置允许精细的性能/成本优化。文档明确对比了三种部署模式的 privacy/setup time/cost tradeoff。LoCoMo memory benchmark 数据（Neuromancer 86.9% vs base Qwen3-8B 69.6%）提供了量化参考。

## 局限性与风险
单 backup provider 设计，非完整 failover chain。Function-calling 需求阻止了端到端加密——LLM provider 可见请求内容。本地推理限制：embedding 需要云 API，14B 以下模型可能 miss tool calls。GPL-3.0 许可可能影响某些商业场景。

## 与生态系统的关联
是 Hindsight（学习型 memory）在对话记忆维度的互补——Honcho 专注跨 session 对话连续性，Hindsight 专注长期学习。通过 MCP server 可扩展到 Claude Code 等非 Hermes 客户端。展示了将第三方 SaaS 自托管化的社区模式。