# 为什么 Hermes 会超越 OpenClaw：用户需要什么样的AI产品

`2026-06-04`

过去一段时间，Hermes 和 OpenClaw 在 AI Agent 社区里被反复对比。表面上两者都属于"能调用工具、能跨平台交互、能长期运行"的 Agent，但是稍微拆开看，它们是两条完全不同的产品路径。

在OpenClaw最如日中天的时候，我在《Moltbot (ClawdBot) 是对的，但它不是未来》和《OpenClaw 走红背后的冷思考：每个人都该拥有一台"私人助理服务器"》两篇里下过一个判断：OpenClaw 这套思路方向是对的，但部署形态和产品边界都还没收敛，一定会遇到很多现实问题。现在Hermes 在 OpenRouter 上反超 OpenClaw 这件事，把当时的判断又往前推了一步。Hermes 选的人群、它的工程化定位，尤其是它把云端常驻作为默认部署形态，几乎都印证了我之前对"私人助理服务器"的判断。

这篇文章想把这条分水岭说清楚，再回答一个更现实的问题：如果 Hermes 和 OpenClaw 都不是大众 AI 的终局，那什么才是？

## 一、两条路径，两种用户假设

OpenClaw 的故事更接近大众想象里的"全能个人助理"。它能清收件箱、发邮件、管日历、办值机，可以挂在飞书或微信里像聊天一样调用。这个叙事一上来就击中普通人对 AI 的终极想象：不用学软件，发一句话，AI 帮我搞定数字生活的一切。也正是这个故事让它成为了今年最火热的AI产品。

Hermes 的叙事则明显工程化得多。它把自己定位成一个长期运行、有记忆、有技能沉淀的开发者 Agent。终端里能跑，服务器和 VPS 上也能跑，消息平台里同样能挂。它能管多个模型、多套工具和多个 session，经验还可以沉淀成可复用的 skills。

更关键的一点是，Hermes 把"云端常驻"作为默认部署形态。这恰好和我之前的判断对上了。在《OpenClaw 走红背后的冷思考》里我谈过，把 Agent 寄生在 Mac 这种工作机上，会受到环境不纯粹、网络孤岛和能耗失衡这三层天花板的限制。Hermes 直接把私人助理服务器当作正路：24 小时在线，标准 Linux 环境，能被消息平台或 Web 远程触发，这种部署形态本身就比 OpenClaw 那种以本地 Mac 为主的形态更接近终局，也是更好的方式。

所以 Hermes 在 OpenRouter 这种开发者密集的平台上能反超 OpenClaw，并不奇怪。它没想解决"所有人"的问题，它精准服务了一群真正会用 Agent、愿意折腾 Agent，也能从 Agent 中持续拿到收益的人。

## 二、Hermes 的用户匹配度更高

目前 AI Agent 真正的瓶颈，主要还是用户能不能驾驭它。模型本身已经够用，卡点在于任务怎么定义、上下文怎么给、结果怎么评估、失败怎么处理（这些专业性主题可以参考我写的关于Harness工程的系列文章），而开发者天然就具备这四种能力（或者至少愿意去理解）。

开发者手边有代码仓库和文件结构，也有测试、日志和 PR，还有 diff、CI 和回滚机制。他们知道怎么描述任务，也知道怎么判断结果对不对。一个开发者可以让 Hermes 检查服务器日志、定位 failing tests，再调 Codex 或 Claude Code 写补丁，最后把 diff 和 review 整理好，等他在飞书上远程审批。这类场景高频、明确、可验证，用户也愿意承担前置配置成本。

普通 chatbot 完全做不了这种活。Chatbot 适合一次性问答和总结改写，但缺长期上下文，缺工具执行，也缺后台任务和持续记忆。Hermes 的价值正好出现在 chatbot 做不到的地方：跨 session 的项目记忆、多工具协作、远程触发和可复用技能。

Hermes 强不是因为它更适合普通人，而是因为它非常适合"当下最能把 AI 用起来的那群人"。

## 三、OpenClaw 的真正问题：对普适场景的过度承诺

OpenClaw 的方向长期看不算错。全能个人 AI 助理是个巨大的终局市场。问题在于，终局不等于当下可落地。

之前在《Moltbot 是对的，但它不是未来》里我提过一堵"业务逻辑的墙"。OpenClaw 演示视频里订机票、查天气、发邮件都很顺滑，但当你让它"分析过去三年体检报告并结合饮食给建议"，它就走不下去了。体检报告是 PDF 还是 Excel，饮食记录在哪个 App 里，这些都不是 Agent 能凭通用框架自动猜出来的。普通人的需求看似日常，实际上太散、太隐性、太难定义，缺少清晰的验证机制。

更难的是，OpenClaw 一边把使用门槛设得很高，一边又承诺服务普通人。用户要配模型，要接消息平台，要授权邮箱和文件系统，还要理解权限风险、处理报错和成本。开发者还能扛，普通人立刻就矛盾起来：既然你说自己是普通人的全能助理，为什么我还要懂这么多技术细节？

OpenClaw 的困境不在能力，在战略错位。它用一个需要技术用户驾驭的系统，去承诺解决普通用户的普适需求。早期 demo 越惊艳，社区传播越迅猛，但长期留存越是会撑不住。

## 四、Agent 的复杂度不会消失，只会被转移

Hermes 和 OpenClaw 走的方向不同，但底层卡的是同一件事：Agent 的复杂度不会凭空消失。

只要 AI 不只是聊天，而是要行动和记忆、要调用工具和读写文件、要跨平台交互，就一定要面对上下文管理、权限控制和成本控制，再加上安全风险、错误恢复和用户信任。Hermes 也不例外。它的 token 消耗可能很高，工具 schema、skills、memory 加上 session 注入都在烧上下文。它的 topic、session、provider 和 background 这些机制对普通人也不友好。它一旦接入 shell、文件系统、服务器和消息平台，就变成一个高权限常驻进程，安全边界必须很谨慎。

Hermes 的优势在于它没有假装这些复杂度不存在。它服务的那群人本来就理解 sandbox，知道为什么要看 diff，知道为什么先只读日志，知道为什么不能让 Agent 自动部署生产环境。复杂度和用户能力是匹配的。

OpenClaw 把复杂度藏在了"个人助理"的承诺后面。当普通用户发现它需要配置、授权、调试和纠错，落差就来了。这不是某个功能没做好，是产品抽象层级和用户能力之间出现了错配。

## 五、Codex 是更稳妥的大众化路径

如果目标是把 AI 能力推向更普适的用户，Codex 的路线更稳。它没从一开始就承诺"AI 帮所有人管理生活"，而是先切开发者高价值、高频且可验证的场景。

代码任务是 AI Agent 最适合的训练场。代码世界有天然结构：仓库和文件、测试和依赖、提交记录和错误日志、PR 和 CI。Agent 干得好不好，可以用测试、diff 和人工审查来判断。开发者本身熟悉工具链和调试流程，对早期产品的不完美也更宽容。

Codex 没有停在开发者工具里，它走进了 ChatGPT 这种大众入口。用户可以在手机上看任务、审批变更、继续线程，也可以连远程运行环境。先在专业场景里磨可靠能力，再把能力放进大众已经熟悉的入口，是一条非常聪明的路径。

OpenClaw 是从"全能个人助理"的终局往下找落地场景，Codex 则是从"可验证的专业任务"往外扩到更广泛的工作流。当前阶段，后者明显更稳妥得多。它靠真实任务建立信任，而过度承诺只能昙花一现。

## 六、普通用户其实不需要 OpenClaw 式的 Agent

回到普通用户本身。很多高频 AI 场景，chatbot 已经能解决。总结文章、润色邮件、生成计划，加上翻译和写文案，这些任务不需要 Hermes 或 OpenClaw。打开 豆包或ChatGPT，粘贴内容，问一句，结果就出来。

Chatbot 简单，但也限制了 AI 的更强能力。它通常没有长期上下文，用户得手动搬材料。它不天然理解用户已有的数据资产，也没法在持续空间里积累和操作。

真正的中间地带，是设计一种"低认知门槛的上下文型 AI 产品"。它不应该长得像 Agent，而应该长得像普通人已经熟悉的软件，比如笔记本、相册、文件夹、邮箱或学习资料库。用户只要做一点点事情：保存、拍照、拖入文件、选一批材料、点击生成，AI 就能拿到超过 chatbot 的能力。

## 七、用户已有的数据资产，才是大众 AI 的入口

普通人没有代码仓库，但他们有自己的"弱 repo"。笔记和文档、截图和照片、聊天记录和邮件、日历和账单，再加上健康数据、学习资料、家庭合同和旅行计划，这些资产本来就在，只是没有被组织成 AI 可以持续工作的空间。

笔记软件是最典型的样本。一个人的笔记库里有长期思考和碎片记录，也有项目资料和读书摘录。AI 进了笔记库就不再是单轮聊天，它可以提主题、找知识空洞、生成总结，也可以整理文章、回顾决策、画长期知识地图。这几乎就是普通人版本的代码仓库。

类似的入口还有不少：

- 相册和截图，可以变成视觉知识库，整理旅行、消费和家庭事件
- 邮箱和聊天记录，可以变成事务雷达，提取承诺与截止日期
- 家庭文档柜，可以管合同、保险和到期提醒
- 浏览器，可以变成研究工作台，把连续看过的网页整理成对比表
- 健康数据，可以变成趋势解释器，而不是医疗诊断器
- 学习资料库，可以基于错题和课件生成复习路径

这些场景共通的一点：用户不用学复杂 agent 操作，也不用授权 AI 接管人生。用户只是把已有材料放进一个空间，AI 在这个空间里做整理、抽取、生成和提醒。这种产品比 chatbot 更强，因为它利用了长期上下文。又比 OpenClaw 更轻，因为它不需要高权限自动执行。

## 八、未来的大众 AI，可能是 AI Workspace 而非 Agent

适合普通用户的产品形态，更像"你有一个带 AI 的上下文容器"。它不要求用户给命令、等待行动，而是把 AI 嵌在用户已经熟悉的空间里。这个容器可以是文件夹、项目板、笔记库、相册或学习空间。

它的交互方式也应该极其简单。不是命令，是提示：

> "我发现这些材料可以分成四类。"
> "这里有三个日期可能要提醒。"
> "这些截图可以整理成一张购物对比表。"
> "你过去一个月笔记里反复提到同一个问题，要不要合并成一篇总结？"
> "这个旅行文件夹里缺签证材料和保险单。"

这是普通用户能理解、能验证、能持续使用的 AI。它不承诺接管一切，只在用户已有的数据资产上加一层智能组织能力。

至于这种 AI Workspace 跑在哪儿，我在《再谈 OpenClaw 与私人服务器：从"宠物"到"牛群"的代码成人礼》里讨论过。本地、私人服务器和集群分别对应小孩、青年和大人三个阶段。AI Workspace 起步可以是本地笔记库或个人服务器，长大之后再往集群迁。这条演化路径对开发者来说已经成熟，对普通用户的产品也一样适用。区别只在于普通用户感知不到这层基础设施，他们只看到自己的笔记库突然就变得善解人意了。

## 九、结论

Hermes 反超 OpenClaw，说明的是一条朴素的产品规律：越早期的技术，越应该服务那些能定义问题、能评估结果、能容忍复杂度的人群。Hermes 找到了这群人，又选对了云端常驻的部署形态，所以它跑起来了。OpenClaw 把目标指向更大的普通人市场，复杂度和权限、成本和需求模糊性，都在每日蚕食它的留存。

Codex 的路径更合理，因为它先在开发者场景建立可验证的能力，再走进 ChatGPT 这种大众入口，让更广泛的用户逐步拿到能力，而不是一开始就承诺全能。

要找真正面向大众的 AI 产品机会，方向不在复制 OpenClaw 式的无限承诺，也不在把 Hermes 这种开发者 Agent 硬塞给普通人。方向是围绕普通人已有的数据资产，构建低摩擦的 AI Workspace。笔记和相册、邮箱和日历、家庭文档和学习资料，这些已经在用户的硬盘和云盘里，或者即将非常简单地迁移到精明的创业者的App里。用户只要轻轻做一点点，AI 就能在已有上下文里产生超过 chatbot 的价值。

普及的 AI 产品未必是无所不能的 Agent，更可能是无数个嵌入日常数据空间的智能容器。它们不接管人生，但能在用户最熟悉的地方把已有信息变成可理解、可决策、可行动的东西。