Hermes Agent 深度解析:开源自进化 AI 智能体,开发者的“夜班团队“来了

张开发
2026/4/18 19:44:57 15 分钟阅读

分享文章

Hermes Agent 深度解析:开源自进化 AI 智能体,开发者的“夜班团队“来了
前言AI Agent 赛道又出新星2026 年 2 月 25 日一个名为Hermes Agent的开源项目在 GitHub 上悄然上线。短短不到两个月它收获了超过27,000 颗 Stars成为 AI 智能体领域的新星。4 月 13 日Hermes 发布 v0.9.0 “the everywhere release”过去两周合并 209 个 PR、解决 81 个 issue。看着很热闹但你可能跟我第一反应一样OpenClaw 的龙虾热还没散又来一个我花了一周时间把 Hermes 从头到尾拆了一遍又对照读完了官方 63 页教程。结论是Hermes 不是又一只龙虾它在做一件我们一直讨论但没人做成产品的事——把 Harness Engineering 的五个组件全内建了而且让缰绳自己长大。如果你在用 Claude Code这不是让你换工具的文章。如果你用过 OpenClawHermes 也不是龙虾的升级版。它解决的是另一个问题你不在场的时候Agent 怎么继续干活并变得越来越懂你。一、Hermes Agent 是什么物种一句话定义Hermes Agent 自改进学习循环 三层记忆 自主 Skill 系统 40 内置工具 多平台 Gateway全部 MIT 开源部署到 $5 VPS 就能 7×24 跑。它的官方 slogan 是 “The Agent That Grows With You”——会成长的 Agent。这句话很容易被当营销词读过去但拆开看会成长 它每次完成任务后会自动复盘决定什么该记住、什么该提炼成 Skill、现有 Skill 需不需要优化和你一起 它记得你是谁、知道你的偏好、理解你的工作习惯而不是每次从零开始我在《OpenClaw vs AI Agents 生态全景》里聊过 2026 年 Agent 赛道的几条路线。当时我没看到 Hermes 这种把 Harness Engineering 产品化的做法。它和 OpenClaw 的差别可以用一句话总结OpenClaw 是你养出来的龙虾Hermes 是自己会长大的龙虾。一个靠你用心喂养一个靠自己从经验中学习。核心数据一览指标数据GitHub stars27,000发布两个月内置工具40支持平台12v0.9.0 加入 Termux/iMessage/WeChatMCP 可接入6,000 应用子 Agent 并发最多 3 个最低部署成本$5/月 VPS内存占用500MB不跑本地 LLM许可证MIT完全开源二、为什么这次不一样从 Harness Engineering 到出厂就带缰绳如果你读过我之前那篇《AI 编码 Agent 2026 横评》可能记得一个观点2026 年初 AI 编码圈的共识是瓶颈不是模型是环境——LangChain 团队用同一个 GPT-5.2-Codex只调整缰绳配置成绩从 52.8% 涨到 66.5%排名从 Top 30 跳到 Top 5。Mitchell HashimotoTerraform 创始人给这事命了名Harness Engineering。他的做法很朴素——每次 AI 犯错就加一条规则到 CLAUDE.md让它永远不再犯同一个错。但方法论有一个问题执行全靠人。你得自己写 CLAUDE.md、自己配 hooks、自己搭记忆系统、自己设计工作流。Hermes 做的事情就一件把 Harness 的五个组件全部内建了而且自动运转。Harness 五组件手动实现方式Hermes 内建系统指令层手写 CLAUDE.md / AGENTS.mdSkill 系统markdown自动创建 自改进约束层配置 hooks / linter / CITool permissions sandbox toolset 按需启用反馈层人工审查 / 评估者 Agent自改进学习循环任务完成后自动复盘记忆层手动维护 knowledge base三层记忆会话/持久/Skill Honcho 用户建模编排层自己搭多 Agent pipeline子 Agent 委派 cron 调度看左列和右列的对比。左边全是手动操作你得是一个有经验的工程师才能搭出来。右边是开箱即用装完改一份 YAML 就有。这就是出厂就带缰绳的字面意思你不需要像 Mitchell 那样每次犯错加一条规则。Hermes 会自己观察、自己总结、自己写入 Skill、自己在下次调用时应用这些规则。人的参与从持续写规则变成偶尔审查一下。三、核心机制学习循环是怎么转起来的这是 Hermes 最值得琢磨的部分。很多 Agent 都说我有记忆但 Hermes 的记忆是活的它的 Skill 也是活的。学习循环有五个环节策划记忆 → 创建 Skill → Skill 自改进 → FTS5 召回 → 用户建模。单看每个都不新鲜但串起来形成了一个持续改进的飞轮。举一个官方教程里的真实例子假设你第一次让 Hermes 帮你写一个 Python 爬虫。它会写出一个能用的脚本但风格可能不是你喜欢的变量命名可能跟你的习惯不一样错误处理方式也未必符合你的预期。挺正常的毕竟它不认识你。到了第十次情况完全不同。它知道你偏好用 httpx 而不是 requests知道你习惯把错误日志写到文件而不是打印到终端知道你的项目结构通常在 src/ 目录下按模块划分知道你讨厌过长的函数。没有人教它这些。它是自己学会的。这个过程的关键在于用户反馈被沉淀为 Skill 文件。你每次的修改把进行优化改成优化一下把综上所述删掉都会被 Hermes 观察记录然后写入~/.hermes/skills/下的对应 markdown 文件。下次再调用时那条规则已经内化。我在《Claude Code 最佳实践》里写过Claude Code 的 CLAUDE.md 也能做类似的事但区别是CLAUDE.md 是人编写的AI 执行Skill 是 AI 编写的人可以覆盖。前者控制力更强后者门槛为零。三层记忆从金鱼到老友大多数 AI 聊天工具的记忆像金鱼上一轮说的话下一轮就忘了。Hermes 用三层架构解决第一层 会话记忆情景记忆回答发生了什么。每轮对话写入 SQLite FTS5 全文索引。关键设计是按需检索而不是全量加载——新对话开始时不把过去所有历史都塞进来而是根据当前话题 FTS5 搜索相关片段。第二层 持久记忆语义记忆回答你是谁。存的不是对话内容是从对话中提炼的持久状态编码偏好、项目结构习惯、常用工具链、工作时间规律。第三层 Skill 记忆程序性记忆回答怎么做事。每个 Skill 是~/.hermes/skills/下一个 markdown 文件可读可编辑。这三层对应认知科学里的三种记忆类型情景/语义/程序性。官方教程给了一个很直观的例子你说帮我部署这个项目Hermes 会先 FTS5 搜索会话记忆找到上次部署时遇到的端口冲突问题情景再查持久记忆知道你用的是阿里云 ECS、Nginx 反向代理语义最后加载 deployment-checklist.md 这个 Skill按验证过的步骤执行程序性三层各司其职。重点FTS5 是 SQLite 的全文搜索扩展所有数据存在本地~/.hermes/目录下。没有云端同步搬家时拷贝这个目录就行。对比 ChatGPT 那种看起来有记忆但其实每次都重新加载全部历史的做法Hermes 是按需检索数据库积累几个月对话也不会变慢。四、怎么装三种方式5 分钟到 24/7安装方式三选一以下步骤全部基于官方教程 v260407。方式一本地安装5 分钟上手# 官方一键脚本curl-fsSLhttps://raw.githubusercontent.com/NousResearch/hermes-agent/main/scripts/install.sh|bash脚本会自动处理 Python、Node.js 和所有依赖。macOS、Linux、WSL2 都能跑。装完编辑~/.hermes/config.yamlmodel:provider:openrouter# 模型提供商api_key:sk-or-xxxxx# 你的 API Keymodel:anthropic/claude-sonnet-4# 使用的模型terminal:local# 本地执行代码最后启动hermes没错就一个词。方式二Docker隔离干净dockerpull nousresearch/hermes-agent:latestdockerrun-v~/.hermes:/opt/data nousresearch/hermes-agent:latest-v ~/.hermes:/opt/data这个参数把容器的数据卷映射到宿主机所有状态记忆、Skill、配置都存在~/.hermes/一个目录下。容器删了数据不丢。方式三$5 VPS 24/7 运行推荐的长期方案这是 Hermes 真正的使用场景。如果你只是偶尔在笔记本上玩玩那 Claude Code 够用了。Hermes 的价值在于你睡觉的时候它也在干活。推荐配置VPS 提供商月费说明Hetzner CX22~$4/月性价比最高欧洲节点DigitalOcean Droplet$5/月新加坡/美西节点Vultr$5/月东京节点延迟低选 Ubuntu 22.04 LTSSSH 登录后跑一键脚本和本地安装一模一样。不跑本地模型的话内存占用不到 500MB$5 的机器绰绰有余。⚠️ 关于 provider 的一个重要提醒从官方教程里我看到一条很关键的信息——2026 年 4 月起Anthropic 封禁了第三方工具通过 Claude 订阅 (Pro/Max) 访问 Claude。Hermes、OpenClaw 等 Agent 框架都受影响。这意味着你不能再用 Claude Code 的订阅账号给 Hermes 共用只能走 API key 按量付费。但按 API 付费成本会高得多。我的建议起步阶段用 OpenRouter200 模型可选灵活切换试手感确定常用模型后再直连对应 API 省中间费国内用户可以考虑 z.ai/智谱的 GLM-5隐私敏感可以在 VPS 上跑 Ollama 开源模型需 16GB 以上内存五、v0.9.0 “the everywhere release”2026-04-13 刚发布这是昨天的新闻。v0.9.0 叫 “the everywhere release”直译是无处不在版。过去两周 209 个 PR 合并、81 个 issue 解决重点是把 Hermes 搬到所有你能想到的消息入口。核心新特性Termux / Android 移动端在安卓手机上跑一个完整的 Hermes 实例配合 Termux 做本地终端iMessage 集成苹果用户可以直接在系统 iMessage 里和 Hermes 对话国外场景WeChat 集成通过社区扩展的 WeChat Bot 接入Fast Mode for OpenAI and Anthropic针对 OpenAI/Anthropic 优化的快速响应模式减少学习循环的 token 消耗后台进程监控可视化当前有多少子 Agent 在跑、每个在做什么本地 Web 仪表板http://localhost:port 打开一个管理界面看记忆、Skill、任务历史这里有一个很 Nous Research 的设计哲学不是我来就我家是你在哪我去哪。传统 Agent 工具要求你打开它的界面。Hermes 的思路是让 Agent 藏在你原本就在用的入口后面——Telegram、微信、iMessage、Discord。你甚至意识不到自己在和一个AI Agent对话。我个人最看重的是 Fast Mode。官方教程提过学习循环的问题它的效率和使用频率直接相关。如果你一周只用一两次改进会很慢。Fast Mode 降低了单次调用的延迟和成本让高频使用这件事更可持续。六、实操场景Hermes 在我工作流里的位置讲了这么多机制问题来了你到底拿它干什么我现在同时用 Claude Code、Hermes 和 OpenClaw 三个工具。它们的分工是这样的Claude Code白天团队实时编码。我坐在终端前它写代码、跑测试、提交 git。核心价值是实时的代码生产力。Hermes夜班团队我不在场的事。官方教程给了一个典型场景我觉得很好早上 9 点打开电脑Telegram 弹出三条消息。不是同事发的是 Hermes 发的“昨晚 23:17main 分支有一个 PR 合并新增 387 行代码。审查了一下有两个问题auth 模块的 token 过期逻辑没处理边界情况测试覆盖率从 82% 掉到 76%。详细报告已存到项目 Skill 里。”“凌晨 2:40CI 流水线跑了一轮回归测试3 个用例失败。2 个是昨天那个 PR 引入的1 个是已知的 flaky test。”“今天的日报初稿已生成基于昨天的 4 个 commit 和 2 个 PR。需要你确认后发送。”这就是 Hermes 最擅长的事cron 调度 GitHub MCP 记忆系统让它在你睡觉时持续工作。OpenClaw标准化配置企业合规和团队协作场景。SOUL.md 一目了然可审计可复制。七、MCP 集成连接 6000 外部应用Hermes 内置 40 多个工具已经能打了但真实工作场景远不止这些。MCPModel Context Protocol让 Hermes 接入 GitHub、数据库、Slack、Jira 等 6000 多个外部服务不用写一行适配代码。接入 GitHub MCP 的完整配置mcp_servers:github:command:npxargs:[-y,modelcontextprotocol/server-github]env:GITHUB_PERSONAL_ACCESS_TOKEN:ghp_xxxxxallowed_tools:# per-server 工具过滤-list_issues-create_issue-get_pull_request-create_pull_request_review注意allowed_tools字段——即使 GitHub MCP Server 提供了删除仓库、修改设置等高权限工具Hermes 也只会用你白名单里的几个。最小权限原则在 Agent 时代比以往任何时候都重要。我在《Skill 和 MCP 的关系》里详细聊过这两者的配合。简单说MCP 解决能连什么Skill 解决怎么用。两者配合效果最好。八、和其他 AI Agent 工具怎么选不是选择题写到这里你可能想问我已经在用 Claude Code 了还要装 Hermes 吗我的判断三个工具不是三条路是三匹马。你要做的不是挑一匹是搞清楚谁拉货、谁赶路、谁看家。维度Claude CodeOpenClawHermes Agent核心理念交互式编码配置即行为自主后台 自改进你的角色坐在终端前指挥写配置文件定义行为部署后偶尔检查记忆机制CLAUDE.md auto-memory多层记忆SOUL.md Daily Logs三层自改进记忆Skill 来源手动安装ClawHub 44000Agent 自创 社区 Hub运行模式按需启动按需启动24/7 后台运行部署方式本地 CLI订阅制本地 CLI免费API 费$5 VPS / Docker / Serverless什么场景用哪个写新功能、重构代码→ Claude Code需要实时反馈和人的判断给团队搭标准化 Agent→ OpenClawSOUL.md 一目了然可审计可复制7×24 小时代码审查→ Hermescron 调度 GitHub MCP无人值守个人知识助手→ Hermes三层记忆跨会话积累越用越懂你搭客服/社区 Bot→ Hermes原生 12 平台 Gateway多端互通九、什么人适合装 Hermes读到这里你大概能判断自己该不该装。我总结 4 种适合的人你用过 Claude Code 或 OpenClaw想要一个能自主跑后台任务的 Agent。不是你坐在旁边盯着的那种是你睡觉它也在干活的那种。你对 Harness Engineering 了解好奇这套方法论被产品化之后是什么样子。Hermes 是目前唯一把 Harness 五组件全内建的 Agent。你想在自己的 VPS 上部署一个私有 AI Agent数据不离开自己的服务器。MIT 开源完全自托管。你做内容创作、个人知识管理、或者运营类工作需要一个能持续积累你的风格和偏好的助手。Claude Code 做单篇文章很好但第十篇和第一篇表现差不多Hermes 第十篇已经比第一篇好太多了。不适合装的人只是想快速验证一次性任务翻译一段话、写个小脚本→ 用 ChatGPT / Claude Code 就够了不想折腾 VPS 和配置文件 → 用 Claude Code 或 Cursor 订阅制更省心企业合规场景需要完全可审计的行为 → 用 OpenClaw 的 SOUL.md 配置更透明结语Agent 赛道的下一个里程碑Hermes Agent 的出现标志着 AI Agent 赛道从玩具走向工具。它不是第一个开源 Agent但它是第一个把 Harness Engineering 完整产品化的 Agent。它不是第一个有记忆的 Agent但它是第一个让记忆自己生长、自己优化的 Agent。两个月 27,000 stars这不是偶然。这是开发者用脚投票的结果。如果你一直在等一个装了就能用、用了就会成长的 AI AgentHermes 可能就是那个答案。最后送一句官方教程里的话“The best time to plant a tree was 10 years ago. The second best time is now.”种一棵树最好的时间是十年前其次是现在。部署一个 Hermes让它在你睡觉的时候开始学习。等你醒来它已经比你昨天离开时更懂你了。参考资料Hermes Agent 官方仓库https://github.com/NousResearch/hermes-agent《Hermes Agent 从入门到精通》教程 v260407https://github.com/alchaincyf/hermes-agent-orange-bookHermes Agent 深度解读https://www.ai-insight.org/reports/hermes-agent-2026官方教程 PDFhttps://github.com/NousResearch/hermes-agent/blob/main/docs/hermes-agent-tutorial-v260407.pdf

更多文章