Hermes Agent | GitHub | Nous Research | MIT | v0.8.0 | 33 万行 Python | 判断:开源 Agent 中功能覆盖最广之一,自学习循环是核心差异。
如今的 AI Agent 框架多到让人有些审美疲劳。大多数框架的工作方式雷同:编写 Prompt → 配置工具 → 执行任务 → 任务结束,下次启动时一切归零。Hermes Agent 却做了一件不一样的事:它拥有记忆,并且能够自己编写和优化技能。
自学习闭环:三层记忆架构
Hermes 的核心竞争力在于其三层记忆架构:
- 即时记忆:当前会话的上下文信息。
- 程序性记忆(技能):从复杂任务中自动创建的、可在使用中自主改进的技能。
- 用户建模:基于 Honcho 方言模型,能够跨会话构建详细的用户画像。
在实现上,记忆后端采用了 SQLite 结合 FTS5 全文搜索,并利用 LLM 生成摘要来支持跨会话的回忆。具体代码逻辑在 agent/memory_manager.py 的 MemoryManager 类中,它负责编排内置的记忆提供商以及最多一个外部插件提供商,且一个提供商的失败不会阻塞其他部分。
实际体验如何?比如,让它连续一周帮你做代码审查,它会逐渐记住你的代码风格、经常提出的反馈类型以及项目的技术栈偏好。目前的一个限制是,外部记忆提供商最多只能接一个,这意味着你无法同时使用 Notion 和本地文件系统作为记忆后端。
全栈架构:33 万行代码的工程化实现

整个项目由 33 万行 Python 代码构成,仅 v0.8.0 一个版本就合并了 209 个 PR。其架构清晰分为四层:
- 通讯层:一个统一的 Gateway 可同时接入 Telegram、Discord、Slack、WhatsApp、Signal 以及邮件。
- 执行层:支持六种后端:本地环境、Docker、SSH、Daytona、Singularity 和 Modal。其中 Daytona 和 Modal 支持无服务器持久化运行。
- 工具层:内置 48 种原生工具,外加 40 个工具集,并通过 MCP(Model Context Protocol)协议进行扩展。v0.8.0 版本新增了对 MCP OAuth 2.1 的支持,并集成了 OSV 恶意软件包扫描功能。
- 调度层:内置了 Cron 调度器,可以用自然语言描述定时任务,任务完成后会自动通知。
在安全性方面也做了加固,包括 SSRF 防护、时序攻击缓解、tar 文件路径穿越防护以及跨会话隔离等。
技能系统:渐进式披露与自我进化

技能系统采用渐进式披露策略来节省 System Prompt 的 token 开销:Level 0 仅加载技能名称列表,Level 1 提供技能摘要,Level 2 才加载技能的完整详细内容。这巧妙地解决了将 48 种工具全量塞入 Prompt 所导致的 token 膨胀问题。
技能的生命周期包括自动创建、使用中改进、持久化存储,并兼容 agentskills.io 标准。v0.8.0 版本新增了子代理系统,可以启动隔离的子 Agent 来并行处理工作流,同时,Python 脚本可以通过 RPC 方式调用工具,将多步操作“折叠”成单轮对话来完成。
v0.8.0 版本亮点:更智能、更安全

该版本于 2026 年 4 月 8 日发布,包含了 209 个 PR 和 82 个 issue 的修复,主要亮点如下:
- 后台任务自动通知:长时间运行的进程完成后会主动通知 Agent,其跟踪的是实际工具活动时间而非简单的挂钟时间。
- 自诊断与修复:Agent 能够自行诊断并修复 GPT/Codex 工具调用时常见的 5 种失败模式。
- MCP OAuth 2.1 安全增强:支持 PKCE 标准认证,并集成了 OSV 漏洞库用于自动扫描扩展包的安全性。
- Google AI Studio 原生集成:直接支持 Gemini 模型,并能实时检测上下文长度。
快速上手
安装过程非常简单,通过以下命令即可:
curl -fsSL https://raw.githubusercontent.com/NousResearch/hermes-agent/main/scripts/install.sh | bash
source ~/.bashrc
hermes setup # 启动配置向导
它支持 Linux、macOS 和 WSL2 环境。在模型支持上非常开放,不锁定任何供应商,支持 Nous Portal、OpenRouter(200+模型)、OpenAI、Anthropic、Gemini、Grok 等,甚至在会话中可以通过 /model 指令随时切换模型。
总结:它适合你吗?
适合场景:
- 需要长期运行、并能从交互中持续学习的 AI Agent。
- 希望将 Agent 部署到服务器,通过 Telegram/Slack 等平台随时交互。
- 对自学习和记忆管理有实际需求的复杂任务流。
不适合场景:
- 仅需运行单次任务的轻量级场景——此时使用 LangChain 或直接调用 API 可能更简单。
- 畏惧复杂配置——33 万行代码带来的学习曲线不低。
- 需要原生 Windows 支持——目前只能通过 WSL2 运行。
总而言之,Hermes Agent 在功能覆盖面上确实站在了 开源 AI Agent 的前列。它的自学习闭环并非营销噱头,从记忆管理、技能进化到自诊断修复,确实构成了一个可运行的增强循环。当然,它并非一个开箱即用的“傻瓜”工具,需要你投入时间去配置和深入使用,才能充分体会到这些精心设计的价值所在。如果你对这类能够自主进化的智能体框架感兴趣,不妨在 云栈社区 与更多开发者一起交流探讨。
|