云栈社区»论坛 › 开源实战「 OpenSource 」 › 开源 Hermes Agent 解析：基于自学习闭环与记忆架构的智能体框架 ...

发回帖发新帖

5739 积分	0 好友	724 主题

发消息

[Python] 开源 Hermes Agent 解析：基于自学习闭环与记忆架构的智能体框架

发表于 2026-4-12 00:41:49 | 查看: 211| 回复: 0

Hermes Agent | GitHub | Nous Research | MIT | v0.8.0 | 33 万行 Python | 判断：开源 Agent 中功能覆盖最广之一，自学习循环是核心差异。

如今的 AI Agent 框架多到让人有些审美疲劳。大多数框架的工作方式雷同：编写 Prompt → 配置工具 → 执行任务 → 任务结束，下次启动时一切归零。Hermes Agent 却做了一件不一样的事：它拥有记忆，并且能够自己编写和优化技能。

自学习闭环：三层记忆架构

Hermes 的核心竞争力在于其三层记忆架构：

即时记忆：当前会话的上下文信息。
程序性记忆（技能）：从复杂任务中自动创建的、可在使用中自主改进的技能。
用户建模：基于 Honcho 方言模型，能够跨会话构建详细的用户画像。

在实现上，记忆后端采用了 SQLite 结合 FTS5 全文搜索，并利用 LLM 生成摘要来支持跨会话的回忆。具体代码逻辑在 agent/memory_manager.py 的 MemoryManager 类中，它负责编排内置的记忆提供商以及最多一个外部插件提供商，且一个提供商的失败不会阻塞其他部分。

实际体验如何？比如，让它连续一周帮你做代码审查，它会逐渐记住你的代码风格、经常提出的反馈类型以及项目的技术栈偏好。目前的一个限制是，外部记忆提供商最多只能接一个，这意味着你无法同时使用 Notion 和本地文件系统作为记忆后端。

全栈架构：33 万行代码的工程化实现

Hermes Agent四层全栈架构示意图

整个项目由 33 万行 Python 代码构成，仅 v0.8.0 一个版本就合并了 209 个 PR。其架构清晰分为四层：

通讯层：一个统一的 Gateway 可同时接入 Telegram、Discord、Slack、WhatsApp、Signal 以及邮件。
执行层：支持六种后端：本地环境、Docker、SSH、Daytona、Singularity 和 Modal。其中 Daytona 和 Modal 支持无服务器持久化运行。
工具层：内置 48 种原生工具，外加 40 个工具集，并通过 MCP（Model Context Protocol）协议进行扩展。v0.8.0 版本新增了对 MCP OAuth 2.1 的支持，并集成了 OSV 恶意软件包扫描功能。
调度层：内置了 Cron 调度器，可以用自然语言描述定时任务，任务完成后会自动通知。

在安全性方面也做了加固，包括 SSRF 防护、时序攻击缓解、tar 文件路径穿越防护以及跨会话隔离等。

技能系统：渐进式披露与自我进化

Hermes Agent技能系统渐进式披露模型示意图

技能系统采用渐进式披露策略来节省 System Prompt 的 token 开销：Level 0 仅加载技能名称列表，Level 1 提供技能摘要，Level 2 才加载技能的完整详细内容。这巧妙地解决了将 48 种工具全量塞入 Prompt 所导致的 token 膨胀问题。

技能的生命周期包括自动创建、使用中改进、持久化存储，并兼容 agentskills.io 标准。v0.8.0 版本新增了子代理系统，可以启动隔离的子 Agent 来并行处理工作流，同时，Python 脚本可以通过 RPC 方式调用工具，将多步操作“折叠”成单轮对话来完成。

v0.8.0 版本亮点：更智能、更安全

Hermes Agent v0.8.0版本四大新增功能

该版本于 2026 年 4 月 8 日发布，包含了 209 个 PR 和 82 个 issue 的修复，主要亮点如下：

后台任务自动通知：长时间运行的进程完成后会主动通知 Agent，其跟踪的是实际工具活动时间而非简单的挂钟时间。
自诊断与修复：Agent 能够自行诊断并修复 GPT/Codex 工具调用时常见的 5 种失败模式。
MCP OAuth 2.1 安全增强：支持 PKCE 标准认证，并集成了 OSV 漏洞库用于自动扫描扩展包的安全性。
Google AI Studio 原生集成：直接支持 Gemini 模型，并能实时检测上下文长度。

快速上手

安装过程非常简单，通过以下命令即可：

curl -fsSL https://raw.githubusercontent.com/NousResearch/hermes-agent/main/scripts/install.sh | bash
source ~/.bashrc
hermes setup    # 启动配置向导

它支持 Linux、macOS 和 WSL2 环境。在模型支持上非常开放，不锁定任何供应商，支持 Nous Portal、OpenRouter（200+模型）、OpenAI、Anthropic、Gemini、Grok 等，甚至在会话中可以通过 /model 指令随时切换模型。

总结：它适合你吗？

适合场景：

需要长期运行、并能从交互中持续学习的 AI Agent。
希望将 Agent 部署到服务器，通过 Telegram/Slack 等平台随时交互。
对自学习和记忆管理有实际需求的复杂任务流。

不适合场景：

仅需运行单次任务的轻量级场景——此时使用 LangChain 或直接调用 API 可能更简单。
畏惧复杂配置——33 万行代码带来的学习曲线不低。
需要原生 Windows 支持——目前只能通过 WSL2 运行。

总而言之，Hermes Agent 在功能覆盖面上确实站在了开源 AI Agent 的前列。它的自学习闭环并非营销噱头，从记忆管理、技能进化到自诊断修复，确实构成了一个可运行的增强循环。当然，它并非一个开箱即用的“傻瓜”工具，需要你投入时间去配置和深入使用，才能充分体会到这些精心设计的价值所在。如果你对这类能够自主进化的智能体框架感兴趣，不妨在云栈社区与更多开发者一起交流探讨。

上一篇：GreptimeDB 如何借助 pgwire 与 datafusion-postgres 实现 PostgreSQL 协议兼容
下一篇：DeepTutor开源AI学习平台：五种模式统一线程与本地部署指南

智能代理, Python, 自学习, 开源项目, 智能助手