找回密码
立即注册
搜索
热搜: Java Python Linux Go
发回帖 发新帖

5065

积分

0

好友

672

主题
发表于 2 小时前 | 查看: 4| 回复: 0

Hermes Agent | GitHub | Nous Research | MIT | v0.8.0 | 33 万行 Python | 判断:开源 Agent 中功能覆盖最广之一,自学习循环是核心差异。

如今的 AI Agent 框架多到让人有些审美疲劳。大多数框架的工作方式雷同:编写 Prompt → 配置工具 → 执行任务 → 任务结束,下次启动时一切归零。Hermes Agent 却做了一件不一样的事:它拥有记忆,并且能够自己编写和优化技能

自学习闭环:三层记忆架构

Hermes 的核心竞争力在于其三层记忆架构:

  • 即时记忆:当前会话的上下文信息。
  • 程序性记忆(技能):从复杂任务中自动创建的、可在使用中自主改进的技能。
  • 用户建模:基于 Honcho 方言模型,能够跨会话构建详细的用户画像。

在实现上,记忆后端采用了 SQLite 结合 FTS5 全文搜索,并利用 LLM 生成摘要来支持跨会话的回忆。具体代码逻辑在 agent/memory_manager.pyMemoryManager 类中,它负责编排内置的记忆提供商以及最多一个外部插件提供商,且一个提供商的失败不会阻塞其他部分。

实际体验如何?比如,让它连续一周帮你做代码审查,它会逐渐记住你的代码风格、经常提出的反馈类型以及项目的技术栈偏好。目前的一个限制是,外部记忆提供商最多只能接一个,这意味着你无法同时使用 Notion 和本地文件系统作为记忆后端。

全栈架构:33 万行代码的工程化实现

Hermes Agent四层全栈架构示意图

整个项目由 33 万行 Python 代码构成,仅 v0.8.0 一个版本就合并了 209 个 PR。其架构清晰分为四层:

  • 通讯层:一个统一的 Gateway 可同时接入 Telegram、Discord、Slack、WhatsApp、Signal 以及邮件。
  • 执行层:支持六种后端:本地环境、Docker、SSH、Daytona、Singularity 和 Modal。其中 Daytona 和 Modal 支持无服务器持久化运行。
  • 工具层:内置 48 种原生工具,外加 40 个工具集,并通过 MCP(Model Context Protocol)协议进行扩展。v0.8.0 版本新增了对 MCP OAuth 2.1 的支持,并集成了 OSV 恶意软件包扫描功能。
  • 调度层:内置了 Cron 调度器,可以用自然语言描述定时任务,任务完成后会自动通知。

在安全性方面也做了加固,包括 SSRF 防护、时序攻击缓解、tar 文件路径穿越防护以及跨会话隔离等。

技能系统:渐进式披露与自我进化

Hermes Agent技能系统渐进式披露模型示意图

技能系统采用渐进式披露策略来节省 System Prompt 的 token 开销:Level 0 仅加载技能名称列表,Level 1 提供技能摘要,Level 2 才加载技能的完整详细内容。这巧妙地解决了将 48 种工具全量塞入 Prompt 所导致的 token 膨胀问题。

技能的生命周期包括自动创建、使用中改进、持久化存储,并兼容 agentskills.io 标准。v0.8.0 版本新增了子代理系统,可以启动隔离的子 Agent 来并行处理工作流,同时,Python 脚本可以通过 RPC 方式调用工具,将多步操作“折叠”成单轮对话来完成。

v0.8.0 版本亮点:更智能、更安全

Hermes Agent v0.8.0版本四大新增功能

该版本于 2026 年 4 月 8 日发布,包含了 209 个 PR 和 82 个 issue 的修复,主要亮点如下:

  • 后台任务自动通知:长时间运行的进程完成后会主动通知 Agent,其跟踪的是实际工具活动时间而非简单的挂钟时间。
  • 自诊断与修复:Agent 能够自行诊断并修复 GPT/Codex 工具调用时常见的 5 种失败模式。
  • MCP OAuth 2.1 安全增强:支持 PKCE 标准认证,并集成了 OSV 漏洞库用于自动扫描扩展包的安全性。
  • Google AI Studio 原生集成:直接支持 Gemini 模型,并能实时检测上下文长度。

快速上手

安装过程非常简单,通过以下命令即可:

curl -fsSL https://raw.githubusercontent.com/NousResearch/hermes-agent/main/scripts/install.sh | bash
source ~/.bashrc
hermes setup    # 启动配置向导

它支持 Linux、macOS 和 WSL2 环境。在模型支持上非常开放,不锁定任何供应商,支持 Nous Portal、OpenRouter(200+模型)、OpenAI、Anthropic、Gemini、Grok 等,甚至在会话中可以通过 /model 指令随时切换模型。

总结:它适合你吗?

适合场景

  • 需要长期运行、并能从交互中持续学习的 AI Agent。
  • 希望将 Agent 部署到服务器,通过 Telegram/Slack 等平台随时交互。
  • 对自学习和记忆管理有实际需求的复杂任务流。

不适合场景

  • 仅需运行单次任务的轻量级场景——此时使用 LangChain 或直接调用 API 可能更简单。
  • 畏惧复杂配置——33 万行代码带来的学习曲线不低。
  • 需要原生 Windows 支持——目前只能通过 WSL2 运行。

总而言之,Hermes Agent 在功能覆盖面上确实站在了 开源 AI Agent 的前列。它的自学习闭环并非营销噱头,从记忆管理、技能进化到自诊断修复,确实构成了一个可运行的增强循环。当然,它并非一个开箱即用的“傻瓜”工具,需要你投入时间去配置和深入使用,才能充分体会到这些精心设计的价值所在。如果你对这类能够自主进化的智能体框架感兴趣,不妨在 云栈社区 与更多开发者一起交流探讨。




上一篇:GreptimeDB 如何借助 pgwire 与 datafusion-postgres 实现 PostgreSQL 协议兼容
下一篇:DeepTutor开源AI学习平台:五种模式统一线程与本地部署指南
您需要登录后才可以回帖 登录 | 立即注册

手机版|小黑屋|网站地图|云栈社区 ( 苏ICP备2022046150号-2 )

GMT+8, 2026-4-12 02:52 , Processed in 0.638418 second(s), 39 queries , Gzip On.

Powered by Discuz! X3.5

© 2025-2026 云栈社区.

快速回复 返回顶部 返回列表