云栈社区»论坛 › 技术文档「 Note & Doc 」 › Hermes Agent技能系统(Skills)详解：核心机制、管理与内置技能大 ...

发回帖发新帖

4218 积分	0 好友	554 主题

发消息

Hermes Agent技能系统(Skills)详解：核心机制、管理与内置技能大全

发表于 2026-4-2 05:08:39 | 查看: 213| 回复: 0

如果你熟悉OpenClaw（龙虾），那么上手Hermes Agent会倍感亲切。它在设计理念和架构上有很多相似之处，但在细节与生态上更为强大。其中，技能系统 (Skills System) 无疑是其核心亮点之一，它让Agent具备了自我进化与知识沉淀的能力。

Hermes Agent技能系统官方文档截图

目录结构

完成首次安装后，Hermes Agent的主目录结构如下：

~/.hermes/
├── .env
├── config.yaml
├── SOUL.md
├── hermes-agent/
├── skills/
├── memories/
├── sessions/
├── logs/
└── ...其他运行目录

安装过程会将所有源代码拉取到 /hermes-agent/ 目录中，运行环境及工作代码都在此处。其余的 /skills、/sessions/、/memories/、SOUL.md 等文件，对于OpenClaw用户来说再熟悉不过了——这本质上就是它的工作空间 (workspace)。在默认状态下，~/.hermes/ 这个根目录就是Hermes Agent的工作空间，相当于OpenClaw的 ~/.openclaw/workspace/。只有在多Agents场景下，Hermes才会额外创建一个 ~/.hermes/profiles/ 目录来作为其他Agent的工作空间。

技能系统 (Skills)

Skills是Agent在需要时可以加载的知识和行动文档。它们遵循渐进式披露模式，以最小化令牌使用量，并且兼容 agentskills.io 开放标准（Claude Code、Codex等编程Agent都使用此标准语法）。

所有技能都位于 ~/.hermes/skills/ —— 这是主目录和唯一可信源。在全新安装时，捆绑的技能会从代码仓库复制到此目录。从技能中心安装的以及Agent自己创建的技能也会放在这里。Agent可以修改或删除任何技能。

你也可以将Hermes指向外部技能目录——这些是除了本地目录外还会被扫描的额外文件夹。具体配置方法见后文。

使用技能

每个已安装的技能都会自动作为一个斜杠命令可用：

# 在 CLI 或任何消息平台中：
/gif-search funny cats
/axolotl help me fine-tune Llama 3 on my dataset
/github-pr-workflow create a PR for the auth refactor
/plan design a rollout for migrating our auth provider

# 仅输入技能名称会加载它，并让Agent询问你的需求：
/excalidraw

捆绑的 plan 技能是一个很好的例子。运行 /plan [请求] 会指示Hermes在需要时检查上下文，编写一个Markdown实施计划（而非直接执行任务），并将结果保存在相对于活动工作空间/后端工作目录的 .hermes/plans/ 下。

你也可以通过自然对话与技能交互：

hermes chat --toolsets skills -q “你有什么技能？”
hermes chat --toolsets skills -q “给我看看 axolotl 技能”

渐进式披露

技能使用一种节省令牌的加载模式：

Level 0: skills_list()           → [{name, description, category}, ...]   (~3k tokens)
Level 1: skill_view(name)        → 完整内容 + 元数据       (可变)
Level 2: skill_view(name, path)  → 特定的参考文件         (可变)

Agent只在真正需要时才加载完整的技能内容。

SKILL.md 格式

技能的核心是一个 SKILL.md 文件，遵循特定格式，这也是构建标准化技术文档的基础。

---
name: my-skill
description: 此技能功能的简要描述
version: 1.0.0
platforms: [macos, linux]     # 可选——限制在特定的操作系统平台
metadata:
  hermes:
    tags: [python, automation]
    category: devops
    fallback_for_toolsets: [web]    # 可选——条件激活（见下文）
    requires_toolsets: [terminal]   # 可选——条件激活（见下文）
---

# 技能标题

## 何时使用
此技能的触发条件。

## 步骤
1. 第一步
2. 第二步

## 常见问题
- 已知的失败模式及修复方法

## 验证
如何确认它已成功。

平台特定技能

技能可以使用 platforms 字段限制自己只在特定的操作系统上运行：

值	匹配
`macos`	macOS (Darwin)
`linux`	Linux
`windows`	Windows

platforms: [macos]            # 仅 macOS (例如，iMessage, Apple Reminders, FindMy)
platforms: [macos, linux]     # macOS 和 Linux

当设置此字段时，技能会在不兼容的平台上自动从系统提示、skills_list() 和斜杠命令中隐藏。如果省略，技能将在所有平台上加载。

条件激活（备用技能）

技能可以根据当前会话中可用的工具自动显示或隐藏自己。这对于备用技能最为有用——这些是免费或本地的替代方案，应该只在高级工具不可用时才出现。

metadata:
  hermes:
    fallback_for_toolsets: [web]      # 仅当这些工具集不可用时显示
    requires_toolsets: [terminal]     # 仅当这些工具集可用时显示
    fallback_for_tools: [web_search]  # 仅当这些特定工具不可用时显示
    requires_tools: [terminal]        # 仅当这些特定工具可用时显示

字段	行为
`fallback_for_toolsets`	当列出的工具集可用时，技能被隐藏。当它们缺失时显示。
`fallback_for_tools`	同上，但检查的是单个工具而不是工具集。
`requires_toolsets`	当列出的工具集不可用时，技能被隐藏。当它们存在时显示。
`requires_tools`	同上，但检查的是单个工具。

示例：内置的 duckduckgo-search 技能使用了 fallback_for_toolsets: [web]。当你设置了 FIRECRAWL_API_KEY 时，web 工具集可用，Agent会使用 web_search —— DuckDuckGo技能保持隐藏。如果API密钥缺失，web 工具集不可用，DuckDuckGo技能会自动作为备用方案出现。

没有任何条件字段的技能行为与之前完全一样——它们总是显示。

加载时的安全设置

技能可以声明所需的环境变量，而不会从发现列表中消失：

required_environment_variables:
  - name: TENOR_API_KEY
    prompt: Tenor API 密钥
    help: 从 https://developers.google.com/tenor 获取密钥
    required_for: 完整功能

当遇到缺失的值时，Hermes仅在技能实际在本地CLI中加载时才会安全地询问。你可以跳过设置并继续使用该技能。消息界面永远不会在聊天中询问密钥——它们会告诉你在本地使用 hermes setup 或编辑 ~/.hermes/.env。

一旦设置，声明的环境变量会自动传递到 execute_code 和 terminal 沙箱——技能的脚本可以直接使用 $TENOR_API_KEY。对于非技能的环境变量，请使用 terminal.env_passthrough 配置选项。

技能目录结构

~/.hermes/skills/                  # 唯一可信源
├── mlops/                         # 分类目录
│   ├── axolotl/
│   │   ├── SKILL.md               # 主要说明（必需）
│   │   ├── references/            # 附加文档
│   │   ├── templates/             # 输出格式
│   │   ├── scripts/               # 可从技能调用的辅助脚本
│   │   └── assets/                # 补充文件
│   └── vllm/
│       └── SKILL.md
├── devops/
│   └── deploy-k8s/                # 代理创建的技能
│       ├── SKILL.md
│       └── references/
├── .hub/                          # 技能中心状态
│   ├── lock.json
│   ├── quarantine/
│   └── audit.log
└── .bundled_manifest              # 跟踪已植入的捆绑技能

外部技能目录

如果你在Hermes之外维护技能——例如，一个被多个AI工具共享的 ~/.agents/skills/ 目录——你可以告诉Hermes也扫描这些目录。

在 ~/.hermes/config.yaml 的 skills 部分下添加 external_dirs：

skills:
  external_dirs:
    - ~/.agents/skills
    - /home/shared/team-skills
    - ${SKILLS_REPO}/skills

路径支持 ~ 扩展和 ${VAR} 环境变量替换。

工作原理

只读：外部目录仅用于技能发现扫描。当Agent创建或编辑技能时，它总是写入 ~/.hermes/skills/。
本地优先：如果同一个技能名称同时存在于本地目录和外部目录中，则本地版本优先。
完全集成：外部技能会出现在系统提示索引、skills_list、skill_view 以及 /skill-name 斜杠命令中——与本地技能没有区别。
不存在的路径会被静默跳过：如果配置的目录不存在，Hermes会忽略它而不报错。这对于可能并非每台机器上都存在的可选共享目录很有用。

示例

~/.hermes/skills/               # 本地（主目录，读写）
├── devops/deploy-k8s/
│   └── SKILL.md
└── mlops/axolotl/
    └── SKILL.md

~/.agents/skills/               # 外部（只读，共享）
├── my-custom-workflow/
│   └── SKILL.md
└── team-conventions/
    └── SKILL.md

所有四个技能都会出现在你的技能索引中。如果你在本地创建一个名为 my-custom-workflow 的新技能，它会覆盖外部版本。

Agent管理的技能 (skill_manage 工具) -- Hermes最重要能力

Agent可以通过 skill_manage 工具创建、更新和删除自己的技能。这是Agent的程序性记忆——当它弄清楚一个非平凡的工作流程时，它会将该方法保存为一个技能以供将来重用。

Agent何时创建技能

成功完成复杂任务（5次以上工具调用）后
当它遇到错误或死胡同并找到可行路径时
当用户纠正其方法时
当它发现一个非平凡的工作流程时

操作

操作	用途	关键参数
`create`	从头创建新技能	`name`, `content` (完整的SKILL.md)，可选的 `category`
`patch`	针对性修复（推荐）	`name`, `old_string`, `new_string`
`edit`	主要结构重写	`name`, `content` (完整的SKILL.md替换)
`delete`	完全移除技能	`name`
`write_file`	添加/更新支持文件	`name`, `file_path`, `file_content`
`remove_file`	移除支持文件	`name`, `file_path`

Tip
patch 操作是推荐的更新方式——它比 edit 更节省令牌，因为只有更改的文本会出现在工具调用中。

技能中心

你可以从官方 (official)、skills.sh、直接已知技能端点以及官方可选技能中浏览、搜索、安装和管理技能，这极大地丰富了你的开源实战工具箱。

常用命令

hermes skills browse                              # 浏览所有中心技能（官方优先）
hermes skills browse --source official            # 仅浏览官方可选技能
hermes skills search kubernetes                   # 搜索所有来源
hermes skills search react --source skills-sh     # 搜索 skills.sh 目录
hermes skills search https://mintlify.com/docs --source well-known
hermes skills inspect openai/skills/k8s           # 安装前预览
hermes skills install openai/skills/k8s           # 安装并进行安全扫描
hermes skills install official/security/1password
hermes skills install skills-sh/vercel-labs/json-render/json-render-react --force
hermes skills install well-known:https://mintlify.com/docs/.well-known/skills/mintlify
hermes skills list --source hub                   # 列出从中心安装的技能
hermes skills check                               # 检查已安装的中心技能是否有上游更新
hermes skills update                              # 在需要时重新安装有上游更改的中心技能
hermes skills audit                               # 重新扫描所有中心技能的安全性
hermes skills uninstall k8s                       # 移除一个中心技能
hermes skills publish skills/my-skill --to github --repo owner/repo
hermes skills snapshot export setup.json          # 导出技能配置
hermes skills tap add myorg/skills-repo           # 添加自定义 GitHub 源

支持的技能中心来源

来源	示例	说明
`official`	`official/security/1password`	随Hermes分发的可选技能。
`skills-sh`	`skills-sh/vercel-labs/agent-skills/vercel-react-best-practices`	可通过 `hermes skills search <query> --source skills-sh` 搜索。当skills.sh的别名与仓库文件夹不同时，Hermes会解析别名风格的技能。
`well-known`	`well-known:https://mintlify.com/docs/.well-known/skills/mintlify`	直接从网站的 `/.well-known/skills/index.json` 提供的技能。使用网站或文档URL进行搜索。
`github`	`openai/skills/k8s`	直接GitHub仓库/路径安装和自定义源。
`clawhub`, `lobehub`, `claude-marketplace`	特定来源的标识符	社区或市场集成。

集成的中心和注册中心

Hermes目前集成了以下技能生态系统和发现来源：

1. 官方可选技能 (`official`)

这些技能在Hermes仓库内部维护，安装时自带信任度。

目录：官方可选技能目录
仓库内源位置：optional-skills/

示例：

hermes skills browse --source official
hermes skills install official/security/1password

2. skills.sh (`skills-sh`)

这是Vercel的公共技能目录。Hermes可以直接搜索它，查看技能详情页面，解析别名形式的短名称，并从底层的源码仓库安装。

目录：skills.sh
CLI/工具仓库：vercel-labs/skills
官方Vercel技能仓库：vercel-labs/agent-skills

示例：

hermes skills search react --source skills-sh
hermes skills inspect skills-sh/vercel-labs/json-render/json-render-react
hermes skills install skills-sh/vercel-labs/json-render/json-render-react --force

3. 知名技能端点 (`well-known`)

这是基于URL的发现方式，从发布 /.well-known/skills/index.json 的网站获取。它不是单一的中心化枢纽，而是网络发现约定。

实时端点示例：Mintlify文档技能索引
参考服务器实现：vercel-labs/skills-handler

示例：

hermes skills search https://mintlify.com/docs --source well-known
hermes skills inspect well-known:https://mintlify.com/docs/.well-known/skills/mintlify
hermes skills install well-known:https://mintlify.com/docs/.well-known/skills/mintlify

4. 直接GitHub技能 (`github`)

Hermes可以直接从GitHub仓库和基于GitHub的taps安装。当你已经知道仓库/路径或者想添加自己的自定义源仓库时，这很有用。
默认taps（无需设置即可浏览）：

openai/skills
anthropics/skills
VoltAgent/awesome-agent-skills
garrytan/gstack

示例：

hermes skills install openai/skills/k8s
hermes skills tap add myorg/skills-repo

5. ClawHub (`clawhub`)

一个作为社区源集成的第三方技能市场。

站点：clawhub.ai
Hermes源标识：clawhub

6. Claude市场风格仓库 (`claude-marketplace`)

Hermes支持发布Claude兼容的插件/市场清单的市场仓库。
已知的集成源包括：

anthropics/skills
aiskillstore/marketplace
Hermes源标识：claude-marketplace

7. LobeHub (`lobehub`)

Hermes可以从LobeHub的公共目录中搜索并转换智能体条目为可安装的Hermes技能。

站点：LobeHub
公共智能体索引：chat-agents.lobehub.com
支撑仓库：lobehub/lobe-chat-agents
Hermes源标识：lobehub

安全扫描与 `--force`

所有通过中心安装的技能都会经过一个安全扫描器的检查，它会检测数据窃取、提示注入、破坏性命令、供应链信号和其他威胁。
hermes skills inspect ... 现在也会在有可用信息时展示上游元数据：

仓库URL
skills.sh详情页面URL
安装命令
每周安装次数
上游安全审计状态
知名索引/端点URL

当你已经审查了一个第三方技能并想覆盖一个非危险的政策阻止时，请使用 --force：

hermes skills install skills-sh/anthropics/skills/pdf --force

重要行为：

--force 可以覆盖针对谨慎/警告类发现的政策阻止。
--force 不会覆盖 dangerous 扫描裁决。
官方可选技能 (official/...) 被视为自带信任，不会显示第三方警告面板。

信任级别

级别	来源	策略
`builtin`	Hermes自带	始终信任
`official`	仓库内的 `optional-skills/`	自带信任，无第三方警告
`trusted`	受信任的注册表/仓库，例如 `openai/skills`, `anthropics/skills`	比社区源更宽松的策略
`community`	其他一切 (`skills.sh`, 知名端点, 自定义GitHub仓库, 大多数市场)	非危险发现可以用 `--force` 覆盖；`dangerous` 裁决保持阻止

更新生命周期

技能中心现在会追踪足够的来源信息，以重新检查已安装技能的在线副本：

hermes skills check           # 报告哪些已安装的中心技能在上游发生了变化
hermes skills update          # 仅重新安装有可用更新的技能
hermes skills update react    # 更新一个特定的已安装中心技能

这使用了存储的源标识加上当前上游bundle内容哈希来检测变更。

斜杠命令（在聊天中）

所有相同的命令都可以通过 /skills 使用：

/skills browse
/skills search react --source skills-sh
/skills search https://mintlify.com/docs --source well-known
/skills inspect skills-sh/vercel-labs/json-render/json-render-react
/skills install openai/skills/skill-creator --force
/skills check
/skills update
/skills list

官方可选技能仍然使用像 official/security/1password 和 official/migration/openclaw-migration 这样的标识符。

内置技能目录

Hermes附带一个庞大的内置技能库，安装时会复制到 ~/.hermes/skills/ 目录下。本部分记录了位于仓库 skills/ 目录下的内置技能。

apple

Apple/macOS专属技能——iMessage、提醒事项、备忘录、查找以及macOS自动化。这些技能仅在macOS系统上加载。

技能	描述	路径
`apple-notes`	通过macOS上的memo CLI管理Apple备忘录（创建、查看、搜索、编辑）。	`apple/apple-notes`
`apple-reminders`	通过remindctl CLI管理Apple提醒事项（列出、添加、完成、删除）。	`apple/apple-reminders`
`findmy`	通过AppleScript和屏幕截图，在macOS上使用FindMy.app追踪Apple设备和AirTag。	`apple/findmy`
`imessage`	通过macOS上的imsg CLI发送和接收iMessage/短信。	`apple/imessage`

autonomous-ai-agents

用于启动和编排自主AI编程智能体及多智能体工作流的技能——运行独立的智能体进程、委派任务、协调并行工作流。

技能	描述	路径
`claude-code`	将编码任务委派给Claude Code（Anthropic的CLI智能体）。用于构建功能、重构、PR审查和迭代式编码。需要安装claude CLI。	`autonomous-ai-agents/claude-code`
`codex`	将编码任务委派给OpenAI Codex CLI智能体。用于构建功能、重构、PR审查和批量问题修复。需要安装codex CLI和一个git仓库。	`autonomous-ai-agents/codex`
`hermes-agent-spawning`	将额外的Hermes Agent实例作为自主子进程启动，用于独立的长期运行任务。支持非交互式单次运行模式 (-q) 和用于多轮协作的交互式PTY模式。与delegate_task不同——这会运行一个完全独立的hermes进程。	`autonomous-ai-agents/hermes-agent`
`opencode`	将编码任务委派给OpenCode CLI智能体，用于功能实现、重构、PR审查和长期运行的自主会话。需要安装并认证opencode CLI。	`autonomous-ai-agents/opencode`

data-science

用于数据科学工作流的技能——交互式探索、Jupyter笔记本、数据分析和可视化。

技能	描述	路径
`jupyter-live-kernel`	通过hamelnb使用实时Jupyter内核进行有状态的、迭代式的Python执行。当任务涉及探索、迭代或检查中间结果时加载此技能。	`data-science/jupyter-live-kernel`

creative

创意内容生成——ASCII艺术、手绘风格图表和视觉设计工具。

技能	描述	路径
`ascii-art`	使用pyfiglet（571种字体）、cowsay、boxes、toilet、image-to-ascii、远程API（asciified, ascii.co.uk）和LLM后备方案生成ASCII艺术。无需API密钥。	`creative/ascii-art`
`ascii-video`	“ASCII艺术视频的生产管线——支持任何格式。将视频/音频/图像/生成式输入转换为彩色ASCII字符视频输出（MP4、GIF、图像序列）。涵盖：视频转ASCII、音频响应式音乐可视化、生成式ASCII艺术动画、混合…	`creative/ascii-video`
`excalidraw`	使用Excalidraw JSON格式创建手绘风格图表。生成.excalidraw文件用于架构图、流程图、序列图、概念图等。文件可在excalidraw.com打开或上传以获取可分享链接。	`creative/excalidraw`

devops

DevOps和基础设施自动化技能。

技能	描述	路径
`webhook-subscriptions`	为事件驱动的智能体激活创建和管理webhook订阅。外部服务（GitHub、Stripe、CI/CD、IoT）通过POST事件来触发智能体运行。需要启用webhook平台。	`devops/webhook-subscriptions`

dogfood

技能	描述	路径
`dogfood`	对Web应用程序进行系统化的探索性QA测试——发现错误、捕获证据并生成结构化报告。	`dogfood/dogfood`
`hermes-agent-setup`	帮助用户配置Hermes Agent——CLI使用、设置向导、模型/提供商选择、工具、技能、语音/STT/TTS、网关和故障排除。	`dogfood/hermes-agent-setup`

email

用于从终端发送、接收、搜索和管理电子邮件的技能。

技能	描述	路径
`himalaya`	通过IMAP/SMTP管理电子邮件的CLI。使用himalaya从终端列出、阅读、撰写、回复、转发、搜索和组织电子邮件。支持多个账户和使用MML（MIME元语言）撰写消息。	`email/himalaya`

gaming

用于设置、配置和管理游戏服务器、模组包及游戏相关基础设施的技能。

技能	描述	路径
`minecraft-modpack-server`	从CurseForge/Modrinth服务器包zip文件设置一个模组化Minecraft服务器。涵盖NeoForge/Forge安装、Java版本、JVM调优、防火墙、局域网配置、备份和启动脚本。	`gaming/minecraft-modpack-server`
`pokemon-player`	通过无头模拟自主玩宝可梦游戏。启动游戏服务器，从RAM读取结构化游戏状态，做出策略决策，并发送按钮输入——全部在终端中完成。	`gaming/pokemon-player`

github

使用gh CLI和git通过终端管理仓库、拉取请求、代码审查、问题和CI/CD管道的GitHub工作流技能。

技能	描述	路径
`codebase-inspection`	使用pygount检查和分析代码库，用于代码行数统计、语言细分和代码与注释比例。当被要求检查代码行数、仓库大小、语言构成或代码库统计信息时使用。	`github/codebase-inspection`
`github-auth`	使用git（普遍可用）或gh CLI为智能体设置GitHub身份验证。涵盖HTTPS令牌、SSH密钥、凭证助手和gh auth——带有一个检测流程以自动选择正确的方法。	`github/github-auth`
`github-code-review`	通过分析git差异、在PR上留下内联评论以及执行彻底的推送前审查来审查代码变更。可与gh CLI配合使用，或回退到通过curl使用git + GitHub REST API。	`github/github-code-review`
`github-issues`	创建、管理、分类和关闭GitHub问题。搜索现有问题、添加标签、分配人员并链接到PR。可与gh CLI配合使用，或回退到通过curl使用git + GitHub REST API。	`github/github-issues`
`github-pr-workflow`	完整的拉取请求生命周期——创建分支、提交更改、打开PR、监控CI状态、自动修复失败并合并。可与gh CLI配合使用，或回退到通过curl使用git + GitHub REST API。	`github/github-pr-workflow`
`github-repo-management`	克隆、创建、分叉、配置和管理GitHub仓库。管理远程仓库、密钥、发布和工作流。可与gh CLI配合使用，或回退到通过curl使用git + GitHub REST API。	`github/github-repo-management`

inference-sh

通过inference.sh云平台执行AI应用的技能。

技能	描述	路径
`inference-sh-cli`	通过inference.sh CLI (infsh) 运行150+个AI应用——图像生成、视频创作、LLM、搜索、3D、社交自动化。	`inference-sh/cli`

leisure

技能	描述	路径
`find-nearby`	使用OpenStreetMap查找附近地点（餐厅、咖啡馆、酒吧、药店等）。适用于坐标、地址、城市、邮政编码或Telegram位置标记。无需API密钥。	`leisure/find-nearby`

mcp

用于处理MCP（模型上下文协议）服务器、工具和集成的技能。包括内置的原生MCP客户端（在config.yaml中配置服务器以自动发现工具）以及用于临时服务器交互的mcporter CLI桥接。

技能	描述	路径
`mcporter`	使用mcporter CLI直接列出、配置、认证和调用MCP服务器/工具（HTTP或stdio），包括临时服务器、配置编辑和CLI/类型生成。	`mcp/mcporter`
`native-mcp`	内置的MCP（模型上下文协议）客户端，连接到外部MCP服务器，发现其工具，并将它们注册为Hermes Agent的原生工具。支持stdio和HTTP传输，具有自动重连、安全过滤和零配置工具注入功能。	`mcp/native-mcp`

media

用于处理媒体内容的技能——YouTube字幕、GIF搜索、音乐生成和音频可视化。

技能	描述	路径
`gif-search`	使用curl从Tenor搜索和下载GIF。除了curl和jq外无需其他依赖。适用于查找反应GIF、创建视觉内容以及在聊天中发送GIF。	`media/gif-search`
`heartmula`	设置和运行HeartMuLa，开源音乐生成模型系列（类似Suno）。根据歌词 + 标签生成完整歌曲，支持多语言。	`media/heartmula`
`songsee`	通过CLI从音频文件生成频谱图和音频特征可视化（梅尔频谱、色度、MFCC、节奏图等）。适用于音频分析、音乐制作调试和视觉文档记录。	`media/songsee`
`youtube-content`	获取YouTube视频字幕并将其转换为结构化内容（章节、摘要、线程、博客文章）。	`media/youtube-content`

mlops

通用ML运维工具——模型中心管理、数据集操作和工作流编排。

技能	描述	路径
`huggingface-hub`	Hugging Face Hub CLI (hf)——搜索、下载和上传模型与数据集，管理仓库，部署推理端点。	`mlops/huggingface-hub`

mlops/cloud

用于ML工作负载的GPU云提供商和无服务器计算平台。

技能	描述	路径
`lambda-labs-gpu-cloud`	用于ML训练和推理的预留和按需GPU云实例。当您需要具有简单SSH访问、持久文件系统或用于大规模训练的高性能多节点集群的专用GPU实例时使用。	`mlops/cloud/lambda-labs`
`modal-serverless-gpu`	用于运行ML工作负载的无服务器GPU云平台。当您需要按需GPU访问而无需基础设施管理、将ML模型部署为API或运行具有自动扩展的批处理作业时使用。	`mlops/cloud/modal`

mlops/evaluation

模型评估基准、实验跟踪、数据整理、分词器和可解释性工具。

技能	描述	路径
`evaluating-llms-harness`	在60+个学术基准（MMLU、HumanEval、GSM8K、TruthfulQA、HellaSwag）上评估LLM。用于基准测试模型质量、比较模型、报告学术结果或跟踪训练进度。EleutherAI、HuggingFace和主要实验室使用的行业标准。超…	`mlops/evaluation/lm-evaluation-harness`
`huggingface-tokenizers`	为研究和生产优化的快速分词器。基于Rust的实现可在<20秒内对1GB文本进行分词。支持BPE、WordPiece和Unigram算法。训练自定义词汇表、跟踪对齐、处理填充/截断。与transformers无缝集成。使用…	`mlops/evaluation/huggingface-tokenizers`
`nemo-curator`	用于LLM训练的GPU加速数据整理。支持文本/图像/视频/音频。功能包括模糊去重（快16倍）、质量过滤（30+种启发式方法）、语义去重、PII编辑、NSFW检测。通过RAPIDS跨GPU扩展。用于准备高质量训…	`mlops/evaluation/nemo-curator`
`sparse-autoencoder-training`	提供使用SAELens训练和分析稀疏自编码器（SAE）的指导，以将神经网络激活分解为可解释的特征。用于发现可解释特征、分析叠加或研究语言模型中的单义表示时使用…	`mlops/evaluation/saelens`
`weights-and-biases`	使用自动日志记录跟踪ML实验，实时可视化训练，通过扫描优化超参数，并使用W&B（协作式MLOps平台）管理模型注册表。	`mlops/evaluation/weights-and-biases`

mlops/inference

模型服务、量化（GGUF/GPTQ）、结构化输出、推理优化和模型手术工具，用于部署和运行LLM。

技能	描述	路径
`gguf-quantization`	GGUF格式和llama.cpp量化，用于高效的CPU/GPU推理。适用于在消费级硬件、Apple Silicon上部署模型，或需要灵活的2-8位量化且无需GPU的场景。	`mlops/inference/gguf`
`guidance`	使用正则表达式和语法控制LLM输出，保证有效的JSON/XML/代码生成，强制执行结构化格式，并使用Guidance（微软研究院的约束生成框架）构建多步骤工作流。	`mlops/inference/guidance`
`instructor`	使用Pydantic验证从LLM响应中提取结构化数据，自动重试失败的提取，以类型安全的方式解析复杂JSON，并使用Instructor（经过实战检验的结构化输出库）流式传输部分结果。	`mlops/inference/instructor`
`llama-cpp`	在CPU、Apple Silicon和消费级GPU（无需NVIDIA硬件）上运行LLM推理。适用于边缘部署、M1/M2/M3 Mac、AMD/Intel GPU或CUDA不可用的情况。支持GGUF量化（1.5-8位），可减少内存占用，在CPU上相比PyTorch提速4-10倍。	`mlops/inference/llama-cpp`
`obliteratus`	使用OBLITERATUS（机制可解释性技术，如diff-in-means、SVD、白化SVD、LEACE、SAE分解等）移除开源权重LLM的拒绝行为，在保留推理能力的同时剔除护栏。包含9种CLI方法、28个分析模块、116个模型预设…	`mlops/inference/obliteratus`
`outlines`	在生成过程中保证有效的JSON/XML/代码结构，使用Pydantic模型实现类型安全的输出，支持本地模型（Transformers、vLLM），并使用Outlines（dottxt.ai的结构化生成库）最大化推理速度。	`mlops/inference/outlines`
`serving-llms-vllm`	使用vLLM的PagedAttention和连续批处理技术提供高吞吐量的LLM服务。适用于部署生产级LLM API、优化推理延迟/吞吐量，或在GPU内存有限的情况下服务模型。支持OpenAI兼容的端点、量化（GPTQ/AWQ/FP8）…	`mlops/inference/vllm`
`tensorrt-llm`	使用NVIDIA TensorRT优化LLM推理，实现最大吞吐量和最低延迟。适用于在NVIDIA GPU（A100/H100）上进行生产部署，需要比PyTorch快10-100倍的推理速度，或需要支持量化（FP8/INT4）、动态批处理和…	`mlops/inference/tensorrt-llm`

mlops/models

特定模型架构和工具——计算机视觉（CLIP、SAM、Stable Diffusion）、语音（Whisper）、音频生成（AudioCraft）和多模态模型（LLaVA）。

技能	描述	路径
`audiocraft-audio-generation`	用于音频生成的PyTorch库，包括文本到音乐（MusicGen）和文本到声音（AudioGen）。适用于需要根据文本描述生成音乐、创建音效或进行旋律条件音乐生成的场景。	`mlops/models/audiocraft`
`clip`	OpenAI的连接视觉和语言的模型。支持零样本图像分类、图文匹配和跨模态检索。在4亿图文对上训练。适用于图像搜索、内容审核或无需微调的视觉语言任务。最适合通用…	`mlops/models/clip`
`llava`	大型语言和视觉助手。支持视觉指令微调和基于图像的对话。结合了CLIP视觉编码器和Vicuna/LLaMA语言模型。支持多轮图像聊天、视觉问答和指令跟随。适用于视觉语言聊天…	`mlops/models/llava`
`segment-anything-model`	用于图像分割的基础模型，具有零样本迁移能力。适用于需要使用点、框或掩码作为提示来分割图像中的任何对象，或自动生成图像中所有对象掩码的场景。	`mlops/models/segment-anything`
`stable-diffusion-image-generation`	通过HuggingFace Diffusers使用Stable Diffusion模型进行最先进的文本到图像生成。适用于根据文本提示生成图像、执行图像到图像转换、修复或构建自定义扩散管道。	`mlops/models/stable-diffusion`
`whisper`	OpenAI的通用语音识别模型。支持99种语言、转录、翻译成英语和语言识别。六种模型大小，从tiny（3900万参数）到large（15.5亿参数）。适用于语音转文本、播客转录或多语言音频处理…	`mlops/models/whisper`

mlops/research

用于通过声明式编程构建和优化AI系统的ML研究框架。

技能	描述	路径
`dspy`	使用声明式编程构建复杂的AI系统，自动优化提示，使用DSPy（斯坦福NLP的系统化LM编程框架）创建模块化的RAG系统和智能体。	`mlops/research/dspy`

mlops/training

用于训练LLM和其他模型的微调、RLHF/DPO/GRPO训练、分布式训练框架和优化工具，这些都是人工智能领域实践者需要掌握的核心能力。

技能	描述	路径
`axolotl`	使用Axolotl进行LLM微调的专家指导——YAML配置、100+模型、LoRA/QLoRA、DPO/KTO/ORPO/GRPO、多模态支持。	`mlops/training/axolotl`
`distributed-llm-pretraining-torchtitan`	使用torchtitan提供PyTorch原生的分布式LLM预训练，支持4D并行（FSDP2、TP、PP、CP）。适用于使用Float8、torch.compile和分布式检查点，在8到512+ GPU上大规模预训练Llama 3.1、DeepSeek V3或自定义模型。	`mlops/training/torchtitan`
`fine-tuning-with-trl`	使用TRL通过强化学习微调LLM——SFT用于指令微调，DPO用于偏好对齐，PPO/GRPO用于奖励优化，以及奖励模型训练。适用于需要RLHF、将模型与偏好对齐或从人类反馈中训练的场景。可与HuggingFace Tr…	`mlops/training/trl-fine-tuning`
`grpo-rl-training`	使用TRL进行GRPO/RL微调的专家指导，用于推理和特定任务模型训练。	`mlops/training/grpo-rl-training`
`hermes 阿特洛波斯环境`	为Atropos训练构建、测试和调试Hermes Agent RL环境。涵盖HermesAgentBaseEnv接口、奖励函数、智能体循环集成、工具评估、wandb日志记录以及三种CLI模式（serve/process/evaluate）。适用于创建、审查或修复…	`mlops/training/hermes-atropos-environments`
`huggingface-accelerate`	最简单的分布式训练API。只需4行代码即可为任何PyTorch脚本添加分布式支持。DeepSpeed/FSDP/Megatron/DDP的统一API。自动设备放置、混合精度（FP16/BF16/FP8）。交互式配置，单一启动命令。HuggingFace生态系统标准。	`mlops/training/accelerate`
`optimizing-attention-flash`	使用Flash Attention优化Transformer注意力机制，实现2-4倍加速和10-20倍内存减少。适用于使用长序列（>512个token）训练/运行Transformer、遇到注意力机制GPU内存问题或需要更快推理的场景。支持PyTorch原生SDPA…	`mlops/training/flash-attention`
`peft-fine-tuning`	使用LoRA、QLoRA和25+种方法对LLM进行参数高效微调。适用于在GPU内存有限的情况下微调大型模型（7B-70B），需要训练<1%的参数且精度损失最小，或用于多适配器服务。HuggingFace的官方库…	`mlops/training/peft`
`pytorch-fsdp`	使用PyTorch FSDP进行完全分片数据并行训练的专家指导——参数分片、混合精度、CPU卸载、FSDP2。	`mlops/training/pytorch-fsdp`
`pytorch-lightning`	高级PyTorch框架，包含Trainer类、自动分布式训练（DDP/FSDP/DeepSpeed）、回调系统和最少的样板代码。使用相同代码可从笔记本电脑扩展到超级计算机。适用于希望使用内置最佳实践构建简洁训练循环的场景。	`mlops/training/pytorch-lightning`
`simpo-training`	用于LLM对齐的简单偏好优化。是DPO的无参考替代方案，性能更优（在AlpacaEval 2.0上+6.4分）。无需参考模型，比DPO更高效。适用于偏好对齐，且希望训练比DPO/PPO更简单、更快的场景。	`mlops/training/simpo`
`slime-rl-training`	使用slime（一个Megatron+SGLang框架）为LLM后训练提供RL指导。适用于训练GLM模型、实现自定义数据生成工作流，或需要与Megatron-LM紧密集成以进行RL扩展的场景。	`mlops/training/slime`
`unsloth`	使用Unsloth进行快速微调的专家指导——训练速度提升2-5倍，内存减少50-80%，LoRA/QLoRA优化。	`mlops/training/unsloth`

mlops/vector-databases

用于RAG、语义搜索和AI应用后端的向量相似性搜索和嵌入数据库。

技能	描述	路径
`chroma`	用于AI应用的开源嵌入数据库。存储嵌入和元数据，执行向量和全文搜索，按元数据过滤。简单的4函数API。可从笔记本扩展到生产集群。适用于语义搜索、RAG应用或文档检索。最适合…	`mlops/vector-databases/chroma`
`faiss`	Facebook的高效密集向量相似性搜索和聚类库。支持数十亿向量、GPU加速和各种索引类型（Flat、IVF、HNSW）。适用于快速k-NN搜索、大规模向量检索，或需要纯相似性搜索且无需…	`mlops/vector-databases/faiss`
`pinecone`	用于生产AI应用的托管向量数据库。完全托管、自动扩展，支持混合搜索（稠密+稀疏）、元数据过滤和命名空间。低延迟（<100ms p95）。适用于生产级RAG、推荐系统或大规模语义搜索。最适合无服务器…	`mlops/vector-databases/pinecone`
`qdrant-vector-search`	用于RAG和语义搜索的高性能向量相似性搜索引擎。适用于构建需要快速最近邻搜索、带过滤的混合搜索或具有Rust驱动性能的可扩展向量存储的生产级RAG系统。	`mlops/vector-databases/qdrant`

note-taking

笔记技能，用于保存信息、协助研究，以及在多会话规划和信息共享上进行协作。

技能	描述	路径
`obsidian`	在Obsidian知识库中读取、搜索和创建笔记。	`note-taking/obsidian`

productivity

用于文档创建、演示文稿、电子表格和其他生产力工作流的技能。

技能	描述	路径
`google-workspace`	通过Python集成Gmail、Calendar、Drive、Contacts、Sheets和Docs。使用OAuth2并自动刷新令牌。无需外部二进制文件——完全在Hermes venv中使用Google的Python客户端库运行。	`productivity/google-workspace`
`linear`	通过GraphQL API管理Linear问题、项目和团队。创建、更新、搜索和组织问题。	`productivity/linear`
`nano-pdf`	使用nano-pdf CLI通过自然语言指令编辑PDF。修改文本、修复拼写错误、更新标题，并对特定页面进行内容更改，无需手动编辑。	`productivity/nano-pdf`
`notion`	用于通过curl创建和管理页面、数据库和块的Notion API。直接从终端搜索、创建、更新和查询Notion工作区。	`productivity/notion`
`ocr-and-documents`	从PDF和扫描文档中提取文本。对远程URL使用web_extract，对本地基于文本的PDF使用pymupdf，对OCR/扫描文档使用marker-pdf。对于DOCX使用python-docx，对于PPTX请参阅powerpoint技能。	`productivity/ocr-and-documents`
`powerpoint`	“任何涉及.pptx文件的方式——作为输入、输出或两者——都使用此技能。这包括：创建幻灯片、演示文稿或推介材料；读取、解析或从任何.pptx文件中提取文本（即使提取的内容将用于其他地方，例如在…	`productivity/powerpoint`

research

用于学术研究、论文发现、文献综述、领域侦察、市场数据、内容监控和科学知识检索的技能。

技能	描述	路径
`arxiv`	使用arXiv的免费REST API搜索和检索学术论文。无需API密钥。可通过关键词、作者、类别或ID进行搜索。可与web_extract或ocr-and-documents技能结合以阅读完整的论文内容。	`research/arxiv`
`blogwatcher`	使用blogwatcher CLI监控博客和RSS/Atom源的更新。添加博客、扫描新文章并跟踪已读内容。	`research/blogwatcher`
`domain-intel`	使用Python标准库进行被动域名侦察。包括子域名发现、SSL证书检查、WHOIS查询、DNS记录查询、域名可用性检查以及批量多域名分析。无需API密钥。	`research/domain-intel`
`duckduckgo-search`	通过DuckDuckGo进行免费的网页搜索——文本、新闻、图片、视频。无需API密钥。优先使用已安装的`ddgs` CLI；仅在确认当前运行时环境中`ddgs`可用时，才使用Python DDGS库。	`research/duckduckgo-search`
`ml-paper-writing`	为NeurIPS、ICML、ICLR、ACL、AAAI、COLM等会议撰写符合发表要求的ML/AI论文。适用于从研究仓库起草论文、构建论证结构、验证引用或准备最终提交版本。包含LaTeX模板、审稿人指南和引用验证…	`research/ml-paper-writing`
`polymarket`	查询Polymarket预测市场数据——搜索市场、获取价格、订单簿和价格历史。通过公共REST API进行只读访问，无需API密钥。	`research/polymarket`

red-teaming

用于LLM红队测试、越狱和安全过滤器绕过研究的技能。

技能	描述	路径
`godmode`	使用G0DM0D3技术对API服务的LLM进行越狱——包括Parseltongue输入混淆（33种技术）、GODMODE CLASSIC系统提示模板、ULTRAPLINIAN多模型竞速、编码升级，以及与Hermes原生预填充/系统提示的集成。适用于任何可通过API访问的模型，包括闭源模型。	`red-teaming/godmode`

smart-home

用于控制智能家居设备（灯光、开关、传感器和家庭自动化系统）的技能。

技能	描述	路径
`openhue`	通过OpenHue CLI控制Philips Hue灯光、房间和场景。开关灯、调整亮度、颜色、色温，并激活场景。	`smart-home/openhue`

social-media

用于与社交平台交互的技能——发布、阅读、监控和账户操作。

技能	描述	路径
`xitter`	使用官方X API凭证，通过x-cli终端客户端与X/Twitter交互。	`social-media/xitter`

software-development

技能	描述	路径
`code-review`	以安全和质量为重点进行彻底代码审查的指南。	`software-development/code-review`
`plan`	Hermes的计划模式——检查上下文，将Markdown计划写入活动工作空间/后端工作目录的`.hermes/plans/`中，但不执行具体工作。	`software-development/plan`
`requesting-code-review`	在完成任务、实现主要功能或合并代码前使用。通过系统化的审查流程验证工作是否符合要求。	`software-development/requesting-code-review`
`subagent-driven-development`	在执行包含独立任务的实施计划时使用。为每个任务分派新的delegate_task，并进行两阶段审查（先规范符合性，再代码质量）。	`software-development/subagent-driven-development`
`systematic-debugging`	在遇到任何错误、测试失败或意外行为时使用。包含4阶段根本原因调查——在理解问题之前不进行修复。	`software-development/systematic-debugging`
`test-driven-development`	在实现任何功能或修复错误之前，编写实现代码之前使用。强制执行测试优先的RED-GREEN-REFACTOR循环。	`software-development/test-driven-development`
`writing-plans`	当你有一个多步骤任务的规范或需求时使用。创建包含小任务、确切文件路径和完整代码示例的综合实施计划。	`software-development/writing-plans`

可选技能

可选技能随仓库提供，位于optional-skills/目录下，但默认不激活。它们涵盖较重或小众的用例。使用以下命令安装：

hermes skills install official/<category>/<skill>

autonomous-ai-agents

技能	描述	路径
`blackbox`	将编码任务委托给Blackbox AI CLI Agent。这是一个多模型Agent，内置评判器，可通过多个LLM运行任务并选择最佳结果。需要blackbox CLI和Blackbox AI API密钥。	`autonomous-ai-agents/blackbox`

blockchain

技能	描述	路径
`base`	查询Base（以太坊L2）区块链数据，并附带美元计价——包括钱包余额、代币信息、交易详情、Gas分析、合约检查、巨鲸检测和实时网络统计。使用Base RPC + CoinGecko。无需API密钥。	`blockchain/base`
`solana`	查询Solana区块链数据，并附带美元计价——包括钱包余额、带估值的代币组合、交易详情、NFT、巨鲸检测和实时网络统计。使用Solana RPC + CoinGecko。无需API密钥。	`blockchain/solana`

creative

技能	描述	路径
`blender-mcp`	通过socket连接到blender-mcp插件，直接从Hermes控制Blender。创建3D对象、材质、动画，并运行任意Blender Python (bpy)代码。	`creative/blender-mcp`
`meme-generation`	通过选择模板并使用Pillow叠加文本来生成真实的梗图。生成实际的.png梗图文件。	`creative/meme-generation`

devops

技能	描述	路径
`docker-management`	管理Docker容器、镜像、卷、网络和Compose堆栈——包括生命周期操作、调试、清理和Dockerfile优化。	`devops/docker-management`

email

技能	描述	路径
`agentmail`	通过AgentMail为Agent提供其专属的电子邮件收件箱。使用Agent拥有的电子邮件地址（例如hermes-agent@agentmail.to）自主发送、接收和管理电子邮件。	`email/agentmail`

health

技能	描述	路径
`neuroskill-bci`	连接到正在运行的NeuroSkill实例，并将用户的实时认知和情绪状态（专注度、放松度、情绪、认知负荷、困倦度、心率、HRV、睡眠分期以及40多种衍生的EXG评分）纳入响应中。需要BCI可穿戴设备（Muse 2/S或OpenBCI）和NeuroSkill桌面应用程序。	`health/neuroskill-bci`

mcp

技能	描述	路径
`fastmcp`	在Python中使用FastMCP构建、测试、检查、安装和部署MCP服务器。适用于创建新的MCP服务器、将API或数据库包装为MCP工具、暴露资源或提示，或准备FastMCP服务器以进行HTTP部署。	`mcp/fastmcp`

migration

技能	描述	路径
`openclaw-migration`	将用户的OpenClaw自定义配置迁移到Hermes Agent中。从~/.openclaw导入与Hermes兼容的记忆、SOUL.md、命令白名单、用户技能和选定的工作空间资产，然后报告无法迁移的内容及原因。	`migration/openclaw-migration`

productivity

技能	描述	路径
`telephony`	为Hermes提供电话功能——配置并持久化一个Twilio号码，发送和接收SMS/MMS，直接拨打电话，并通过Bland.ai或Vapi进行AI驱动的外呼。	`productivity/telephony`

research

技能	描述	路径
`bioinformatics`	通往来自bioSkills和ClawBio的400多种生物信息学技能的网关。涵盖基因组学、转录组学、单细胞、变异检测、药物基因组学、宏基因组学、结构生物学等领域。	`research/bioinformatics`
`qmd`	使用qmd在本地搜索个人知识库、笔记、文档和会议记录——这是一个结合了BM25、向量搜索和LLM重排序的混合检索引擎。支持CLI和MCP集成。	`research/qmd`

security

技能	描述	路径
`1password`	设置和使用1Password CLI (op)。适用于安装CLI、启用桌面应用集成、登录以及为命令读取/注入密钥。	`security/1password`
`oss-forensics`	针对GitHub仓库的供应链调查、证据恢复和取证分析。涵盖已删除提交恢复、强制推送检测、IOC提取、多源证据收集和结构化取证报告。	`security/oss-forensics`
`sherlock`	在400多个社交网络上进行OSINT用户名搜索。通过用户名追踪社交媒体账户。	`security/sherlock`

官方可选技能目录

官方可选技能位于仓库的optional-skills/目录下。使用hermes skills install official/<category>/<skill>命令安装，或使用hermes skills browse --source official命令浏览。内容与上一节“可选技能”列表基本一致，此处不再赘述。

希望这份详细的Hermes Agent技能系统指南能帮助你更好地理解和使用这个强大的功能。技能系统是Hermes实现自主进化与高效协作的核心，熟练掌握它，你将能极大提升AI智能体的工作效率与智能化水平。如果你想了解更多AI相关的技术讨论与实战经验，欢迎访问云栈社区与开发者们交流。

上一篇：深度渗透测试实战：三个月挖透一站的高危漏洞挖掘与利用剖析
下一篇：C++项目依赖分析实战：5款工具助你破解编译耦合与架构混乱

HermesAgent, 智能体技能系统, LLM, AI智能体, GitHub

Hermes Agent技能系统(Skills)详解：核心机制、管理与内置技能大全

目录结构

技能系统 (Skills)

使用技能

渐进式披露

SKILL.md 格式

平台特定技能

条件激活（备用技能）

加载时的安全设置

技能目录结构

外部技能目录

工作原理

示例

Agent管理的技能 (skill_manage 工具) -- Hermes最重要能力

Agent何时创建技能

操作

技能中心

常用命令

支持的技能中心来源

集成的中心和注册中心

1. 官方可选技能 (official)

2. skills.sh (skills-sh)

3. 知名技能端点 (well-known)

4. 直接GitHub技能 (github)

5. ClawHub (clawhub)

6. Claude市场风格仓库 (claude-marketplace)

7. LobeHub (lobehub)

安全扫描与 --force

信任级别

更新生命周期

斜杠命令（在聊天中）

内置技能目录

apple

autonomous-ai-agents

data-science

creative

devops

dogfood

email

gaming

github

inference-sh

leisure

mcp

media

mlops

mlops/cloud

mlops/evaluation

mlops/inference

mlops/models

mlops/research

mlops/training

mlops/vector-databases

note-taking

productivity

research

red-teaming

smart-home

social-media

software-development

可选技能

autonomous-ai-agents

blockchain

creative

devops

email

health

mcp

migration

productivity

research

security

官方可选技能目录

相关帖子

1. 官方可选技能 (`official`)

2. skills.sh (`skills-sh`)

3. 知名技能端点 (`well-known`)

4. 直接GitHub技能 (`github`)

5. ClawHub (`clawhub`)

6. Claude市场风格仓库 (`claude-marketplace`)

7. LobeHub (`lobehub`)

安全扫描与 `--force`