云栈社区»论坛 › 回收站「 Recycle Bin 」 › Claude Code技能管理工具skill-monitor：监控Token成本与安全风 ...

发回帖发新帖

3585 积分	0 好友	475 主题

发消息

Claude Code技能管理工具skill-monitor：监控Token成本与安全风险

发表于 2026-4-5 05:50:28 | 查看: 98| 回复: 0

之前我分享过几篇框架级别的skill pack的文章，每个框架都很重，而且各个框架之间有不少技能的作用是重复的。

我自己的Claude Code装了包括gstack在内的四个大型skill pack之后，系统里积累了221个skill文件。

221个Skill，每次对话默默吃掉12，800个token，其中89%从未被触发过。

之前一篇文章中我也提到了：“Skill管理需要一套包括安全审计、性能监控、使用频率追踪、稳定性验证在内的持续监控机制。” （关于Claude Code Skills 必备的几个认知）

这篇就是来兑现的。从调研到开发到开源发布，我把完整过程分享出来。

Skill Monitor项目首页截图

先说一个大部分人不知道的事。

Claude Code 的 Skill 加载是有隐性成本的。 官方文档里写得很清楚：每个已安装 Skill 的 name 和 description 会在每次对话启动时预加载到 system prompt 里。不管你用不用，token 都会被吃掉。

具体来说，加载分三层：

Layer 1：name + description，每次对话都加载，无条件
Layer 2：SKILL.md 正文，只在触发时才读
Layer 3：references/ 等附件，按需读取

关键是第一层。你装了 200 个 Skill，每个 description 平均 260 个字符，那就是 5 万多字符的 metadata 要塞进 system prompt。而 Claude Code 给 Skill 的 context 预算只有 context window 的 1%，兜底 8K 字符。超出预算后 description 会被截断到 250 字符。

后果很直接：你精心写的触发条件，可能根本没被 Claude 看到。

我实测的数据：221 个 Skill 的 description 总共 68,070 字符，预算是 15,700 字符。超了 433%。 这意味着只有不到四分之一的 Skill 描述能被完整加载，剩下的要么被截断要么被忽略。

Skill Token成本估算表

这还没算 token 成本。按每天 50 次对话算，光 description 注入一项，每月就是 1920 万 token 的固定开销。这笔钱花出去了，但 89% 的 Skill 一次都没被调用。

社区其实早有人注意到了。有个帖子标题很直白：“Most Claude Code Skills Are Garbage”。不是说 Skill 本身质量差，而是装太多之后互相挤占，8-10 个开始冲突，Claude 变得犹豫和冗余。社区共识推荐的上限是 30 个。

这就是我做 skill-monitor 的动机。不是为了再造一个审计工具，是自己真的需要。

开发历程：从“能用”到“可靠”

说一下开发过程。

第一版是直接让 Claude 原生写的。给它描述需求：“做一个审查已安装 Skill 的工具，覆盖安全扫描、token 成本分析、使用追踪、冲突检测”。30 分钟出了一个能跑的原型，dashboard 也有了，基本功能齐全。

skill-monitor初期代码审计结果截图

然后我做了一件事：用这个安全审计工具审计它自己。

结果挺讽刺。这个专门检查别人有没有用无限制 Bash 的工具，自己的 allowed-tools 里赫然写着不加任何限制的 Bash。JSON 解析用的是 grep 正则提取，遇到恶意构造的输入就会误判。日志文件是明文 append-only，任何进程都能篡改。

更深层的问题是：它在做安全审计时需要读取每个 SKILL.md 的完整内容。如果某个被审计的 Skill 里嵌入了提示词注入（比如 ），Claude 读到这段内容时可能就被干扰了。审计工具反被审计对象操控，这就不好玩了。

skill-monitor自身安全性问题分析截图

兜了一圈回来看，Claude 原生写 Skill 的能力确实够用。但“能写”和“写得可靠”是两件事。

顺着这个问题我去查了社区有没有专门做 Skill 质量保证的工具。找到了 Anthropic 官方的 skill-creator，就在 anthropics/skills 仓库里。

skill-creator与Claude原生开发对比表

核心差异不在“帮你写”，在“帮你验证”。它把 Skill 创建变成了一个有测试、有评分、有迭代的工程流程。

我装了 skill-creator，然后把已有的 skill-monitor 丢进去走了一遍。

它做的第一件事就是检查 description。发现我在 description 里写了功能摘要——“security scan， token cost， conflict detection”。这在 skill-creator 的方法论里是个错误：description 应该只写触发条件（什么时候该调用这个 Skill），绝不写工作流摘要。因为 Claude 看到 description 里有流程描述时，会直接按 description 执行而跳过 SKILL.md 正文。

这个发现对我后续的开发影响很大。相当于之前精心写的几百行指令，Claude 很可能根本没读。

经过 skill-creator 的优化循环和几轮手动迭代，最终的 skill-monitor 稳定在 v0.1.0。

skill-monitor 能做什么？

Skill Monitor仪表盘运行结果截图

简单说一下它能做什么。分三类：

脚本驱动（225ms 出结果）：

/skill-monitor — 总览 dashboard
/skill-monitor security — 安全模式扫描（反向 Shell、curl|bash、凭据泄露等）
/skill-monitor cost — Token 成本分项（user/plugin 分开算）
/skill-monitor budget — description 预算诊断（谁被截断了）
/skill-monitor hooks — Hook 冲突检测
/skill-monitor usage — 使用频率追踪

LLM 驱动（需要 Claude 分析）：

/skill-monitor overlap — 跨层重叠检测（user skill 和 plugin skill 功能重复）
/skill-monitor profile — 技术栈匹配（装了一堆 Ruby/Rails skill 但你写 Python）
/skill-monitor compress — 自动压缩超长 description 到 250 字符以内

管理操作：

/skill-monitor disable <name> — 禁用（可恢复）
/skill-monitor quarantine <name> — 隔离到独立目录（用于有安全风险的 Skill）
/skill-monitor restore <name> — 恢复

安装与使用

最后说说安装。一条命令：

claude plugin add github:Luxuzhou/skill-monitor-plugin

或者手动 clone：

git clone https://github.com/Luxuzhou/skill-monitor-plugin.git
cp -r skill-monitor-plugin/skills/skill-monitor ~/.claude/skills/

它支持 Claude Code、Codex、Gemini CLI、OpenCode、Cursor，遵循 Agent Skills 开放标准。

这个工具解决的问题不复杂，就是给你的技能管理做个“体检”。但我在做的过程中发现，真正难的不是写出一个能跑的 Skill，而是写出一个不会被 Claude 绕过、不会自己变成安全隐患、加载机制又刚好兼容的 Skill。

开发过程中，为了确保脚本的稳定性和安全性，我反复检查和重构了其中的 Bash脚本 逻辑。这中间的差距，就是“用 AI 写代码”和“用 AI 写出可靠代码”之间的那道坎。如果你也在探索如何更好地管理和优化你的 AI 助手技能栈，欢迎来云栈社区交流讨论。

上一篇：前端工程师如何转型？掌握Vercel AI SDK与全栈技能成为新时代产品工程师
下一篇：C#调用C接口回调函数：Marshal转换与委托绑定实战

Claude, Python, AI编程助手, 技能管理, Bash

Claude Code技能管理工具skill-monitor：监控Token成本与安全风险

开发历程：从“能用”到“可靠”

skill-monitor 能做什么？

安装与使用

相关帖子

浏览过的版块