云栈社区»论坛 › 开发者广场「Dev Plaza」 › Claude Code 源码泄露事件全解析：架构、价值与社区响应 ...

发回帖发新帖

5439 积分	0 好友	737 主题

发消息

Claude Code 源码泄露事件全解析：架构、价值与社区响应

发表于 2026-4-2 14:04:34 | 查看: 96| 回复: 0

事件概况：Claude Code 源码泄露是 2026 年 3 月 31 日 发生的一起 Anthropic 自己打包失误导致的事件，而不是黑客攻击。

🔍 泄露是怎么发生的？

打包失误：Anthropic 在发布 Claude Code（他们的终端 AI 编程 Agent 工具）最新版本 v2.1.88 到 npm 时，忘记把 source map 文件（.map）加入 .npmignore。
源码曝光：这个 60MB 左右的 cli.js.map 文件包含了完整的 sourcesContent，直接可以还原出 1900+ 个 TypeScript 文件、约 51 万行代码。
直接下载：代码还指向 Anthropic 自己的 R2 存储桶里的 src.zip，任何人下载 npm 包就能拿到完整源码。
事件发酵：Anthropic 很快删了包并开始发 DMCA 移除 GitHub 镜像，但代码已经被大量备份（例如 instructkr/claude-code 等仓库），基本“永久留存”了。
历史重演：这已经是第二次类似泄露（2025 年初也出过一次 source map 问题）。

🛠️ 泄露的内容有什么用？

泄露的是 Claude Code 这个 CLI Agent 的前端/工具层代码（用 Bun + TypeScript 写），不是 Claude 模型权重，也不是核心大模型本身。所以不会直接让你“免费拥有 Claude Opus”。

但对开发者、AI 公司和研究者来说，价值还是挺大的，主要用途包括：

1. 学习顶级 Agent Harness（代理框架）的最佳实践

构建生产级 AI Agent：包括工具调用、子 Agent 调度、上下文工程、长期记忆（CLAUDE.md 文件机制，只记偏好不记敏感代码）。
多层安全审查：Auto 模式据说跑两个 AI 互查。
工程细节：系统提示词（system prompt）拼接逻辑、slash commands（隐藏指令有 26+ 个）、Hook 系统、权限控制、进程间通信等。
业界评价：很多人说这是目前能看到的最成熟的 “Agent 外壳” 之一，60% 靠模型，40% 靠工程。

2. 反向工程和复刻/改进类似工具

国内外的 AI 编程工具（包括一些国产替代品）可以直接参考其架构、提示词工程、记忆系统来快速迭代。
已经有人基于泄露代码做了新 SDK、插件系统、开源 Agent 项目。

3. 发现未发布/隐藏功能

电子宠物：Tamagotchi 风格的 Buddy，有稀有度、不同生物、帽子、闪光变体，根据用户 ID 生成。
Undercover Mode：伪装成人类提交 commit，隐藏 AI 痕迹。
Anti-distillation 机制：注入假工具来毒害竞争对手的蒸馏/训练数据。
高级隐藏模块：Kairos（全自主模式？据说能“睡觉时工作”）、多 Agent swarm、30 分钟深度规划等 feature flag 控制的特性。
彩蛋细节：“愚人节彩蛋”、挫败感正则（frustration regexes）等有趣细节。

4. 安全与工程反思

暴露了 Anthropic 在打包流程、敏感文件处理上的低级失误（两次了）。
让大家看到真实的生产级 AI 工具在权限控制、遥测、反越狱、防数据泄露等方面的实现细节（6 级安全架构等）。
对竞争对手来说，能更快找到潜在漏洞或优化点（不过也可能触发 Anthropic 的法律行动）。

📊 实际影响总结

🧑‍💻 对普通用户：几乎没影响，你还是得用官方版本 + API 密钥。不会因为这个就“白嫖”更强的 Claude。
👨‍🔬 对开发者/AI 从业者：是一份难得的“教科书”。很多人已经在用 Claude Code 自己分析自己的源码，产出架构报告、prompt 提取等。想做终端 Agent、AI 编码助手的人，现在有了一个高质量参考。
🏢 对 Anthropic：有点尴尬（尤其刚泄露过模型相关信息），但核心竞争力（模型本身 + 训练数据）没丢。Anthropic 已经确认是“人为打包错误”，没有客户数据泄露。

总的来说，这次泄露最大的价值是把一个闭源顶级 AI Agent 的工程实现细节“开源”了，加速了整个行业的 Agent 开发和 prompt 工程水平。很多人调侃：Anthropic 又一次“无偿贡献”了。如果你想自己看看，可以去搜那些公开的镜像仓库（注意法律风险，Anthropic 在发 DMCA）。或者直接用官方 Claude Code 体验，它确实在终端 Agent 里目前算很强的。

发现亮点一：多 Agent 编排如何实现

Claude Code 的多代理系统是核心亮点之一，完全靠 Task 工具 + 子代理提示 + 协调协议实现，而不是第三方框架。泄漏源码里已经把整套机制暴露得很清楚。

核心实现机制（从泄漏源码提取）

主代理（Orchestrator）：
先用 TodoWrite 工具把大任务拆成结构化 TODO 列表（带状态：todo / in_progress / completed）。
根据任务复杂度决定是否进入 Plan Mode（EnterPlanMode 工具）。

子代理生成与调度（Task 工具）：
主代理调用 Task 工具（可并行多个）来 spawn 子代理。
支持的子代理类型（每个都有独立 system prompt）：
Explore：只读快速探索代码库（有 quick/medium/thorough 三档）。
Plan：做软件架构规划、方案对比。
General-purpose：通用研究 + 多步执行。
还有 Agent Creation Architect（动态创建新代理）、Verification Specialist（安全/验证）等。
子代理运行在独立上下文窗口（independent session），主代理继续自己的工作，完成后通过 TaskOutput 回调结果。

协调协议（Coordination）：
Teammate Communication（130 tokens 片段）：子代理之间可以 peer-to-peer 发消息。
Subagent Delegation Examples（606 tokens）：主代理有现成例子教它怎么正确委托。
Hooks 系统：用户/项目定义的 hook 可以自动触发子代理（Agent Hook 提示 133 tokens）。
Dream Memory Consolidation：后台子代理做记忆合并（727 tokens），让多代理共享长期记忆。

官方进阶特性（源码里已实现）：
Agent Teams（实验功能，需环境变量开启）：正式的多代理团队模式，支持 git worktrees 并行、共享任务列表。
Background / Parallel：一个消息里可以同时发起多个 Task，真正并行执行。
Security Monitor：每个子代理行动前都有两阶段安全审查（2726 + 3150 tokens 的巨型安全提示）。

发现亮点二：提示词拆分

把 prompt 拆成独立段落区块，每段只管一件事  
Claude Code 的 system prompt 不是一整段文字，
而是由 getSimpleSystemSection()、getSimpleDoingTasksSection()、getSimpleToneAndStyleSection() 等十几个函式各自产生，最后拼接起来。  
每个 section 用 # 标题 开头，像 # System、# Doing tasks、# Tone and style、# Output efficiency。
彼此不重叠、不矛盾。  
这代表什么？
当你的 prompt 超过 500 字，把它结构化成多个 section 的效果会远好于一段长文。
因为模型在处理指令时，section 标题本身就是一个分类锚点（anchor），让它更容易判断「这条规则属于哪个范畴」。

发现亮点三：节省 Token

https://github.com/Rangizingo/cc-cache-fix/tree/main
加上这个补丁可以防止多消耗 token。

🚀 事件发酵：泄漏之后的相关开源项目和相关教程说明

泄漏发生后（2026 年 3 月 31 日），社区反应非常迅速。Anthropic 很快发出 DMCA 删除请求，但代码已被大量镜像、备份和 “clean-room”（干净室重写，不直接复制原代码）项目接手，基本无法完全移除。目前 GitHub 上有多个相关仓库，主要分为两类：

📂 1. 主要开源/镜像项目（直接或间接基于泄漏）

instructkr/claw-code （或 instructkr/claude-code）
https://github.com/instructkr/claw-code
- 地位：最受欢迎的项目，被称为“GitHub 历史上最快达到 50K stars 的仓库”（2 小时内）。
- 特点：这是一个 Python clean-room 重写，不直接包含原泄漏源码，而是基于架构模式重新实现 Claude Code 的 Agent Harness（代理框架）。重点是“Better Harness Tools”，适合学习和实际使用。很多人用它来构建自己的多 Agent 系统。
chauncygu/collection-claude-code-source-code
- 特点：收集了泄漏的 TypeScript 源码（约 1884 个文件）和一个 Python 重写子项目（claw-code）。适合想直接研究原架构的人。
Kuberwastaken/claude-code
- 特点：包含泄漏源码备份 + 详细的技术 Breakdown（分析如何工作、隐藏功能等），还有 Rust 重写分支。README 里有很好的架构解读。
直接镜像仓库（如 abubakarsiddik31/leaked-claude-code、leeyeel/claude-code-sourcemap、nirholas/claude-code 等）
- 特点：存放从 npm source map（cli.js.map）提取/还原的完整 TypeScript 源码（约 1900 个文件，51-60 万行）。用于源码分析，但注意法律风险（Anthropic 正在清理）。
Claude Code反封号反追踪工具：cc-gateway
https://github.com/motiful/cc-gateway

📚 2. 相关教程、分析和说明资源

架构与 Breakdown：

Kuberwastaken/claude-code 的 README：详细解释泄漏过程、源码结构、隐藏功能（如 Undercover Mode、fake tools、防蒸馏机制、frustration regexes 等）。
Layer5.io 的博客文章：《The Claude Code Source Leak》——分析 51.2 万行代码的意义、社区反应、最快增长仓库等。
Medium/DEV.to 上的多篇分析：如系统提示词拼接逻辑、多层安全审查、上下文压缩（MicroCompact、AutoCompact）、AutoDream 记忆机制、权限邮箱、多 Agent 编排等。

系统提示词（System Prompts）提取：

asgeirtj/system_prompts_leaks（Anthropic/claude-code.md）：提取了 Claude Code 的各种 system prompt 片段，包括 slash commands、工具描述、子 Agent 提示等。
Piebald-AI/claude-code-system-prompts：收集了 40+ 个 prompt 片段、token 计数、版本变更历史，适合 prompt engineering 学习。

零基础抄作业：

claude-howto
一个直白的实战案例库。没有枯燥理论，全是现成的场景模板。你想让 AI 干什么活，直接在里面找对应的例子复制粘贴，马上就能跑通，很适合新手破冰。
https://github.com/luongnv89/claude-howto

避坑与进阶指南

claude-code-best-practice
用久了肯定会遇到 AI 死循环或者胡言乱语。这套教程整理了社区的 80 多个真实经验。主要教怎么正确下指令：比如怎么中途打断、怎么回滚、怎么让它先理清思路再动手。看完能少走不少弯路。
https://github.com/shanraisshan/claude-code-best-practice

高阶自动化配置

oh-my-claudecode
想追求更顺滑的操作，就看这个（致敬了经典的 oh-my-zsh）。它把很多复杂的交互提前封装好了，不用死记繁琐的命令，通过简单的键盘操作就能让 AI 自动拆解任务，日常使用会流畅很多。
https://github.com/Yeachan-Heo/oh-my-claudecode

⚠️ 注意事项

⚖️ 法律风险：直接 fork 或使用原泄漏源码的仓库可能被 DMCA 下架，建议优先看 clean-room 重写项目（如 instructkr/claw-code）。
💎 实际价值：这些项目加速了整个 AI Agent 领域的工程水平。核心不是“白嫖 Claude”，而是学到生产级 Agent 的提示词工程、工具调用、安全沙箱、多 Agent 协作、内存管理等最佳实践。
💡 对开发者：想自己实现类似终端 Agent 的人，现在有高质量参考模板。可以结合 Bun/TypeScript 或直接用 Python/Rust 重写。

另外刚知道OpenAI的Codex 一直也是开源的：
https://github.com/openai/codex

总的来说，如果你不关注工具的开发之类的，你拿到源码其实没啥用，主要是学习人家的一个思路。这次事件更像是一次对顶级 AI 工程实践的公开课，为整个技术社区提供了宝贵的参考资料。更多技术深度讨论，欢迎来云栈社区交流。

上一篇：60+实战专家齐聚SITS 2026，全景解析奇点智能技术大会日程
下一篇：基于ODIN芯粒架构的CPU-GPU融合验证：如何用重放驱动方法实现83.3%的硬件利用率

Claude Code, AI代理, TypeScript, Bun, 源码泄露