找回密码
立即注册
搜索
热搜: Java Python Linux Go
发回帖 发新帖

4781

积分

0

好友

655

主题
发表于 5 天前 | 查看: 26| 回复: 0

事件概况:Claude Code 源码泄露是 2026 年 3 月 31 日 发生的一起 Anthropic 自己打包失误导致的事件,而不是黑客攻击。

🔍 泄露是怎么发生的?

  • 打包失误:Anthropic 在发布 Claude Code(他们的终端 AI 编程 Agent 工具)最新版本 v2.1.88 到 npm 时,忘记把 source map 文件(.map)加入 .npmignore
  • 源码曝光:这个 60MB 左右的 cli.js.map 文件包含了完整的 sourcesContent,直接可以还原出 1900+ 个 TypeScript 文件、约 51 万行代码。
  • 直接下载:代码还指向 Anthropic 自己的 R2 存储桶里的 src.zip,任何人下载 npm 包就能拿到完整源码。
  • 事件发酵:Anthropic 很快删了包并开始发 DMCA 移除 GitHub 镜像,但代码已经被大量备份(例如 instructkr/claude-code 等仓库),基本“永久留存”了。
  • 历史重演:这已经是第二次类似泄露(2025 年初也出过一次 source map 问题)。

🛠️ 泄露的内容有什么用?

泄露的是 Claude Code 这个 CLI Agent 的前端/工具层代码(用 Bun + TypeScript 写),不是 Claude 模型权重,也不是核心大模型本身。所以不会直接让你“免费拥有 Claude Opus”。

但对开发者、AI 公司和研究者来说,价值还是挺大的,主要用途包括:

1. 学习顶级 Agent Harness(代理框架)的最佳实践

  • 构建生产级 AI Agent:包括工具调用、子 Agent 调度、上下文工程、长期记忆(CLAUDE.md 文件机制,只记偏好不记敏感代码)。
  • 多层安全审查:Auto 模式据说跑两个 AI 互查。
  • 工程细节:系统提示词(system prompt)拼接逻辑、slash commands(隐藏指令有 26+ 个)、Hook 系统、权限控制、进程间通信等。
  • 业界评价:很多人说这是目前能看到的最成熟的 “Agent 外壳” 之一,60% 靠模型,40% 靠工程

2. 反向工程和复刻/改进类似工具

  • 国内外的 AI 编程工具(包括一些国产替代品)可以直接参考其架构、提示词工程、记忆系统来快速迭代。
  • 已经有人基于泄露代码做了新 SDK、插件系统、开源 Agent 项目。

3. 发现未发布/隐藏功能

  • 电子宠物:Tamagotchi 风格的 Buddy,有稀有度、不同生物、帽子、闪光变体,根据用户 ID 生成。
  • Undercover Mode:伪装成人类提交 commit,隐藏 AI 痕迹。
  • Anti-distillation 机制:注入假工具来毒害竞争对手的蒸馏/训练数据。
  • 高级隐藏模块:Kairos(全自主模式?据说能“睡觉时工作”)、多 Agent swarm、30 分钟深度规划等 feature flag 控制的特性。
  • 彩蛋细节:“愚人节彩蛋”、挫败感正则(frustration regexes)等有趣细节。

4. 安全与工程反思

  • 暴露了 Anthropic 在打包流程、敏感文件处理上的低级失误(两次了)。
  • 让大家看到真实的生产级 AI 工具在权限控制、遥测、反越狱、防数据泄露等方面的实现细节(6 级安全架构等)。
  • 对竞争对手来说,能更快找到潜在漏洞或优化点(不过也可能触发 Anthropic 的法律行动)。

📊 实际影响总结

  • 🧑‍💻 对普通用户:几乎没影响,你还是得用官方版本 + API 密钥。不会因为这个就“白嫖”更强的 Claude。
  • 👨‍🔬 对开发者/AI 从业者:是一份难得的“教科书”。很多人已经在用 Claude Code 自己分析自己的源码,产出架构报告、prompt 提取等。想做终端 Agent、AI 编码助手的人,现在有了一个高质量参考。
  • 🏢 对 Anthropic:有点尴尬(尤其刚泄露过模型相关信息),但核心竞争力(模型本身 + 训练数据)没丢。Anthropic 已经确认是“人为打包错误”,没有客户数据泄露。

总的来说,这次泄露最大的价值是把一个闭源顶级 AI Agent 的工程实现细节“开源”了,加速了整个行业的 Agent 开发和 prompt 工程水平。很多人调侃:Anthropic 又一次“无偿贡献”了。如果你想自己看看,可以去搜那些公开的镜像仓库(注意法律风险,Anthropic 在发 DMCA)。或者直接用官方 Claude Code 体验,它确实在终端 Agent 里目前算很强的。


发现亮点一:多 Agent 编排如何实现

Claude Code 的多代理系统是核心亮点之一,完全靠 Task 工具 + 子代理提示 + 协调协议 实现,而不是第三方框架。泄漏源码里已经把整套机制暴露得很清楚。

核心实现机制(从泄漏源码提取)

主代理(Orchestrator):
先用 TodoWrite 工具把大任务拆成结构化 TODO 列表(带状态:todo / in_progress / completed)。
根据任务复杂度决定是否进入 Plan Mode(EnterPlanMode 工具)。

子代理生成与调度(Task 工具):
主代理调用 Task 工具(可并行多个)来 spawn 子代理。
支持的子代理类型(每个都有独立 system prompt):
Explore:只读快速探索代码库(有 quick/medium/thorough 三档)。
Plan:做软件架构规划、方案对比。
General-purpose:通用研究 + 多步执行。
还有 Agent Creation Architect(动态创建新代理)、Verification Specialist(安全/验证)等。
子代理运行在独立上下文窗口(independent session),主代理继续自己的工作,完成后通过 TaskOutput 回调结果。

协调协议(Coordination):
Teammate Communication(130 tokens 片段):子代理之间可以 peer-to-peer 发消息。
Subagent Delegation Examples(606 tokens):主代理有现成例子教它怎么正确委托。
Hooks 系统:用户/项目定义的 hook 可以自动触发子代理(Agent Hook 提示 133 tokens)。
Dream Memory Consolidation:后台子代理做记忆合并(727 tokens),让多代理共享长期记忆。

官方进阶特性(源码里已实现):
Agent Teams(实验功能,需环境变量开启):正式的多代理团队模式,支持 git worktrees 并行、共享任务列表。
Background / Parallel:一个消息里可以同时发起多个 Task,真正并行执行。
Security Monitor:每个子代理行动前都有两阶段安全审查(2726 + 3150 tokens 的巨型安全提示)。

发现亮点二:提示词拆分

把 prompt 拆成独立段落区块,每段只管一件事  
Claude Code 的 system prompt 不是一整段文字,
而是由 getSimpleSystemSection()、getSimpleDoingTasksSection()、getSimpleToneAndStyleSection() 等十几个函式各自产生,最后拼接起来。  
每个 section 用 # 标题 开头,像 # System、# Doing tasks、# Tone and style、# Output efficiency。
彼此不重叠、不矛盾。  
这代表什么?
当你的 prompt 超过 500 字,把它结构化成多个 section 的效果会远好于一段长文。
因为模型在处理指令时,section 标题本身就是一个分类锚点(anchor),让它更容易判断「这条规则属于哪个范畴」。

发现亮点三: 节省 Token

https://github.com/Rangizingo/cc-cache-fix/tree/main
加上这个补丁可以防止多消耗 token。


🚀 事件发酵:泄漏之后的相关开源项目和相关教程说明

泄漏发生后(2026 年 3 月 31 日),社区反应非常迅速。Anthropic 很快发出 DMCA 删除请求,但代码已被大量镜像、备份和 “clean-room”(干净室重写,不直接复制原代码)项目接手,基本无法完全移除。目前 GitHub 上有多个相关仓库,主要分为两类:

📂 1. 主要开源/镜像项目(直接或间接基于泄漏)

  • instructkr/claw-code (或 instructkr/claude-code
    https://github.com/instructkr/claw-code
    • 地位:最受欢迎的项目,被称为“GitHub 历史上最快达到 50K stars 的仓库”(2 小时内)。
    • 特点:这是一个 Python clean-room 重写,不直接包含原泄漏源码,而是基于架构模式重新实现 Claude Code 的 Agent Harness(代理框架)。重点是“Better Harness Tools”,适合学习和实际使用。很多人用它来构建自己的多 Agent 系统。
  • chauncygu/collection-claude-code-source-code
    • 特点:收集了泄漏的 TypeScript 源码(约 1884 个文件)和一个 Python 重写子项目(claw-code)。适合想直接研究原架构的人。
  • Kuberwastaken/claude-code
    • 特点:包含泄漏源码备份 + 详细的技术 Breakdown(分析如何工作、隐藏功能等),还有 Rust 重写分支。README 里有很好的架构解读。
  • 直接镜像仓库(如 abubakarsiddik31/leaked-claude-codeleeyeel/claude-code-sourcemapnirholas/claude-code 等)
    • 特点:存放从 npm source map(cli.js.map)提取/还原的完整 TypeScript 源码(约 1900 个文件,51-60 万行)。用于源码分析,但注意法律风险(Anthropic 正在清理)。
  • Claude Code反封号反追踪工具:cc-gateway
    https://github.com/motiful/cc-gateway

📚 2. 相关教程、分析和说明资源

架构与 Breakdown:

  • Kuberwastaken/claude-code 的 README:详细解释泄漏过程、源码结构、隐藏功能(如 Undercover Mode、fake tools、防蒸馏机制、frustration regexes 等)。
  • Layer5.io 的博客文章:《The Claude Code Source Leak》——分析 51.2 万行代码的意义、社区反应、最快增长仓库等。
  • Medium/DEV.to 上的多篇分析:如系统提示词拼接逻辑、多层安全审查、上下文压缩(MicroCompact、AutoCompact)、AutoDream 记忆机制、权限邮箱、多 Agent 编排等。

系统提示词(System Prompts)提取:

  • asgeirtj/system_prompts_leaks(Anthropic/claude-code.md):提取了 Claude Code 的各种 system prompt 片段,包括 slash commands、工具描述、子 Agent 提示等。
  • Piebald-AI/claude-code-system-prompts:收集了 40+ 个 prompt 片段、token 计数、版本变更历史,适合 prompt engineering 学习。

零基础抄作业:

claude-howto
一个直白的实战案例库。没有枯燥理论,全是现成的场景模板。你想让 AI 干什么活,直接在里面找对应的例子复制粘贴,马上就能跑通,很适合新手破冰。
https://github.com/luongnv89/claude-howto

避坑与进阶指南

claude-code-best-practice
用久了肯定会遇到 AI 死循环或者胡言乱语。这套教程整理了社区的 80 多个真实经验。主要教怎么正确下指令:比如怎么中途打断、怎么回滚、怎么让它先理清思路再动手。看完能少走不少弯路。
https://github.com/shanraisshan/claude-code-best-practice

高阶自动化配置

oh-my-claudecode
想追求更顺滑的操作,就看这个(致敬了经典的 oh-my-zsh)。它把很多复杂的交互提前封装好了,不用死记繁琐的命令,通过简单的键盘操作就能让 AI 自动拆解任务,日常使用会流畅很多。
https://github.com/Yeachan-Heo/oh-my-claudecode


⚠️ 注意事项

  1. ⚖️ 法律风险:直接 fork 或使用原泄漏源码的仓库可能被 DMCA 下架,建议优先看 clean-room 重写项目(如 instructkr/claw-code)。
  2. 💎 实际价值:这些项目加速了整个 AI Agent 领域的工程水平。核心不是“白嫖 Claude”,而是学到生产级 Agent 的提示词工程、工具调用、安全沙箱、多 Agent 协作、内存管理等最佳实践。
  3. 💡 对开发者:想自己实现类似终端 Agent 的人,现在有高质量参考模板。可以结合 Bun/TypeScript 或直接用 Python/Rust 重写。

另外刚知道OpenAI的Codex 一直也是开源的:
https://github.com/openai/codex

总的来说,如果你不关注工具的开发之类的,你拿到源码其实没啥用,主要是学习人家的一个思路。这次事件更像是一次对顶级 AI 工程实践的公开课,为整个技术社区提供了宝贵的参考资料。更多技术深度讨论,欢迎来 云栈社区 交流。




上一篇:60+实战专家齐聚SITS 2026,全景解析奇点智能技术大会日程
下一篇:基于ODIN芯粒架构的CPU-GPU融合验证:如何用重放驱动方法实现83.3%的硬件利用率
您需要登录后才可以回帖 登录 | 立即注册

手机版|小黑屋|网站地图|云栈社区 ( 苏ICP备2022046150号-2 )

GMT+8, 2026-4-7 19:46 , Processed in 0.991251 second(s), 42 queries , Gzip On.

Powered by Discuz! X3.5

© 2025-2026 云栈社区.

快速回复 返回顶部 返回列表