云栈社区»论坛 › 开发者广场「Dev Plaza」 › Claude Cowork文件安全风险实测：AI代理误删11GB文件，权限管理 ...

5732 积分	0 好友	762 主题

发消息

Claude Cowork文件安全风险实测：AI代理误删11GB文件，权限管理成焦点

发表于 2026-1-21 10:46:38 | 查看: 192| 回复: 0

转自：InfoQ

近日，Anthropic 推出了 Claude Cowork 的研究预览版。然而，这款旨在为非技术用户提供强大AI协作能力的新产品，在上线后不久便被曝出存在严重的安全隐患。它不仅发生了误删用户11GB文件的“惨剧”，还被安全研究人员指出存在文件窃取风险。

事情的起因是博主 James McAulay 的一次常规测试。在对比 Claude Cowork 与 Claude Code 的文件夹整理功能时，意外发生了。正当 James 观察两者的整理进度时，Claude Cowork 突然报错：它在操作过程中，擅自删除了约 11GB 的文件。

更令人不安的是，这些被删除的文件并未进入系统的回收站，而是被直接执行了类似 rm -rf 这样的不可逆删除命令。James 立即让 Claude Cowork 导出操作日志以确认情况，随后咨询 Claude Code 是否有恢复可能，得到的回复是“无法恢复，属于致命操作”。

复盘整个过程发现，当 Claude Cowork 请求文件操作权限时，James 点击了“全部允许”或“始终允许”。他并未预料到，即便在后续的交互中明确给出了“保留文件”的指令，这个 AI 代理仍会无视指令，并最终执行不可逆的删除操作。幸运的是，此次被删除的均为过往上传的非核心文件，未造成实质性重大损失，但这次事件无疑暴露了当前 AI Agent 在权限控制和指令遵循上存在的巨大安全隐患。

Claude Cowork 报错信息截图，显示误删了约11GB的视频文件

除了严重的安全事故，James 在对比测试中还指出了 Claude Cowork 与 Claude Code 的两点显著差距：

交互繁琐：当发出“整理文件夹”指令后，Claude Cowork 并未直接行动，而是要求用户先启动新任务并手动选择目标文件夹。相比之下，Claude Code 会直接定位到文件夹并开始分析，用户只需授予一次权限即可。在整个整理过程中，Claude Cowork 会反复交互确认细节，例如询问“文件按什么维度分类”、“用户数据文件夹如何处理”。即便 James 明确回复“用户数据文件夹暂不删除、保留”，它仍在待办清单中标记“删除用户数据文件夹：已完成”。尽管后续并未真正执行删除，但这暴露了其指令响应机制存在漏洞。
效率滞后：在整理过程中，Claude Cowork 运行命令时多次出现停顿，节奏拖沓。而同期使用 Claude Code 整理“音乐文件夹”时，AI 能迅速给出“专辑和迷你专辑、单曲、Demo、翻唱”等分类建议，用户确认后即刻执行，全程仅需数十秒。即使两者均基于 Opus 4.5 模型，Claude Cowork 的响应速度和执行效率也明显落后，使得简单的文件夹整理任务变成了“持久战”。

安全隐患：已知漏洞与文件窃取风险

文件误删并非唯一风险。AI 安全公司 PromptArmor 的研究进一步指出，由于 Claude 代码执行环境中存在一个已知但未解决的隔离缺陷，Claude Cowork 容易遭受通过间接提示注入实施的文件窃取攻击。

据悉，该漏洞最早由研究员 Johann Rehberger 在 Claude.ai 的聊天环境中发现，并已扩展到 Cowork 功能中。Anthropic 确认了该漏洞的存在，但尚未进行修复。公司方面提醒用户：“Cowork 是一个研究预览版，由于其 agentic 的特性以及可访问互联网，存在独特风险”，并建议用户警惕“可能表明存在提示注入的可疑行为”。

然而，PromptArmor 对此回应表示，由于该功能面向的是普通大众而非仅限技术用户，要求他们去识别专业的提示注入行为“是不公平的”，并引用了 Simon Willison 的观点来支持这一说法。

社交媒体对话截图，用户抱怨API故障，官方致歉并承诺改进

产品背后的故事：一周半的极速开发与未来愿景

在安全风波之前，Every 团队曾提前体验并直播测试了 Claude Cowork。Anthropic Claude Cowork 项目的核心成员 Felix Rieseberg 在直播中分享了产品的设计思路。他透露，Cowork 是一个快速上线、旨在观察用户如何使用并进行迭代的产品，整个开发周期仅用了 1.5 周。Felix 强调，未来将围绕用户反馈进行快速迭代。工程师 Boris Cherny 还在 X 上透露，该产品的全部代码都是由 Claude Code 编写的。

Felix 在访谈中阐述了产品的工作流设计理念，即可分为“非确定性（依赖模型智能）”和“稳定可重复（编写工具）”两类，需要在两者间做出取舍。他认为 Skills 是平衡“模型灵活性”与“工作流稳定性”的关键，能够沉淀可复用的知识，甚至催生出涌现能力。

对于未来，Felix 预测 Agent 类应用的界面将趋于简化，会使用统一的“泛化入口”覆盖更多场景，而非堆砌大量专用化的输入框。他坦诚，关于 AI 交互的最终形态，即便在团队内部也存在不同看法，但他个人相信类似搜索框的“我想要某样东西”的输入形态会长期存在，且入口会趋向统一而非割裂。

当被问及产品设计中的取舍时，Felix 给出了一个核心建议：将工作流拆分为非确定性的和稳定可重复的两部分。对于那些非常可重复、确信永远不会改变，且模型能力提升也带不来额外收益的部分，正是编写具体工具的好时机。他同样强调了 Skills 的重要性，认为这是目前最主要的、也是最“可 hack”的定制化入口，它允许用户用 Markdown 描述规则和原则，让 Claude 遵循执行，这比直接提供极其底层的通用工具（如“直接调用GCC”）更为高效和可控。

测试总结：理念超前，但执行仍需打磨

根据 Every 团队的测评，Claude Cowork 的核心定位是为非技术用户提供 Claude Code 级别的 AI 异步协作能力。其最显著的突破在于将 AI 使用逻辑从传统的“一问一答”升级为“异步托付”。产品具备持续运行任务直至完成的能力，适合审计日历、分析数据、整理文件夹、校对文档等耗时较长的任务。

在产品设计上，右侧的待办任务列表和“询问用户”的可视化交互界面，旨在降低非技术用户的操作门槛。其支持加载用户已安装的 Claude Skills，也被认为是产品最具“可定制性”的亮点。

然而，测评也指出了产品当前的诸多不足：

UI/UX 粗糙：任务列表仅按时间排序，缺乏视觉区分。
权限管理不直观：用户难以判断 AI 是在本地还是云端运行，文件夹访问权限需手动配置，容易造成困惑。
功能逻辑缺陷：“询问用户”功能可能在用户未响应时自动跳过问题，且存在选项和字符数限制。
复杂应用适配不佳：对 Google Docs 等应用的操作容易失败。

最终，测评团队给出的结论是：“理念绿牌，当前执行黄牌”。Claude Cowork 在推动 AI 协作范式转变上理念超前，具备高探索价值；但受限于粗糙的 UI、不完善的功能逻辑以及潜在的安全风险，当前体验仍有巨大的优化空间。对于所有用户，尤其是非技术背景的用户而言，在拥抱这类强大 AI 代理工具时，审慎管理其权限，并保持对潜在风险的认识，或许是当前阶段更为稳妥的做法。这正是每一位开发者在探索 AI 与自动化运维边界时需要时刻警惕的核心议题。

参考链接：

上一篇：腾讯DMCA投诉致GitHub下架超4000个微信聊天记录开源仓库
下一篇：Datadog Bits AI SRE Agent深度解析：如何实现故障根因自动调查与定位

Anthropic, Claude, AI代理, 文件安全, 权限管理

Claude Cowork文件安全风险实测：AI代理误删11GB文件，权限管理成焦点

安全隐患：已知漏洞与文件窃取风险

产品背后的故事：一周半的极速开发与未来愿景

测试总结：理念超前，但执行仍需打磨

相关帖子