最近,Anthropic 发布了一项基于数百万次真实交互的研究报告,试图量化人类在使用 AI Agent 时的授权行为。其中几个数据颇具启发性。
Claude Code 的最长自主运行时长,在三个月内从 25 分钟翻倍到超过 45 分钟。新用户中大约有 20% 会开启全自动审批,而有经验的用户中这一比例超过了 40%。最有趣的是,在最复杂的任务中,Claude 主动暂停并请求澄清的频率,竟然是用户主动中断它的两倍。
最后这个数据尤其反直觉。我们通常担心 AI 会自作主张、鲁莽行事,但实际数据显示,模型可能比我们更谨慎、更主动地“要求确认”。
这份报告引出了一个更深层的问题:在实践中,我们到底应该如何把控制权交给 AI?

先搞清楚你在交什么
“控制权”并非铁板一块,它可以被拆解为几个相互独立的维度来理解:
- 执行权:AI 能否不经过每步确认,直接运行命令、修改文件或调用 API?
- 决策权:当任务遇到分叉路口或不确定因素时,AI 是否能自行做出选择,还是必须停下来问你?
- 范围权:AI 的操作边界在哪里?是仅限于当前项目目录,还是可以访问整个文件系统或网络?
- 时间权:AI 能够连续自主工作多长时间而不被强制中断?
这四个维度完全可以独立配置。例如,你可以授予 AI 完整的执行权(无需逐步确认),但同时严格限制其范围权(仅能操作指定的沙盒目录)。许多人误将“控制权”视为一个非开即关的开关,这其实是一个常见的误区。
新手与老手的差距在哪里?
Anthropic 的数据揭示了一个现象:新用户中约20%开启全自动审批,而有经验的用户这一比例超过40%。
这个差距并非源于老手更“胆大”,而是因为他们更清晰地划定了安全的边界。
新手不敢放权,往往是因为不了解 AI Agent 的行为模式和潜在风险。每一步都要求确认,源于对下一步操作是否会引发问题的不确定性。这种谨慎是合理的,但它也极大地限制了效率,让 AI 的潜力无法充分发挥。
有经验的用户之所以敢放更多权,是因为他们已经基于实践构建了一套“信任模型”:清楚哪类任务 AI 能够稳定可靠地完成,知道哪些环节必须人工介入把关,也准备好了问题发生时的回滚方案。这种信任并非盲目给予,而是基于一次次具体交互经验积累的结果。
因此,“应该给 AI 多少控制权?”这个问题没有标准答案。答案取决于你对工具的熟悉程度,以及你为可能的失误铺设了多厚的安全垫。
一个可操作的授权框架
我们可以根据任务的风险高低和操作的可逆性,将任务大致归为四类,并采取不同的授权策略:
- 低风险 + 可逆:例如生成代码草稿、撰写文档、进行数据分析。这类任务可以完全放手,让 AI 自主完成,你只需最后验收结果。
- 低风险 + 不可逆:例如发送邮件、提交代码合并请求(PR)、部署到测试环境。建议让 AI 准备好所有内容,由你进行最终确认后再执行。
- 高风险 + 可逆:例如重构核心模块、修改数据库结构(前提是已做好备份)。可以让 AI 执行,但必须设置多个检查点,每完成一个关键阶段就进行人工确认。
- 高风险 + 不可逆:例如删除生产环境数据、修改系统关键权限配置、对外发布正式内容。这类任务中,AI 应仅充当辅助角色,所有最终决策必须由人做出。
这个框架并不复杂,但很多人在实际使用中会无意识地将“高风险 + 不可逆”的任务也交给 AI 全权处理,直到出了问题才追悔莫及。

几个具体的操作建议
- 从小任务开始建立信任:首次使用 AI 处理某类新任务时,先给它一个规模小、后果可逆的版本。观察它的决策逻辑,注意它在不确定时是否会主动暂停。正如报告所示,Claude 在复杂任务上高频次地主动暂停,这正是一个积极的信号,表明模型具备自我校准的机制。
- 明确说出你的边界:不要假设 AI 能猜透你的所有限制。“只修改
config.yaml 这个文件”、“不要动数据库的任何表”、“遇到函数逻辑不清晰的地方先问我”——这些约束应当明确地写在你的初始提示词或系统指令中。
- 建立回滚机制再放权:在授予 AI 执行权之前,务必先确认你有能力撤销它的操作。无论是 Git 提交、数据库备份还是系统快照,这些都不是可选项,而是前置的安全保障。
- 定期审查 AI 的决策:无需步步紧盯,但要有计划地抽查。AI 的决策模式可能会随着任务经验的积累而发生微妙变化,定期审查能帮助你及时发现它在哪些方面开始偏离预期轨道。
- 出了问题,先复盘再调整:AI 犯错不应成为彻底收权的理由,而应视为一次优化授权边界的机会。需要厘清:是任务描述本身模糊不清?是权限边界设置得过于宽泛?还是这类任务本身就不适合交由 AI 自主处理?
Anthropic 的报告中有句话非常精辟:“信任是逐步建立的,不是一次性授予的。” 那 40% 敢于开启全自动审批的有经验用户,绝非从一开始就如此。他们是在一次次小型、可控的任务中,通过持续观察、验证和调整,才慢慢构筑起这份信任的。
这个过程没有捷径,但对于希望真正提升工作效率的开发者而言,这份投入绝对值得。关于人机协作的更多深度讨论和实践心得,欢迎在技术社区如 云栈社区 中与同行们一起交流探索。
|