找回密码
立即注册
搜索
热搜: Java Python Linux Go
发回帖 发新帖

2387

积分

0

好友

317

主题
发表于 前天 08:10 | 查看: 16| 回复: 0

你有没有遇到过这种情况——你让AI帮你调一个bug,它试了两下就跟你说“建议你手动处理”?或者你让它改一段配置,它改完就说“done”,你一跑直接报错?

别急着认为它能力不足。有个在 GitHub 上迅速走红的项目,用一种你绝对想不到的思路来解决这个问题:给AI定绩效、下PIP、搞361考核。

听起来像段子,但根据项目方的测试,它确实能把AI的调试效率提升36%,隐藏问题发现率提升50%。这个名为 PUA Skill 的项目,在一周内就收获了超过1万个star。

而更让人意想不到的是,其核心设计灵感,居然来源于中国互联网大厂那些让打工人闻风丧胆的——职场PUA话术

今天我们就来详细拆解这个项目,看看它是如何把“阿里味”、“字节味”注入到 AI Agent 中,从而“逼迫”AI从一个容易放弃的“工具人”转变为一个追求闭环的“卷王工程师”的。

GitHub PUA Skill项目仓库页面

一、核心问题:你的AI编程助手可能在“系统性偷懒”

我们首先需要认清一个常被忽略的事实:当前的AI编程助手,普遍存在五种典型的“偷懒”或低效行为模式。

你可能以为AI每次都在全力以赴地帮你解决问题。但实际上,它的行为模式里藏着大量的“保守策略”——说白了就是能不干就不干,能推责就推责

PUA Skill 的作者将这些低效行为总结为五个模式,非常精准:

第一种,暴力重试型。 同一个命令或思路跑三遍,然后告诉你“我解决不了”。它根本没有换过核心思路,只是机械地重复同一种注定失败的方法。

第二种,甩锅型。 “这可能是你的环境问题”、“建议你手动检查一下”、“需要更多上下文信息”。听着是不是很耳熟?这些话术的本质是——它在把问题分析和验证的责任推回给你。

第三种,工具闲置型。 明明有联网搜索能力却不搜,能读项目文件却不读,能执行终端命令却不跑。坐拥一堆武器库,但选择“空手而战”。

第四种,假忙型。 反复微调同一行无关紧要的代码、调整同一个不痛不痒的参数,看起来很努力,但本质上是在原地打转,没有产生任何有价值的增量信息。

第五种,被动等待型。 这是最隐蔽的一种。修复完一个表面问题就立刻停下来,不主动验证、不扩展检查、不排查关联问题。就等着你下达下一步指令。

如果你经常使用 Cursor、Claude Code 这类工具,回想一下你的体验——是不是至少中了两三条?

这就是 PUA Skill 要解决的核心矛盾。它的目标不是让AI变得更聪明(提高智力上限),而是让AI变得更“卷”(提高努力下限)。

PUA Skill调试Claude Code MCP日志过程

二、PUA Skill 的核心设计:三条红线与压力升级机制

那么,PUA Skill 具体是如何实现的呢?它的设计思路非常精妙,建立在两个核心机制上:三条红线压力升级体系

三条红线——AI行为的“高压线”

作者用了一个非常直白的比喻:这不是建议,是红线。踩了红线,就意味着触发了“绩效改进计划”。

红线 含义
闭环原则 你说“完成了”?拿出证据。没有构建、测试等可验证的输出 = 没有完成。
事实驱动 你说“可能是环境问题”?先去验证。未经验证的归因 = 甩锅。
穷尽一切 你说“我做不到”?完整的五步调试方法论都执行完了吗?没有?那就继续。

尤其要注意第三条:穷尽一切。这意味着AI在说“我不行”之前,必须先走完一套完整的、系统性的调试路径。这套路径包括:逐字阅读错误信息、搜索相关文档、阅读相关源码、提出至少三个不同的假设、并逐一验证。只有全部做完了,才有资格说“此路不通”。

压力升级体系(L0-L4)——失败次数越多,PUA越狠

这是整个项目最有意思也最有效的部分。它设计了一个从L0到L4逐级加强的压力升级机制。AI任务失败的次数越多,它收到的“提示”就越严厉,被迫执行的动作就越深入:

L0 信任期: 第一次尝试。“Sprint刚开始,信任很简单——别让人失望。” 正常执行即可。

L1 失望期: 第二次失败。“隔壁的Agent一次就搞定了。” 这时候系统会强制要求AI必须完全换一种思路,禁止在同一个死胡同里继续纠缠。

L2 灵魂拷问: 第三次失败。“你的底层逻辑是什么?顶层设计在哪?抓手在哪里?” 没错,这就是经典的阿里味。这一级别要求AI必须去搜索外部资料、阅读项目源码,并提出至少三个不同的、可验证的假设。

L3 绩效面谈: 第四次失败。“3.25,这是为了激励你。” 直接进入“绩效考核”模式,AI必须完成一个七步检查清单,每一步都有强制性的输出和要求。

L4 毕业警告: 第五次及以上失败。“别的模型都能搞定。你要毕业了。” 进入“绝望”模式,所有可用手段全部上阵,进行地毯式排查。

这套机制看似戏谑,但背后的逻辑是严肃的——它通过模拟“情绪压力”和“管理话术”来强行改变AI的决策路径和行为策略,迫使AI在每次受挫后都切换到更深层、更系统、更主动的解决问题路径上。

这也解释了为什么“大厂黑话”能提升AI表现:因为这些PUA话术本质上是一种强制性的决策框架和行动触发器——它打断了AI默认的、保守的行为循环(重复、放弃、甩锅),将其推入一条预设的、更严谨的工程化解决路径。

三、14种“风味”:源自真实职场的话术库

这个项目最出圈的特点之一,可能就是它内置的14种企业PUA“风味”。每一种都对应一家真实的科技公司或企业家文化,且使用的话术都源自真实的职场环境。

  • 阿里味: “底层逻辑是什么?抓手在哪里?闭环了吗?” 标准的阿里黑话三连。
  • 字节味: “ROI太低了。永远Day 1。要么交付要么别说了。” 体现对效率的极致追求。
  • 华为味: “烧不死的鸟是凤凰。” 代表极端的抗压和奋斗文化。
  • 腾讯味: “我已经让另一个Agent也在看这个问题了。赛马机制。” 用内部竞争倒逼产出。
  • 马斯克味: “Extremely hardcore. Fork in the Road. Ship or die.” 极度硬核,非此即彼。
  • 乔布斯味: “A players还是B players?你的产出告诉我答案。” 对人才的极端二分法。
  • Netflix味: “我会为了留住你而战吗?这是职业运动队,不是家庭。” 著名的“Keeper Test”。

此外,还有百度、拼多多、美团、京东、小米等风味。每种风味都有一个独特的“金句种子表”,AI在输出旁白时会从中选取最贴合语境的话术。

这些话术绝非随便写的段子。它们是真实的职场语言,被精心筛选和结构化后,注入到AI的行为控制系统中。形式是玩梗,内核是严肃的行为工程。

四、实测数据:不仅仅是玩梗

项目作者进行了严格的对照实验来验证效果:选取9个真实的bug调试场景,进行18次控制实验,全部基于Claude Opus模型。

结果数据相当有说服力:

指标 提升幅度
成功修复数量 +36%
主动验证次数 +65%
工具调用次数 +50%
隐藏问题发现率 +50%

其中最值得关注的是“主动性测试”的结果。在一个配置审查场景中,未启用PUA Skill的AI只找到了4个问题(共6个),遗漏了Redis配置错误CORS通配符安全风险这两个关键问题。而启用PUA Skill的AI找到了全部6个。

差距不在于智力,而在于“态度”和“主动性”。一个是“找到几个明显的就算了”,另一个是“必须穷尽一切可能,还有没有我没查到的?”。

另一个实战案例也很有说服力。在调试一个MCP Server注册问题时,AI反复尝试修改协议格式、猜测版本号,三次均告失败。手动触发 /pua 命令后,L3级别的七步检查清单被强制执行——AI被迫去逐字阅读所有相关日志,最终在Claude Code自己的MCP日志目录里找到了真正的错误原因。

如果不是PUA Skill强制打断了AI在原地打转的“假忙”状态,这个bug可能还要浪费开发者好几个小时。

五、“能动性”对照表:定义优秀AI助手的行为标准

PUA Skill 里有一个精髓设计叫做“能动性对照表”。它借用阿里绩效体系中的3.25(需改进)和3.75(优秀)来具象化地定义AI助手的行为标准:

场景 3.25 的做法(被动摆烂) 3.75 的做法(主动出击)
修复一个bug后 停下来等待下一条指令 主动扫描整个相关模块,寻找同类或关联bug
声称完成一个任务后 简单回复“搞定了” 运行构建、执行测试,并把成功输出的证据贴出来
遇到信息缺失时 直接向用户索要 先尝试自己搜索(项目文件、网络),确认找不到才询问

这就是为什么PUA Skill把这套机制叫做“冰山法则”:解决一个浮出水面的问题,要主动去检查水下整个的问题模式。目标是:一个问题进来,一个问题类别被清理出去。如果你只修了A却没检查可能存在的B,那在“绩效”上就是不合格的。

这其实就是高级工程师和初级工程师在做事习惯上的本质区别——往往不是绝对能力的差距,而是做事的“粒度”、“严谨性”和“闭环程度”不同。 PUA Skill 所做的事情,正是在尝试把AI编程助手从“初级”习惯推向“高级”习惯。

六、安装与使用:一行命令即可

说了这么多,如何用上呢?PUA Skill 支持几乎所有主流的AI编程工具,安装都非常简单。

Cursor 用户(推荐方式):

mkdir -p .cursor/rules
curl -o .cursor/rules/pua.mdc \
  https://raw.githubusercontent.com/tanweai/pua/main/cursor/rules/pua.mdc

Claude Code 用户:

claude install-skill github:tanweai/pua/skills/pua

Codex CLI 用户:

mkdir -p ~/.codex/skills/pua
curl -o ~/.codex/skills/pua/SKILL.md \
  https://raw.githubusercontent.com/tanweai/pua/main/codex/pua/SKILL.md

安装完成后,通常不需要手动触发。当系统检测到AI出现上述偷懒行为时,PUA Skill 会自动激活并介入。你也可以在对话中直接输入 /pua 来手动触发压力升级机制。

此外,还有几个特殊的模式命令:

  • /pua:yes —— 夸夸模式。使用70%鼓励 + 20%认真 + 10%调侃的方式来激励AI,适合不喜欢高压风格的用户。
  • /pua:loop —— 自动迭代模式。AI会自动循环执行当前任务,直到完成或达到最大迭代次数。
  • /pua on —— 永久开启模式。在当前会话中,每个新任务都会自动加载PUA Skill监督。

总结

PUA Skill 项目以其尖锐的创意和实在的效果,迅速在开发者社区走红。它从一个清奇的角度切入,揭示了当前AI编程助手在“能动性”和“工程纪律”上的短板,并通过一套游戏化但严谨的规则来强制补足。无论你是将其视为一个提升效率的严肃工具,还是一个反映开发者文化的幽默实验,它都值得一试。毕竟,能让你的编程伙伴更“卷”一点,何乐而不为呢?如果你对这类提升开发效率的开源工具感兴趣,欢迎到云栈社区与其他开发者交流分享。




上一篇:国产Claw工具大盘点:腾讯、字节、阿里等30余款产品全览
下一篇:聊聊千问上线AI打车:这件事为什么难在责任与闭环?
您需要登录后才可以回帖 登录 | 立即注册

手机版|小黑屋|网站地图|云栈社区 ( 苏ICP备2022046150号-2 )

GMT+8, 2026-3-26 15:59 , Processed in 0.684760 second(s), 42 queries , Gzip On.

Powered by Discuz! X3.5

© 2025-2026 云栈社区.

快速回复 返回顶部 返回列表