云栈社区»论坛 › 开发者广场「Dev Plaza」 › Karpathy亲述：从焦虑落后到颠覆20年编程习惯，我的AI辅助编程工 ...

发回帖发新帖

4062 积分	0 好友	558 主题

发消息

Karpathy亲述：从焦虑落后到颠覆20年编程习惯，我的AI辅助编程工作流

发表于 2026-1-28 01:51:59 | 查看: 67| 回复: 0

今天，Andrej Karpathy 再次在社交平台上分享了一篇长文，内容是关于他密集使用 Claude 进行编程数周后的深刻体会。他坦言，自己过去二十年形成的编程习惯，在短短几周内被彻底改变：从去年11月还主要依赖手动编码和自动补全，到12月已经迅速转变为大约80%的代码交给AI智能体(agent)生成，自己只负责20%的修改和润色。

他认为，以 Claude 和 Codex 为代表的大语言模型，大约在2025年12月左右跨过了一个关键的“连贯性门槛”，使得这种以智能体为主导的编程方式突然变得切实可行，并且让人很难再想回到完全手动编码的状态。

“2026年将是充满活力的一年，因为整个行业都在消化吸收这项新技术。”他这样预测道。

Andrej Karpathy 关于AI编程工作流变化的推文截图

一个月前，这位顶级工程师曾坦言“我落后了”

有趣的是，就在大约一个月前，这位曾提出“vibe coding”概念的AI专家，还在社交平台上表达过截然不同的焦虑。

“作为一名程序员，我从未像现在这样感到如此落后。”

Karpathy表达职业重构焦虑的推文截图

在那条动态里，Karpathy 写道，程序员这个职业正在被“剧烈地重构”，个人所贡献的代码正变得愈发稀疏和零散。

“我有一种强烈的感觉：如果我能把过去一年里涌现的这些工具真正串联、用好，我的能力可能会提升10倍，”他写道，“没能拿到这种增益，感觉上纯粹就是技能问题。”

他认为，现在需要掌握的是一套全新的、可编程的抽象层（叠加在以往那些熟悉的抽象层之上）：这涉及到智能体、子智能体，它们的提示词、上下文、记忆、运行模式、权限、工具、插件、技能、钩子、MCP、LSP、斜杠命令、工作流、IDE集成等等。同时，还必须在脑中建立一个全局心智模型，去理解这些 本质上随机、会出错、难以解释、而且不断变化的实体 的优势与陷阱——而它们如今被突然掺进了原本那套‘老派而扎实’的软件工程体系之中。

这一切更像是“一个强大的外星工具被直接发下来，却没有配套说明书”。“每个人都得自己摸索该怎么握住它、怎么操作它，而与此同时，一场9级地震正在撼动整个职业。”他如此形容道。

这番言论之所以引发广泛共鸣，正是因为出自 Karpathy 之口——他长期被视为走在技术最前沿的那类人：2015年加入OpenAI成为创始成员，之后又早期投身自动驾驶领域，担任特斯拉Autopilot的AI负责人。如果连他都感到“落后”，那确实说明了技术变革的剧烈程度。

在评论区，另一位重量级人物表达了强烈共鸣。Claude Code的核心作者、Anthropic工程师 Boris Cherny 坦言，自己“几乎每周”都会有类似的感受。

Boris Cherny与Karpathy讨论AI编程习惯的推文截图

他提到，有时会下意识地按照老方法去解决问题，做着做着才突然反应过来：“等等，Claude可能可以直接搞定这个。”

他分享了一个最近的例子：在排查 Claude Code 的一个内存泄漏问题时，他一开始走的是传统路径：连接性能分析器(profiler)、运行应用、暂停采样、再手动翻看堆(heap)分配记录。而同时，他的一位同事处理同一个问题，则是直接让 Claude 生成堆转储(heap dump)，再让模型去读取转储文件，找出那些“本不该还被保留着”的对象。结果Claude一次就定位到问题点，并顺手提交了一个修复问题的PR。

“这种事几乎每周都会发生。”他写道。

Cherny 还补充了一个有意思的观察：某种意义上，那些新入职的同事，甚至刚毕业的新人，反而更容易把模型用到位。 因为他们不会被“模型做不到什么”的旧印象所束缚——那些印象大多是早期模型时代形成的“历史记忆”。而对已经形成固定习惯的工程师来说，每隔一两个月，就得花费不小的心理能量去重新校准：模型现在究竟能做到什么——而且这个边界还在持续外扩。

Karpathy 则在回复中用了一个生动的比喻：就像你拿着一把“激光枪”到处指，有时只打出一堆小弹丸，有时甚至会哑火；但偶尔，当你握对了姿势，一束强力激光会突然喷涌而出，直接把你的问题“熔掉”。

工具用顺手后：“这是我20年编程生涯的最大变化”

到了今天，Karpathy 的状态已经明显不同：不再是“我跟不上”，而是“我已经换了一种编程方式”。

他以一种略带夸张但真实的口吻描述了这种转变：过去20年形成的编程肌肉记忆，在短短几周内被打断并重塑。他也给出了一个关键的时间点判断：在他看来，Claude 和 Codex 大约是在2025年12月左右跨过了某种“一致性/连贯性门槛”，让智能体编程从“偶尔惊艳”变成了“可以稳定纳入日常工作流”。

这条推文的评论区一如既往地热闹。

很快有人表示，这种转变并非个例。一位工程负责人在回复中写道，这和他的体验完全一致：最令人惊喜的并非是单纯的提速，而是写代码这件事反而变得更有趣了。那些重复、机械的繁琐工作被拿掉之后，剩下的更多是创造性的、真正值得投入的问题解决过程；而那些积极拥抱人工智能辅助开发的工程师，不只是变得更快，还开始大胆尝试以前根本不会去碰的事情。

他引用 Karpathy 的一句话来总结这种变化：“不要告诉它怎么做，给它成功标准，然后看它自己跑。”

Matthew O‘Riordan分享AI编程乐趣的推文截图

还有不少人关注那组80/20的数字变化。

“未来这个比例只会继续上升，直到有一天我们几乎不再‘写’代码，而只是负责阅读和审查它。”也有人认为未来的瓶颈将不再是打字速度，而是我们审查代码的速度有多快，尤其是识别那些“由智能体幻觉产生却被误合并进主分支”的内容。

这势必会引发关于“理解债务”(comprehension debt)的讨论：因为逐行审查AI生成的代码过于耗时，人们会越来越倾向于“能跑就先过”，长此以往反而对自己代码库的理解越来越少。Karpathy 在评论中表示，他很喜欢“理解债务”这个词，虽然之前没遇到过，但觉得非常贴切；他也承认，这种诱惑确实存在——当LLM一次就把问题搞定、而且看起来运行得还不错时，人真的很容易就想直接跳过深入理解，继续推进。

关于“理解债务”讨论的推文截图

也有人将这种变化比喻为一种“角色对调”：我们花了很多年学会如何编写代码，现在却更像是在担任一个永不疲倦的“实习生”的项目经理——负责分派任务、验收结果、并最终兜底风险。

总而言之，工具在持续变强，工程师的角色正在重新排列组合，而效率的瓶颈也随之迁移：从“写得快”，变成了“看得懂、审得住”。这一轮由大模型驱动的变革，显然还远未到达终点。

Andrej Karpathy 完整长文分享

以下是Karpathy今天发布的完整长文（经通顺处理）：

过去几周我大量用 Claude 写代码，随手记几条零散想法。

编程工作流

随着最近一轮LLM编码能力的明显提升，和很多人一样，我的工作方式在很短时间内发生了变化：11月大概还是80%手写 + 自动补全 / 20% 智能体辅助；到12月就变成80%智能体编码 / 20% 人工修改和收尾润色。也就是说，我现在基本是在用英语“编程”——有点不好意思地用自然语言告诉LLM该写什么代码。自尊心多少会疼一下，但能用这种大粒度的“代码动作”去操控软件，带来的净收益实在太大了，尤其是当你适应它、把它配置好、学会怎么用，并真正想清楚它能做什么、不能做什么之后。

这是我近二十年编程生涯里，对基础工作流影响最大的一次变化，而且它是在短短几周内发生的。 我猜现在已经有两位数百分比的工程师也在经历类似的转变；但在更广泛的人群中，对这件事的认知可能仍只有个位数低位百分比。

IDE / 智能体群 / 出错风险

在我看来，现在不管是“IDE不再需要”的论调，还是“智能体群(agent swarm)”的热炒，都有点过头了。模型当然还会犯错——如果是你真正在乎的代码，我会建议你像鹰一样盯着它们：旁边开一个足够大的IDE窗口，用来随时检查。

而且错误的形态也变了：不再是简单的语法错，而是更隐蔽的概念性错误，有点像一个略显草率、匆忙的初级工程师会犯的那种。最常见的一类是：模型会替你做出一些错误假设，然后不核实就沿着假设一路执行下去。它们也不太会管理自己的困惑：不主动澄清、不揭示不一致性、不提供权衡取舍、该反对时也不反对，而且还有点过度讨好。规划模式(Plan mode)会好一些，但我感觉仍需要一种更轻量的、内联的规划模式。

它们也很容易把代码和API过度复杂化：抽象膨胀、架构臃肿、自己制造出一堆死代码(dead code)却不清理。它们能写出一个低效、臃肿、脆弱的1000行实现，然后就等你提醒一句：“呃……是不是其实可以更简单？”它们就会说“当然可以！”并立刻把它精简到100行。

此外，它们偶尔会作为副作用去修改或删除一些自己不喜欢、或没完全理解的注释和代码——哪怕这些内容和当前任务是正交的。即使我在类似 CLAUDE.md 的指令文件中做了几次简单的约束尝试，这些问题仍会发生。

尽管有这些毛病，它依然带来了巨大的净效益提升，而且很难想象再回到纯手工写代码的时代。简而言之：每个人都在形成自己的新工作流；我现在的配置是：左边开少量几个Claude Code会话（放在Ghostty的窗口/标签页里），右边开IDE负责浏览代码和进行手动微调。

韧性。 观察一个智能体不知疲倦地死磕某件事真的很有意思。它们不会累，不会灰心，就是持续尝试——很多时候如果换成人，早就放弃、改天再战了。看着它为一个问题挣扎很久，30分钟后又突然解决了，那种“感受到AGI”的感觉很强。你会意识到：耐力本身就是工作的核心瓶颈之一，而LLM把这条上限显著抬高了。

加速。 LLM辅助带来的“加速”其实不太好衡量。我当然感觉自己做原本要做的事更快了，但更大的变化是：我做了更多事情，原因主要有两点：1）我可以写很多以前根本不值得花时间去写的东西；2）我可以去碰以前因为知识/技能门槛而不敢碰的代码领域。所以这当然是提速，但可能更像是一种“能力范围的扩张”。

杠杆。 LLM特别擅长反复循环执行，直到达到明确目标——大部分“感受到AGI”的魔法就在这里。与其告诉它具体每一步怎么做，不如给它成功的最终标准，然后看它自己尝试。让它先写测试，再让测试通过；把它放进一个带有浏览器MCP（模型上下文协议）的闭环里；先写一个很可能正确的朴素算法，再让它在保持正确性的前提下进行优化。把你的指令从“命令式”转变为“声明式”，会让智能体循环更久，从而获得更大的杠杆效应。

乐趣。 我原本没预料到：用智能体编程反而更有趣了，因为大量“填空式的苦力活”被拿掉，剩下的更多是创造性部分。我也更少被卡住（被卡住真的不快乐），同时更有勇气——几乎总能找到一种方式与它并肩作战，推动事情向前。我也见过相反的观点：LLM编程可能会把工程师分成两类——主要喜欢“写代码”过程的人 vs 主要喜欢“造东西”结果的人。

退化。 我已经注意到，自己手写代码的能力正在慢慢退化。“生成代码”和“判别代码（阅读/审查）”在大脑里是两种不同的能力。因为编程里有大量偏语法的细碎细节，即便你亲自动笔写起来很费劲，但审查别人（或AI）写的代码通常仍能做得很好。

“垃圾内容末日”(Slopacolypse)。 我已经在为2026年做心理建设：那很可能是GitHub、Substack、arXiv、X/Instagram，乃至整个数字媒体的“垃圾内容大爆发”之年。我们还会看到更多AI炒作式的生产力表演（这居然还能更夸张吗？），与此同时，也会出现真实而确凿的改进。

一些问题。 我脑子里萦绕着一些问题：“10倍效率工程师”会变成怎样？平均工程师与顶尖工程师的生产力差距，可能会被这项技术拉得更大。有了LLM之后，通才会越来越超过专才吗？因为LLM似乎更擅长“填空”（微观任务）而不是“制定大战略”（宏观规划）。未来的LLM编程体验会像什么？像玩《星际争霸》？《幸福工厂》(Factorio)？还是演奏音乐？社会中有多少领域的发展，本质上被数字化知识工作的效率瓶颈给卡住了？

简而言之：我们现在处在哪？

到2025年12月左右，LLM智能体的能力（尤其是Claude和Codex）似乎跨过了一个关键的连贯性阈值，并在软件工程及相关领域引发了一次“相变”。现在，“智能”这部分突然显得明显领先于其他所有配套——工具与知识的集成、组织层面的新工作流与流程、以及更广泛的社会化扩散机制。

2026年将是高能量的一年：整个行业都在消化、吸收这股新能力。这不仅是工具的变化，更是思维模式和工作哲学的革新，值得每一位技术从业者，在开发者社区里深入思考和持续交流。

上一篇：深入浅出GNU链接器ld：从目标文件到可执行文件的链接过程解析
下一篇：Python地理绘图进阶：geo_plotkit模块升级实现色条自动生成与多子图配色

人工智能编程, LLM, 软件工程, 编程工作流, Claude

Karpathy亲述：从焦虑落后到颠覆20年编程习惯，我的AI辅助编程工作流

一个月前，这位顶级工程师曾坦言“我落后了”

工具用顺手后：“这是我20年编程生涯的最大变化”

Andrej Karpathy 完整长文分享

相关帖子