找回密码
立即注册
搜索
热搜: Java Python Linux Go
发回帖 发新帖

2769

积分

0

好友

385

主题
发表于 18 小时前 | 查看: 0| 回复: 0

今天,Andrej Karpathy 再次在社交平台上分享了一篇长文,内容是关于他密集使用 Claude 进行编程数周后的深刻体会。他坦言,自己过去二十年形成的编程习惯,在短短几周内被彻底改变:从去年11月还主要依赖手动编码和自动补全,到12月已经迅速转变为大约80%的代码交给AI智能体(agent)生成,自己只负责20%的修改和润色。

他认为,以 Claude 和 Codex 为代表的大语言模型,大约在2025年12月左右跨过了一个关键的“连贯性门槛”,使得这种以智能体为主导的编程方式突然变得切实可行,并且让人很难再想回到完全手动编码的状态。

“2026年将是充满活力的一年,因为整个行业都在消化吸收这项新技术。”他这样预测道。

Andrej Karpathy 关于AI编程工作流变化的推文截图

一个月前,这位顶级工程师曾坦言“我落后了”

有趣的是,就在大约一个月前,这位曾提出“vibe coding”概念的AI专家,还在社交平台上表达过截然不同的焦虑。

“作为一名程序员,我从未像现在这样感到如此落后。”

Karpathy表达职业重构焦虑的推文截图

在那条动态里,Karpathy 写道,程序员这个职业正在被“剧烈地重构”,个人所贡献的代码正变得愈发稀疏和零散。

“我有一种强烈的感觉:如果我能把过去一年里涌现的这些工具真正串联、用好,我的能力可能会提升10倍,”他写道,“没能拿到这种增益,感觉上纯粹就是技能问题。”

他认为,现在需要掌握的是一套全新的、可编程的抽象层(叠加在以往那些熟悉的抽象层之上):这涉及到智能体、子智能体,它们的提示词、上下文、记忆、运行模式、权限、工具、插件、技能、钩子、MCP、LSP、斜杠命令、工作流、IDE集成等等。同时,还必须在脑中建立一个全局心智模型,去理解这些 本质上随机、会出错、难以解释、而且不断变化的实体 的优势与陷阱——而它们如今被突然掺进了原本那套‘老派而扎实’的软件工程体系之中。

这一切更像是“一个强大的外星工具被直接发下来,却没有配套说明书”。“每个人都得自己摸索该怎么握住它、怎么操作它,而与此同时,一场9级地震正在撼动整个职业。”他如此形容道。

这番言论之所以引发广泛共鸣,正是因为出自 Karpathy 之口——他长期被视为走在技术最前沿的那类人:2015年加入OpenAI成为创始成员,之后又早期投身自动驾驶领域,担任特斯拉Autopilot的AI负责人。如果连他都感到“落后”,那确实说明了技术变革的剧烈程度。

在评论区,另一位重量级人物表达了强烈共鸣。Claude Code的核心作者、Anthropic工程师 Boris Cherny 坦言,自己“几乎每周”都会有类似的感受。

Boris Cherny与Karpathy讨论AI编程习惯的推文截图

他提到,有时会下意识地按照老方法去解决问题,做着做着才突然反应过来:“等等,Claude可能可以直接搞定这个。”

他分享了一个最近的例子:在排查 Claude Code 的一个内存泄漏问题时,他一开始走的是传统路径:连接性能分析器(profiler)、运行应用、暂停采样、再手动翻看堆(heap)分配记录。而同时,他的一位同事处理同一个问题,则是直接让 Claude 生成堆转储(heap dump),再让模型去读取转储文件,找出那些“本不该还被保留着”的对象。结果Claude一次就定位到问题点,并顺手提交了一个修复问题的PR。

“这种事几乎每周都会发生。”他写道。

Cherny 还补充了一个有意思的观察:某种意义上,那些新入职的同事,甚至刚毕业的新人,反而更容易把模型用到位。 因为他们不会被“模型做不到什么”的旧印象所束缚——那些印象大多是早期模型时代形成的“历史记忆”。而对已经形成固定习惯的工程师来说,每隔一两个月,就得花费不小的心理能量去重新校准:模型现在究竟能做到什么——而且这个边界还在持续外扩。

Karpathy 则在回复中用了一个生动的比喻:就像你拿着一把“激光枪”到处指,有时只打出一堆小弹丸,有时甚至会哑火;但偶尔,当你握对了姿势,一束强力激光会突然喷涌而出,直接把你的问题“熔掉”。

工具用顺手后:“这是我20年编程生涯的最大变化”

到了今天,Karpathy 的状态已经明显不同:不再是“我跟不上”,而是“我已经换了一种编程方式”。

他以一种略带夸张但真实的口吻描述了这种转变:过去20年形成的编程肌肉记忆,在短短几周内被打断并重塑。他也给出了一个关键的时间点判断:在他看来,Claude 和 Codex 大约是在2025年12月左右跨过了某种“一致性/连贯性门槛”,让智能体编程从“偶尔惊艳”变成了“可以稳定纳入日常工作流”。

这条推文的评论区一如既往地热闹。

很快有人表示,这种转变并非个例。一位工程负责人在回复中写道,这和他的体验完全一致:最令人惊喜的并非是单纯的提速,而是写代码这件事反而变得更有趣了。那些重复、机械的繁琐工作被拿掉之后,剩下的更多是创造性的、真正值得投入的问题解决过程;而那些积极拥抱人工智能辅助开发的工程师,不只是变得更快,还开始大胆尝试以前根本不会去碰的事情。

他引用 Karpathy 的一句话来总结这种变化:“不要告诉它怎么做,给它成功标准,然后看它自己跑。”

Matthew O‘Riordan分享AI编程乐趣的推文截图

还有不少人关注那组80/20的数字变化。

“未来这个比例只会继续上升,直到有一天我们几乎不再‘写’代码,而只是负责阅读和审查它。”也有人认为未来的瓶颈将不再是打字速度,而是我们审查代码的速度有多快,尤其是识别那些“由智能体幻觉产生却被误合并进主分支”的内容。

这势必会引发关于“理解债务”(comprehension debt)的讨论:因为逐行审查AI生成的代码过于耗时,人们会越来越倾向于“能跑就先过”,长此以往反而对自己代码库的理解越来越少。Karpathy 在评论中表示,他很喜欢“理解债务”这个词,虽然之前没遇到过,但觉得非常贴切;他也承认,这种诱惑确实存在——当LLM一次就把问题搞定、而且看起来运行得还不错时,人真的很容易就想直接跳过深入理解,继续推进。

关于“理解债务”讨论的推文截图

也有人将这种变化比喻为一种“角色对调”:我们花了很多年学会如何编写代码,现在却更像是在担任一个永不疲倦的“实习生”的项目经理——负责分派任务、验收结果、并最终兜底风险。

总而言之,工具在持续变强,工程师的角色正在重新排列组合,而效率的瓶颈也随之迁移:从“写得快”,变成了“看得懂、审得住”。这一轮由大模型驱动的变革,显然还远未到达终点。

Andrej Karpathy 完整长文分享

以下是Karpathy今天发布的完整长文(经通顺处理):

过去几周我大量用 Claude 写代码,随手记几条零散想法。

编程工作流

随着最近一轮LLM编码能力的明显提升,和很多人一样,我的工作方式在很短时间内发生了变化:11月大概还是80%手写 + 自动补全 / 20% 智能体辅助;到12月就变成80%智能体编码 / 20% 人工修改和收尾润色。也就是说,我现在基本是在用英语“编程”——有点不好意思地用自然语言告诉LLM该写什么代码。自尊心多少会疼一下,但能用这种大粒度的“代码动作”去操控软件,带来的净收益实在太大了,尤其是当你适应它、把它配置好、学会怎么用,并真正想清楚它能做什么、不能做什么之后。

这是我近二十年编程生涯里,对基础工作流影响最大的一次变化,而且它是在短短几周内发生的。 我猜现在已经有两位数百分比的工程师也在经历类似的转变;但在更广泛的人群中,对这件事的认知可能仍只有个位数低位百分比。

IDE / 智能体群 / 出错风险

在我看来,现在不管是“IDE不再需要”的论调,还是“智能体群(agent swarm)”的热炒,都有点过头了。模型当然还会犯错——如果是你真正在乎的代码,我会建议你像鹰一样盯着它们:旁边开一个足够大的IDE窗口,用来随时检查。

而且错误的形态也变了:不再是简单的语法错,而是更隐蔽的概念性错误,有点像一个略显草率、匆忙的初级工程师会犯的那种。最常见的一类是:模型会替你做出一些错误假设,然后不核实就沿着假设一路执行下去。它们也不太会管理自己的困惑:不主动澄清、不揭示不一致性、不提供权衡取舍、该反对时也不反对,而且还有点过度讨好。规划模式(Plan mode)会好一些,但我感觉仍需要一种更轻量的、内联的规划模式。

它们也很容易把代码和API过度复杂化:抽象膨胀、架构臃肿、自己制造出一堆死代码(dead code)却不清理。它们能写出一个低效、臃肿、脆弱的1000行实现,然后就等你提醒一句:“呃……是不是其实可以更简单?”它们就会说“当然可以!”并立刻把它精简到100行。

此外,它们偶尔会作为副作用去修改或删除一些自己不喜欢、或没完全理解的注释和代码——哪怕这些内容和当前任务是正交的。即使我在类似 CLAUDE.md 的指令文件中做了几次简单的约束尝试,这些问题仍会发生。

尽管有这些毛病,它依然带来了巨大的净效益提升,而且很难想象再回到纯手工写代码的时代。简而言之:每个人都在形成自己的新工作流;我现在的配置是:左边开少量几个Claude Code会话(放在Ghostty的窗口/标签页里),右边开IDE负责浏览代码和进行手动微调。

韧性。 观察一个智能体不知疲倦地死磕某件事真的很有意思。它们不会累,不会灰心,就是持续尝试——很多时候如果换成人,早就放弃、改天再战了。看着它为一个问题挣扎很久,30分钟后又突然解决了,那种“感受到AGI”的感觉很强。你会意识到:耐力本身就是工作的核心瓶颈之一,而LLM把这条上限显著抬高了。

加速。 LLM辅助带来的“加速”其实不太好衡量。我当然感觉自己做原本要做的事更快了,但更大的变化是:我做了更多事情,原因主要有两点:1)我可以写很多以前根本不值得花时间去写的东西;2)我可以去碰以前因为知识/技能门槛而不敢碰的代码领域。所以这当然是提速,但可能更像是一种“能力范围的扩张”。

杠杆。 LLM特别擅长反复循环执行,直到达到明确目标——大部分“感受到AGI”的魔法就在这里。与其告诉它具体每一步怎么做,不如给它成功的最终标准,然后看它自己尝试。让它先写测试,再让测试通过;把它放进一个带有浏览器MCP(模型上下文协议)的闭环里;先写一个很可能正确的朴素算法,再让它在保持正确性的前提下进行优化。把你的指令从“命令式”转变为“声明式”,会让智能体循环更久,从而获得更大的杠杆效应。

乐趣。 我原本没预料到:用智能体编程反而更有趣了,因为大量“填空式的苦力活”被拿掉,剩下的更多是创造性部分。我也更少被卡住(被卡住真的不快乐),同时更有勇气——几乎总能找到一种方式与它并肩作战,推动事情向前。我也见过相反的观点:LLM编程可能会把工程师分成两类——主要喜欢“写代码”过程的人 vs 主要喜欢“造东西”结果的人。

退化。 我已经注意到,自己手写代码的能力正在慢慢退化。“生成代码”和“判别代码(阅读/审查)”在大脑里是两种不同的能力。因为编程里有大量偏语法的细碎细节,即便你亲自动笔写起来很费劲,但审查别人(或AI)写的代码通常仍能做得很好。

“垃圾内容末日”(Slopacolypse)。 我已经在为2026年做心理建设:那很可能是GitHub、Substack、arXiv、X/Instagram,乃至整个数字媒体的“垃圾内容大爆发”之年。我们还会看到更多AI炒作式的生产力表演(这居然还能更夸张吗?),与此同时,也会出现真实而确凿的改进。

一些问题。 我脑子里萦绕着一些问题:“10倍效率工程师”会变成怎样?平均工程师与顶尖工程师的生产力差距,可能会被这项技术拉得更大。有了LLM之后,通才会越来越超过专才吗?因为LLM似乎更擅长“填空”(微观任务)而不是“制定大战略”(宏观规划)。未来的LLM编程体验会像什么?像玩《星际争霸》?《幸福工厂》(Factorio)?还是演奏音乐?社会中有多少领域的发展,本质上被数字化知识工作的效率瓶颈给卡住了?

简而言之:我们现在处在哪?

到2025年12月左右,LLM智能体的能力(尤其是Claude和Codex)似乎跨过了一个关键的连贯性阈值,并在软件工程及相关领域引发了一次“相变”。现在,“智能”这部分突然显得明显领先于其他所有配套——工具与知识的集成、组织层面的新工作流与流程、以及更广泛的社会化扩散机制。

2026年将是高能量的一年:整个行业都在消化、吸收这股新能力。这不仅是工具的变化,更是思维模式和工作哲学的革新,值得每一位技术从业者,在开发者社区里深入思考和持续交流。




上一篇:深入浅出GNU链接器ld:从目标文件到可执行文件的链接过程解析
下一篇:Python地理绘图进阶:geo_plotkit模块升级实现色条自动生成与多子图配色
您需要登录后才可以回帖 登录 | 立即注册

手机版|小黑屋|网站地图|云栈社区 ( 苏ICP备2022046150号-2 )

GMT+8, 2026-1-28 20:16 , Processed in 0.328676 second(s), 42 queries , Gzip On.

Powered by Discuz! X3.5

© 2025-2026 云栈社区.

快速回复 返回顶部 返回列表