
恭喜学员拿下大模型独角兽“月之暗面”的offer,总包60w+。从最初面试受挫,到坚持每场录音复盘、补齐短板,再到认真完成每一项实战作业、手动吃透项目,上岸靠的从来不是运气,而是正确的方法加上足够的强度,逼迫自己在实战中把能力一步步练出来。
对于 LLM 发展的一些思考
还是想努力把过年期间的一些思考总结出来。说起来25年春节时还想着接下来一年要多写点,结果反向突破,差点变成年更账号了。
站在当前这个节点,我感觉LLM的应用方向越来越清晰。它最大的价值在于成为生产力变革的核心工具。“三年淘汰50%白领”的说法或许并非危言耸听,甚至可能是个保守估计(至于生活场景,让AI帮忙点奶茶之类的吸引力似乎有限)。
这个判断主要基于过去两三个月我自己、团队同事以及业界牛人使用AI的体验。其实直到25年七八月份,AI对我的生产力提升大概在20%-30%,但最近两三个月,确实有种“奇点”临近的感觉。
因此,我现在反而不那么关注模型层面具体的性能进展了。各家在春节期间是否发布新模型,在我看来都没那么重要。现有模型的智能程度,已经足够支撑一场生产力爆发的潜力。如果要说关注,我更关注推理成本,而不是各种跑分榜单。
更值得我关注的技术进展,其实集中在下面这三个方向:
第一是 Agent 持续进化的能力。
许多技术都在为这个目标努力,无论是 Memory,还是 continue learning 或 test-time training,本质上都是为了让 Agent 能在使用中不断学习和适应。现实生产环境中的任务往往复杂且独特,模型很难在出厂那一刻就完全准备好。
第二是 Agent 的 test-time scaling 能力。
也就是如何将更多计算力有效转化为生产力。实现 Agent 的很多技术,比如最常见的上下文工程(context engineering),说到底也是在为 test-time scaling 服务。这个领域的潜能远未被充分挖掘,虽然现在越来越多产品开始采用并行思考(parallel thinking),但这仍是一种比较原始和粗暴的方式,理应存在巨大的提升空间。
第三是推理成本。
大概从去年6月开始,就有朋友问我未来 token 消耗量的高增速能否持续。我一直的观点是:当 Agent 成熟后,其消耗 token 的速度会非常疯狂。25年大家对推理成本可能还不算特别敏感,但进入26年,这种敏感度很可能会大幅提升。
具体来看,目前行业的主流思路还是在“不影响模型性能的前提下降低成本”。例如,量化的前提通常是对基准数据集的跑分没有显著影响。但随着降本需求日益强烈,产品中可能会尝试更激进的方式,比如采用更小的模型,然后试图通过 test-time scaling 的技术,将模型因此损失的能力补回来。
test-time scaling 与降低推理成本,表面看是方向相反的两件事,实则相辅相成,互相促进。对更高阶能力的追求,会倒逼出更高效的资源利用方式;而成本的降低,则为大规模、深度的 Agent 应用铺平了道路。
以上是关于 LLM 本身如何发展的一些看法。但最近思考更多的,其实是 LLM 将如何重塑程序员的工作。
LLM 如何影响程序员的工作
一个比较确定的前提是,LLM 与 Agent 对编程效率的提升是指数级的。最近我还发现,不仅是写代码这个环节,环境部署、性能分析、Bug 修复等全流程都能获得巨大的效率提升。这迫使我们重新思考很多固有观念。
首先是工程思路的迭代。
很多过去“不可能”的事情正在变得可能。记得24年我在太初时,曾和团队同学聊到:也许我们现在做的各种降低 SDAA(太初的类CUDA中间层)开发难度的工作都不重要,未来直接把 CUDA 代码丢给 LLM,它就能自动转成 SDAA。当时大家觉得这想法有点天方夜谭,但现在看来已经非常可行了。前两天和做硬件设计的朋友聊天,现在 LLM 写算子这么快,我们就在想:也许未来硬件团队完成一版设计后,AI 能快速写出一版适配新硬件的算子集,直接端到端跑模型,然后丢给模拟器去找瓶颈。
第二是软件架构的重构。
当代码主要由 AI 来编写时,许多软件工程的理念就需要重新审视。比如“测试驱动开发”,过去很多团队只是说说而已。但当 Agent 成为主要编码者时,测试和各种自动化工具就变得极其重要,未来测试代码和工具代码的占比会远比现在高。又比如,我们需要在不封装和过度封装之间找到新的平衡点。人类和 Agent 所期望的平衡点是不同的——Agent 可能没那么害怕代码冗余和膨胀,却可能被过度封装带来的语义模糊所困扰。
第三是团队分工的调整。
这一点比较好理解:未来的每个人都将像是一个小型团队。如果只具备某个单一方面的能力,比如仅仅擅长代码实现,那么他的生产力将会非常受限。
最后不得不感慨,程序员无疑将成为最先被 AI 浪潮冲击的行业。这当然是巨大的挑战,但换个角度看,程序员也最有可能成为第一批充分掌握 AI 工具、驾驭这股力量的人。对于非技术行业的朋友,如果现在感受还不强烈,我有两个建议供参考:
- 第一,尽早拥抱像 openclaw 这类可高度个人定制的 Agent 工具。
- 第二,掌握 vibe coding 的能力。这其实不难,甚至不用系统学习编程,目标是能自己开发一些解决实际痛点的小工具。
祝大家都能在变革中找到自己的位置,驾驭 AI,加速成长。如果你对LLM的技术实践和职业发展有更多兴趣,欢迎来 云栈社区 与更多开发者交流探讨。
作者:霸王手枪腿,已获作者授权发布
来源:https://zhuanlan.zhihu.com/p/2008171458891891194