云栈社区»论坛 › 开发者广场「Dev Plaza」 › 从“苦涩的教训”谈起：为何你的AI技巧，终将沦为默认配置？ ...

发回帖发新帖

5142 积分	0 好友	727 主题

发消息

从“苦涩的教训”谈起：为何你的AI技巧，终将沦为默认配置？

发表于 2026-2-25 06:22:07 | 查看: 157| 回复: 0

围棋对局画面：AlphaGo vs. 李世石第78手

（图中为 AlphaGo 对阵李世石第四局，李世石白棋第78手“挖”。策略网络评估人类下出此手的概率仅为 0.007%。此手之后，AI胜率估算崩溃，昏招频出。人类凭此“神之一手”，拿下了对抗AlphaGo的唯一一场胜利。）

AlphaGo最初的训练数据，来源于人类历史的棋谱。在人类的经验边界之外，那个概率不到万分之一的盲区，机器直接放弃了搜索。后来，DeepMind训练AlphaGo Zero时，彻底清空了人类棋谱，让AI从零开始纯自我对弈。结果它碾压了所有基于人类知识的前代版本。当人类知识被从系统中抹除，机器反而迎来了真正的飞升。

2019年，强化学习之父 Richard Sutton 发表了一篇短文《The Bitter Lesson》（苦涩的教训）。其中提到，近70年的人工智能研究反复证明了一件事：利用简单方法，叠加海量算力的“暴力美学”，最终会碾压一切人类精心设计的复杂方法。 原因很简单：人类的知识，本质上是对AI探索能力的限制。将人类认知编入系统，等于将AI锁定在人类已知的解空间内，主动放弃了在更广阔空间内找到更优解的可能性。

一、神奈川冲浪里

我们可以定义一个简单的公式：

最终表现 = 基模能力 × (1 + ε_human)

这里的 ε_human，就是人类叠加在基础模型之上的各种小技巧所提供的边际增益。无论是精心设计的提示词（Prompt）、复杂的智能体（Agent）工作流，还是上下文管理、自我进化的框架，都属于这个范畴。这是人类在算力怪兽面前，试图从牙缝里抠出的一点额外价值。“会用AI的人替代不会用AI的人”，这句话流行的底层逻辑就在于此。

一个现实的例子：2014年，开发者季逸超开始从零训练专用模型来构建知识图谱。他花了近五年时间，写爬虫、构建索引引擎、搭建向量数据库，最终炼出一个0.3B参数的专用模型。然而，当他拿到GPT-3的早期测试资格后，仅仅写了几段Prompt，其效果就与自己四年的心血成果打成了平手。数年的人类知识垂直整合工程，被一个通用大模型一夜之间抹平了差距。

更经典的案例是“Let‘s think step by step”。在早期驯化大语言模型时，人们发现，在提问末尾加上这句神奇的咒语，就能显著提升模型在复杂推理任务上的表现。两年后，OpenAI的o1模型直接将这种“分步思考”的能力内化为了基础功能。有趣的是，这种内化并非靠人类编写复杂规则，而是通过纯粹的强化学习实现的。

DeepSeek R1的论文中透露了关键信息：研究团队不给模型提供任何人类编写的思维链（CoT）示例数据，只根据最终答案的正确与否来提供奖励信号。为了最大化这个数学上的奖励，模型在数千万次的迭代中，自己“顿悟”了反思、纠错和长链条推理。它甚至学会了用拟人化的语气自我怀疑：“等等，这好像不对，让我重新算一遍。” 人类视之为高级认知能力的体现，但在机器眼中，这只是一条能让预测结果概率分布更优的路径。当模型自己学会了思考，人类引以为傲的提示工程技巧，其价值又剩几何呢？

二、镜中世界

Epoch AI 的研究预测，前沿AI模型的训练算力，正以每年约翻2倍的速度增长，形成了AI领域的“算力摩尔定律”。这还只是硬件层面，之上更有算法效率的持续改进，使得更小、更高效的模型能够追平甚至超越过去庞大臃肿的模型。

问题的关键不在于进化速度，而在于加速度。机器的进化在指数级加速，而人类技巧的发明本身，却没有这样的加速度。今天你凭借独门秘籍跑在了世界前面，但世界正在加速，你却仍在原地踏步。这不是因为你做错了什么，恰恰是因为你做对了——而那些“对的事情”，注定被更底层的暴力计算所碾压，并且被碾压的速度会越来越快。

三、半兽人

1997年，“深蓝”击败国际象棋世界冠军卡斯帕罗夫，但故事并未终结。此后几年，国际象棋界流行起“自由式”比赛，允许人类选手携带电脑软件组队参赛。2005年的PAL/CSS锦标赛上，参赛者既有携带顶级象棋软件的国际特级大师，也有当时最强的纯AI超级计算机。但最终的冠军，既不是大师，也不是超级计算机，而是两名业余爱好者。他们的棋艺甚至连参加本地比赛的资格都不够，但他们精通“工作流”：同时操作多台运行不同象棋引擎的电脑，交叉验证和整合引擎的建议。

这揭示了一个当时震撼的公式：
普通人类 + AI + 优秀的工作流 > 顶级人类专家 + AI > 纯AI
人类与算法融合的“半兽人”站上了顶峰。

然而，真正的临界点并非AI比人聪明——那早已实现。真正的临界点是：“半兽人”也打不过纯血的、独立运行的AI了。 在今天，国际象棋领域的人类-AI组合，已无法战胜最新版本的纯AI软件。人类在机器智能之上叠加的那层“价值”，已被证明是累赘，彻底归零。

我们只需要关注一个简单的信号：当你花费一个月时间，在现有模型上终于摸索出一点提升效果的技巧，正自鸣得意时，刷到新闻推送——新一代模型发布，能力全面提升，所有旧技巧瞬间失效。这好比西西弗斯刚刚把石头推到半山腰，石头不仅滚落，还变得更重、更大了。

四、美丽新世界

临界点之后，纯粹的“智力”将不再稀缺。稀缺本身，才是唯一的价值来源。你会发现，AI能滔滔不绝地教你如何修理精密仪器、泡一壶好茶或进行外科手术，但一旦让它自己动手，却可能连滚带爬、原形毕露。这是因为物理世界的反馈循环复杂而昂贵，具身智能的Scaling Law（规模定律）尚未跑通。但这绝不是永恒的护城河，这只是另一处等待被跨越的“神奈川”。

人类的底色终究是情绪与连接。情绪连接能诞生强大的品牌，而算力无法直接“Scale”（规模化扩展）出一个品牌。同理，AI或许能写出代码质量高出几百倍的聊天软件，但它搬不走微信的12亿用户关系网。这回到了价值投资的核心命题——护城河理论。什么资产能真正对抗时间？在这个维度上，巴菲特的理念依然闪耀。

黑云压城之下，人类似乎还有最后一道防线：AI没有公民权。它们不能拥有资产，不能成为法律意义上的被告。房子、土地、能源、矿权，这些硬资产的归属仍在人类名下。但法律并非铁板一块，历史早已证明，生产力终将决定生产关系。“羊吃人”的圈地运动殷鉴不远。

前AI时代，社会阶层流动的一条重要路径是“智力变异”。财富地位或可世袭，但智力难以继承，“富不过三代”背后有生物学的均值回归在起作用。然而，AI的进化是绝对继承的。下一代模型永远在上一代的基础上碾压式前进，是单向度的智力升华。

我们是否只是在扮演“引导器”的角色，为硅基生命的终极崛起铺平道路？这正应了那句诗：苦恨年年压金线，为他人作嫁衣裳。

参考文献
[1] Richard S. Sutton, The Bitter Lesson, 2019. (http://www.incompleteideas.net/IncIdeas/BitterLesson.html)
[2] 季逸超 (Peak Ji)，Peak Labs 及 Manus 联合创始人。张小珺商业访谈录，《128. Manus决定出售前最后的访谈：啊，这奇幻的2025年漂流啊…》 (https://www.xiaoyuzhoufm.com/episode/695331cb2db086f897b50ea9)
[3] DeepSeek-AI, DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning, 2025. (https://arxiv.org/abs/2501.12948)
[4] David Owen, Epoch AI, What will AI look like in 2030?, 2025. (https://epoch.ai/blog/what-will-ai-look-like-in-2030)

关于人工智能技术的更多前沿探讨，欢迎来云栈社区交流。

上一篇：华为防火墙 FTP 穿越配置全解：ASPF与NAT ALG原理与排错指南
下一篇：AI软件工程：如何用确定性约束驾驭大语言模型的概率性输出

人工智能, 算力, 规模定律, 提示工程, 智能代理