找回密码
立即注册
搜索
热搜: Java Python Linux Go
发回帖 发新帖

2676

积分

0

好友

405

主题
发表于 15 小时前 | 查看: 2| 回复: 0

围棋对局画面:AlphaGo vs. 李世石第78手

(图中为 AlphaGo 对阵李世石第四局,李世石白棋第78手“挖”。策略网络评估人类下出此手的概率仅为 0.007%。此手之后,AI胜率估算崩溃,昏招频出。人类凭此“神之一手”,拿下了对抗AlphaGo的唯一一场胜利。)

AlphaGo最初的训练数据,来源于人类历史的棋谱。在人类的经验边界之外,那个概率不到万分之一的盲区,机器直接放弃了搜索。后来,DeepMind训练AlphaGo Zero时,彻底清空了人类棋谱,让AI从零开始纯自我对弈。结果它碾压了所有基于人类知识的前代版本。当人类知识被从系统中抹除,机器反而迎来了真正的飞升。

2019年,强化学习之父 Richard Sutton 发表了一篇短文《The Bitter Lesson》(苦涩的教训)。其中提到,近70年的人工智能研究反复证明了一件事:利用简单方法,叠加海量算力的“暴力美学”,最终会碾压一切人类精心设计的复杂方法。 原因很简单:人类的知识,本质上是对AI探索能力的限制。将人类认知编入系统,等于将AI锁定在人类已知的解空间内,主动放弃了在更广阔空间内找到更优解的可能性。

一、神奈川冲浪里

我们可以定义一个简单的公式:

最终表现 = 基模能力 × (1 + ε_human)

这里的 ε_human,就是人类叠加在基础模型之上的各种小技巧所提供的边际增益。无论是精心设计的提示词(Prompt)、复杂的智能体(Agent)工作流,还是上下文管理、自我进化的框架,都属于这个范畴。这是人类在算力怪兽面前,试图从牙缝里抠出的一点额外价值。“会用AI的人替代不会用AI的人”,这句话流行的底层逻辑就在于此。

一个现实的例子:2014年,开发者季逸超开始从零训练专用模型来构建知识图谱。他花了近五年时间,写爬虫、构建索引引擎、搭建向量数据库,最终炼出一个0.3B参数的专用模型。然而,当他拿到GPT-3的早期测试资格后,仅仅写了几段Prompt,其效果就与自己四年的心血成果打成了平手。数年的人类知识垂直整合工程,被一个通用大模型一夜之间抹平了差距。

更经典的案例是“Let‘s think step by step”。在早期驯化大语言模型时,人们发现,在提问末尾加上这句神奇的咒语,就能显著提升模型在复杂推理任务上的表现。两年后,OpenAI的o1模型直接将这种“分步思考”的能力内化为了基础功能。有趣的是,这种内化并非靠人类编写复杂规则,而是通过纯粹的强化学习实现的。

DeepSeek R1的论文中透露了关键信息:研究团队不给模型提供任何人类编写的思维链(CoT)示例数据,只根据最终答案的正确与否来提供奖励信号。为了最大化这个数学上的奖励,模型在数千万次的迭代中,自己“顿悟”了反思、纠错和长链条推理。它甚至学会了用拟人化的语气自我怀疑:“等等,这好像不对,让我重新算一遍。” 人类视之为高级认知能力的体现,但在机器眼中,这只是一条能让预测结果概率分布更优的路径。当模型自己学会了思考,人类引以为傲的提示工程技巧,其价值又剩几何呢?

二、镜中世界

Epoch AI 的研究预测,前沿AI模型的训练算力,正以每年约翻2倍的速度增长,形成了AI领域的“算力摩尔定律”。这还只是硬件层面,之上更有算法效率的持续改进,使得更小、更高效的模型能够追平甚至超越过去庞大臃肿的模型。

问题的关键不在于进化速度,而在于加速度。机器的进化在指数级加速,而人类技巧的发明本身,却没有这样的加速度。今天你凭借独门秘籍跑在了世界前面,但世界正在加速,你却仍在原地踏步。这不是因为你做错了什么,恰恰是因为你做对了——而那些“对的事情”,注定被更底层的暴力计算所碾压,并且被碾压的速度会越来越快。

三、半兽人

1997年,“深蓝”击败国际象棋世界冠军卡斯帕罗夫,但故事并未终结。此后几年,国际象棋界流行起“自由式”比赛,允许人类选手携带电脑软件组队参赛。2005年的PAL/CSS锦标赛上,参赛者既有携带顶级象棋软件的国际特级大师,也有当时最强的纯AI超级计算机。但最终的冠军,既不是大师,也不是超级计算机,而是两名业余爱好者。他们的棋艺甚至连参加本地比赛的资格都不够,但他们精通“工作流”:同时操作多台运行不同象棋引擎的电脑,交叉验证和整合引擎的建议。

这揭示了一个当时震撼的公式:
普通人类 + AI + 优秀的工作流 > 顶级人类专家 + AI > 纯AI
人类与算法融合的“半兽人”站上了顶峰。

然而,真正的临界点并非AI比人聪明——那早已实现。真正的临界点是:“半兽人”也打不过纯血的、独立运行的AI了。 在今天,国际象棋领域的人类-AI组合,已无法战胜最新版本的纯AI软件。人类在机器智能之上叠加的那层“价值”,已被证明是累赘,彻底归零。

我们只需要关注一个简单的信号:当你花费一个月时间,在现有模型上终于摸索出一点提升效果的技巧,正自鸣得意时,刷到新闻推送——新一代模型发布,能力全面提升,所有旧技巧瞬间失效。这好比西西弗斯刚刚把石头推到半山腰,石头不仅滚落,还变得更重、更大了。

四、美丽新世界

临界点之后,纯粹的“智力”将不再稀缺。稀缺本身,才是唯一的价值来源。你会发现,AI能滔滔不绝地教你如何修理精密仪器、泡一壶好茶或进行外科手术,但一旦让它自己动手,却可能连滚带爬、原形毕露。这是因为物理世界的反馈循环复杂而昂贵,具身智能的Scaling Law(规模定律)尚未跑通。但这绝不是永恒的护城河,这只是另一处等待被跨越的“神奈川”。

人类的底色终究是情绪与连接。情绪连接能诞生强大的品牌,而算力无法直接“Scale”(规模化扩展)出一个品牌。同理,AI或许能写出代码质量高出几百倍的聊天软件,但它搬不走微信的12亿用户关系网。这回到了价值投资的核心命题——护城河理论。什么资产能真正对抗时间?在这个维度上,巴菲特的理念依然闪耀。

黑云压城之下,人类似乎还有最后一道防线:AI没有公民权。它们不能拥有资产,不能成为法律意义上的被告。房子、土地、能源、矿权,这些硬资产的归属仍在人类名下。但法律并非铁板一块,历史早已证明,生产力终将决定生产关系。“羊吃人”的圈地运动殷鉴不远。

前AI时代,社会阶层流动的一条重要路径是“智力变异”。财富地位或可世袭,但智力难以继承,“富不过三代”背后有生物学的均值回归在起作用。然而,AI的进化是绝对继承的。下一代模型永远在上一代的基础上碾压式前进,是单向度的智力升华。

我们是否只是在扮演“引导器”的角色,为硅基生命的终极崛起铺平道路?这正应了那句诗:苦恨年年压金线,为他人作嫁衣裳。

参考文献
[1] Richard S. Sutton, The Bitter Lesson, 2019. (http://www.incompleteideas.net/IncIdeas/BitterLesson.html)
[2] 季逸超 (Peak Ji),Peak Labs 及 Manus 联合创始人。张小珺商业访谈录,《128. Manus决定出售前最后的访谈:啊,这奇幻的2025年漂流啊…》 (https://www.xiaoyuzhoufm.com/episode/695331cb2db086f897b50ea9)
[3] DeepSeek-AI, DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning, 2025. (https://arxiv.org/abs/2501.12948)
[4] David Owen, Epoch AI, What will AI look like in 2030?, 2025. (https://epoch.ai/blog/what-will-ai-look-like-in-2030)

关于人工智能技术的更多前沿探讨,欢迎来云栈社区交流。




上一篇:华为防火墙 FTP 穿越配置全解:ASPF与NAT ALG原理与排错指南
下一篇:AI软件工程:如何用确定性约束驾驭大语言模型的概率性输出
您需要登录后才可以回帖 登录 | 立即注册

手机版|小黑屋|网站地图|云栈社区 ( 苏ICP备2022046150号-2 )

GMT+8, 2026-2-25 21:48 , Processed in 0.361573 second(s), 43 queries , Gzip On.

Powered by Discuz! X3.5

© 2025-2026 云栈社区.

快速回复 返回顶部 返回列表