
图源:MIT TR
对 AI 产生一些幻灭感在所难免。
2022 年末,OpenAI 发布了名为 ChatGPT 的免费网页应用,它不仅改变了整个行业的走向,甚至重塑了全球多个经济体的运行轨迹。数以百万计的人第一次开始与机器进行真正意义上的对话。由此,我们被推入了一个对 人工智能 抱有无限遐想的时代。
科技巨头们为了保持领先地位而竞相冲刺,接连推出在语音、图像、视频等不同维度“各擅胜场”的竞品。每一次产品更新都被包装成一次重大突破,进一步强化了公众的普遍信念:这项技术正变得越来越好。
AI的拥护者们总爱描绘一幅指数级进步的图景,用一张张持续上扬的曲线图来证明我们距离通用智能又近了一步。生成式 AI 一度显得无所不能。
然而,2025年似乎成了一场“清算”。顶级AI公司的领导者们许下了太多难以兑现的承诺:生成式 AI 将取代白领工作、开启富足时代、加速科学发现……在“错失恐惧症”(FOMO)的驱使下,无数企业匆忙入场。
也就是从那时起,光环开始褪色。尽管这项技术被包装成重塑业务流程、削减成本的“万能工具”,但多项研究显示,企业并未能让那点“AI仙尘”真正发挥魔力。
来自美国人口普查局与斯坦福大学等机构的追踪数据表明,企业采用 AI 工具的势头正在放缓。许多项目长期卡在试点阶段,难以规模化。如果缺乏更广泛的经济投入,人们不禁要问:这些投入了惊人资金的 AI 巨头们,该如何收回成本?
与此同时,核心技术的迭代也不再像从前那样带来阶跃式提升。
最典型的例子莫过于 GPT-5 在8月的发布。OpenAI 为这款“任何领域的博士级专家”连续数月造势,将市场期待推至顶峰。然而当它真正上线时,给许多人的感觉却像是“相同的东西又发布了一次”。
AI 研究者扬尼克·基尔彻在视频中评论道:“突破边界的时代结束了。AGI 不会到来。我们看起来已经进入了大语言模型的三星 Galaxy 时代。”
很多人将其类比为智能手机的发展轨迹:在经历了令人兴奋的快速迭代期后,每年的新款逐渐变得“平平无奇”,升级多体现在细节而非颠覆性体验上。生成式 AI 是否也到了这个阶段?如果是,这算是问题吗?智能手机已成为“新常态”,但它确实深刻改变了世界。
需要承认的是,过去几年充满了激动人心的突破,从视频生成质量的飞跃到推理模型解题能力的展现,都是真实的进步。但这项非凡技术从走红至今也不过短短几年,在许多方面仍处于实验阶段。伴随着它的成功,是诸多重要的限制条件——也许,我们是时候重新调整预期了。
这里必须小心:从“过热”到“过冷”的钟摆也可能摆得过头。仅仅因为一项技术被过度炒作就全盘否定它,无疑是轻率的。
当 AI 未能回应过高期待时,人们常会断言“进展撞了南墙”。但这误解了技术创新的本质:进步从来都是偶发且不均衡的。墙可以被翻越、绕行甚至从下方挖穿。
不妨将视线从 GPT-5 的发布上挪开。在它之前,OpenAI 密集推出了开创性的推理模型 o1/o3,以及再次抬高视频生成门槛的 Sora 2。这听起来可不像撞墙。
AI 的确很强。看看 Google DeepMind 的 Nano Banana Pro,它能将书籍章节转化为信息图,而且就免费躺在你的手机里。
但核心问题依然存在:当最初的“惊艳感”消退之后,还剩下什么?一年或五年后,我们会如何评价这项技术?它会值得我们已经付出和将要付出的巨大成本吗——无论是金钱还是环境代价?
基于这些思考,以下是看待当前 AI 现状的四种视角。这或许是一场迫切需要的热潮纠偏的开始。
大语言模型不是全部
从某种意义上说,需要纠偏的是围绕大语言模型(LLM)的热潮,而非 AI 整体。现在越来越明显,LLM 可能并非通往通用人工智能(AGI)的终极路径。
即便是像伊利亚·苏茨克维这样的 AGI 坚定信仰者(前 OpenAI 首席科学家),也开始强调 LLM 的局限性。他在近期访谈中指出,这些模型擅长学会完成许多具体任务,却似乎并未掌握任务背后的通用原理。这就像学会解一千道不同的代数题,与掌握解决任何代数题的能力之间的区别。
苏茨克维说:“我认为最根本的一点是,这些模型在泛化能力上不知为何明显比人类差得多。”
LLM 卓越的语言能力极具迷惑性,容易让人产生它“无所不能”的错觉。我们天生倾向于从模仿人类的行为中看见“智能”,而营销则利用了这种心理,不断抬高预期。随着我们与这项技术共处、对其理解加深,这些预期理应回归地面。
AI 不是解决一切问题的速效药
今年7月,麻省理工学院的一项研究常被引用,其最醒目的结论是:高达95%的企业在尝试使用 AI 后发现其“零价值”。其他研究也呼应了类似判断。
但这其中存在误读。MIT 研究中所谓的95%失败率,统计的是那些尝试部署定制 AI 系统,但在6个月后仍未能将其扩展到试点阶段之外的公司。实验性技术的许多实验无法立刻见效,这并不令人意外。
该研究也发现,约90%的公司内部存在 AI “影子经济”——员工私下使用聊天机器人处理工作,而这部分创造的价值并未被测量。当研究观察 AI 智能体与人类专家协作时,任务成功率便大幅上升。
这与 AI 研究者安德烈·卡帕希的观点一致。他指出,聊天机器人在许多方面比普通人强(如提供法律建议、修复漏洞),但并不比该领域的专家更强。这解释了它为何受个人用户欢迎,却尚未颠覆整个经济——要颠覆经济,它必须超越熟练员工。
目前,AI 并非速效药,也无法完全替代人类。但它如何被整合进工作流,仍在不断试验与摸索中。
我们身处泡沫之中吗?
如果 AI 是泡沫,它更像哪一个?是2000年留下互联网基础设施的“.com泡沫”,还是2008年只留下债务的次贷危机?
或许,我们正身处一种新型泡沫。LLM 尚未形成真正成熟的商业模式,杀手级应用也未见踪影。大量资金被投入建设算力基础设施以服务“预期需求”,但如果需求最终未达预期呢?
一些投资者则显得淡定。他们认为,当前的数据中心建设大多有“具备偿付能力的对手方”签约承诺接收全部产出,并非盲目建设。其中最大的客户之一微软,拥有顶级的信用评级。
许多CEO从互联网泡沫中汲取的教训是:确保有足够资金“买”过可能的市场下行期,留在赛道上。但另一条教训是,一些起初看似“边角料”的应用(如虚拟人生成工具 Synthesia),最终可能成长为价值数十亿美元的独角兽。
ChatGPT 不是开始,也不会是结束
ChatGPT 是深度学习十年进步的结晶,而深度学习的种子早在几十年前就已埋下。以这样的历史背景衡量,生成式 AI 或许才刚刚起步。
研究热度已至沸点。全球顶级 AI 会议收到的高质量论文投稿创下纪录,以至于一些会议不得不拒绝已通过评审的论文。与此同时,arXiv 等预印本平台也被 AI 生成的“学术垃圾”所淹没。
苏茨克维在谈到当前瓶颈时说:“我们又回到了研究的时代。”这并非挫折,而可能是一个新纪元的开端。
风投人士内森·贝奈奇指出:“总会有很多‘炒作怪兽’。”但热潮的积极面在于,它能吸引实现真正进步所必需的资金与顶尖人才。“现在,几乎所有在技术上真正厉害的人都在做这件事。”
接下来我们往哪里走?
这股热潮不仅源于公司为昂贵新技术招揽生意的需求,也源于人类内心深处一个持续数十年的狂野梦想:机器可以阅读、写作和思考。
但热潮从来不可持续,这反倒是件好事。我们现在有机会重置预期,看清这项技术的真实面貌,评估其能力,理解其缺陷,并花时间学习如何将其用在有价值且有益的领域。这场关于 AI 未来 的讨论,正在全球的 开发者广场 热烈进行。
贝奈奇说:“我们仍在摸索,如何从这个维度高得离谱的信息与技能黑箱中,调动出我们想要的特定行为。”这场热潮纠偏早就该来了。但要知道,AI 不会消失。我们甚至尚未完全理解自己迄今为止创造了什么,更不用说未来会发生什么。
原文链接:https://www.technologyreview.com/2025/12/15/1129174/the-great-ai-hype-correction-of-2025/