云栈社区»论坛 › 站务中心「 Forum Service 」 › 证明丰裕时代：陶哲轩谈AI如何颠覆数学千年竞赛规则 ...

发回帖发新帖

5575 积分	0 好友	708 主题

发消息

证明丰裕时代：陶哲轩谈AI如何颠覆数学千年竞赛规则

发表于 2026-5-17 04:31:09 | 查看: 107| 回复: 0

菲尔兹奖得主陶哲轩在斯坦福大学发表题为《新数学工作流》的演讲后，宣布改变个人工作习惯：不再试图实时跟进所有新证明。AI生成证明的速度已经远超人类消化能力，数学正在被自己的产出撑爆。

他在Mathstodon上写下一条公告，表示要改变自己的工作习惯，不再试图实时跟进所有新证明。

陶哲轩Mathstodon推文截图

一个每年审阅上百篇论文的数学家，亲手给自己按下了暂停键。原因不是他老了，不是他累了，而是一个他亲眼看着成形的事实：AI生成数学证明的速度，已经远远超过人类消化证明的速度。数学正在被AI撑爆。

陶哲轩在演讲开头就甩出了一个判断：数学正在经历其他科学领域早已经历过的那场革命。

生物学有基因测序爆炸、天文学有望远镜数据洪流，每个学科进入「数据丰裕」时代之后，都被迫重建自己的工作流程。AI时代，数学的版本是：证明丰裕。

几千年来，数学一直活在「证明稀缺」的年代。看一眼数学论文的署名传统就知道——其他学科早已习惯10人、20人、50人合著的常态，数学一百年来还卡在1-2人。

陶哲轩在演讲里直接放了一张对比图，那条几乎贴地的线就是数学。

数学、化学、物理学科平均合著作者数对比，数学长期贴地

为什么数学这么独？因为证明很贵。一篇定理的诞生需要几年甚至几十年——Andrew Wiles关了自己7年才证完费马大定理。

费马大定理公式

在那个稀缺时代，「谁第一个走出帐篷」就是最自然的衡量标准。你给他一切——荣誉、教职、奖项、定理的署名权。这套激励运转得非常好，因为它和「推动整个数学社区进步」的目标基本对齐：第一个走出来的人，通常也是把这件事讲清楚的人。

一个猜想悬在那里几十年，全世界最聪明的脑袋轮番上阵，能解出来就是载入史册的事件。整个学科的激励体系、荣誉体系、评价体系，全部建立在这个稀缺性之上。

现在稀缺性正在被AI抹掉。

陶哲轩举了一个很具体的例子。Erdős问题网站——数学界最著名的未解难题清单之一，目前已经有大约20篇AI辅助解题方案处于积压待审状态。提交者自己坦言：根本没有时间手动验证。

Erdős问题论坛截图，显示已解和待审问题

不是没人想看，是看不过来。陶哲轩把这比作19世纪的汽车困境——车的速度越来越快，但当时的道路系统根本承载不了。结果不是交通更快了，而是交通更堵了。

AI是能生成数学难题的证明。

Erdős问题解决进展图，AI辅助贡献明显

但证明堆在那里没人消化，等于什么都没证明。

数学家的工作流，被AI切成了三段

陶哲轩在演讲里把数学的生产过程拆成三步。

第一步，proof generation，证明生成。 AI现在已经在批量产出。GPT-5.5、Claude Opus 4.7、专门做形式化数学的求解器，一夜之间能涌出几十条新证明。一年前还是惊喜的事情，现在变成生产线日产。

第二步，verification，证明验证。 Lean、Coq这一类形式化验证工具大半年迭代一次。AI加Lean让验证流程半自动化，审稿人不再需要一行一行手算每个引理。GPT-5.2解Erdős#728那次，验证环节由工具Aristotle自动完成，陶哲轩本人只在终点确认了一下。

第三步，digestion，消化与理解。 现在，完全空白。没有任何工具能帮数学家把机器证完的东西转化成人类读得懂的洞察。一条证明被形式化验证为正确，和这条证明对数学家有用，是两回事。前两阶段越快，第三阶段越追不上。

更要命的是，目前学术界没有任何成型的方法论，让数学家批量消化AI产出的证明。每天审稿邮件里塞满Lean验证过的新证明，能读的人就那么多。

AI竞赛中各模型性能对比

陶哲轩说了一句被现场反复引用的话：数学的本质，不是积累正确证明的数量，是让人类理解这个世界为什么是这样运行的。

机器解出#1196是一回事。陶哲轩亲自从Price的证明里提炼出向下冯·曼戈尔特链这种新概念、再把它扩展成新理论，是另一回事。前者AI可以包圆。后者目前还得人来做。而且越来越没人做得过来。每天几十条新证明涌出来，能读懂的数学家就那么多。瓶颈不在生产端，在阅读端。

像素分割装饰

技术正确，但没人理解

真正让陶哲轩警觉的，不是AI生成证明的速度，而是AI生成的证明长什么样。

他在演讲中做了一个关键区分：数学研究有两类目标。 第一类是显性目标——证明某个定理、解决某个猜想。写在论文标题里的那种。第二类是隐性目标——弄清楚这个证明和已有文献的关系，发现后续的自然问题，提炼新的技术手段，理解核心困难在哪里，以及最重要的：让做这个研究的人本身变得更强。

过去几百年里，这两类目标从来不需要分开讨论。因为当一个人类数学家解决一个问题时，隐性目标是自动完成的——你不可能在证明过程中不了解文献、不发现新问题、不训练自己的直觉。AI把它们拆开了。 AI可以在技术层面解决显性目标，给出一个逻辑上正确的证明。但它生成的证明不引用已有文献，不突出核心思想，不启发后续研究，不帮任何人变得更聪明。用陶哲轩的表述：这种证明技术上正确，但与数学的真正进步目标脱节。一道题被AI解了，但数学界对这道题的理解没有增长一毫米。

这就像一个学生在考试里拿了满分，但走出考场什么都没学到。

古德哈特定律发作了

陶哲轩在演讲里搬出了一个经济学概念：古德哈特定律。Charles Goodhart在1975年提出那条以他名字命名的定律：当一个衡量标准变成目标，它就不再是好的衡量标准。

古德哈特定律漫画：当一项指标变成了目标，它就不再是一个好的指标

这条定律过去50年发作过无数次：KPI文化下的销售作假；Twitter算法把互动变成目标，结果催生了愤怒经济；学术影响因子（h-index）被刷成了产业链。数学曾经是少数没被它击穿的领域。

翻译到数学界：「谁第一个证明了这个定理」，曾经是衡量数学进步的好指标。因为在证明稀缺的年代，能第一个证明的人，一定深入理解了问题，一定推进了数学的前沿。显性目标和隐性目标完全对齐。

AI让这个对齐崩了。 第一个证明的速度可以被无限加速，但理解不能。当整个社区开始无限制地卷「证明速度」，这个指标就和真正的数学进步脱钩了。继续按旧规则玩，不仅不创造进步，反而在多方面阻碍数学的发展。

陶哲轩的建议很明确：停止对「谁是第一个解决某个未解难题」的过度执着。 把锦标赛式的极限优化引导到更受控的方向——比如专门为重度使用AI而设计的数学竞赛工作流，让竞速归竞速，让理解归理解。菲尔兹奖得主亲手给数学界的旧游戏规则判了缓刑。

数学是预告片

把视线从数学拉远一步。陶哲轩描述的这个困境——AI产出速度远超人类消化速度，显性目标和隐性目标被强行解耦——不是数学独有的。

代码可以被AI大量生成，但没人review。论文可以被AI批量写出，但没人读。诊断可以被AI秒出，但医生来不及理解推理过程。每一个知识密集型行业，都在走向同一个岔路口：产出在爆炸，理解在停滞。

陶哲轩在演讲中反复强调一句话：数学不只是一堆互不相关的定理的集合，它上面有一整套系统。 证明是砖。但建筑不是砖堆。当AI能无限供应砖块的时候，建筑师比砖匠更重要。问题是，连建筑师都快被埋在砖堆下面了。

陶哲轩选择不追了。

陶哲轩建议幻灯片：从证明稀缺到证明丰裕的转变

不是追不上，而是他发现，追本身正在成为问题。

像素分割装饰

锦标赛灯光熄了，剧场刚刚开门

陶哲轩在演讲最后，留下一个具体的提议：为AI重度使用设计专门的数学竞赛。评判标准不再是「谁先证出来」，是谁的证明体系最有解释力、谁的形式化最干净、谁能推动整个领域消化某个突破。

陶哲轩演讲现场，提出新竞赛标准

这句话的潜台词很明白：奖项、期刊、招聘评价——所有建立在证明稀缺时代之上的制度，都要重做。数学不是被AI终结的第一门学科，但它是第一门由顶级专家亲手宣告规则失效的学科。物理、化学、生物大概率会跟上。

千年来，数学家比谁先证出来。从今天起，比的是谁更能读得懂AI的证明。

参考资料：

YouTube: https://www.youtube.com/watch?v=Uc2zt198U_U
Mathstodon: https://mathstodon.xyz/@tao/116569989993991669

上一篇：Codex 进阶玩法：MacBook 无缝接管 Mac mini 实现跨设备上下文同步
下一篇：OpenCyvis开源方案：Android后台虚拟显示器运行AI Agent，实现不锁屏自动化

AI, Lean, 数学证明, 古德哈特定律, 陶哲轩