近日,数学家陶哲轩与多位研究者协作,在多种AI工具的辅助下,仅用48小时便完全解决了尘封50年的数学难题——Erdős#1026。
这一成果不仅标志着该问题的终结,更展示了人机协作在尖端科研中的巨大潜力。陶哲轩本人表示,若采用传统方法,此工作可能需要数周甚至数月才能完成。
那么,他们是如何在如此短的时间内解决这一难题的?
48小时攻克Erdős#1026
Erdős#1026问题最早于1975年被提出,其初始表述较为模糊。数学家Desmond Weisenberg随后引入了最大常数c(n)的概念,将问题明确为:对于所有长度为n的不同实数序列,c(n)是使得某个不等式恒成立的最大常数。
该问题可以用博弈论的语言形象地解释:Alice将N枚硬币分成n堆,Bob则选择一个单调的子序列堆并拿走其中的所有硬币。c(n)代表了无论Alice如何分配,Bob都能保证拿走的最小硬币比例。
陶哲轩首先给出了c(1)、c(2)、c(3)等简单情况的直观答案。随后,数学家Stijn Cambie提出了更进一步的猜想。但该问题长期未有实质性进展,直到研究者Boris Alexeev使用名为“亚里士多德”的数学AI模型,在证明助手Lean中自动构造并证明了关键不等式,将原问题成功转化为一个计算几何领域的矩形填充问题。
约一小时后,另一位数学家Koishi Chan给出了一个基于经典Erdős–Szekeres定理的替代证明,印证了AI的发现。
次日,陶哲轩介入,他利用AlphaEvolve工具生成特定实数序列来探索c(n)的上界。运行一小时后,AI生成了一系列结构清晰的上界值。陶哲轩通过公开工具将这些数值序列整理,形成了一个关于c(n)值的明确猜想。
Boris Alexeev随后找到了该猜想的简洁数学表述,并提供了一个精巧的上界构造。其核心思想源自Erdős–Szekeres定理:通过精心设计序列的分块与排列顺序,使得长的单调序列无法同时拥有较大的权重。为了直观展示,研究者利用ChatGPT Pro生成了1/c(n)的函数图像,结果显示它近似于对平方根函数的分段线性逼近。
紧接着,数学家Lawrence Wu将问题与正方形填充问题(Erdős#106)进行关联阐述。他引入函数f(n),并通过AI进行论文检索,找到了一篇去年发表的相关研究。该论文中的结论最终完成了对猜想的证明。
最后,陶哲轩将整个证明过程的各部分信息输入大型语言模型,生成了完整、连贯的证明文本。
人机协作成为数学研究新范式
这并非陶哲轩首次借助AI解决数学难题。近期,他还利用Gemini 2.5 Deep Think在十分钟内补全了Erdős问题#367的证明。此外,他通过GPT-5进行半自动化文献检索,将计算出的数列与OEIS数据库对照,发现了部分Erdős问题其实早已在既往研究中被解决,只是未被关联起来。
Erdős问题源自匈牙利数学家保罗·埃尔德什,他一生提出了海量的数学问题。其中大多数难题至今悬而未决,被收录在erdosproblems.com网站中。随着AI技术的发展,利用其辅助甚至主导解决这些历史难题的案例正逐渐增多。
就在前几天,Harmonic的数学AI模型被曝独立证明了Erdős问题#124,全程耗时6小时。目前,Erdős问题网站也已公开鼓励在满足一定条件下使用AI辅助解题。
Erdős#1026的快速解决,是“人与人的协作”与“人与AI的协作”共同作用的成果。这种融合人类智慧与机器算力、算法效率的新模式,正在成为突破复杂科学前沿问题的重要趋势。
参考链接:[1]https://www.erdosproblems.com/forum/thread/1026 [2]https://terrytao.wordpress.com/2025/12/08/the-story-of-erdos-problem-126/
|