云栈社区»论坛 › 开发者广场「Dev Plaza」 › AlphaEvolve基于LLM自动生成算法，刷新五项拉姆齐数下界纪录 ...

发回帖发新帖

5628 积分	0 好友	731 主题

发消息

AlphaEvolve基于LLM自动生成算法，刷新五项拉姆齐数下界纪录

发表于 2026-3-16 01:40:47 | 查看: 137| 回复: 0

一位站在宇宙与神经网络背景前的科学家

谷歌DeepMind在数学AI领域再次取得突破。其研发的AlphaEvolve系统，通过大语言模型（LLM）驱动的代码进化，一次性改进了五个经典拉姆齐数（Ramsey number）的下界，打破了其中一些尘封十年的纪录。

论文地址：https://arxiv.org/pdf/2603.09172

这项成果并非依靠人工设计五套不同算法，而是通过一个统一的“元算法”（meta-algorithm）自动完成的。该元算法能自主发现针对特定拉姆齐数问题的搜索流程。

论文封面：Reinforced Generation of Combinatorial Structures: Ramsey Numbers

具体突破如下：

R(3,13)： 60 → 61（此前纪录保持11年）
R(3,18)： 99 → 100（此前纪录保持20年）
R(4,13)： 138 → 139（此前纪录保持11年）
R(4,14)： 147 → 148（此前纪录保持11年）
R(4,15)： 158 → 159（此前纪录保持6年）

拉姆齐数新旧下界对比表格

在拉姆齐数这个组合数学的经典难题上，即使是微小的推进也极其困难。AlphaEvolve不仅创造了五项新纪录，还成功匹配或恢复了所有已知精确值的拉姆齐数下界，以及大量其他情况下的当前最佳下界，总共覆盖了28个R(r,s)值。

DeepMind的研究负责人Pushmeet Kohli在社交媒体上分享了这一进展。

Pushmeet Kohli关于AlphaEvolve突破的推文

DeepMind联合创始人兼CEO Demis Hassabis也对此表示祝贺，称这是“人工智能在数学领域的一个重大里程碑”。

Demis Hassabis庆祝AlphaEvolve成果的推文

图灵奖得主Yann LeCun同样向团队表达了祝贺。

Yann LeCun祝贺Demis和团队的推文

拉姆齐数为何如此困难？

拉姆齐理论的核心问题之一是确定拉姆齐数 R(r, s)。简单来说，它指的是：对于一个足够大的完全图，无论你如何对其边进行着色（比如红色或绿色），都必然会出现一个全是红色的 r 个顶点的完全子图，或者一个全是绿色的 s 个顶点的完全子图。

最著名的例子是 R(3,3)=6，即“六人集会问题”：在任何六人中，总能找到三人彼此都认识，或三人彼此都不认识。

弗兰克·拉姆齐肖像及图表示例

然而，随着 r 和 s 增大，确定精确的拉姆齐数变得异常困难。著名数学家保罗·埃尔德什（Paul Erdős）曾用一个生动的比喻描述其难度：如果外星人威胁人类必须算出 R(5,5)，否则就毁灭地球，那么人类最明智的选择可能是直接投降。

因为仅 R(5,5) 这一个问题的搜索空间就包含大约 10^271 种可能的图，暴力求解所需的时间远超宇宙年龄。几十年来，数学家们每想在一个具体的拉姆齐数上取得进展，都不得不从零开始手工设计一套定制的搜索算法。

关于R(5,5)难度的长推文截图

AlphaEvolve 改变了这一范式。它不是一个直接寻找反例图（用于确定下界）的程序，而是一个搜索“搜索算法”的元算法。

AlphaEvolve 如何工作：不算题，算算法

传统路径是：人类专家设计算法 -> 计算机执行算法寻找图。
AlphaEvolve 的路径是：LLM 根据反馈进化算法代码 -> 执行进化出的算法 -> 评估结果并进一步指导进化。

其核心流程可以概括为以下元算法：

Algorithm 1: AlphaEvolve: Ramsey Program Search
Input: Ramsey parameters (r,s,nSoTA)
Output: Program p* with best graph
1 Init: Population P ← {Pbase} // Pbase returns empty graph
2 while compute budget remaining do
3   Pnew ← LLM.Mutation(Select(P))
4   (G1,G2) ← Pnew.run()
5   if G1 has no r-cliques or s-independent sets then
6      v1,v2 ← |V(G1)|,|V(G2)|
7      S ← {4·v1 if v1 > nSoTA
            2·v1 if v1 = nSoTA
            v1 otherwise}
8      if v2 > v1 then
9         Eviol ← (v2²)/2^(½) + (v2²)/2^(½)
10        S ← S + ½ max(0,1 − count_viol(G2)/Eviol)
11   else
12      S ← −1
13   score(pnew) ← S
14   P ← P ∪ {(pnew,S)}
15 return arg max p∈P score(p)

简单来说：

初始化种群：从一个最简单的基线程序（如返回空图）开始。
LLM变异：从种群中选择表现较好的程序，让大语言模型（如 Gemini）对其进行代码变异，修改搜索策略、初始化方式或启发式规则。
执行与评分：运行变异后的程序。如果它能构造出更大的合法图（无r-团且无s-独立集），则获得高分。对于接近合法（违规很少）的图，也会给予奖励，以引导搜索向边界推进。
进化迭代：将高分程序加入种群，重复选择、变异、评估的循环。

最终，AlphaEvolve 输出的不是图，而是一段能够找到更好图的代码。

对AlphaEvolve发现算法模式的文字分析

AI 发现的四大算法家族

研究人员对 AlphaEvolve 为 28 个 R(r,s) 值生成的算法进行了归纳，大致可分为四类，其分类依据主要是算法的初始化方法：

Table 2: Taxonomy of Ramsey Search Algorithms by Initialization Method
算法按初始化方法分类的表格

1. 随机与随机化初始化
从随机图（如 Erdős–Rényi 图 G(n,p)）或空图/贪心基线图开始，主要依靠模拟退火等随机优化方法逐步消除违规结构。适用于一些较小规模的拉姆齐数。

示例：R(3,5) 的搜索算法
Algorithm 7: Search algorithm for R(3,5) lower bound

示例：R(3,7) 的搜索算法
Algorithm 9: Search algorithm for R(3,7) lower bound

2. 代数结构播种
使用具有良好数学性质的图作为起点，如 Paley 图、二次剩余图、三次剩余图等。这些图本身已接近满足拉姆齐约束，为后续优化提供了一个“高起点”。

3. 循环图与循环引导
从循环图（Circulant Graph）家族出发，利用无和集（sum-free set）等代数性质来保证部分约束（如无三角形），再进行迭代扩展。本次多项新纪录（如 R(3,13), R(3,18)）的算法属于此类。

示例：R(3,13) 的搜索算法
Algorithm 2: Search algorithm for R(3,13) lower bound

示例：R(3,18) 的搜索算法
Algorithm 3: Search algorithm for R(3,18) lower bound

4. 混合、分形与谱方法
最复杂的一类，融合了分形自相似构造、谱性质分析、多种启发式并行等策略。

示例：R(3,11) 的搜索算法
Algorithm 15: Search algorithm for R(3,11)

这些算法高度针对其对应的 (r,s) 参数，相当于为每个具体问题“量身定制”。而定制过程，是完全自动化的。

透视AI设计的算法：以R(4,15)为例

近距离观察一个突破性算法，能更直观地感受AI设计的精巧之处。以刷新R(4,15)下界的算法为例，它包含以下几个关键创新：

Algorithm 6: Search algorithm for R(4,15) lower bound

和声遗传记忆：维护一个全局记忆池，跨代记录在成功图中频繁出现的“边”和“轨道”（循环距离）。这为初始化提供了概率指导。
谱初始化：新图的候选要么来自广义Paley图等代数构造，要么基于“和声记忆”中的概率分布，通过扩展已有最佳图来生成。
前瞻与和声评分：在删除一条边以破坏一个4-团时，评分不仅考虑直接的团数变化，还评估此操作引发大独立集的风险，并对历史表现好的边给予“和声”保护加分。
和声隧穿：当搜索陷入局部最优（仍有4-团未消除）时，算法会识别出在剩余4-团中出现频率最高的“有毒轨道”（一个特定的循环距离 d*），然后*一次性翻转所有距离为 d 的边**。这种大规模突变帮助搜索跳出局部陷阱。

这种将长期记忆、启发式评分与激进逃逸机制相结合的策略，在人类设计的算法中并不常见，但AlphaEvolve通过进化找到了它。

对比人类专家：AI的优势何在？

与人类专家手工设计的顶尖算法相比，AlphaEvolve生成的算法展现出一些显著特点：

1. 懂得利用已知的强代数结构
AI并非盲目随机搜索，它会主动选择Paley图、循环图、三次剩余图等数学上已知的、性质良好的图作为搜索起点。这表明LLM在代码变异过程中，能够隐含地运用领域知识。

2. 擅长串联多种启发式策略
人类算法往往侧重于一种核心策略（如模拟退火）。而AlphaEvolve生成的算法经常将多种方法串联或混合使用，例如先进行禁忌搜索，再结合退火，中间可能还穿插着局部修复或遗传算法的思想。

3. 自创高效的计算技巧
对于需要频繁检查图中是否存在4-团或13-独立集的任务，精确计算开销巨大。AI生成的算法会自发地采用位运算加速、启发式预过滤、增量更新等技巧来大幅提升效率。

R(4,13)：同一起点，不同路径
此前最佳纪录（Exoo & Tatarevic, 2015）的算法从三次剩余图出发，使用标准模拟退火。AlphaEvolve选择了完全相同的起点，但后续采用了不同的策略组合。

Algorithm 4: Search algorithm for R(4,13)

R(4,14)：更换赛道
对于同一个问题，人类专家（Exoo, 2015）使用三次图初始化，而AlphaEvolve则转向了循环图领域，并采用了随机轨道采样和基于位运算的高速过滤技术。

Algorithm 5: Search algorithm for R(4,14) lower bound

R(4,10)：发明新策略
与此前的最佳算法（Harborth & Krause, 2003 的分支定界法）相比，AlphaEvolve发明了一套基于循环图自适应概率采样、结合禁忌搜索与“近似命中仓库”机制的策略。论文作者指出，这种策略“在已有文献中找不到先例”。

Algorithm 24: Search algorithm for R(4,10)

总结：AI正在改写科学发现的范式

AlphaEvolve在拉姆齐数上的成功，是AI向纯数学领域深度渗透的又一例证。它展示了一条新的科研路径：不是用AI直接解决问题，而是用AI来发现解决问题的工具（算法）。

这项工作的意义不仅在于推进了几个具体的数学下界，更在于它验证了“元搜索”范式的有效性。从打破矩阵乘法纪录，到优化数据中心调度和芯片设计，再到此次攻克组合数学难题，AlphaEvolve作为一个“发现算法的算法”，其通用性和威力正在多个领域显现。

当然，当前方法仍有局限。它专注于通过构造反例来推高“下界”，而拉姆齐数的“上界”证明需要完全不同的、逻辑严密的数学论证，这超出了当前系统基于搜索和构造的能力范围。

然而，在其擅长的道路上，AlphaEvolve已经证明了自己可以超越人类直觉，自主探索出新颖、高效甚至人类未曾想到的算法策略。这标志着一个新的阶段：AI正从执行人类设定的规则，逐渐转变为参与甚至主导“规则”（即算法）的创造过程。

对于此类前沿的人工智能与算法研究动态，技术开发者与爱好者可以关注云栈社区的“开发者广场”等板块，获取更多深度资讯与讨论。

参考资料：

Demis Hassabis 推文：https://x.com/demishassabis/status/2032267485735460867
Pushmeet Kohli 推文：https://x.com/pushmeet/status/2031727892346941499
研究论文：https://arxiv.org/pdf/2603.09172
Aakash Gupta 推文：https://x.com/aakashgupta/status/2032326637577257345

上一篇：KAN 2.0论文详解：超越黑箱，如何用可解释神经网络驱动科学发现？
下一篇：国产开源工作流EsFlow：零代码拖拽，8张表搞定企业审批流程

人工智能, AlphaEvolve, 大语言模型, 拉姆齐数, 算法设计