“Shock! Shock!”
这不是哪部惊悚电影的台词,这是计算机科学泰斗高德纳(Donald Knuth)在给同行的一封信里亲口说的。
如果你对高德纳感到陌生,那么那套被誉为“程序员圣经”的《计算机程序设计艺术》正是出自他手。这位图灵奖得主、算法界的宗师级人物,竟用了“震惊”一词来形容自己的感受,这本身就非同寻常。
事情的原委是这样的:高德纳花费了数周时间研究一个数学猜想,并准备将它作为习题写进新书里。就在这个当口,他的朋友告诉他,这个难题已经被人工智能解决了。
而这个解题的 AI,正是 Anthropic 旗下的 Claude Opus 4.6。这件事的戏剧性,就好比你潜心钻研剑法十年,出山时却遇到了一个手持现代枪械的孩子。
大神遇上“拦路虎”
高德纳这次遇到的,是一个关于“有向哈密顿圈”分解的硬骨头问题。别被术语吓退,我们可以将其简单地理解为:在一个复杂的网络中,能否找到几条路径,不重复也不遗漏地访问所有的节点?
他在撰写《计算机程序设计艺术》的新章节时,顺手解决了当 m=3 的情况。但他认为这还不够,应该存在一个普适的解法,适用于所有大于 2 的整数 m。于是,他把这个更广泛的难题交给了朋友 Filip Stappers。
Filip 也很实在,没有选择自己硬啃,而是转头就把题目抛给了 Claude。如果在几年前,将这种级别的数学猜想交给 AI,无异于对牛弹琴。但如今,故事的剧本已经悄然改变。
Claude 的 31 次“头脑风暴”
有趣的是,Claude 并非那种“灵光乍现”的天才型选手,它更像是一位极其勤奋、但偶尔也会犯迷糊的研究员。
根据高德纳在信中所附的日志记录,Claude 为了攻克这个难题,前后总共进行了 31 次“探索”(Exploration)。
一开始,它也是个“愣头青”。它先尝试了简单的线性函数,发现行不通;接着又想进行暴力搜索,但面对 的庞大搜索空间,计算直接陷入了停滞。
这时,它开始展现出一些“智能”的迹象。它识别出这个图在数学上属于“凯莱有向图”(Cayley Digraph),并构思出一种“蛇形模式”(Serpentine Pattern)的解法思路。虽然中间走了不少弯路,甚至一度陷入死胡同,但在第 31 次探索时,Claude 终于交出了它的答卷。
它编写出了一个 Python 程序,这个程序不仅解决了 m=3 的情况,还一并将 m=5, 7, 9, 11… 等所有奇数情况都求解了出来。Filip 进行了测试,从 3 到 101 的所有奇数 m,结果全部正确。
高德纳在信中这样写道:“What a joy...”(多么令人快乐…)。
硬币的另一面
读到这里,你或许会觉得 AI 已经无所不能了?先别急着下结论。
虽然 Claude 漂亮地解决了奇数 m 的情况,但在面对偶数 m 的同类问题时,它却彻底“卡壳”了。
Filip 让它继续攻克偶数 m 的难题。结果,Claude 的表现判若两人,它不仅没能给出解法,甚至连运行测试程序都开始报错,最终完全陷入停滞。Filip 只能无奈地终止了搜索。
所以,现阶段的 AI 远非全知全能的神明,它更像是一个偏科的天才:有时能给出惊艳绝伦的答案,有时又会在一些看似简单的问题上“翻车”。
而且,这次的成功也不能完全归功于 Claude。在整个过程中,Filip 这位“教练”的引导和调教至关重要。他不仅负责提出问题,还需要在 Claude 思路跑偏时将其拉回正轨,甚至强制要求它记录每一步的思考过程。如果没有 Filip 这个“扶手”,Claude 很可能还在盲目地兜圈子。这正体现了当前 AI 工具与人类专家协同工作的典型模式。
大师的胸襟
尽管偶数问题依然成谜,尽管 Claude 的发挥离不开人类的从旁辅助,高德纳仍然对此给出了极高的评价。
他说:“看来我得修正一下我对‘生成式 AI’的看法了。”
要知道,高德纳此前对 AI 一直持相对保守的态度。就在不久之前,他还与 Wolfram 进行过一场辩论,强调应把精力放在“真实可信”的概念上。但这一次,他实实在在地被“上了一课”,并且欣然接受了这个结果。
他在信的最后写道:“Hats off to Claude!”(向 Claude 脱帽致敬!)
这才是真正大师的风范。在这个技术狂飙突进的时代,坦然承认并欣赏机器在某些方面超越人类,并非丢人之事。毕竟,能够灵活运用新工具来拓展人类认知的边界,这本身也是一种更高维度的智慧。
至于偶数 m 的解法?这个有趣的谜题,就留给下一位人类研究者,或者下一代更强大的 AI 去完成了。
参考链接: https://www-cs-faculty.stanford.edu/~knuth/papers/claude-cycles.pdf
你对这种 AI 辅助解决复杂数学问题的案例怎么看?是觉得它预示着通用人工智能的曙光,还是认为它仅仅是人类智慧延伸出的高效工具?欢迎在 云栈社区 的开发者广场分享你的见解,与其他技术爱好者一起探讨前沿科技的无限可能。