数学家如何应对AI时代的机遇和挑战

▲ 在AI时代，随着越来越多的数学问题能被AI解决，数学研究正在由证明稀缺状态快速走向一个证明丰裕的时代。（视觉中国 / 图）

全文共 5464字，阅读大约需要 10分钟

观察睿智而理性的数学家如何因应AI时代的机遇和挑战，也许有助于对更宏大、更遥远的整个人类的未来作出更好的评估。

本文首发于南方周末未经授权不得转载

文 | 卢昌海

责任编辑 | 王江涛

AI时代的降临

最近几年，AI几乎成了持续不断的热门话题。

之前的AI也屡屡有过高光时刻：比如IBM的AI系统“深蓝”于1997年击败国际象棋世界冠军卡斯帕罗夫，“华生”于2011年夺得电视智力竞赛《Jeopardy！》的冠军；比如深思公司的AI系统“阿尔法围棋”于2016年击败人类顶尖围棋手李世石，“阿尔法折叠”自2020年起在研究蛋白质三维结构的效率上屡创新高，远远超越了人类研究者……

但就影响的深远而言，那些都远远及不上2022年以ChatGPT为代表的基于所谓大语言模型的新兴AI系统的崛起。跟这种新兴AI系统相比，之前的AI系统虽也攻克了一个个曾经专属于人类的智力堡垒，但用途大都局限于规则相对森严的专门领域，普罗大众则多怀着吃瓜般的轻松，旁观事态之发展；而以ChatGPT为代表的新兴AI系统却是在规则松散、用途却极为广泛的语言领域惊艳登场，之后更是以极快的速度成片突入了几乎所有的人类智力领地，使长期只作为抽象概念存在的所谓通用人工智能忽然变得近在咫尺。相应地，大批吃瓜群众则猝不及防地遭遇了AI兵临城下的职业危机，由观众变成演员，被迫出演了AI的对手戏——至于剧本，想想卡斯帕罗夫和李世石就知道了。

在迄今为止的AI发展史上，没有任何时期比最近这几年更能凸显AI时代的降临，真正的“山雨欲来风满楼”。

伴随着这种发展，有关AI的书也如雨后春笋般涌现出来。然而人类作者了解AI的速度，往往已赶不上AI的发展速度，使许多书的问世过程直接变成落伍过程，几乎一出版就已被前沿抛离。这种情况下，反倒是“碎片化”的社交媒体显出了独特优势——因为更实时地记录下了人类面对AI时代的思考。

AI进军数学世界

本文就以几位数学家的这种“碎片化”思考为线索，来议论一下AI时代的一个小小侧面：数学研究。

ChatGPT问世之初，其数学能力是相对引人注目的短板。从机制上讲，这并不奇怪，因为作为其核心的大语言模型解决问题的基本思路，是从基于人类数据的反复训练中推衍出最契合人类模式的答案。因此，大语言模型回答一个问题时，它实际回答的是：对这个问题，最契合人类模式的答案是什么？由于这一特点，大语言模型没有回答不了的问题——哪怕宣称“不知道”，也只是因为它们“知道”最契合人类模式的答案是“不知道”。大语言模型所属的人工智能有一个“学名”叫作生成式人工智能，它很贴切地道出了大语言模型只是“生成”答案，而非进行创造或思考。大语言模型的这一特点“生成”了无数似是而非的东西，或所谓“一本正经地胡说八道”，被称为AI泔水。在语言、艺术、社会、历史之类的领域里，它们常被领域固有的模糊性所遮盖，但在严密而精确的数学领域里，则不易遁形——故而成为短板。

但这个短板在短短一两年间就得到了大幅消解。许多人注意到，随着大语言模型的演进，它的数学能力似乎成为了一种超越原初设计而自发产生的所谓“涌现行为”。这种在自然界很多复杂现象——包括生命——之中扮演着微妙角色的“涌现行为”具体是如何产生的，目前并不清楚，但作为表象的AI数学能力的突飞猛进，则已是不争的事实。

在这样的背景之下，一些勇于弄潮的数学家开始率先在数学研究中运用AI，并取得了不容小觑的成果。比如从著名匈牙利数学家埃尔德什的研究中衍生出的所谓埃尔德什问题集，最近就成为了在数学研究中运用AI的“练兵场”，成果则是：在这一问题集所包含的上千个数学问题（其中半数以上尚未解决）中，以往几乎任何时候都只有一两个处于活跃状态，即被标记为取得显著进展等候核验，随着AI的运用，这数目一举跃升到了二十个左右。其中，最引起轰动的是编号为1196的埃尔德什问题。这个数十年悬而未决的问题于今年四月份被GPT-5.4Pro只花费短短80分钟就给出了解决方法，并通过了核验。研究该问题已有数年之久的美国斯坦福大学的数学家利希特曼于2026年4月15日在社交媒体上发文表示，AI的解决方法新颖而聪明，称得上是“来自天书的证明”——那是埃尔德什本人关于优美数学证明的最高标准。

在数学研究中运用AI的这些新近例子跟早期的计算机辅助研究有一个巨大差异，那就是早期的计算机辅助研究往往是用计算机做一些跟人类数学家互补的事情——比如人类数学家做不了的复杂计算或核验，本质上是人类动脑子、计算机卖力气，分工明确、主次鲜明。一个最典型的例子是完成于1976年的四色定理的证明，那是在人类数学家将证明归结为对数以千计的复杂地图的核验之后，用计算机完成了核验。与之相比，在数学研究中运用AI的新近例子则完全模糊了人类与计算机的界限，AI往往会直接进入传统上属于人类数学家的领地，甚至给出人类数学家没能想到的思路。AI涌现出的这种能力及其所代表的趋势是颇让一些人不安的。

陶哲轩的比喻

在数学研究中率先运用AI的那些弄潮儿之中，最积极、最著名的一位也许是2006年菲尔兹奖得主陶哲轩。

陶哲轩不仅对在数学研究中运用AI持相对积极的态度，而且对AI时代的数学研究进行了许多思考。在3月18日发表于社交媒体的一则文字中，他将AI在数学中的运用类比为汽车对出行的作用。他认为，正如汽车的兴起只是拓展了城市规模及出行范围，而不等于人们不再步行，AI在数学中的运用也将只会拓展数学的疆域，而并不意味着数学家将无事可做；他还认为，正如一个好的城市规范可以让城市既拥有汽车又适合步行，我们也可以通过某种规划使AI与数学家和谐共存。

陶哲轩的上述类比对AI时代的数学研究是持乐观态度的，甚至很有几分浪漫憧憬——毕竟，谁不想生活在一个既拥有汽车又适合步行的城市里呢？不过细究起来，在数学研究中运用AI，跟汽车对出行的作用相比，似乎有一个不适用于上述类比的本质差异。以跟多数人关系最密切的家与办公室之间的日常出行为例，那样的出行只是生活或工作的“前奏”，而且是一个不得不重复的“前奏”，生活或工作的主体是在抵达目的地之后才展开的，由汽车完成那样的出行，带来的只是便利，而并不取代生活或工作的主体；但对数学来说，任何东西一经证明就永远成立，不存在不得不重复的“前奏”，而若是尚未证明的东西，哪怕是对应于“家与办公室之间的日常出行”那样的简单东西，其证明也依然是对数学实实在在的贡献，是数学工作的一部分。由AI帮助完成就等于取代了数学家的这部分工作，虽然并不意味着他们将无事可做，但数学家跟AI的关系显然远比行人与汽车的关系更有竞争意味。

高尔斯的例子

关于这种竞争，1998年菲尔兹奖得主高尔斯在5月8日发表于社交媒体的一篇文章里，给出了一个很好的例子。

高尔斯说他最近用GPT-5.5Pro，只花费不到两小时的运算时间，就对一项新近的组合学研究作出了改进。这项改进虽算不上一流工作，却足可作为数学博士论文的一个章节。高尔斯由此感慨道，为博士生提供既能产出原创贡献又难度适中的课题本就不易，在AI时代变得更难了——因为一旦AI能解决一个课题，那课题就不再适合博士生了。对数学作出原创贡献的门槛原本是相对于人类数学家的，如今被提升为了超越AI。高尔斯针对这种AI带来的门槛提升的唯一安慰是：组合学问题也许是最能展示大语言模型优势的——言下之意，这种门槛提升对组合学研究最为显著，其他数学分支则或许尚有缓冲时间。不过，AI的发展如此之快，任何安慰都很可能是极其暂时的，高尔斯自己也承认，对如今刚刚开始念博士的学生来说，当他们毕业时，从事数学研究的含义或许已变得面目全非了。

从某种意义上讲，高尔斯的文章跟陶哲轩的前述文字有一定的互补性：AI在数学中的运用对陶哲轩这种层级的数学家来说也许不算什么，甚至只相当于替他证明了一系列引理，让他有像乘汽车那样的舒适，但对入门层级的数学家及正在入门途中的博士生来说，带来的也许只是激烈乃至残酷的竞争。

而如果将眼光放远些，则即便对陶哲轩这种层级的数学家来说，乘汽车那样的舒适能持续多久？会不会逐渐甚至很快步上卡斯帕罗夫和李世石的后尘？恐怕也并非杞人忧天的问题。比之更进一步的AI时代的数学研究将会走向何方？应该走向何方？则更是所有数学家共同关注的问题。陶哲轩在四五月份发表于社交媒体的若干文字及同期的讲演中，针对后者作出了一些猜测和提议，在一定程度上可视为对先前提到的通过某种规划使AI与数学家和谐共存的展开说明。

陶哲轩认为，数学研究长期以来处于一种证明稀缺状态，相应地，为数学问题提供证明成为了数学研究的核心目标，数学评价体系里的注重证明优先权之类也都是围绕这一核心目标而形成的。但在AI时代，随着越来越多的数学问题能被AI解决，数学研究正在由证明稀缺状态快速走向一个证明丰裕的时代。面对这样的时代，数学评价体系应该作出相应的调整。

AI时代的数学研究

具体地说，陶哲轩认为数学家的主要工作可大致分为三个类别：1.提供证明；2.核验证明；3.消化证明。

在传统的数学研究中，这三个类别都有相当难度，也都很花费时间。而且传统的数学研究还有一个特点，那就是提供证明的数学家必然会在很多层面上核验证明，而他们对证明的理解也往往最为深入——消化证明因此变得不言而喻。由于这个特点，传统的数学评价体系素来看重提供证明与核验证明，对不言而喻的消化证明则持相对轻忽的态度。但AI时代的数学研究出现了完全不同的格局：提供证明已越来越可能由AI独立完成，核验证明也已有AI工具可以辅助，反倒是传统上因不言而喻而遭轻忽的消化证明成了留给人类数学家的紧迫任务——因为由AI提供的数学证明，多数都尚未得到充分消化，所以也未对数学发展产生与数量相称的推动——用陶哲轩的话说，“也许出人意料地，在提供证明上的这种大幅提速实际上并未对数学发展本身产生重大促进”。

有鉴于此，陶哲轩提议，在证明丰裕的AI时代，我们应显著提升消化证明在数学评价体系中的分量，使之与另两个类别“鼎足而立”。他还将这一提议“数字化”，主张将单纯提供证明只视为解决数学问题的1/3贡献，将完成核验的证明也只视为2/3的贡献，而将最后1/3的贡献归于消化证明，以激励数学家们花费更多时间来理解AI提供的数学证明。因为一个数学证明只有得到理解，才能转化为人类自己的数学洞察——这在传统的数学研究中是极普通的事情，在证明丰裕的AI时代却几乎要成为危机了。未来若有越来越多由AI提供证明的数学命题被人类不加消化地运用，则数学将会越来越变成死记硬背的学科，人类的数学洞察则会有退化之虞。陶哲轩对这一提议也给出了一个类比，将之比喻为：在食物稀缺的年代，找到任何食材都是贡献，但到了食物丰裕的时代，单纯找到食材已不算什么，甚至未必还会受欢迎，因为人们已转而期待经过良好烹饪的食物。

我对陶哲轩的上述提议是很赞赏的，它不仅合理，而且对有志于数学科普的人来说是很鼓舞人心的，因为消化证明这件事情不仅数学家能做，数学科普尤其专业科普亦是大有可为。使这件事情跟提供证明与核验证明“鼎足而立”，无形中提升了数学科普的地位。

当然，“三分天下”已插足其二的AI未必就不能在消化证明上有所作为，但人类对某些东西或许是会有同类偏好的，就比如一篇小说，是出自可以与之共鸣共情的人类作者还是AI，对多数人类读者来说是截然不同的。更何况，有些事情是必须由人类亲自去做的——就好比食物的消化必须用人类自己的肠胃来做，才能吸收为人类自己的营养，机器是无法代劳的。因此，消化证明也许确实会如陶哲轩所提议的，成为AI时代数学研究的重要方面，甚至，在未来数学评价体系中的占比高于陶哲轩提议的1/3也是不无可能的。

除了像陶哲轩那样的个人思考外，数学家们对AI时代的数学研究也正在进行着集体讨论。如果说陶哲轩的思考侧重于AI时代的数学研究应鼓励哪些东西，那么数学家们的集体讨论则似乎更侧重于或起码同等侧重于AI时代的数学研究应规范哪些方面。毕竟，规范乃是一种集体准则，理应成为集体讨论的议题，何况在数学研究中运用AI得到的并非都是成果，而是也包含了用AI炮制出的垃圾论文之类，后者必须通过适当的规范予以遏止。那样的集体讨论虽远未完成——且在未来很长时间里都理应处于修订而非完成状态，却已酝酿出一些阶段性的措施和倡议。

比如为遏止用AI炮制出的垃圾论文，一些学术预印本网站及学术刊物已出台措施，对用AI炮制垃圾论文的作者施以封禁一段时间的处罚。比如6月2日，国际数学联盟支持发布了一份被称为“人工智能及数学莱顿宣言”的文件，针对AI时代的数学研究提出了一系列倡议，其中包括：数学证明必须公开透明，对AI的运用必须明确列出；人类作者继续享有论文的署名权，但同时也必须对论文负全责（因此出了问题不能甩锅给AI）；数学家有责任对数学新闻给予支持，并向公众解释运用AI得到的数学成果（跟陶哲轩提议的消化证明颇有些异曲同工）；等等。

尽管有了上述种种思考和讨论，AI时代的数学研究无疑仍处在刚刚起步的阶段，所面临的机遇和挑战在深度和广度上都尚待观察。从历史的视角看，人类经历的每一次技术革命都对社会形态带来过变更，替代掉某些工作，同时也创造出新的工作。如果说AI时代有什么特殊性的话，也许是在极短的时间内涵盖了极广的领域，比以往任何一次技术革命都更让人猝不及防。以往的技术革命发生时，人们也许会问：什么工作会被替代？而在AI时代，面对通用人工智能的降临，那问题变成了：什么工作不会被替代？一项技术、一场革命、一个时代，如果在短时间内冲击太多人的生活，那么哪怕远景值得憧憬，如何度过当下依然是巨大悬念。

AI时代的数学研究只是上述大背景下AI时代的一个缩影。但数学家无疑是人类最精英的群体之一，观察这样一群睿智而理性的人如何因应AI时代的机遇和挑战，也许有助于对更宏大、更遥远的整个人类的未来作出更好的评估，这是这一话题超越学科的价值之所在。

其他人都在看