我们正在进入数学的未知领域
2024-10-05 13:23

我们正在进入数学的未知领域

加州大学洛杉矶分校的数学教授特伦斯·陶(Terence Tao)是一个现实生活中的超级智能。他有时被称为“数学界的莫扎特”,被广泛认为是世界上最伟大的在世数学家。由于他的进步和证明,他获得了许多奖项,包括相当于诺贝尔数学奖的奖项。现在,人工智能远不及他的水平。

但科技公司正在努力实现这一目标。最近几代引人注目的人工智能,甚至是全能的chatgpt,都不是为处理数学推理而设计的。相反,他们关注的是语言:当你让这样一个程序回答一个基本问题时,它不会理解和执行一个方程,也不会形成一个证明,而是根据可能依次出现的单词给出一个答案。例如,最初的ChatGPT不会加法或乘法,但已经看到了足够多的代数例子来解决x + 2 = 4:“为了解决方程x + 2 = 4,从两边减去2……”然而,现在,OpenAI明确地推广了一系列新的“推理模型”,这些模型被称为o1系列,因为它们能够“像人一样”解决问题,并处理复杂的数学和科学任务和查询。如果这些模型成功了,它们可能代表着陶和他的同事们缓慢而孤独的工作的巨大变化。

在我看到陶发表了他对01在线的印象之后——他把它比作一个“平庸,但并非完全不称职”的研究生——我想更多地了解他对这项技术潜力的看法。在上周的Zoom电话会议上,他描述了一种以前从未有过的人工智能支持的“工业规模数学”:在这种数学中,至少在不久的将来,人工智能本身并不是一个创造性的合作者,而是数学家假设和方法的润滑剂。这种新型的数学可以打开未知的知识领域,但它的核心仍将是人类,包括人类和机器的不同优势,它们应该被视为互补而不是竞争。

出于篇幅和清晰度考虑,本对话经过了编辑。


Matteo Wong:你第一次使用ChatGPT的体验是什么?

Terence Tao:它一出来我就开始玩了。我提出了一些困难的数学问题,它给出了相当愚蠢的结果。它是连贯的英语,它提到了正确的单词,但缺乏深度。任何真正先进的东西,早期的gpt都不令人印象深刻。它们很适合做有趣的事情——比如,如果你想用一首诗或一个孩子的故事来解释一些数学主题。这些都很令人印象深刻。

Wong: OpenAI说o1可以“推理”,但你把这个模型比作“一个平庸但不是完全不称职的”研究生。

陶:最初的措辞很火,但却被误解了。我并不是说这个工具在研究生学习的每一个方面都相当于一个研究生。我对使用这些工具作为研究助手很感兴趣。一个研究项目有很多繁琐的步骤:你可能有一个想法,你想充实计算,但你必须手工完成它,并把它全部计算出来。

黄:所以这是一个平庸或不称职的研究助理。

陶:对,就助理的作用而言,这是等价的。但我确实设想了一个未来,你可以通过与聊天机器人的对话来做研究。假设你有一个想法,聊天机器人就会按照你的想法去做,并填写所有的细节。

这已经在其他一些地区发生了。人工智能早在几年前就征服了国际象棋,但国际象棋在今天仍然蓬勃发展,因为现在一个相当优秀的国际象棋玩家可以推测在什么情况下什么棋是好的,他们可以使用国际象棋引擎提前检查20步棋。我可以预见这种事情最终会在数学中发生:你有一个项目,然后问:“如果我尝试这种方法会怎么样?”而不是花几个小时的时间让它工作,你引导GPT为你做这件事。

对于0,你可以这样做。我给它一个我知道如何解决的问题,我试图引导模型。首先,我给了它一个提示,它忽略了这个提示,做了一些别的事情,但没有成功。当我解释这一点时,它道歉说:“好吧,我照你说的做。”然后它很好地执行了我的指令,然后它又卡住了,我不得不再次修改它。模型从来没有想出最聪明的步骤。它可以做所有常规的事情,但它非常缺乏想象力。

研究生和人工智能的一个关键区别是研究生会学习。你告诉AI它的方法行不通,它会道歉,它可能会暂时纠正它的路线,但有时它只是迅速回到它之前尝试过的东西。如果你与AI开始一个新的会话,你就回到了起点。我对研究生更有耐心,因为我知道,即使一个研究生完全无法解决一个任务,他们也有学习和自我纠正的潜力。

Wong: OpenAI描述它的方式是,我可以识别自己的错误,但你说这与持续学习不同,持续学习实际上是让错误对人类有用的。

陶:是的,人类有生长。这些模型是静态的——我给GPT-4的反馈可能被用作GPT-5训练数据的0.00001%。但这和学生的情况不一样。

人工智能和人类在学习和解决问题的方式上有着如此不同的模式——我认为最好把人工智能看作是完成任务的一种补充方式。对于许多任务来说,让人工智能和人类一起做不同的事情将是最有前途的。

王:你之前也说过,计算机程序可能会改变数学,使人类更容易相互协作。所以如何?生成式人工智能在这里有什么贡献吗?

陶:从技术上讲,它们不属于人工智能,但证明助手是有用的计算机工具,可以检查数学论证是否正确。它们使数学领域的大规模合作成为可能。这是最近才出现的。

数学是非常脆弱的:如果证明中的一步是错的,整个论证就会崩溃。如果你和100个人一起做一个合作项目,你把你的证明分成100份,每个人贡献一份。但如果它们不能相互协调,这些碎片就可能无法正确匹配。正因为如此,一个项目很少有超过5个人参与。

有了证明助手,你不需要信任和你一起工作的人,因为这个程序给了你百分之百的保证。然后你可以做工厂生产式的、工业规模的数学计算,这在现在还不存在。一个人专注于证明某些类型的结果,比如现代供应链。

问题是这些程序非常繁琐。你必须用一种专门的语言来写你的论点——你不能只用英语来写。人工智能也许能够将人类语言翻译成程序。将一种语言翻译成另一种语言几乎正是设计大型语言模型的目的。我们的梦想是,你只需与聊天机器人进行对话,解释你的证明,聊天机器人会在你进行的过程中将其转换为证明系统语言。

王:所以聊天机器人不是知识或想法的来源,而是一种接口方式。

涛:是的,它可能是一种非常有用的胶水。

黄:这可能有助于解决哪些问题?

陶:数学的经典概念是,你选了一些非常难的问题,然后找一两个人把它锁在阁楼里,花上七年时间埋头苦干。你想用AI解决的问题类型正好相反。你使用人工智能的最幼稚的方式是把我们在数学中遇到的最困难的问题交给它。我不认为这会非常成功,而且,我们已经有人在研究这些问题了。

我最感兴趣的数学类型是不存在的数学。几天前我发起的这个项目是关于一个叫做通用代数的数学领域,它是关于某些数学命题或方程是否意味着其他命题为真。过去人们研究这个问题的方式是,他们选择一两个方程,然后研究到死,就像工匠过去是如何一次制作一个玩具,然后再制作下一个玩具一样。现在我们有工厂;我们一次可以生产成千上万的玩具。在我的项目中,有一个大约4000个方程的集合,任务是找到它们之间的联系。每个都相对简单,但却有无数的含义。大概有10个亮点,这数千个方程中有10个已经被研究得相当好,然后是整个未知领域。

还有其他领域也发生了这种转变,比如遗传学。过去,如果你想对一个生物体的基因组进行测序,这是一篇完整的博士论文。现在我们有了这些基因测序机器,遗传学家可以对整个种群进行测序。你可以用这种方式做不同类型的基因。你可以用广泛的、众包的问题来代替狭窄的、深奥的数学,即一个专家在狭窄的问题范围内非常努力地工作,这些问题可能是肤浅的,但规模要大得多。这可能是获得数学洞察力的一种非常补充的方式。

黄:这让我想起了谷歌Deepmind开发的一个名为AlphaFold的人工智能程序是如何预测蛋白质的三维结构的,在很长一段时间里,这是一件只能一次预测一种蛋白质的事情。

陶:对,但这并不意味着蛋白质科学已经过时了。你必须改变你研究的问题。150年前,数学家的主要用途是解偏微分方程。现在有一些计算机程序包可以自动完成这项工作。600年前,数学家们正在构建导航所需的正弦和余弦表,但现在计算机可以在几秒钟内生成这些表。

我对复制人类已经擅长的事情并不是很感兴趣。这似乎效率低下。我认为,在前沿领域,我们永远需要人类和人工智能。他们有互补的优势。人工智能非常擅长将数十亿条数据转化为一个好的答案。人类善于观察并做出真正有灵感的猜测。

本内容为作者翻译自英文材料或转自网络,不代表本站立场,未经允许不得转载
如对本稿件有异议或投诉,请联系本站
想要了解世界的人,都在 时光网

相关推荐