当前位置:首页 > 热点

人工智能成功挑战奥数难题

据美国《纽约时报》网站1月17日报道,人工在4年时间里,成功计算机科学家郑潮(音)一直被某件类似于元数学问题的挑战任务弄得心神不宁:如何构建一个可以解答国际数学奥林匹克竞赛中的几何题的人工智能模型。国际奥数竞赛是奥数一年一度全世界最有数学才能的高中生的比赛。

上周,难题郑潮在纽约大学成功地进行了自己有关该课题的人工博士学位论文答辩。他在学术期刊《自然》杂志上介绍了自己辛苦研究的成功成果。这个名为“阿尔法几何”(AlphaGeometry)的挑战系统能够以接近于人类金牌得主的水准解答奥数竞赛中的几何题。

在开发该项目的奥数过程中,郑潮向谷歌公司的难题两位研究科学家进行了推介,他们举荐他在2021年至2023年间担任了谷歌公司常驻科学家。人工“阿尔法几何”系统加入了谷歌旗下“深层思维”公司的成功人工智能系统群体,该群体已经因为解决重大挑战而被人熟知。挑战其中最著名的奥数也许是2017年征服了国际象棋的深度学习算法“阿尔法零”。数学是难题一类更加困难的问题,因为通往答案的可能路径的数目有时是无限的,而国际象棋的套路总是有限的。

论文第一作者、该项目的主要推手郑潮说:“走在错误的道路上,我曾不断地进入死胡同。”

论文的联合作者包括:郑潮在纽约大学的博士生导师何河、被称为“托尼”的xAI公司联合创始人吴宇怀,以及来自谷歌的主要研究者梁胜(音)和同样来自谷歌的黎国(音)。吴宇怀以前也在谷歌工作,他曾在2019年独立地开始探索一种类似的设想。

郑潮的坚持有了收获。他说:“我们谈不上是循序渐进。我们是在一步登天,即在结果方面取得了重大突破。”“只是不要过分夸大这一点。”

郑潮从2000年至2022年的国际奥数竞赛试卷中抽取30道几何题组成一套试卷,对“阿尔法几何”系统进行测试。该系统解出了25道题;在奥数竞赛史上,同时期的人类金牌得主平均解出25.9道题。郑潮还把这些题目交给上世纪70年代开发出的一个曾被认为是最强几何定理证明器的系统;它解出了10道题。

在过去几年里,谷歌“深层思维”公司开展了若干探索人工智能的数学应用的项目。而在这个研究领域中,更为普遍的做法是把奥数竞赛题作为一种基准:OpenAI和元宇宙AI公司已经取得了一些成果。作为额外要求,还有“国际奥数大挑战题”以及去年11月宣布的一项新挑战——“人工智能数学奥林匹克奖”,该奖项悬赏500万美元以征集第一个可以赢得奥数竞赛金牌的人工智能系统。

介绍“阿尔法几何”系统的论文开门见山提出了证明奥数定理“代表人类级自动推理技术的一个重要里程碑”的论点。

爱丁堡大学数学和科学史学家迈克尔·巴拉尼说,他想知道这是不是一个有意义的数学里程碑。他说:“国际奥数竞赛所考察的东西,与绝大多数数学家心目中的创造性数学是截然不同的。”

加利福尼亚大学洛杉矶分校数学家、12岁时成为史上最年少奥数金牌得主的陶哲轩说,他认为“阿尔法几何”系统“干得不错”,取得了“令人意想不到的厉害结果”。

他说,对某个人工智能系统进行微调以解答奥数题或许不会提升其深度研究技能,但在这个案例中,过程或许被证明比目标更有价值。

正如郑潮认为的,数学推理只是推理的一种类型,但它具有易验证的优势。他说,“数学是真理的语言。如果你想构建某种人工智能,重要的是构建你可以信赖的求真、可靠的人工智能”,尤其是对于“安全性至关重要的应用”。(编译/曹卫国)

分享到:

京ICP备19007577号-5