人工智能(AI)再破紀(jì)錄,這一次,它挑戰(zhàn)的是奧數(shù)金牌!
谷歌DeepMind最新發(fā)布的幾何推理模型AlphaGeometry,成功回答了國際數(shù)學(xué)奧林匹克競賽(IMO)30個(gè)幾何問題中的25個(gè),這一成就接近于人類奧數(shù)金牌選手的水平。昨天,隨著相關(guān)研究成果登上《自然》雜志,再次引發(fā)學(xué)術(shù)界的熱議與討論。
除了AI在數(shù)學(xué)領(lǐng)域表現(xiàn)出來的巨大潛力,一些業(yè)內(nèi)人士指出,這項(xiàng)成果實(shí)際上代表著,AI再度向人類的推理能力邁進(jìn)了一大步。在很短的時(shí)間里,這些開創(chuàng)性的工作正推動(dòng)AI以驚人的速度迭代。
“AI的推理和建模能力已達(dá)到了一個(gè)新高度,其進(jìn)化的速度比我們想象的快得多。”上海交通大學(xué)智能計(jì)算研究院院長葛冬冬教授在接受本報(bào)記者采訪時(shí)如是說。
AI在數(shù)學(xué)推理方面,取得開創(chuàng)性進(jìn)展
在AlphaGeometry問世之前,AI的推理能力一直“不太行”,也難以解決幾何和數(shù)學(xué)方面的復(fù)雜問題。
但現(xiàn)在,AlphaGeometry展示了AI最新具備的邏輯推理能力,以及發(fā)現(xiàn)和驗(yàn)證新知識(shí)的能力。在對30道奧數(shù)幾何題的基準(zhǔn)測試中,AlphaGeometry在標(biāo)準(zhǔn)奧數(shù)時(shí)限內(nèi)解決了25道——與人類奧數(shù)金牌得主平均解決25.9個(gè)問題的水平不相上下。和之前最先進(jìn)的AI系統(tǒng)解決其中10個(gè)幾何問題的表現(xiàn)相比,AlphaGeometry可謂實(shí)現(xiàn)了史詩級(jí)升級(jí)。
在解決幾何問題方面,該模型幾乎趕上了最聰明的人類。一位IMO金牌得主受邀作為評(píng)審,連連稱贊AlphaGeometry的輸出結(jié)果不僅可以經(jīng)得起驗(yàn)證,而且表述清晰。不僅如此,在回答奧數(shù)真題時(shí),AlphaGeometry還發(fā)現(xiàn)了2004年國際數(shù)學(xué)奧林匹克競賽定理的一個(gè)新版本。
在業(yè)界,具備更強(qiáng)的定理證明能力,一直是AI研究的焦點(diǎn)。比如,對于大模型來說,學(xué)習(xí)定理證明很困難。要知道,OpenAI去年發(fā)布的GPT-4,可是連一道奧數(shù)題都做不出來!
“可以說,AI在數(shù)學(xué)推理方面取得了開創(chuàng)性進(jìn)展。”如今任教于高校的葛冬冬,在學(xué)生時(shí)代也曾是一位奧數(shù)選手。他直言,雖然AlphaGeometry表現(xiàn)搶眼,但也要看到其局限性。因?yàn)镮MO的賽題通常有六道,分為好幾種類型,此次的新模型專注于解決幾何類賽題,范圍相對狹窄。“但可以預(yù)見,類似AlphaGeometry的能力,應(yīng)該在很短的時(shí)間里就可以覆蓋到更多數(shù)學(xué)領(lǐng)域,比如數(shù)論、方程等等。”
正如DeepMind研究人員所說的那樣,未來更大的挑戰(zhàn)在于,AI是否能發(fā)現(xiàn)新的數(shù)學(xué)方法,解決迄今的未解之謎。AI的下一個(gè)目標(biāo)就是:創(chuàng)建能夠處理超越人類思維的數(shù)學(xué)問題的人工智能系統(tǒng)。
解決復(fù)雜問題,AI有機(jī)會(huì)取得更大進(jìn)展
更大的影響,在數(shù)學(xué)之外。就在上個(gè)月,DeepMind還提出了一種名為FunSearch的新方法,首次利用大型語言模型在數(shù)學(xué)領(lǐng)域未解之謎及更多科學(xué)的挑戰(zhàn)性問題上取得新發(fā)現(xiàn)。相關(guān)成果同樣發(fā)表于《自然》。日前,DeepMind聯(lián)合創(chuàng)始人兼首席AGI科學(xué)家謝恩·萊格明確表示,“離通用人工智能(AGI),越來越近了。”
復(fù)旦大學(xué)特聘教授林偉昨天接受本報(bào)記者采訪時(shí)指出,谷歌Deepmind團(tuán)隊(duì)專注于一個(gè)垂直領(lǐng)域,生成了專業(yè)的、大規(guī)模的數(shù)據(jù)集。從目前AI的進(jìn)展來看,精耕于某一領(lǐng)域,做好數(shù)據(jù)集標(biāo)記和大規(guī)模專業(yè)數(shù)據(jù)收集測試,同時(shí)發(fā)展構(gòu)建精調(diào)模型架構(gòu)與參數(shù),是通向AGI的關(guān)鍵之徑。他認(rèn)為,對于復(fù)雜問題的解決,AI有機(jī)會(huì)取得更大的進(jìn)展。但實(shí)現(xiàn)的前提是,需要具備專業(yè)的數(shù)據(jù)、好的計(jì)算模型架構(gòu)以及可計(jì)算的應(yīng)用場景。
讓人難忘的是,過去一年里,全球多個(gè)AI大模型各展所長,已然在應(yīng)用領(lǐng)域掀起巨大變革。以GPT-4為例。通過適當(dāng)?shù)囊龑?dǎo)和訓(xùn)練,GPT-4可以根據(jù)不同制造業(yè)企業(yè)提出的小眾需求,通過建立復(fù)雜的數(shù)學(xué)模型,幫助解決實(shí)際生產(chǎn)問題。
“在復(fù)雜建模、推理和設(shè)計(jì)能力方面,AI正在以前所未有的速度提升。”葛冬冬評(píng)論說,不僅GPT-4表現(xiàn)不俗,在建模等不少方面的能力甚至達(dá)到了人類研究生的水平,如今AI解決實(shí)際問題的能力,無論是廣度還是深度,都出現(xiàn)了一個(gè)飛躍。“無論是現(xiàn)實(shí)領(lǐng)域的諸多復(fù)雜問題,還是長期存在且目前無解的科學(xué)難題,AI都開始逐步學(xué)習(xí)、理解,并進(jìn)行復(fù)雜建模。”包括葛冬冬在內(nèi),不少業(yè)界人士給出預(yù)判:接下來,大模型的迭代和進(jìn)化,一定會(huì)達(dá)到更令人不可思議的程度。
(原標(biāo)題:AI幾何能力接近人類奧數(shù)金牌選手,谷歌DeepMind研究成果登上《自然》 AI進(jìn)化速度“比想象的快得多”)
本文鏈接:谷歌研究登《自然》:AI幾何能力接近人類奧數(shù)金牌選手http://www.lensthegame.com/show-11-2180-0.html
聲明:本網(wǎng)站為非營利性網(wǎng)站,本網(wǎng)頁內(nèi)容由互聯(lián)網(wǎng)博主自發(fā)貢獻(xiàn),不代表本站觀點(diǎn),本站不承擔(dān)任何法律責(zé)任。天上不會(huì)到餡餅,請大家謹(jǐn)防詐騙!若有侵權(quán)等問題請及時(shí)與本網(wǎng)聯(lián)系,我們將在第一時(shí)間刪除處理。
上一篇: 1萬年前“口香糖”揭示古人糟糕的口腔健康
下一篇: 一萬年前“口香糖”揭示糟糕口腔健康