人工智能(AI)再破紀錄,這一次,它挑戰的是奧數金牌!
谷歌DeepMind最新發布的幾何推理模型AlphaGeometry,成功回答了國際數學奧林匹克競賽(IMO)30個幾何問題中的25個,這一成就接近于人類奧數金牌選手的水平。昨天,隨著相關研究成果登上《自然》雜志,再次引發學術界的熱議與討論。
除了AI在數學領域表現出來的巨大潛力,一些業內人士指出,這項成果實際上代表著,AI再度向人類的推理能力邁進了一大步。在很短的時間里,這些開創性的工作正推動AI以驚人的速度迭代。
“AI的推理和建模能力已達到了一個新高度,其進化的速度比我們想象的快得多。”上海交通大學智能計算研究院院長葛冬冬教授在接受本報記者采訪時如是說。
AI在數學推理方面,取得開創性進展
在AlphaGeometry問世之前,AI的推理能力一直“不太行”,也難以解決幾何和數學方面的復雜問題。
但現在,AlphaGeometry展示了AI最新具備的邏輯推理能力,以及發現和驗證新知識的能力。在對30道奧數幾何題的基準測試中,AlphaGeometry在標準奧數時限內解決了25道——與人類奧數金牌得主平均解決25.9個問題的水平不相上下。和之前最先進的AI系統解決其中10個幾何問題的表現相比,AlphaGeometry可謂實現了史詩級升級。
在解決幾何問題方面,該模型幾乎趕上了最聰明的人類。一位IMO金牌得主受邀作為評審,連連稱贊AlphaGeometry的輸出結果不僅可以經得起驗證,而且表述清晰。不僅如此,在回答奧數真題時,AlphaGeometry還發現了2004年國際數學奧林匹克競賽定理的一個新版本。
在業界,具備更強的定理證明能力,一直是AI研究的焦點。比如,對于大模型來說,學習定理證明很困難。要知道,OpenAI去年發布的GPT-4,可是連一道奧數題都做不出來!
“可以說,AI在數學推理方面取得了開創性進展。”如今任教于高校的葛冬冬,在學生時代也曾是一位奧數選手。他直言,雖然AlphaGeometry表現搶眼,但也要看到其局限性。因為IMO的賽題通常有六道,分為好幾種類型,此次的新模型專注于解決幾何類賽題,范圍相對狹窄。“但可以預見,類似AlphaGeometry的能力,應該在很短的時間里就可以覆蓋到更多數學領域,比如數論、方程等等。”
正如DeepMind研究人員所說的那樣,未來更大的挑戰在于,AI是否能發現新的數學方法,解決迄今的未解之謎。AI的下一個目標就是:創建能夠處理超越人類思維的數學問題的人工智能系統。
解決復雜問題,AI有機會取得更大進展
更大的影響,在數學之外。就在上個月,DeepMind還提出了一種名為FunSearch的新方法,首次利用大型語言模型在數學領域未解之謎及更多科學的挑戰性問題上取得新發現。相關成果同樣發表于《自然》。日前,DeepMind聯合創始人兼首席AGI科學家謝恩·萊格明確表示,“離通用人工智能(AGI),越來越近了。”
復旦大學特聘教授林偉昨天接受本報記者采訪時指出,谷歌Deepmind團隊專注于一個垂直領域,生成了專業的、大規模的數據集。從目前AI的進展來看,精耕于某一領域,做好數據集標記和大規模專業數據收集測試,同時發展構建精調模型架構與參數,是通向AGI的關鍵之徑。他認為,對于復雜問題的解決,AI有機會取得更大的進展。但實現的前提是,需要具備專業的數據、好的計算模型架構以及可計算的應用場景。
讓人難忘的是,過去一年里,全球多個AI大模型各展所長,已然在應用領域掀起巨大變革。以GPT-4為例。通過適當的引導和訓練,GPT-4可以根據不同制造業企業提出的小眾需求,通過建立復雜的數學模型,幫助解決實際生產問題。
“在復雜建模、推理和設計能力方面,AI正在以前所未有的速度提升。”葛冬冬評論說,不僅GPT-4表現不俗,在建模等不少方面的能力甚至達到了人類研究生的水平,如今AI解決實際問題的能力,無論是廣度還是深度,都出現了一個飛躍。“無論是現實領域的諸多復雜問題,還是長期存在且目前無解的科學難題,AI都開始逐步學習、理解,并進行復雜建模。”包括葛冬冬在內,不少業界人士給出預判:接下來,大模型的迭代和進化,一定會達到更令人不可思議的程度。
(原標題:AI幾何能力接近人類奧數金牌選手,谷歌DeepMind研究成果登上《自然》 AI進化速度“比想象的快得多”)
本文鏈接:谷歌研究登《自然》:AI幾何能力接近人類奧數金牌選手http://www.lensthegame.com/show-11-2180-0.html
聲明:本網站為非營利性網站,本網頁內容由互聯網博主自發貢獻,不代表本站觀點,本站不承擔任何法律責任。天上不會到餡餅,請大家謹防詐騙!若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。
上一篇: 1萬年前“口香糖”揭示古人糟糕的口腔健康
下一篇: 一萬年前“口香糖”揭示糟糕口腔健康