“太忙了。”這是清華大學人工智能(AI)國際治理研究院副院長梁正面對記者脫口而出的一句話。
去年11月30日,非營利性研究機構OpenAI推出AI聊天機器人ChatGPT,它所展現出的智能涌現能力在全球范圍內引發了一場AI“狂飆”,也在業界點燃了一場百模大戰。在記者詢問過的每一個和大模型相關的人中,“忙”是出現頻率最高的詞。
忙碌的景象不僅在國內,那些大洋彼岸原本早已習慣了“慢慢”打磨產品的AI專家們也進入了“滿負荷”狀態。“在谷歌、微軟或OpenAI的辦公室里,你能感受到他們的工作節奏至少比之前快了兩倍。”梁正說。
這一切都是因為以ChatGPT為代表的大語言模型向世人展露出了前所未有的能力,一條通往AGI(通用人工智能)的道路被打通,誰也不希望落于人后。
這一年,人工智能領域發生的事件比前十年加起來還要多。據不完全統計,目前國內的AI大模型已超過100個。除了百度、阿里等互聯網大廠,創新工場CEO李開復、美團創始人王興、搜狗創始人王小川等“科技老兵”紛紛重披戰甲進軍大模型領域。
這一年,大模型改變了公眾的關注點。據柯林斯詞典統計,今年人們提及“AI”的次數是去年的4倍。而有關AI是否會取代人類的擔憂,也比以往任何時候都緊迫而強烈。
前所未有的變革
“這是傾盆大雨前的一場雨,是一個分水嶺。”OpenAI首席科學家伊利亞·蘇茨克維這樣形容ChatGPT的誕生。
一年前的11月30日,ChatGPT上線,短短5天,用戶數突破百萬。由于太過火爆,OpenAI不得不暫時關閉了用戶的測試入口。兩個月后,ChatGPT月活躍用戶破億,刷新了App應用用戶過億的最快紀錄。半個月前,OpenAI暫停ChatGPT Plus的新用戶注冊,原因是11月6日的開發者大會后,用戶量激增。
一年來,ChatGPT從一個只能處理文字信息的網頁端應用,變成了一個可以同時處理文字、語音、圖像信息的超級應用,每周吸引上億人使用。OpenAI也從一個非營利性研究機構變成了估值900億美元的超級“獨角獸”,聚攏了200萬開發者。在最新演示中,ChatGPT的表現甚至超越了“神筆馬良”——當有人想要做一個創業助手時,只要把概念說給GPT-4Turbo聽,兩三分鐘后便可生成一個應用。
ChatGPT幾乎以一己之力改變了AI研究生態。在它爆火之前,谷歌是該領域當之無愧的翹楚,不僅論文發表數量最多,其對思維鏈路提示、大模型涌現現象的研究也走在前列。那時,自然語言處理、計算機視覺等還是眾人追捧的AI前沿領域;現在,幾乎所有人都涌向OpenAI引領的生成式AI方向。今年2月,研究自然語言處理的復旦大學計算機科學技術學院邱錫鵬教授團隊發布國內首個類ChatGPT模型“MOSS”,也曾一度因用戶的大量涌入而“宕機”。
與谷歌技術路線相比,OpenAI是“力大磚飛”的代表。“我們的算法非常簡單。”伊利亞·蘇茨克維直言不諱。他們把從海量數據中獲取的標注信息導入模型,不斷重復這個過程,最終得到一個超復雜的“黑箱”,即使是OpenAI首席科學家自己也不知道模型中正在發生什么。
ChatGPT上線后,全球大科技公司幾乎都發布了自己的大語言模型,比如谷歌的PaLM2、Meta的Llama2、百度的文心一言、華為的盤古等,但只要使用過這些模型,你就會發現,GPT模型是“獨一檔的存在”。對此,梁正解釋說:“這種差距可能無關芯片、算法、數據,純粹是OpenAI比較幸運。”
幸運是指什么?不妨從凱文·凱利的暢銷書《失控》中尋找答案。他在書中預測生命的智慧來自涌現,而科技也是一種生命。伊利亞同樣認為,數據在大模型“黑箱”中發生的就是演化,盡管世界上有很多這樣的“黑箱”,但發生在GPT身上的涌現與眾不同,如同300多萬年前開始直立行走的“人類祖母”露西。
借助于世界上最大的算力和最強的GPU芯片,這一年,GPT正以人類難以想象的速度繼續進化。事實上,在基于GPT-3.5模型的ChatGPT上線時,OpenAI已經完成了GPT-4的訓練。而據微軟研究院估算,GPT-4已經是一個早期的、仍不完整的AGI系統。
業界認為,800億參數是大模型得以涌現的“門檻”,這意味著全球有多個大模型可能涌現智能。對于大模型的未來,梁正借用菲爾茨獎得主陶哲軒的說法表達自己的預見:如果使用得當,到2026年,AI將成為數學研究和許多其他領域值得信賴的合著者。而數學,一直是象征人類智力巔峰的學科領域。
前所未有的繁榮
在人工智能投資領域,美國與中國是全球投入最多的兩個國家。隨著ChatGPT的橫空出世,各國對AI的投資繼續加碼,中美之間的AI投資差距正在縮小。
早在ChatGPT發布之初,中國計算機學會術語工委副主任、同濟大學特聘研究員王昊奮就意識到,這是一個改變人與計算機交互模式的“接口”。這也解釋了為何整個科技界對它如此興奮,以至于任何可能“搭邊”的人都動了起來。
浙江大學上海高等研究院常務副院長、人工智能研究所所長吳飛對大模型的態度有過一次明顯改變。“今年3月前,我對它還是旁觀待變的態度,現在我已經深刻感受到它的‘通用之力’。”
大模型是比互聯網門檻更低的“接口”。吳飛解釋說,互聯網的能力是賦能特定領域、特定任務。比如用互聯網賦能餐飲,可以讓程序員做一個美食推薦應用,而要賦能體育,則可以做一個體育新聞推送應用。因此,現在我們每個人的手機里都裝有各種不同功能的應用。大模型則不同,基礎大模型可以解答我們提出的任何問題,但如果想要在專業上更進一步,則需要垂直領域大模型。
過去一年,吳飛團隊打造了多個垂直領域大模型。只用45TB(萬億字節)法律方面的專業數據,他們就訓練出了“智海-錄問”,一個為法律從業者提供法律問答、知識檢索增強問答、案情分析、意圖識別等多項法律輔助服務的工具。過去一年,該模型已應用于浙江省高級人民法院,大大加快了法官審案流程。
科大訊飛今年則一口氣發布了12款行業大模型,涉及金融、汽車、運營商、工業、住建、法律等多個領域。科大訊飛總裁劉慶峰援引知名咨詢機構Gartner的數據表示,目前全球已有5%的企業在使用大模型,到2026年,這一數字將達到80%。
在邱錫鵬看來,大模型在應用端的發力速度會比預計的更快,覆蓋面也會更廣。因為大部分軟硬件服務公司都開始接入大模型,在感嘆效率提高的同時,用戶可能不知道自己其實已經在使用大模型了。
梁正用30年前的互聯網“誕生時刻”來類比當下,且相較前者,大模型能夠覆蓋的行業更多,更加避無可避。他甚至認為,30年的互聯網繁榮似乎就是為大模型準備的,因為驅動大模型涌現的主要數據來自互聯網。
這一年,大模型已經在教育、醫療等諸多領域展現出過人本領。不久前,ChatGPT根據病情描述和檢查報告,幫助一位母親為她的孩子找到了病因——新生兒發病率最高只有0.025%的脊髓栓系綜合征。此前,這位母親已經帶著孩子求醫3年,求助了17位醫生,都沒有診斷出原因。
前所未有的分裂
如果說ChatGPT的問世讓全球科技界沉浸在大模型的狂歡之中,那么關于AI倫理之爭則是新技術“狂飆”之下的靈魂拷問。
從3月底的千人聯名信到5月底的AI風險聲明,在要不要繼續推動大模型發展、如何防范AI風險上,即使是AI陣營內部也呈現出了前所未有的分裂。5月初,有“AI教父”之稱的計算機科學家杰弗里·辛頓離開谷歌,加深了人們對AI是否已經失控的擔憂。他坦言,之所以離開谷歌,就是為了完全自由地說出AI潛在的風險,向世人提出警示。
最具戲劇性的事件要屬最近發生在OpenAI內部的“宮斗”:首席執行官山姆·奧爾特曼被董事會開除,幾天后,他又宣布重返OpenAI。業內普遍推測,如何規制AI發展是公司內部矛盾爆發的導火索。作為掌握最“聰明”大模型的公司,OpenAI的態度很大程度上代表了AI發展的最真實狀態,而據其判斷,AGI有很大概率會在10年內到來。
人類已經致力于發展AI超過60年,為什么這一次如此警鈴大作?伊利亞·蘇茨克維表示,AGI與迄今為止人類創造的任何東西都不同,它是有自己目標的完全自主的生物。如果這一天到來,人與AGI的關系相當于人與動物,只不過這一次站在動物位置上的是人類。
奧爾特曼則表示,AGI只是發展AI道路上的一個小節點,他們的遠景目標是創造出遠超人類智能的超級AI。不過即便如此,他仍向美國國會表達了希望加強對OpenAI監管的愿望。今年7月,OpenAI首次提出“超級對齊”概念,宣布將投入20%的計算資源、花費4年時間全力打造一個超級對齊系統。
如何保證AI向善?梁正說,目前業界觀點主要分成了兩派:一派認為應該先在AI中普及人類的道德規范再允許其發展;另一派則認為AI在發展中會形成自己的道德規范,就像人類在群體行為中產生了道德一樣,但前提是AI需要擁有和人類一樣的外形。
一方面人們對可能到來的AGI爭論不休,而另一方面,充分的競爭則會加速AGI的到來。上海交通大學教授江曉原對人類能否對一路“狂飆”的AI適時“踩剎車”表示悲觀。他說,企業是推動AI“狂飆”的決定性力量,它無法依靠自己的道德慢下來,因為如果你不做,別人就會趕超你。
仍有許多科學家堅信AI只是人類發明的一件好用的工具,即便如此,它仍然有毀滅人類的風險。清華瑞萊智慧科技有限公司AI治理研究院院長張偉強提出了這樣一個假設:人類總是在不斷試錯的過程中走向成功,而大模型提供了前往正確答案的直通車,人們將由此減少很多試錯機會。正如劉慈欣在科幻作品《鏡子》中描寫的一種人類“結局”,人類因為從不犯錯而走向滅亡。
還有更多問題
“與上半年的烈火烹油相比,下半年大家對大模型的態度務實了許多,它還有很多問題沒有解決,比如模型復雜度、多模態融合、模型評測等,我們都在全力解決。”邱錫鵬說。
吳飛也表示,繼續通過某些任務對大模型進行特定訓練,以期在某個指標上超過ChatGPT,意義可能并不大,中國在大模型上的機會與當年的互聯網一樣,即從實際應用倒逼模型迭代。
許多專家都表示,國內大模型的挑戰主要來自兩方面——算力和數據。大模型與其他軟件應用不同,不僅訓練起來費錢,運行起來更燒錢。想要處理用戶輸入的問題,基本上每個字都要在大模型上跑一遍,參數上千億的大模型,每跑一遍都要調用多個A100 GPU,每個價值一萬美元,十分“燒錢”。
國內使用大模型的用戶畫像也和國外有所區別。簡單來說,國外有更多高端用戶傾向于使用GPT,這些相對高質量的海量數據使GPT的迭代比國內大模型要快。
如何破局?當務之急是提高算力。據浪潮信息、國際數據公司(IDC)和清華大學聯合發布《2021-2022年全球計算力指數評估報告》,15個重點國家的計算力指數平均每提高1個點,國家的數字經濟和GDP將分別增長3.5‰和1.8‰,預計該趨勢在2021-2025年將繼續保持。吳飛認為,隨著“算力網”的落地,國內大模型會在未來幾年不斷帶來好消息。
大模型是AI發展唯一正確的路嗎?Meta首席AI科學家楊樂昆對此并不認同。在他看來,大模型是“一條下坡路”,遠離了通往更強大的AI的道路。他在《經濟學家》上撰文說:“大型語言模型能有多聰明、能有多準確,都是有限度的,因為它們沒有現實世界的經驗。”
邱錫鵬表示,在使用工程性的方法確保自己“不掉隊”的前提下,還要想辦法研究下一代大模型,即在算力不夠的現有條件下,有無新途徑去實現生成式AI。“前者我們只能跟隨,后者則有幾率超越。”他透露,MOSS正朝著這一目標努力。這一年來,它在架構上有所創新,規避了現有系統的一些缺陷;在“對齊”上采用了更人性化、更多維度的幻覺數據集,使內容生成更安全;在學習能力上也更加主動。
面對大模型高昂的成本和耗能,整個行業也在尋找解決辦法。一些科技巨頭親自下場研發芯片,比如谷歌、亞馬遜、微軟,甚至OpenAI都在考慮針對AI運算自研芯片,或是讓消費者購買更適合大模型計算的手機和電腦,分擔算力成本。
“開源會讓創新速度更快。”上海對外經貿大學人工智能與變革管理研究院副院長、上海開源信息技術協會秘書長張國鋒說,目前國內大模型的開源方式都以企業為主導,并且只開源了整個大模型生態的一小部分,從而出現了算力分散、算力資源浪費等問題。他建議整合政府、高校、企業等優質的大模型生產要素數據、算法和算力,采用開源項目的協作模式和治理方式降低成本,建立大模型時代的“Linux”生態位。
(原標題:大模型爆火這一年——對ChatGPT在全球引發AI“狂飆”的觀察與思考)
本文鏈接:大模型爆火,ChatGPT在全球引發AI“狂飆”http://www.lensthegame.com/show-11-1735-0.html
聲明:本網站為非營利性網站,本網頁內容由互聯網博主自發貢獻,不代表本站觀點,本站不承擔任何法律責任,僅提供存儲服務。天上不會到餡餅,請大家謹防詐騙!若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。
上一篇: 魯迅為何沒有參加“科玄論戰”
下一篇: 這種減肥藥咋成《科學》10大突破之首