■本報記者趙廣立
“DeepSeek公司堅持開放開源的技術(shù)路線,推動了人工智能技術(shù)在全球的普遍應(yīng)用,為世界貢獻了‘中國智慧’。”
3月4日,在十四屆全國人大三次會議新聞發(fā)布會上,大會發(fā)言人婁勤儉點贊中國人工智能大模型DeepSeek及其團隊。面對提問,他進一步說道:“世界豐富多彩,技術(shù)進步也不只有一條路徑。”
話雖不長,意味深遠。DeepSeek通過開源、系統(tǒng)性協(xié)同創(chuàng)新和工程上的優(yōu)化,以較低的成本實現(xiàn)了可媲美世界一流大模型的性能,走出了一條自立自強的大模型技術(shù)發(fā)展之路。在接受《中國科學報》采訪的代表委員和專家們看來,“條條大路通羅馬”,隨著大模型角力進入下半場,中國人工智能(AI)正迎來歷史性的趕超機遇。
從“追趕者”變?yōu)椤耙?guī)則改寫者”
因為DeepSeek,北京郵電大學人機交互與認知工程實驗室主任劉偉“整個春節(jié)都過得非常愉快”。他在接受《中國科學報》采訪時說,DeepSeek“炸場”之后,“身邊的人都很興奮”。
的確,自1月20日DeepSeek-R1模型發(fā)布至今,一個半月的時間里,關(guān)于DeepSeek的討論熱度不減。中國工程院院士、計算機專家李國杰撰文“七問DeepSeek”,并說道:“DeepSeek的一鳴驚人可能是一個分水嶺,標志著中國AI產(chǎn)業(yè)開始從‘技術(shù)跟跑’向‘技術(shù)并跑和領(lǐng)跑’邁進。”
全國政協(xié)委員、中國科學院自動化所研究員趙曉光說,國外也在密切關(guān)注DeepSeek,可以說DeepSeek給整個AI領(lǐng)域的發(fā)展注入了一股強大的推動力。
以DeepSeek為代表的中國AI大模型崛起,預示著大模型的全球角力進入了下半場。
“大家津津樂道于DeepSeek的‘小力出奇跡’,成本低、效率高,但其實在DeepSeek的突破中,更有意思的是‘巧力出奇跡’,不蠻干、四兩撥千斤,這是典型的‘東方智慧’。”劉偉對記者說,DeepSeek采用的多頭注意力專家模型等技術(shù)方法,體現(xiàn)了他們在大模型的算法和框架優(yōu)化上的巧奪天工,同時帶來了模型發(fā)展的新思路——“人類通過Transformer架構(gòu)實現(xiàn)大模型的路徑不再是一條,而是多條”。
“以前只能從硅谷到‘羅馬’,現(xiàn)在從杭州也可以到‘羅馬’,真正實現(xiàn)了‘條條大路通羅馬’。”劉偉說。
李國杰稱,DeepSeek的崛起,打破了“高算力和高投入是發(fā)展人工智能唯一途徑”和“集成電路制程優(yōu)勢=人工智能技術(shù)霸權(quán)”的迷信,引領(lǐng)AI行業(yè)進入以算法和模型架構(gòu)優(yōu)化為主,同時高度重視數(shù)據(jù)質(zhì)量與規(guī)模、理性提高算力的新時期。
“同時,DeepSeek的崛起也標志著中國科技公司從‘追趕者’變?yōu)椤?guī)則改寫者’。”李國杰說,在全球最關(guān)注的人工智能領(lǐng)域,中國正在以顛覆式創(chuàng)新迎接新挑戰(zhàn)。
更復雜的競爭模式
正如受訪專家們所說,在開啟一個嶄新的AI時代之后,中國AI依然面臨著諸多挑戰(zhàn)。
“小力出奇跡”并不意味著規(guī)模法則的“破產(chǎn)”,中國依然有發(fā)展通用大模型的需要。“未來,AI發(fā)展可能呈現(xiàn)‘雙軌并行’的格局。”全國政協(xié)委員、中國科學院計算技術(shù)研究所研究員張云泉在接受《中國科學報》采訪時說,一方面,小而精的模型會蓬勃發(fā)展,尤其有望在特定場景中發(fā)揮重要作用;另一方面,通用基礎(chǔ)大模型會繼續(xù)按照規(guī)模法則,通過大算力投入、擴大參數(shù)規(guī)模實現(xiàn)更強悍的性能。
張云泉表示,對于中國來說,發(fā)展通用基礎(chǔ)主權(quán)大模型仍然是必要的。通用基礎(chǔ)大模型是AI技術(shù)的基石,能夠為各行各業(yè)提供強大的基礎(chǔ)智能。同時,中國在“小而精”模型的研發(fā)中,要更加注重芯片、算法和生態(tài)系統(tǒng)的自主可控,進而開辟高效、綠色的AI發(fā)展路徑。
他的這番話也指向了AI發(fā)展進程中的另一大變化——AI產(chǎn)業(yè)不再是過去簡單的“單點技術(shù)競賽”,而是轉(zhuǎn)向了更復雜的競爭模式,既包括芯片、模型和算力的比拼,也包含技術(shù)規(guī)則、市場份額、治理權(quán)力等更復雜的方面。
“要實現(xiàn)人工智能自立自強,最困難的是構(gòu)建自主可控的產(chǎn)業(yè)生態(tài)。”李國杰指出,從長遠來講,我們需要開發(fā)一套比英偉達公司“統(tǒng)一計算設(shè)備架構(gòu)”(即CUDA,英偉達基于GPU的軟件生態(tài))更優(yōu)秀的自主可控的AI軟件工具系統(tǒng),重構(gòu)AI軟件生態(tài)。
“實現(xiàn)這個目標需要周密的規(guī)劃和長期努力,相關(guān)部門應(yīng)下決心組織全國的開發(fā)力量,充分調(diào)動上下游企業(yè)的積極性,完成這件大事。”李國杰說。
值得欣慰的是,DeepSeek的開源模式,讓人們看到了AI開放生態(tài)建設(shè)的曙光。
北京并行科技股份有限公司AI云聯(lián)合創(chuàng)始人趙鴻冰對記者說,DeepSeek的崛起帶動了推理大模型的應(yīng)用,“推理市場”將迎來爆發(fā),而這對國產(chǎn)芯片而言是重大機遇。另外,在開源開放的背景下,國產(chǎn)相關(guān)軟硬件技術(shù)更容易實現(xiàn)生態(tài)協(xié)同。
“萬紫千紅春滿園”
一花獨放不是春,萬紫千紅春滿園。
DeepSeek之外,測評水平超過Sora的可靈視頻大模型、中文理解能力評分超GPT-4 Turbo的通義千問Qwen2.5-Max、在GitHub衍生工具超過1200個的智譜AI GLM-4……這些中國AI,正成為一股不容忽視的力量。
近日,全國人大代表、科大訊飛董事長劉慶峰推介了訊飛星火大模型的更新:基于全國產(chǎn)算力,科大訊飛升級了星火大模型X1,它的推理性能可對標DeepSeek“滿血版”。
不過,他也看到,目前國產(chǎn)算力軟件生態(tài)基礎(chǔ)薄弱,算子庫、工具鏈、開源訓練框架及開發(fā)平臺等配套工具尚不完善,“我國亟須加快推進基于國產(chǎn)軟硬件底座的大模型研發(fā)創(chuàng)新、場景應(yīng)用、生態(tài)開放等全鏈條發(fā)展”。
為此,劉慶峰建議,一方面,我國要依托廣泛的AI應(yīng)用場景,積極推廣大模型在產(chǎn)業(yè)領(lǐng)域的應(yīng)用,并形成數(shù)據(jù)飛輪,讓中國率先獲得AI產(chǎn)業(yè)落地紅利;另一方面,要專項支持生態(tài)體系建設(shè),加快形成國產(chǎn)大模型生態(tài)體系和工具鏈,并支持大模型開發(fā)者開源社區(qū)建設(shè)。
劉偉特別提到,中國在落地應(yīng)用場景的優(yōu)勢,會隨著中國AI水平的提高得到進一步放大。“DeepSeek‘出圈’后,產(chǎn)業(yè)界的同行也很興奮,比如制造業(yè)可以跟DeepSeek‘結(jié)對子’,中國的產(chǎn)業(yè)優(yōu)勢加上AI優(yōu)勢,有可能給世界AI發(fā)展帶來一個新景觀。”
全國人大代表、中國工程院院士高文也公開指出,未來文字、圖像、音頻、視頻等多元數(shù)據(jù)處理需求不斷涌現(xiàn),大語言模型以及多模態(tài)大模型技術(shù)將不斷創(chuàng)新,完成更復雜的任務(wù),推動各行業(yè)智能化升級,AI應(yīng)用前景大有可為。
“科學探索從來不是‘華山一條路’,尤其是模仿人類智能方面。”趙曉光說,“相信未來在國家的大力支持下,在一代代科研人員的努力下,我們一定可以跟全世界的AI研究者共同進步,中國也會在未來涌現(xiàn)出更多具有顛覆性的創(chuàng)新故事,引領(lǐng)AI的歷史進程。”
《中國科學報》(2025-03-07第4版兩會)本文鏈接:角力下半場,中國AI亦可“通羅馬”http://www.lensthegame.com/show-11-18225-0.html
聲明:本網(wǎng)站為非營利性網(wǎng)站,本網(wǎng)頁內(nèi)容由互聯(lián)網(wǎng)博主自發(fā)貢獻,不代表本站觀點,本站不承擔任何法律責任,僅提供存儲服務(wù)。天上不會到餡餅,請大家謹防詐騙!若有侵權(quán)等問題請及時與本網(wǎng)聯(lián)系,我們將在第一時間刪除處理。
上一篇: 青年科技人才使用,膽子大點又何妨