“DeepSeek公司堅持開放開源的技術路線,推動了人工智能技術在全球的普遍應用,為世界貢獻了‘中國智慧’。”
3月4日,在十四屆全國人大三次會議新聞發布會上,大會發言人婁勤儉點贊中國人工智能大模型DeepSeek及其團隊。面對提問,他進一步說道:“世界豐富多彩,技術進步也不只有一條路徑。”
話雖不長,意味深遠。DeepSeek通過開源、系統性協同創新和工程上的優化,以較低的成本實現了可媲美世界一流大模型的性能,走出了一條自立自強的大模型技術發展之路。在接受《中國科學報》采訪的代表委員和專家們看來,“條條大路通羅馬”,隨著大模型角力進入下半場,中國人工智能(AI)正迎來歷史性的趕超機遇。
從“追趕者”變為“規則改寫者”
因為DeepSeek,北京郵電大學人機交互與認知工程實驗室主任劉偉“整個春節都過得非常愉快”。他在接受《中國科學報》采訪時說,DeepSeek“炸場”之后,“身邊的人都很興奮”。
的確,自1月20日DeepSeek-R1模型發布至今,一個半月的時間里,關于DeepSeek的討論熱度不減。中國工程院院士、計算機專家李國杰撰文“七問DeepSeek”,并說道:“DeepSeek的一鳴驚人可能是一個分水嶺,標志著中國AI產業開始從‘技術跟跑’向‘技術并跑和領跑’邁進。”
全國政協委員、中國科學院自動化所研究員趙曉光說,國外也在密切關注DeepSeek,可以說DeepSeek給整個AI領域的發展注入了一股強大的推動力。
以DeepSeek為代表的中國AI大模型崛起,預示著大模型的全球角力進入了下半場。
“大家津津樂道于DeepSeek的‘小力出奇跡’,成本低、效率高,但其實在DeepSeek的突破中,更有意思的是‘巧力出奇跡’,不蠻干、四兩撥千斤,這是典型的‘東方智慧’。”劉偉對記者說,DeepSeek采用的多頭注意力專家模型等技術方法,體現了他們在大模型的算法和框架優化上的巧奪天工,同時帶來了模型發展的新思路——“人類通過Transformer架構實現大模型的路徑不再是一條,而是多條”。
“以前只能從硅谷到‘羅馬’,現在從杭州也可以到‘羅馬’,真正實現了‘條條大路通羅馬’。”劉偉說。
李國杰稱,DeepSeek的崛起,打破了“高算力和高投入是發展人工智能唯一途徑”和“集成電路制程優勢=人工智能技術霸權”的迷信,引領AI行業進入以算法和模型架構優化為主,同時高度重視數據質量與規模、理性提高算力的新時期。
“同時,DeepSeek的崛起也標志著中國科技公司從‘追趕者’變為‘規則改寫者’。”李國杰說,在全球最關注的人工智能領域,中國正在以顛覆式創新迎接新挑戰。
更復雜的競爭模式
正如受訪專家們所說,在開啟一個嶄新的AI時代之后,中國AI依然面臨著諸多挑戰。
“小力出奇跡”并不意味著規模法則的“破產”,中國依然有發展通用大模型的需要。“未來,AI發展可能呈現‘雙軌并行’的格局。”全國政協委員、中國科學院計算技術研究所研究員張云泉在接受《中國科學報》采訪時說,一方面,小而精的模型會蓬勃發展,尤其有望在特定場景中發揮重要作用;另一方面,通用基礎大模型會繼續按照規模法則,通過大算力投入、擴大參數規模實現更強悍的性能。
張云泉表示,對于中國來說,發展通用基礎主權大模型仍然是必要的。通用基礎大模型是AI技術的基石,能夠為各行各業提供強大的基礎智能。同時,中國在“小而精”模型的研發中,要更加注重芯片、算法和生態系統的自主可控,進而開辟高效、綠色的AI發展路徑。
他的這番話也指向了AI發展進程中的另一大變化——AI產業不再是過去簡單的“單點技術競賽”,而是轉向了更復雜的競爭模式,既包括芯片、模型和算力的比拼,也包含技術規則、市場份額、治理權力等更復雜的方面。
“要實現人工智能自立自強,最困難的是構建自主可控的產業生態。”李國杰指出,從長遠來講,我們需要開發一套比英偉達公司“統一計算設備架構”(即CUDA,英偉達基于GPU的軟件生態)更優秀的自主可控的AI軟件工具系統,重構AI軟件生態。
“實現這個目標需要周密的規劃和長期努力,相關部門應下決心組織全國的開發力量,充分調動上下游企業的積極性,完成這件大事。”李國杰說。
值得欣慰的是,DeepSeek的開源模式,讓人們看到了AI開放生態建設的曙光。
北京并行科技股份有限公司AI云聯合創始人趙鴻冰對記者說,DeepSeek的崛起帶動了推理大模型的應用,“推理市場”將迎來爆發,而這對國產芯片而言是重大機遇。另外,在開源開放的背景下,國產相關軟硬件技術更容易實現生態協同。
“萬紫千紅春滿園”
一花獨放不是春,萬紫千紅春滿園。
DeepSeek之外,測評水平超過Sora的可靈視頻大模型、中文理解能力評分超GPT-4 Turbo的通義千問Qwen2.5-Max、在GitHub衍生工具超過1200個的智譜AI GLM-4……這些中國AI,正成為一股不容忽視的力量。
近日,全國人大代表、科大訊飛董事長劉慶峰推介了訊飛星火大模型的更新:基于全國產算力,科大訊飛升級了星火大模型X1,它的推理性能可對標DeepSeek“滿血版”。
不過,他也看到,目前國產算力軟件生態基礎薄弱,算子庫、工具鏈、開源訓練框架及開發平臺等配套工具尚不完善,“我國亟須加快推進基于國產軟硬件底座的大模型研發創新、場景應用、生態開放等全鏈條發展”。
為此,劉慶峰建議,一方面,我國要依托廣泛的AI應用場景,積極推廣大模型在產業領域的應用,并形成數據飛輪,讓中國率先獲得AI產業落地紅利;另一方面,要專項支持生態體系建設,加快形成國產大模型生態體系和工具鏈,并支持大模型開發者開源社區建設。
劉偉特別提到,中國在落地應用場景的優勢,會隨著中國AI水平的提高得到進一步放大。“DeepSeek‘出圈’后,產業界的同行也很興奮,比如制造業可以跟DeepSeek‘結對子’,中國的產業優勢加上AI優勢,有可能給世界AI發展帶來一個新景觀。”
全國人大代表、中國工程院院士高文也公開指出,未來文字、圖像、音頻、視頻等多元數據處理需求不斷涌現,大語言模型以及多模態大模型技術將不斷創新,完成更復雜的任務,推動各行業智能化升級,AI應用前景大有可為。
“科學探索從來不是‘華山一條路’,尤其是模仿人類智能方面。”趙曉光說,“相信未來在國家的大力支持下,在一代代科研人員的努力下,我們一定可以跟全世界的AI研究者共同進步,中國也會在未來涌現出更多具有顛覆性的創新故事,引領AI的歷史進程。”
本文鏈接:角力下半場,中國AI亦可“通羅馬”http://www.lensthegame.com/show-11-18246-0.html
聲明:本網站為非營利性網站,本網頁內容由互聯網博主自發貢獻,不代表本站觀點,本站不承擔任何法律責任,僅提供存儲服務。天上不會到餡餅,請大家謹防詐騙!若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。