角力下半場，中國AI亦可“通羅馬”

2025-03-07 10:39:36 來源：中國科學報

觀看：20

“DeepSeek公司堅持開放開源的技術路線，推動了人工智能技術在全球的普遍應用，為世界貢獻了‘中國智慧’。”

3月4日，在十四屆全國人大三次會議新聞發布會上，大會發言人婁勤儉點贊中國人工智能大模型DeepSeek及其團隊。面對提問，他進一步說道：“世界豐富多彩，技術進步也不只有一條路徑。”

話雖不長，意味深遠。DeepSeek通過開源、系統性協同創新和工程上的優化，以較低的成本實現了可媲美世界一流大模型的性能，走出了一條自立自強的大模型技術發展之路。在接受《中國科學報》采訪的代表委員和專家們看來，“條條大路通羅馬”，隨著大模型角力進入下半場，中國人工智能（AI）正迎來歷史性的趕超機遇。

從“追趕者”變為“規則改寫者”

因為DeepSeek，北京郵電大學人機交互與認知工程實驗室主任劉偉“整個春節都過得非常愉快”。他在接受《中國科學報》采訪時說，DeepSeek“炸場”之后，“身邊的人都很興奮”。

的確，自1月20日DeepSeek-R1模型發布至今，一個半月的時間里，關于DeepSeek的討論熱度不減。中國工程院院士、計算機專家李國杰撰文“七問DeepSeek”，并說道：“DeepSeek的一鳴驚人可能是一個分水嶺，標志著中國AI產業開始從‘技術跟跑’向‘技術并跑和領跑’邁進。”

全國政協委員、中國科學院自動化所研究員趙曉光說，國外也在密切關注DeepSeek，可以說DeepSeek給整個AI領域的發展注入了一股強大的推動力。

以DeepSeek為代表的中國AI大模型崛起，預示著大模型的全球角力進入了下半場。

“大家津津樂道于DeepSeek的‘小力出奇跡’，成本低、效率高，但其實在DeepSeek的突破中，更有意思的是‘巧力出奇跡’，不蠻干、四兩撥千斤，這是典型的‘東方智慧’。”劉偉對記者說，DeepSeek采用的多頭注意力專家模型等技術方法，體現了他們在大模型的算法和框架優化上的巧奪天工，同時帶來了模型發展的新思路——“人類通過Transformer架構實現大模型的路徑不再是一條，而是多條”。

“以前只能從硅谷到‘羅馬’，現在從杭州也可以到‘羅馬’，真正實現了‘條條大路通羅馬’。”劉偉說。

李國杰稱，DeepSeek的崛起，打破了“高算力和高投入是發展人工智能唯一途徑”和“集成電路制程優勢=人工智能技術霸權”的迷信，引領AI行業進入以算法和模型架構優化為主，同時高度重視數據質量與規模、理性提高算力的新時期。

“同時，DeepSeek的崛起也標志著中國科技公司從‘追趕者’變為‘規則改寫者’。”李國杰說，在全球最關注的人工智能領域，中國正在以顛覆式創新迎接新挑戰。

更復雜的競爭模式

正如受訪專家們所說，在開啟一個嶄新的AI時代之后，中國AI依然面臨著諸多挑戰。

“小力出奇跡”并不意味著規模法則的“破產”，中國依然有發展通用大模型的需要。“未來，AI發展可能呈現‘雙軌并行’的格局。”全國政協委員、中國科學院計算技術研究所研究員張云泉在接受《中國科學報》采訪時說，一方面，小而精的模型會蓬勃發展，尤其有望在特定場景中發揮重要作用；另一方面，通用基礎大模型會繼續按照規模法則，通過大算力投入、擴大參數規模實現更強悍的性能。

張云泉表示，對于中國來說，發展通用基礎主權大模型仍然是必要的。通用基礎大模型是AI技術的基石，能夠為各行各業提供強大的基礎智能。同時，中國在“小而精”模型的研發中，要更加注重芯片、算法和生態系統的自主可控，進而開辟高效、綠色的AI發展路徑。

他的這番話也指向了AI發展進程中的另一大變化——AI產業不再是過去簡單的“單點技術競賽”，而是轉向了更復雜的競爭模式，既包括芯片、模型和算力的比拼，也包含技術規則、市場份額、治理權力等更復雜的方面。

“要實現人工智能自立自強，最困難的是構建自主可控的產業生態。”李國杰指出，從長遠來講，我們需要開發一套比英偉達公司“統一計算設備架構”（即CUDA，英偉達基于GPU的軟件生態）更優秀的自主可控的AI軟件工具系統，重構AI軟件生態。

“實現這個目標需要周密的規劃和長期努力，相關部門應下決心組織全國的開發力量，充分調動上下游企業的積極性，完成這件大事。”李國杰說。

值得欣慰的是，DeepSeek的開源模式，讓人們看到了AI開放生態建設的曙光。

北京并行科技股份有限公司AI云聯合創始人趙鴻冰對記者說，DeepSeek的崛起帶動了推理大模型的應用，“推理市場”將迎來爆發，而這對國產芯片而言是重大機遇。另外，在開源開放的背景下，國產相關軟硬件技術更容易實現生態協同。

“萬紫千紅春滿園”

一花獨放不是春，萬紫千紅春滿園。

DeepSeek之外，測評水平超過Sora的可靈視頻大模型、中文理解能力評分超GPT-4 Turbo的通義千問Qwen2.5-Max、在GitHub衍生工具超過1200個的智譜AI GLM-4……這些中國AI，正成為一股不容忽視的力量。

近日，全國人大代表、科大訊飛董事長劉慶峰推介了訊飛星火大模型的更新：基于全國產算力，科大訊飛升級了星火大模型X1，它的推理性能可對標DeepSeek“滿血版”。

不過，他也看到，目前國產算力軟件生態基礎薄弱，算子庫、工具鏈、開源訓練框架及開發平臺等配套工具尚不完善，“我國亟須加快推進基于國產軟硬件底座的大模型研發創新、場景應用、生態開放等全鏈條發展”。

為此，劉慶峰建議，一方面，我國要依托廣泛的AI應用場景，積極推廣大模型在產業領域的應用，并形成數據飛輪，讓中國率先獲得AI產業落地紅利；另一方面，要專項支持生態體系建設，加快形成國產大模型生態體系和工具鏈，并支持大模型開發者開源社區建設。

劉偉特別提到，中國在落地應用場景的優勢，會隨著中國AI水平的提高得到進一步放大。“DeepSeek‘出圈’后，產業界的同行也很興奮，比如制造業可以跟DeepSeek‘結對子’，中國的產業優勢加上AI優勢，有可能給世界AI發展帶來一個新景觀。”

全國人大代表、中國工程院院士高文也公開指出，未來文字、圖像、音頻、視頻等多元數據處理需求不斷涌現，大語言模型以及多模態大模型技術將不斷創新，完成更復雜的任務，推動各行業智能化升級，AI應用前景大有可為。

“科學探索從來不是‘華山一條路’，尤其是模仿人類智能方面。”趙曉光說，“相信未來在國家的大力支持下，在一代代科研人員的努力下，我們一定可以跟全世界的AI研究者共同進步，中國也會在未來涌現出更多具有顛覆性的創新故事，引領AI的歷史進程。”

本文鏈接：角力下半場，中國AI亦可“通羅馬”http://www.lensthegame.com/show-11-18246-0.html

聲明：本網站為非營利性網站，本網頁內容由互聯網博主自發貢獻，不代表本站觀點，本站不承擔任何法律責任，僅提供存儲服務。天上不會到餡餅，請大家謹防詐騙！若有侵權等問題請及時與本網聯系，我們將在第一時間刪除處理。

上一篇： 2025年博士后國（境）外交流項目申報指南發布

下一篇：西湖大學33歲海歸博導：愛開飛機、玩游戲，“我的實驗室不打卡”

角力下半場，中國AI亦可“通羅馬”

熱門資訊

推薦資訊

科學最熱文章