21世紀經濟報道記者 袁思杰 香港報道
春節期間,一場“中國AI地震”席卷全球科技圈。
DeepSeek發布的全新人工智能模型 R1,引發了全球范圍內的關注和討論。作為一款主打低成本、高效率的AI語言模型,R1的性能在某些垂直領域已接近甚至媲美OpenAI的ChatGPT-4。更令人矚目的是,DeepSeek宣稱其模型訓練成本僅為同類大模型的1/10。
R1發布后,美國科技股大幅波動:英偉達股價暴跌近17%,單日市值蒸發高達5888億美元,創下美股史上單日市值蒸發新紀錄。“木頭姐”凱西·伍德也在公開訪談中坦言:“DeepSeek的低成本模式可能顛覆硅谷的算力霸權邏輯。”
同時,DeepSeek已展現出商業化勢能:上線18天全球下載量突破1600萬次,日活用戶超2000萬,推動亞馬遜Bedrock、微軟Azure和華為昇騰云爭相接入其模型服務。
DeepSeek是怎樣在算力不足的情況下實現低成本訓練的?開源大模型的模式是否可以打破巨頭壟斷?低成本訓練反而會引起算力需求激增嗎?哪種AI商業化路徑更具長期競爭力?AI浪潮下普通人如何自我提升?
圍繞這些問題,三七二十一節目邀請到了豆神集團副總裁兼任CTO閻鵬、快思慢想研究院院長和原商湯智能產業研究院創始院長田豐,以及知名科技博主(海寧科技觀)陳海寧,共同探討這些話題!
Show Notes:
03:50 DeepSeek通過架構創新實現低成本訓練
04:28 強化學習比重提升使DeepSeek大模型更強大
07:50 2025年是AI大模型的“成本年”
09:20 中國AI技術社區的發展需建立本土技術站
10:00 DeepSeek的成功讓資本重新重視開源模型的潛力
12:03 開源模型在企業應用中有技術門檻
14:04 DeepSeek堅持開源策略旨在建立中國AGI技術社區和創新技術站、減少對美國的依賴
16:38 AI大模型開源的好處在于共享成果和共建提升
21:55 隨著算力需求持續增長和成本降低,大模型應用和服務普及是必然過程
23:02 AI發展對算力需求只會加速
24:10 “DeepSeek時刻”讓AI邁向通用化技術時代
25:52 “成本拐點”:市場規模和產品成本成反比
29:25 AI浪潮已改變普通人的工作和生活
30:30 應盡早使用AI工具提高效率,同時提高數字化教育程度
33:17 AI普及將如智能手機般融入生活,帶來商業機會
37:56 進行AI技能學習,建議打基礎、學習思維方法以應對AI浪潮
43:31 教育和醫療可能成為AI應用最早爆發領域,服務業可實現規模化和高質量發展
48:03 AI將在互聯網、軟件、服務業和硬件四方向推進商業化,科研是關鍵
本文鏈接:三七二十一|中國AI的“斯普特尼克時刻”:DeepSeek的崛起與啟示http://www.lensthegame.com/show-2-10918-0.html
聲明:本網站為非營利性網站,本網頁內容由互聯網博主自發貢獻,不代表本站觀點,本站不承擔任何法律責任。天上不會到餡餅,請大家謹防詐騙!若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。
上一篇: 外賣騎手上社保:“我可以干到退休了!”