近日,國產AI DeepSeek在中國、美國的科技圈受到廣泛關注,甚至被認為是大模型行業的最大“黑馬”,在外網,DeepSeek被不少人稱為“神秘的東方力量”。
1月27日,DeepSeek應用登頂蘋果中國地區和美國地區應用商店免費App下載排行榜,在美區下載榜上超越了ChatGPT。
蘋果美國區應用商店
蘋果AppStore中國區免費榜
DeepSeek是啥?
DeepSeek,全稱杭州深度求索人工智能基礎技術研究有限公司,成立于2023年7月17日,是一家創新型科技公司,專注于開發先進的大語言模型(LLM)和相關技術。
近日,DeepSeek發布推理模型R1,在性能逼近OpenAI o1正式版的同時,推理成本卻僅為后者的幾十分之一。
紐約時報稱,DeepSeek大模型以極低成本(600萬美元)和少量芯片(2000塊)實現了與OpenAI等巨頭相媲美的性能,挑戰了“唯有科技巨頭才能研發尖端AI”的行業共識。
低成本實現高性能模型研發,對用戶來說體驗感也立竿見影——它功能強大,但卻免費使用,并且DeepSeek還將代碼面向開發者進行了開源。
據了解,DeepSeek R1沒有使用業內普遍使用的監督微調(SFT)訓練范式,而是直接通過強化學習讓模型自主進化出復雜的推理能力,包括反思和長鏈思考等能力。這種方法不僅提高了訓練效率,還減少了對昂貴計算資源的依賴。與OpenAI的o1相比,DeepSeek模型的百萬token輸入成本從15美元銳減到0.55美元,輸出成本則從60美元降低到2美元。
有人提出,DeepSeek恰恰是美國對華進行芯片出口限制之下所激發出的創新。
1月26日,DeepSeek出現了短時閃崩現象。不少網友反映,使用時遇到 “服務器繁忙” 的提示。對此,DeepSeek回應稱,當天下午確實出現了局部服務波動,但問題在數分鐘內就得到了解決。此次事件可能是由于新模型發布后,用戶訪問量激增,服務器一時無法滿足大量用戶的并發需求。
團隊不到140人
創始人來自湛江
據悉,DeepSeek創始人梁文鋒來自廣東省湛江市,本科、研究生畢業于浙江大學,擁有信息與電子工程學系本科和碩士學位。2008年起,他開始帶領團隊使用機器學習等技術探索全自動量化交易。2023年7月,DeepSeek正式成立,進軍通用人工智能領域。
近日,梁文鋒還現身《新聞聯播》,以DeepSeek創始人的身份參加了一場座談會,并現場發言。
梁文鋒(左一)
在團隊配置上,DeepSeek團隊最大的特點是名校、年輕。不到140人的團隊,工程師和研發人員幾乎都來自清華大學、北京大學、中山大學、北京郵電大學等國內頂尖高校,工作時間都不長。
來源:澎湃新聞(記者 李瀟瀟 胡含嫣)、北京日報(記者 孫奇茹)、長安街知事、中國新聞社
本文鏈接:超越ChatGPT,中國“神秘力量”火爆全球http://www.lensthegame.com/show-1-34240-0.html
聲明:本網頁內容由互聯網博主自發貢獻,不代表本站觀點,本站不承擔任何法律責任。天上不會到餡餅,請大家謹防詐騙!若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。
上一篇: 巴黎又一古建遭火災,三十米高鐘樓被燒毀