首頁 > 快訊

超越ChatGPT，中國“神秘力量”火爆全球

2025-01-28 08:53:50 來源：新快報綜合

觀看：45

近日，國產AI DeepSeek在中國、美國的科技圈受到廣泛關注，甚至被認為是大模型行業的最大“黑馬”，在外網，DeepSeek被不少人稱為“神秘的東方力量”。

1月27日，DeepSeek應用登頂蘋果中國地區和美國地區應用商店免費App下載排行榜，在美區下載榜上超越了ChatGPT。

蘋果美國區應用商店

蘋果AppStore中國區免費榜

DeepSeek是啥？

DeepSeek，全稱杭州深度求索人工智能基礎技術研究有限公司，成立于2023年7月17日，是一家創新型科技公司，專注于開發先進的大語言模型（LLM）和相關技術。

近日，DeepSeek發布推理模型R1，在性能逼近OpenAI o1正式版的同時，推理成本卻僅為后者的幾十分之一。

紐約時報稱，DeepSeek大模型以極低成本（600萬美元）和少量芯片（2000塊）實現了與OpenAI等巨頭相媲美的性能，挑戰了“唯有科技巨頭才能研發尖端AI”的行業共識。

低成本實現高性能模型研發，對用戶來說體驗感也立竿見影——它功能強大，但卻免費使用，并且DeepSeek還將代碼面向開發者進行了開源。

據了解，DeepSeek R1沒有使用業內普遍使用的監督微調（SFT）訓練范式，而是直接通過強化學習讓模型自主進化出復雜的推理能力，包括反思和長鏈思考等能力。這種方法不僅提高了訓練效率，還減少了對昂貴計算資源的依賴。與OpenAI的o1相比，DeepSeek模型的百萬token輸入成本從15美元銳減到0.55美元，輸出成本則從60美元降低到2美元。

有人提出，DeepSeek恰恰是美國對華進行芯片出口限制之下所激發出的創新。

1月26日，DeepSeek出現了短時閃崩現象。不少網友反映，使用時遇到 “服務器繁忙” 的提示。對此，DeepSeek回應稱，當天下午確實出現了局部服務波動，但問題在數分鐘內就得到了解決。此次事件可能是由于新模型發布后，用戶訪問量激增，服務器一時無法滿足大量用戶的并發需求。

團隊不到140人

創始人來自湛江

據悉，DeepSeek創始人梁文鋒來自廣東省湛江市，本科、研究生畢業于浙江大學，擁有信息與電子工程學系本科和碩士學位。2008年起，他開始帶領團隊使用機器學習等技術探索全自動量化交易。2023年7月，DeepSeek正式成立，進軍通用人工智能領域。

近日，梁文鋒還現身《新聞聯播》，以DeepSeek創始人的身份參加了一場座談會，并現場發言。

梁文鋒（左一）

在團隊配置上，DeepSeek團隊最大的特點是名校、年輕。不到140人的團隊，工程師和研發人員幾乎都來自清華大學、北京大學、中山大學、北京郵電大學等國內頂尖高校，工作時間都不長。

來源：澎湃新聞（記者李瀟瀟胡含嫣）、北京日報（記者孫奇茹）、長安街知事、中國新聞社

本文鏈接：超越ChatGPT，中國“神秘力量”火爆全球http://www.lensthegame.com/show-1-34240-0.html

聲明：本網頁內容由互聯網博主自發貢獻，不代表本站觀點，本站不承擔任何法律責任。天上不會到餡餅，請大家謹防詐騙！若有侵權等問題請及時與本網聯系，我們將在第一時間刪除處理。

上一篇：巴黎又一古建遭火災，三十米高鐘樓被燒毀

下一篇：兩部門：規范通過電子渠道銷售電子式儲蓄國債

超越ChatGPT，中國“神秘力量”火爆全球

熱門資訊

推薦資訊

快訊最熱文章