DeepSeek超越ChatGPT，登頂蘋果美國區(qū)免費(fèi)APP下載排行榜

2025-01-28 08:51:46 來源：

觀看：66

1月27日，Deepseek應(yīng)用登頂蘋果中國地區(qū)和美國地區(qū)應(yīng)用商店免費(fèi)APP下載排行榜，在美區(qū)下載榜上超越了ChatGPT。

蘋果美國區(qū)應(yīng)用商店

蘋果APP Store中國區(qū)免費(fèi)榜

Deepseek來自國產(chǎn)大模型公司深度求索，系量化巨頭幻方量化旗下大模型公司。1月20日，該公司正式發(fā)布推理大模型DeepSeek-R1。一經(jīng)推出，DeepSeek-R1便憑借其“物美價(jià)廉”的特性在海外開發(fā)者社區(qū)中引發(fā)了轟動(dòng)。

作為一款開源模型，R1在數(shù)學(xué)、代碼、自然語言推理等任務(wù)上的性能能夠比肩OpenAI o1模型正式版，并采用MIT許可協(xié)議，支持免費(fèi)商用、任意修改和衍生開發(fā)等。目前，在國外大模型排名榜Chatbot Arena上，DeepSeek-R1的基準(zhǔn)測(cè)試排名已經(jīng)升至全類別大模型第三，與OpenAI的ChatGPT-4o最新版并列，并在風(fēng)格控制類模型（StyleCtrl）分類中與OpenAI的o1模型并列第一。

更令市場(chǎng)驚訝的是，據(jù)DeepSeek介紹，R1的預(yù)訓(xùn)練費(fèi)用只有557.6萬美元，在2048塊英偉達(dá)H800 GPU（針對(duì)中國市場(chǎng)的低配版GPU）集群上運(yùn)行55天完成，僅是OpenAI GPT-4o模型訓(xùn)練成本的不到十分之一。DeepSeek表示，R1在后訓(xùn)練階段大規(guī)模使用了強(qiáng)化學(xué)習(xí)技術(shù)，在僅有極少標(biāo)注數(shù)據(jù)的情況下，極大提升了模型推理能力。此外，DeepSeek不僅將R1訓(xùn)練技術(shù)全部公開，還蒸餾了6個(gè)小模型向社區(qū)開源，允許用戶借此訓(xùn)練其他模型。

英偉達(dá)高級(jí)研究科學(xué)家Jim Fan表示，DeepSeek-R1可能是“首個(gè)展示了RL（強(qiáng)化學(xué)習(xí)）飛輪可以發(fā)揮作用且能帶來持續(xù)增長的OSS（開源軟件）項(xiàng)目”。其中，“飛輪”用來形容AI系統(tǒng)中自我強(qiáng)化、正向循環(huán)的過程。DeepSeek的論文顯示，不同于過去AI模型往往依賴于監(jiān)督微調(diào)（SFT，指AI模型通過已標(biāo)注的數(shù)據(jù)進(jìn)行訓(xùn)練），R1完全由強(qiáng)化學(xué)習(xí)驅(qū)動(dòng)，證明了直接強(qiáng)化學(xué)習(xí)是可行的。

Jim Fan寫道：“我們正處于一個(gè)奇特的時(shí)間線上，一家非美國公司正在踐行OpenAI最初的使命，即實(shí)現(xiàn)真正開放的前沿研究并讓所有人受益。這種情況簡直無法理解。最有娛樂性的結(jié)果卻是可能性最大的結(jié)果。”

本文鏈接：DeepSeek超越ChatGPT，登頂蘋果美國區(qū)免費(fèi)APP下載排行榜http://www.lensthegame.com/show-2-10373-0.html

聲明：本網(wǎng)頁內(nèi)容由互聯(lián)網(wǎng)博主自發(fā)貢獻(xiàn)，不代表本站觀點(diǎn)，本站不承擔(dān)任何法律責(zé)任。天上不會(huì)到餡餅，請(qǐng)大家謹(jǐn)防詐騙！若有侵權(quán)等問題請(qǐng)及時(shí)與本網(wǎng)聯(lián)系，我們將在第一時(shí)間刪除處理。

上一篇：鋼鐵“黃桷樹”扮靚西部地區(qū)最大高鐵樞紐站

下一篇：報(bào)告稱中國高科技高成長50強(qiáng)企業(yè)近三年?duì)I收平均增長588%

DeepSeek超越ChatGPT，登頂蘋果美國區(qū)免費(fèi)APP下載排行榜

熱門資訊

推薦資訊

科技最熱文章