(文/湯普濟(jì) 呂棟)
一邊是高端芯片出貨預(yù)期遭投行巨頭大幅下調(diào),一邊是中國(guó)國(guó)產(chǎn)算力產(chǎn)業(yè)集體支持DeepSeek,在市場(chǎng)看來(lái),GPU巨頭英偉達(dá)股票遭遇的拋售潮似乎仍未結(jié)束。
出貨預(yù)期遭大幅下調(diào)
近日,摩根士丹利發(fā)布最新研究報(bào)告,將英偉達(dá)人工智能芯片GB200 NVL72( 在NVLink域中支持72個(gè)GPU)的2025年出貨量從3萬(wàn)到3.5萬(wàn)大幅下調(diào)至2萬(wàn)到2.5萬(wàn)件。在最壞的情況下,出貨量可能低于2萬(wàn)件。
科技媒體Wccftech報(bào)道稱,這一調(diào)整可能導(dǎo)致300億至350億美元(約合人民幣2184億至2548億元)的GB200供應(yīng)鏈?zhǔn)艿接绊懀?duì)相關(guān)供應(yīng)鏈和半導(dǎo)體企業(yè)造成巨大壓力。
根據(jù)摩根士丹利報(bào)告,調(diào)整的理由是“GB200芯片的主要客戶之一”微軟重新關(guān)注機(jī)型的效率,相應(yīng)地縮減了資本支出增長(zhǎng),對(duì)供應(yīng)鏈產(chǎn)生了負(fù)面影響。此前,微軟CEO納德拉在電話會(huì)上稱,AI成本下降是趨勢(shì)。
同時(shí),尚未成熟的的云計(jì)算和人工智能基礎(chǔ)設(shè)施生態(tài)系統(tǒng),特別是在與GB200相關(guān)的網(wǎng)絡(luò)和電力公用事業(yè)等領(lǐng)域仍然存在不足,供應(yīng)鏈沒(méi)有跟上需求的步伐,限制了GB200的部署。
GB200于2024年3月18日正式發(fā)布。其NVL72可以在一個(gè)機(jī)架中配置72個(gè)GPU,在兩個(gè)機(jī)架中配置18個(gè)雙GB200計(jì)算節(jié)點(diǎn),即72個(gè)GPU,其中有18個(gè)單GB200計(jì)算節(jié)點(diǎn)。
過(guò)去兩年,得益于AI大模型對(duì)算力獲取的焦慮,英偉達(dá)股價(jià)如日中天飆漲,但隨著國(guó)產(chǎn)大模型DeepSeek的橫空出世,它的低成本和高效率,讓市場(chǎng)對(duì)英偉達(dá)的“算力神話”產(chǎn)生動(dòng)搖,截至美東時(shí)間2月3日,英偉達(dá)股價(jià)對(duì)比1月的高點(diǎn),累計(jì)跌幅達(dá)23.8%,總市值累計(jì)蒸發(fā)8931億美元(約合人民幣6.5萬(wàn)億元)。
摩根士丹利認(rèn)為,市場(chǎng)上對(duì)于大型語(yǔ)言模型(LLM)的效率存在爭(zhēng)議,比如DeepSeek與微軟之間存在分歧。1月29日,OpenAI與其最大支持者微軟宣稱就DeepSeek獲取數(shù)據(jù)的方式進(jìn)行調(diào)查。
這家美國(guó)投行巨頭預(yù)計(jì),這些情況將持續(xù)到2025年,使市場(chǎng)難以重新評(píng)估英偉達(dá)等股票的價(jià)值。此外,根據(jù)行業(yè)周期,到2025年第四季度,云計(jì)算行業(yè)的資本支出增長(zhǎng)可能會(huì)放緩至個(gè)位數(shù)。
摩根士丹利指出,云計(jì)算行業(yè)的資本支出是周期性的。歷史數(shù)據(jù)顯示,云計(jì)算行業(yè)通常經(jīng)歷2-3年的增長(zhǎng)周期,隨后是2-4個(gè)季度的低迷期。這種低迷主要表現(xiàn)在美國(guó)大型云服務(wù)提供商的同比增長(zhǎng)放緩。
國(guó)產(chǎn)算力集體支持DeepSeek
在英偉達(dá)股票的拋售潮中,中國(guó)的工程師們加班加點(diǎn),國(guó)產(chǎn)算力開(kāi)始相繼和DeepSeek聯(lián)手。
2月5日開(kāi)工第一天,“華為計(jì)算”發(fā)文稱,DeepSeek系列模型首發(fā)即支持昇騰平臺(tái),用戶能夠在昇騰硬件和MindIE推理引擎上實(shí)現(xiàn)高效推理。2月4日,DeepSeek-R1、DeepSeek-V3、DeepSeek-V2、Janus-Pro正式上線昇騰社區(qū),支持一鍵獲取DeepSeek系列模型,支持昇騰硬件平臺(tái)上開(kāi)箱即用,推理快速部署。
大年初四,經(jīng)過(guò)硅基流動(dòng)和華為云團(tuán)隊(duì)連?攻堅(jiān),雙方聯(lián)合?發(fā)并上線基于華為云昇騰云服務(wù)的DeepSeekR1/V3推理服務(wù),可獲得持平全球?端GPU部署模型的效果,提供穩(wěn)定的、?產(chǎn)級(jí)服務(wù)能力。
隨后阿里云、百度智能云、騰訊云、京東云、天翼云、字節(jié)跳動(dòng)火山引擎等國(guó)內(nèi)多個(gè)云平臺(tái),先后官宣了對(duì)DeepSeek的支持和適配。
在市場(chǎng)分析看來(lái),雖然DeepSeek的模型是開(kāi)源的,但全球云服務(wù)廠商們對(duì)模型的支持仍然十分關(guān)鍵。通過(guò)支持DeepSeek模型的云平臺(tái),開(kāi)發(fā)者可以省去買卡、裝驅(qū)動(dòng)、配網(wǎng)絡(luò)、配存儲(chǔ)、裝環(huán)境、裝框架、下載模型等一系列繁瑣步驟,直接在云服務(wù)廠商的平臺(tái)上去調(diào)用DeepSeek模型。
不止這些云廠商,國(guó)產(chǎn)芯片廠商也紛紛宣布對(duì)DeepSeek的支持。
2月5日上午,海光信息發(fā)文稱,近日海光信息技術(shù)團(tuán)隊(duì)成功完成DeepSeek-Janus-Pro多模態(tài)大模型與海光DCU的適配優(yōu)化,并正式上線。這是繼DeepSeek V3和R1模型之后,海光團(tuán)隊(duì)近期完成適配優(yōu)化的第三款DeepSeek大模型。該公司表示,因DCU采用了GPGPU通用加速計(jì)算架構(gòu),DeepSeek模型可直接在DCU上運(yùn)行,并不需要大量適配工作,技術(shù)團(tuán)隊(duì)的主要工作是進(jìn)行精度驗(yàn)證和持續(xù)的性能優(yōu)化。
下午,壁仞科技發(fā)布消息稱,該公司僅用數(shù)小時(shí)即完成對(duì)DeepSeek R1全系列蒸餾模型的支持,涵蓋了從1.5B到70B各等級(jí)參數(shù)版本,包括LLaMA蒸餾模型和千問(wèn)蒸餾模型;壁仞AI算力平臺(tái)正式上線 DeepSeek R1蒸餾模型推理服務(wù)。該公司還表示,已聯(lián)合上海智能算力科技有限公司、中興通訊、科華數(shù)據(jù)、無(wú)問(wèn)芯穹、開(kāi)源中國(guó)(Gitee AI)、UCloud、一驀科技等戰(zhàn)略伙伴,全面開(kāi)展包括R1在內(nèi)的DeepSeek全系列模型的適配與上線,以滿足不同規(guī)模參數(shù)量模型的部署需求。
2月4日,國(guó)產(chǎn)GPU創(chuàng)企摩爾線程透露,該公司基于自研全功能GPU,通過(guò)開(kāi)源與自研雙引擎方案,快速實(shí)現(xiàn)了對(duì)DeepSeek蒸餾模型的推理服務(wù)部署,用戶也可以基于MTT S80和MTT S4000進(jìn)行DeepSeek-R1蒸餾模型的推理部署。該公司還表示,為推進(jìn)國(guó)產(chǎn)AI生態(tài)發(fā)展,摩爾線程即將開(kāi)放自主設(shè)計(jì)的夸娥(KUAE)GPU智算集群,全面支持DeepSeek V3、R1模型及新一代蒸餾模型的分布式部署。
同一天,天數(shù)智芯與Gitee AI聯(lián)合發(fā)布消息,在雙方的協(xié)作下,僅用時(shí)一天,便成功完成了與DeepSeek R1的適配工作,并且已正式上線多款大模型服務(wù),其中包括DeepSeek R1-Distill-Qwen-1.5B、DeepSeek R1-Distill-Qwen-7B、DeepSeek R1-Distill-Qwen-14B等。
無(wú)獨(dú)有偶,2月2日,Gitee AI聯(lián)合沐曦首發(fā)全套DeepSeek R1千問(wèn)蒸餾模型。本次上線的四個(gè)模型(1.5B、7B、14B、32B)均部署在國(guó)產(chǎn)沐曦曦云GPU上。該平臺(tái)表示,這次Deepseek R1模型+沐曦曦云GPU + Gitee AI平臺(tái),實(shí)現(xiàn)了從芯片到平臺(tái),從算力到模型的全部國(guó)產(chǎn)研發(fā)。隨后在2月5日,聯(lián)想集團(tuán)和沐曦股份聯(lián)合發(fā)布基于DeepSeek大模型的首個(gè)國(guó)產(chǎn)一體機(jī)解決方案,該方案以“聯(lián)想服務(wù)器/工作站+沐曦訓(xùn)推一體國(guó)產(chǎn)GPU+自主算法”為核心架構(gòu),實(shí)現(xiàn)從千億參數(shù)大模型訓(xùn)練到場(chǎng)景化推理落地的全鏈條覆蓋。
不僅如此,相關(guān)產(chǎn)業(yè)鏈也在積極行動(dòng)。AI基礎(chǔ)設(shè)施企業(yè)無(wú)問(wèn)芯穹除夕當(dāng)天宣布Infini-AI異構(gòu)云對(duì)DeepSeek-R1-Distill 32B模型的支持,PPIO派歐、云軸科技則在2月2日官宣對(duì)于DeepSeek模型的支持。
根據(jù)介紹,PPIO派歐算力云支持了DeepSeek-V3、DeepSeek-R1、蒸餾模型DeepSeek-R1-Distill-Llama-70B,模型價(jià)格與官方價(jià)格保持一致;云軸科技ZStack宣布AI Infra平臺(tái)ZStack智塔支持企業(yè)私有化部署DeepSeek V3/R1/Janus Pro三種模型,可基于海光、昇騰、英偉達(dá)、英特爾等國(guó)內(nèi)外CPU/GPU適配。
在行業(yè)看來(lái),國(guó)內(nèi)算力產(chǎn)業(yè)鏈與DeepSeek的適配,可實(shí)現(xiàn)深度學(xué)習(xí)框架與國(guó)內(nèi)自主硬件的深度融合,充分發(fā)揮國(guó)內(nèi)GPU算力優(yōu)勢(shì),提升DeepSeek模型訓(xùn)練和推理的計(jì)算效率,還能促進(jìn)國(guó)內(nèi)人工智能產(chǎn)業(yè)鏈自主可控發(fā)展,減少對(duì)國(guó)外硬件平臺(tái)的依賴,降低技術(shù)風(fēng)險(xiǎn)和成本,更有助于國(guó)內(nèi)GPU拓展市場(chǎng),吸引更多上下游企業(yè)合作,完善產(chǎn)業(yè)鏈生態(tài),促進(jìn)應(yīng)用加速落地。
本文系觀察者網(wǎng)獨(dú)家稿件,未經(jīng)授權(quán),不得轉(zhuǎn)載。
本文鏈接:英偉達(dá)出貨預(yù)期遭大幅下調(diào),國(guó)產(chǎn)算力集體支持DeepSeekhttp://www.lensthegame.com/show-3-60605-0.html
聲明:本網(wǎng)站為非營(yíng)利性網(wǎng)站,本網(wǎng)頁(yè)內(nèi)容由互聯(lián)網(wǎng)博主自發(fā)貢獻(xiàn),不代表本站觀點(diǎn),本站不承擔(dān)任何法律責(zé)任。天上不會(huì)到餡餅,請(qǐng)大家謹(jǐn)防詐騙!若有侵權(quán)等問(wèn)題請(qǐng)及時(shí)與本網(wǎng)聯(lián)系,我們將在第一時(shí)間刪除處理。