設(shè)置
          • 日夜間
            隨系統(tǒng)
            淺色
            深色
          • 主題色

          巖芯數(shù)智董事長(zhǎng)陳代千:通用大模型要解決普適性問(wèn)題,但必須個(gè)性化、低能耗

          2024-01-26 11:17:53 來(lái)源:

          21世紀(jì)經(jīng)濟(jì)報(bào)道記者 張賽男 上海報(bào)道S5b流量資訊——探索最新科技、每天知道多一點(diǎn)LLSUM.COM

          2023年被公認(rèn)為是“大模型元年”,國(guó)內(nèi)外大模型層出不窮,堪稱(chēng)“百模大戰(zhàn)”。在這場(chǎng)競(jìng)賽中,通用大模型、垂直大模型、端側(cè)大模型……各家發(fā)布的大模型各有特色,都想從中分一杯羹。S5b流量資訊——探索最新科技、每天知道多一點(diǎn)LLSUM.COM

          2024年開(kāi)年之際,新的競(jìng)爭(zhēng)也來(lái)臨。先是獵豹移動(dòng)發(fā)布獵戶星空大模型,后有巖山科技(002195.SZ)旗下巖芯數(shù)智推出的自研大模型“Yan模型”……大模型賽道依舊吸引著各路資本的投入。S5b流量資訊——探索最新科技、每天知道多一點(diǎn)LLSUM.COM

          盡管競(jìng)爭(zhēng)者眾多,但市場(chǎng)總會(huì)決出最終的贏家,關(guān)鍵是花落誰(shuí)家?S5b流量資訊——探索最新科技、每天知道多一點(diǎn)LLSUM.COM

          巖山科技常務(wù)副總經(jīng)理、巖芯數(shù)智董事長(zhǎng)陳代千對(duì)21世紀(jì)經(jīng)濟(jì)報(bào)道記者表示:“最終跑出來(lái)的大模型一定具有非常好的用戶體驗(yàn)。大模型本質(zhì)上是用戶的體驗(yàn),不管是B端還是C端,最終是用戶來(lái)評(píng)價(jià)這個(gè)大模型好用不好用。用戶體驗(yàn)怎樣才能好?首先,要能完成用戶給出的任務(wù),如果不能完成任務(wù),談高效率、低能耗是不現(xiàn)實(shí)的。在能完成任務(wù)的基礎(chǔ)上,以更低能耗和更高效率去完成,客戶才會(huì)有很強(qiáng)的意愿去復(fù)用。”S5b流量資訊——探索最新科技、每天知道多一點(diǎn)LLSUM.COM

          1月24日,巖芯數(shù)智發(fā)布“Yan模型”,打出的標(biāo)簽是“非Transformer架構(gòu)”,為國(guó)內(nèi)首個(gè)非Attention機(jī)制的通用自然語(yǔ)言大模型。在陳代千看來(lái),“Yan模型”去除了Transformer中高成本的注意力機(jī)制,代之以計(jì)算量更小、難度更低的線性計(jì)算,能實(shí)現(xiàn)高效率、低能耗的目標(biāo)。S5b流量資訊——探索最新科技、每天知道多一點(diǎn)LLSUM.COM

          Transformer架構(gòu)或許讓普通人感到陌生,但其實(shí)是當(dāng)下爆火的GPT、LLAMA、PaLM等大模型普遍采用的基礎(chǔ)架構(gòu)。憑借著強(qiáng)大的自然語(yǔ)言理解能力,Transformer在問(wèn)世的短短幾年內(nèi)便取代了傳統(tǒng)的RNN網(wǎng)絡(luò)結(jié)構(gòu),不僅成為自然語(yǔ)言處理領(lǐng)域的主流模型架構(gòu),還在計(jì)算機(jī)視覺(jué)、語(yǔ)音識(shí)別等多個(gè)領(lǐng)域展示了其跨界的通用能力。S5b流量資訊——探索最新科技、每天知道多一點(diǎn)LLSUM.COM

          在Transformer已經(jīng)占據(jù)人工智能領(lǐng)域半壁江山的今天,巖芯數(shù)智為何要另辟蹊徑?S5b流量資訊——探索最新科技、每天知道多一點(diǎn)LLSUM.COM

          算力和成本是巖芯數(shù)智的出發(fā)點(diǎn)。巖芯數(shù)智CEO劉凡平介紹,以大規(guī)模著稱(chēng)的Transformer,在實(shí)際應(yīng)用中的高算力和高成本,讓不少中小型企業(yè)望而卻步。其內(nèi)部架構(gòu)的復(fù)雜性,讓決策過(guò)程難以解釋?zhuān)婚L(zhǎng)序列處理困難和無(wú)法控制的幻覺(jué)問(wèn)題也限制了大模型在某些關(guān)鍵領(lǐng)域和特殊場(chǎng)景的廣泛應(yīng)用。隨著云計(jì)算和邊緣計(jì)算的普及,行業(yè)對(duì)于高效能、低能耗AI大模型的需求正不斷增長(zhǎng)。S5b流量資訊——探索最新科技、每天知道多一點(diǎn)LLSUM.COM

          “Yan團(tuán)隊(duì)早在三年前就已經(jīng)開(kāi)始布局、落地非transformer架構(gòu)相關(guān)的事情。在這個(gè)過(guò)程中,行業(yè)也慢慢了解到transformer架構(gòu)機(jī)制有一些共性的缺陷,所以大家都會(huì)去研究有沒(méi)有其他的算法去優(yōu)化、甚至替代這個(gè)結(jié)構(gòu)。”陳代千說(shuō),“我們基于此前的實(shí)踐,確信非transformer的路線是可行的。”S5b流量資訊——探索最新科技、每天知道多一點(diǎn)LLSUM.COM

          陳代千還談到,“對(duì)很多的企業(yè)來(lái)說(shuō),并不是一定要用千億大模型,用百億大模型也許就可以達(dá)到效果。在千億大模型上訓(xùn)練成本太高,以至于可能無(wú)法快速迭代。我們對(duì)通用大模型的理解是,它當(dāng)然要解決很多普適性的問(wèn)題,但是它必須個(gè)性化、同時(shí)必須低能耗。”他還透露,基于Yan架構(gòu),僅需投入同等規(guī)模Transformer架構(gòu)成本的50%甚至更低,就可以擁有百萬(wàn)參數(shù)級(jí)的大模型。S5b流量資訊——探索最新科技、每天知道多一點(diǎn)LLSUM.COM

          那么,這個(gè)新架構(gòu)下的大模型運(yùn)行效率如何?從巖芯數(shù)智給出的對(duì)比結(jié)果來(lái)看,在同等資源條件下,Yan架構(gòu)的模型,訓(xùn)練效率和推理吞吐量分別是Transformer架構(gòu)的7倍及5倍,并使記憶能力得到3倍提升。對(duì)比數(shù)據(jù)表明,在單張4090 24G顯卡上,當(dāng)模型輸出token的長(zhǎng)度超出2600時(shí),Transformer的模型會(huì)出現(xiàn)顯存不足,而Yan模型的顯存使用始終穩(wěn)定在14G左右,理論上能夠?qū)崿F(xiàn)無(wú)限長(zhǎng)度的推理。S5b流量資訊——探索最新科技、每天知道多一點(diǎn)LLSUM.COM

          在主流架構(gòu)之外去搭建一個(gè)新的系統(tǒng),巖芯數(shù)智顯然面臨著更大的挑戰(zhàn)。S5b流量資訊——探索最新科技、每天知道多一點(diǎn)LLSUM.COM

          當(dāng)被問(wèn)及如何看待全新生態(tài)系統(tǒng)帶來(lái)的難度時(shí),巖芯數(shù)智CTO楊華對(duì)21世紀(jì)經(jīng)濟(jì)報(bào)道記者坦言,“這個(gè)點(diǎn)確實(shí)會(huì)存在,我們從零開(kāi)始搭建構(gòu)建自己的生態(tài),確實(shí)需要花費(fèi)更多時(shí)間,但也是我們堅(jiān)信要走的一條路。”S5b流量資訊——探索最新科技、每天知道多一點(diǎn)LLSUM.COM

          他還表示,現(xiàn)在發(fā)布的產(chǎn)品是Yan 1.0版本,目前正在做Yan 2.0。“最后的通用人工智能,它肯定不僅僅是現(xiàn)在以語(yǔ)言輸入、文本輸出等形式,它應(yīng)該是比如計(jì)算機(jī)視覺(jué)、視頻甚至數(shù)字信號(hào)等全模態(tài)的內(nèi)容都可以輸入,然后我的模型也能夠以各種形態(tài),比如說(shuō)以文字吐出、語(yǔ)音合成或者視頻、信號(hào)處理的方式吐回這個(gè)結(jié)果。我們想做的Yan 2.0,其實(shí)就是往這個(gè)方向走,做一個(gè)全模態(tài)的實(shí)時(shí)人機(jī)交互系統(tǒng)。”S5b流量資訊——探索最新科技、每天知道多一點(diǎn)LLSUM.COM

          本文鏈接:巖芯數(shù)智董事長(zhǎng)陳代千:通用大模型要解決普適性問(wèn)題,但必須個(gè)性化、低能耗http://www.lensthegame.com/show-2-2395-0.html

          聲明:本網(wǎng)站為非營(yíng)利性網(wǎng)站,本網(wǎng)頁(yè)內(nèi)容由互聯(lián)網(wǎng)博主自發(fā)貢獻(xiàn),不代表本站觀點(diǎn),本站不承擔(dān)任何法律責(zé)任。天上不會(huì)到餡餅,請(qǐng)大家謹(jǐn)防詐騙!若有侵權(quán)等問(wèn)題請(qǐng)及時(shí)與本網(wǎng)聯(lián)系,我們將在第一時(shí)間刪除處理。

          上一篇: 新東方發(fā)布超預(yù)期財(cái)報(bào) 俞敏洪回應(yīng)董宇輝流量超過(guò)東方甄選

          下一篇: 研究表明土壤壓實(shí)影響大豆根系“進(jìn)化”

          熱門(mén)資訊

          推薦資訊

          • 日榜
          • 周榜
          • 月榜
          主站蜘蛛池模板: 香蕉久久ac一区二区三区| 久久一区二区精品| 成人精品一区二区三区校园激情| 久久精品免费一区二区三区 | 一区二区三区福利视频| 无码一区二区三区AV免费| 波多野结衣一区二区| 精品无人区一区二区三区在线| 无码人妻精品一区二区三区久久| 国产对白精品刺激一区二区| 一区二区三区免费精品视频| 国产未成女一区二区三区 | 国产精品一区二区AV麻豆| 日韩精品电影一区| 国产一区二区影院| 日韩精品无码久久一区二区三| 亚洲高清偷拍一区二区三区| 久久精品国产第一区二区| 日韩制服国产精品一区| 色欲综合一区二区三区| 麻豆国产一区二区在线观看| 亚洲中文字幕久久久一区| 国精产品一区一区三区有限公司 | 亚洲AV无码一区二区三区鸳鸯影院 | 精品无码国产一区二区三区AV| 亚洲视频一区网站| 无码人妻精品一区二区三区不卡 | 亚洲国产精品综合一区在线| 欧美日韩国产免费一区二区三区| 色综合久久一区二区三区| 一区二区在线免费视频| 国产亚洲一区二区三区在线| 精品国产aⅴ无码一区二区| 加勒比无码一区二区三区| 一区 二区 三区 中文字幕| 精品乱人伦一区二区三区| 亚洲av色香蕉一区二区三区| 一区二区三区高清视频在线观看| 国精品无码一区二区三区左线| 老熟妇仑乱一区二区视頻| 国产aⅴ一区二区|