設(shè)置
          • 日夜間
            隨系統(tǒng)
            淺色
            深色
          • 主題色

          巖芯數(shù)智董事長(zhǎng)陳代千:通用大模型要解決普適性問題,但必須個(gè)性化、低能耗

          2024-01-26 11:17:53 來源:

          21世紀(jì)經(jīng)濟(jì)報(bào)道記者 張賽男 上海報(bào)道wfc流量資訊——探索最新科技、每天知道多一點(diǎn)LLSUM.COM

          2023年被公認(rèn)為是“大模型元年”,國內(nèi)外大模型層出不窮,堪稱“百模大戰(zhàn)”。在這場(chǎng)競(jìng)賽中,通用大模型、垂直大模型、端側(cè)大模型……各家發(fā)布的大模型各有特色,都想從中分一杯羹。wfc流量資訊——探索最新科技、每天知道多一點(diǎn)LLSUM.COM

          2024年開年之際,新的競(jìng)爭(zhēng)也來臨。先是獵豹移動(dòng)發(fā)布獵戶星空大模型,后有巖山科技(002195.SZ)旗下巖芯數(shù)智推出的自研大模型“Yan模型”……大模型賽道依舊吸引著各路資本的投入。wfc流量資訊——探索最新科技、每天知道多一點(diǎn)LLSUM.COM

          盡管競(jìng)爭(zhēng)者眾多,但市場(chǎng)總會(huì)決出最終的贏家,關(guān)鍵是花落誰家?wfc流量資訊——探索最新科技、每天知道多一點(diǎn)LLSUM.COM

          巖山科技常務(wù)副總經(jīng)理、巖芯數(shù)智董事長(zhǎng)陳代千對(duì)21世紀(jì)經(jīng)濟(jì)報(bào)道記者表示:“最終跑出來的大模型一定具有非常好的用戶體驗(yàn)。大模型本質(zhì)上是用戶的體驗(yàn),不管是B端還是C端,最終是用戶來評(píng)價(jià)這個(gè)大模型好用不好用。用戶體驗(yàn)怎樣才能好?首先,要能完成用戶給出的任務(wù),如果不能完成任務(wù),談高效率、低能耗是不現(xiàn)實(shí)的。在能完成任務(wù)的基礎(chǔ)上,以更低能耗和更高效率去完成,客戶才會(huì)有很強(qiáng)的意愿去復(fù)用。”wfc流量資訊——探索最新科技、每天知道多一點(diǎn)LLSUM.COM

          1月24日,巖芯數(shù)智發(fā)布“Yan模型”,打出的標(biāo)簽是“非Transformer架構(gòu)”,為國內(nèi)首個(gè)非Attention機(jī)制的通用自然語言大模型。在陳代千看來,“Yan模型”去除了Transformer中高成本的注意力機(jī)制,代之以計(jì)算量更小、難度更低的線性計(jì)算,能實(shí)現(xiàn)高效率、低能耗的目標(biāo)。wfc流量資訊——探索最新科技、每天知道多一點(diǎn)LLSUM.COM

          Transformer架構(gòu)或許讓普通人感到陌生,但其實(shí)是當(dāng)下爆火的GPT、LLAMA、PaLM等大模型普遍采用的基礎(chǔ)架構(gòu)。憑借著強(qiáng)大的自然語言理解能力,Transformer在問世的短短幾年內(nèi)便取代了傳統(tǒng)的RNN網(wǎng)絡(luò)結(jié)構(gòu),不僅成為自然語言處理領(lǐng)域的主流模型架構(gòu),還在計(jì)算機(jī)視覺、語音識(shí)別等多個(gè)領(lǐng)域展示了其跨界的通用能力。wfc流量資訊——探索最新科技、每天知道多一點(diǎn)LLSUM.COM

          在Transformer已經(jīng)占據(jù)人工智能領(lǐng)域半壁江山的今天,巖芯數(shù)智為何要另辟蹊徑?wfc流量資訊——探索最新科技、每天知道多一點(diǎn)LLSUM.COM

          算力和成本是巖芯數(shù)智的出發(fā)點(diǎn)。巖芯數(shù)智CEO劉凡平介紹,以大規(guī)模著稱的Transformer,在實(shí)際應(yīng)用中的高算力和高成本,讓不少中小型企業(yè)望而卻步。其內(nèi)部架構(gòu)的復(fù)雜性,讓決策過程難以解釋;長(zhǎng)序列處理困難和無法控制的幻覺問題也限制了大模型在某些關(guān)鍵領(lǐng)域和特殊場(chǎng)景的廣泛應(yīng)用。隨著云計(jì)算和邊緣計(jì)算的普及,行業(yè)對(duì)于高效能、低能耗AI大模型的需求正不斷增長(zhǎng)。wfc流量資訊——探索最新科技、每天知道多一點(diǎn)LLSUM.COM

          “Yan團(tuán)隊(duì)早在三年前就已經(jīng)開始布局、落地非transformer架構(gòu)相關(guān)的事情。在這個(gè)過程中,行業(yè)也慢慢了解到transformer架構(gòu)機(jī)制有一些共性的缺陷,所以大家都會(huì)去研究有沒有其他的算法去優(yōu)化、甚至替代這個(gè)結(jié)構(gòu)。”陳代千說,“我們基于此前的實(shí)踐,確信非transformer的路線是可行的。”wfc流量資訊——探索最新科技、每天知道多一點(diǎn)LLSUM.COM

          陳代千還談到,“對(duì)很多的企業(yè)來說,并不是一定要用千億大模型,用百億大模型也許就可以達(dá)到效果。在千億大模型上訓(xùn)練成本太高,以至于可能無法快速迭代。我們對(duì)通用大模型的理解是,它當(dāng)然要解決很多普適性的問題,但是它必須個(gè)性化、同時(shí)必須低能耗。”他還透露,基于Yan架構(gòu),僅需投入同等規(guī)模Transformer架構(gòu)成本的50%甚至更低,就可以擁有百萬參數(shù)級(jí)的大模型。wfc流量資訊——探索最新科技、每天知道多一點(diǎn)LLSUM.COM

          那么,這個(gè)新架構(gòu)下的大模型運(yùn)行效率如何?從巖芯數(shù)智給出的對(duì)比結(jié)果來看,在同等資源條件下,Yan架構(gòu)的模型,訓(xùn)練效率和推理吞吐量分別是Transformer架構(gòu)的7倍及5倍,并使記憶能力得到3倍提升。對(duì)比數(shù)據(jù)表明,在單張4090 24G顯卡上,當(dāng)模型輸出token的長(zhǎng)度超出2600時(shí),Transformer的模型會(huì)出現(xiàn)顯存不足,而Yan模型的顯存使用始終穩(wěn)定在14G左右,理論上能夠?qū)崿F(xiàn)無限長(zhǎng)度的推理。wfc流量資訊——探索最新科技、每天知道多一點(diǎn)LLSUM.COM

          在主流架構(gòu)之外去搭建一個(gè)新的系統(tǒng),巖芯數(shù)智顯然面臨著更大的挑戰(zhàn)。wfc流量資訊——探索最新科技、每天知道多一點(diǎn)LLSUM.COM

          當(dāng)被問及如何看待全新生態(tài)系統(tǒng)帶來的難度時(shí),巖芯數(shù)智CTO楊華對(duì)21世紀(jì)經(jīng)濟(jì)報(bào)道記者坦言,“這個(gè)點(diǎn)確實(shí)會(huì)存在,我們從零開始搭建構(gòu)建自己的生態(tài),確實(shí)需要花費(fèi)更多時(shí)間,但也是我們堅(jiān)信要走的一條路。”wfc流量資訊——探索最新科技、每天知道多一點(diǎn)LLSUM.COM

          他還表示,現(xiàn)在發(fā)布的產(chǎn)品是Yan 1.0版本,目前正在做Yan 2.0。“最后的通用人工智能,它肯定不僅僅是現(xiàn)在以語言輸入、文本輸出等形式,它應(yīng)該是比如計(jì)算機(jī)視覺、視頻甚至數(shù)字信號(hào)等全模態(tài)的內(nèi)容都可以輸入,然后我的模型也能夠以各種形態(tài),比如說以文字吐出、語音合成或者視頻、信號(hào)處理的方式吐回這個(gè)結(jié)果。我們想做的Yan 2.0,其實(shí)就是往這個(gè)方向走,做一個(gè)全模態(tài)的實(shí)時(shí)人機(jī)交互系統(tǒng)。”wfc流量資訊——探索最新科技、每天知道多一點(diǎn)LLSUM.COM

          本文鏈接:巖芯數(shù)智董事長(zhǎng)陳代千:通用大模型要解決普適性問題,但必須個(gè)性化、低能耗http://www.lensthegame.com/show-2-2395-0.html

          聲明:本網(wǎng)站為非營利性網(wǎng)站,本網(wǎng)頁內(nèi)容由互聯(lián)網(wǎng)博主自發(fā)貢獻(xiàn),不代表本站觀點(diǎn),本站不承擔(dān)任何法律責(zé)任。天上不會(huì)到餡餅,請(qǐng)大家謹(jǐn)防詐騙!若有侵權(quán)等問題請(qǐng)及時(shí)與本網(wǎng)聯(lián)系,我們將在第一時(shí)間刪除處理。

          上一篇: 新東方發(fā)布超預(yù)期財(cái)報(bào) 俞敏洪回應(yīng)董宇輝流量超過東方甄選

          下一篇: 研究表明土壤壓實(shí)影響大豆根系“進(jìn)化”

          熱門資訊

          推薦資訊

          • 日榜
          • 周榜
          • 月榜
          主站蜘蛛池模板: 国产美女在线一区二区三区| 国精品无码一区二区三区在线 | 精品久久国产一区二区三区香蕉| 久久精品国产一区| 鲁丝片一区二区三区免费| 日本一区二区不卡在线| 国产日本一区二区三区| 亚洲AV无码一区二区三区网址 | 大香伊人久久精品一区二区| 精品人妻中文av一区二区三区| 亚欧免费视频一区二区三区| 亚洲综合在线一区二区三区| 一区二区免费国产在线观看| 99久久国产精品免费一区二区| 色噜噜狠狠一区二区| 区三区激情福利综合中文字幕在线一区亚洲视频1 | 亚洲中文字幕久久久一区| 日韩精品一区二区三区国语自制| 亚洲成av人片一区二区三区| 农村乱人伦一区二区| 精品一区二区三区水蜜桃| 日本免费一区二区三区| 国产一区二区三区四| 亚洲日韩国产欧美一区二区三区| 国产福利电影一区二区三区,亚洲国模精品一区 | 亚洲一区二区三区国产精品| 国产91精品一区二区麻豆网站| 蜜臀Av午夜一区二区三区| 亚洲天堂一区二区三区| 国产精品一区二区AV麻豆| 一区二区三区波多野结衣| 日本香蕉一区二区三区| 一区二区三区AV高清免费波多| 国产精品无码AV一区二区三区| 性色AV一区二区三区| 精品无码人妻一区二区免费蜜桃| 精品无码日韩一区二区三区不卡| 日本无码一区二区三区白峰美| 精品无码一区二区三区水蜜桃| 精品乱码一区二区三区四区| 日本一区二区三区在线观看|