設置
          • 日夜間
            隨系統
            淺色
            深色
          • 主題色

          ai芯片市場前景「業內:過去數月老款AI芯片降價,大模型培訓成本降60%」

          2024-01-26 11:19:21 來源:

          qLx流量資訊——探索最新科技、每天知道多一點LLSUM.COM

          1月24日消息,眾所周知,開發大語言模型(LLM)成本高昂。這不僅包括模型本身的研發,還有在云端運行這些模型的費用。以人工智能初創公司Anthropic為例,云端運行模型的成本幾乎占了該公司上個月收入的一半以上,這還未算上訓練模型的成本。qLx流量資訊——探索最新科技、每天知道多一點LLSUM.COM

          然而,最近的技術進步有望降低大語言模型的開發和運行成本。目前尚不清楚這是否足以將大語言模型開發轉變為高利潤的軟件業務,但它應該有助于緩解許多最緊迫的成本問題。qLx流量資訊——探索最新科技、每天知道多一點LLSUM.COM

          以Writer為例,這家初創公司專門為企業開發人工智能工具。該公司聯合創始人兼首席技術官瓦西姆·阿爾謝赫(Waseem Alshikh)表示,過去三到四個月,一些老式人工智能芯片(如英偉達A100 GPU)的價格不斷下滑,幫助他們將模型培訓成本降低了約60%。此外,英偉達還優化了軟件性能,幫助開發者在這些芯片上更快地訓練和運行大型模型。qLx流量資訊——探索最新科技、每天知道多一點LLSUM.COM

          qLx流量資訊——探索最新科技、每天知道多一點LLSUM.COM

          但與此同時,隨著云計算服務提供商推出更多H100芯片,Writer開始使用更多英偉達新款芯片來訓練大語言模型。阿爾謝赫指出,這些較新的芯片價格高昂,但在模型訓練方面比A100更快。qLx流量資訊——探索最新科技、每天知道多一點LLSUM.COM

          qLx流量資訊——探索最新科技、每天知道多一點LLSUM.COM

          開發者還利用各種新的培訓技術和配置來降低成本。像GPT-4這樣的大型語言模型實際上是由多個“專家”模型組成的,而非一個龐大的模型,每個模型專攻不同主題。這種混合專家系統(Mixture of Experts,簡稱MoE或ME)的計算效率更高,因為查詢僅觸發模型的某些部分,而非整個模型。qLx流量資訊——探索最新科技、每天知道多一點LLSUM.COM

          其他技術,如量化和大語言模型的低階自適應,使得訓練和調整模型的成本更低,且對模型性能影響微乎其微。qLx流量資訊——探索最新科技、每天知道多一點LLSUM.COM

          大語言模型開發者還找到了更高效利用硬件的方法。谷歌研究人員估計,在訓練GPT-3時,OpenAI的GPU大約有80%的時間處于閑置狀態,等待數據輸入。換句話說,它并未充分利用GPU資源。然而,GPU經銷商Together的首席科學家特里·道(Tri Dao)表示,通過采用名為FlashAttention-2的不同技術,可將閑置時間縮短至30%左右。眾多開發者已開始利用這項技術,包括法國人工智能初創公司Mistral。qLx流量資訊——探索最新科技、每天知道多一點LLSUM.COM

          盡管人工智能開發人員擁有眾多降低成本的工具,但并不意味著他們會全都使用。OpenAI、Anthropic等前沿模型的開發商追求卓越的芯片、人才和數據資源,因此他們可能會暫時擱置利潤率目標。qLx流量資訊——探索最新科技、每天知道多一點LLSUM.COM

          例如,Facebook母公司Meta首席執行官馬克·扎克伯格(Mark Zuckerberg)宣布,該公司計劃在今年年底前獲得3.5萬個H100 GPU(總成本超過70億美元)。這表明,實力雄厚的公司正不惜重金購買尖端芯片,即便老款GPU價格更為親民。qLx流量資訊——探索最新科技、每天知道多一點LLSUM.COM

          此外,我們切勿忽視獲取新數據以訓練大語言模型的成本。像OpenAI和蘋果等公司從出版商那里獲得內容授權的費用看似微不足道,但未來可能會大幅增長。盡管大語言模型正逐步生成用于新模型的“合成”訓練數據,但仍有許多高質量信息是它們無法復制的。(小小)qLx流量資訊——探索最新科技、每天知道多一點LLSUM.COM

          qLx流量資訊——探索最新科技、每天知道多一點LLSUM.COM

          本文鏈接:ai芯片市場前景「業內:過去數月老款AI芯片降價,大模型培訓成本降60%」http://www.lensthegame.com/show-3-7955-0.html

          聲明:本網站為非營利性網站,本網頁內容由互聯網博主自發貢獻,不代表本站觀點,本站不承擔任何法律責任。天上不會到餡餅,請大家謹防詐騙!若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。

          上一篇: 矢量圖標設計軟件「設計提效丨你要的免費商用高質量矢量圖標庫來啦!」

          下一篇: 短劇投手掌錢:“揮金如土”,一晚虧10萬_投手是干什么的

          熱門資訊

          推薦資訊

          • 日榜
          • 周榜
          • 月榜
          主站蜘蛛池模板: 成人H动漫精品一区二区| 精品人妻码一区二区三区| 亚洲一区动漫卡通在线播放| 亚洲日韩一区精品射精| 成人乱码一区二区三区av| 暖暖免费高清日本一区二区三区 | 国产在线精品一区二区在线观看| 一区二区视频在线播放| 痴汉中文字幕视频一区| 精品国产免费观看一区| 韩国美女vip福利一区| 国产爆乳无码一区二区麻豆| 亚洲国产高清在线一区二区三区| 69福利视频一区二区| 久久精品一区二区三区资源网 | 精品国产一区二区三区免费看| 无码精品人妻一区二区三区人妻斩| 精品一区二区三区影院在线午夜| 国产乱码精品一区二区三区麻豆 | 国产微拍精品一区二区| 3d动漫精品啪啪一区二区免费 | 精品成人乱色一区二区| 日本在线一区二区| 中文字幕人妻无码一区二区三区| 色一乱一伦一区一直爽| 国产精品成人一区无码| 天海翼一区二区三区高清视频| 国产日韩一区二区三区| 激情内射亚洲一区二区三区爱妻| 久久一区二区三区免费播放| 国产精品美女一区二区视频| 国模丽丽啪啪一区二区| 久久国产三级无码一区二区| 久久AAAA片一区二区| 亚洲夜夜欢A∨一区二区三区| 中文字幕一区二区三区在线不卡 | 日本精品一区二区在线播放| 欧洲精品免费一区二区三区| 国产成人一区二区在线不卡| 国产中文字幕一区| 一区二区三区四区在线视频|