設置
          • 日夜間
            隨系統
            淺色
            深色
          • 主題色

          Llama 3模型的推理性能 延遲降低2倍_英特爾披露至強6處理器針對Meta

          2024-04-20 16:46:21 來源:

          【】4月20日消息,近日,Meta重磅推出其80億和700億參數的Meta Llama 3開源大模型。該模型引入了改進推理等新功能和更多的模型尺寸,并采用全新標記器(Tokenizer),旨在提升編碼語言效率并提高模型性能。UmC流量資訊——探索最新科技、每天知道多一點LLSUM.COM

          在模型發布的第一時間,英特爾即驗證了Llama 3能夠在包括英特爾至強處理器在內的豐富AI產品組合上運行,并披露了即將發布的英特爾至強6性能核處理器(代號為Granite Rapids)針對Meta Llama 3模型的推理性能。UmC流量資訊——探索最新科技、每天知道多一點LLSUM.COM

          英特爾至強處理器可以滿足要求嚴苛的端到端AI工作負載的需求。以第五代至強處理器為例,每個核心均內置了AMX加速引擎,能夠提供出色的AI推理和訓練性能。截至目前,該處理器已被眾多主流云服務商所采用。不僅如此,至強處理器在進行通用計算時,能夠提供更低時延,并能同時處理多種工作負載。UmC流量資訊——探索最新科技、每天知道多一點LLSUM.COM

          事實上,英特爾一直在持續優化至強平臺的大模型推理性能。例如,相較于Llama 2模型的軟件,PyTorch及英特爾?PyTorch擴展包(Intel?Extension for PyTorch)的延遲降低了5倍。這一優化是通過Paged Attention算法和張量并行實現的,這是因為其能夠最大化可用算力及內存帶寬。下圖展示了80億參數的Meta Lama 3模型在AWS m7i.metal-48x實例上的推理性能,該實例基于第四代英特爾至強可擴展處理器。UmC流量資訊——探索最新科技、每天知道多一點LLSUM.COM

          AWS實例上Llama 3的下一個Token延遲UmC流量資訊——探索最新科技、每天知道多一點LLSUM.COM

          不僅如此,英特爾還首次披露了即將發布的產品——英特爾至強?6性能核處理器(代號為Granite Rapids)針對Meta Llama 3的性能測試。結果顯示,與第四代至強處理器相比,英特爾至強6處理器在80億參數的Llama 3推理模型的延遲降低了2倍,并且能夠以低于100毫秒的token延遲,在單個雙路服務器上運行諸如700億參數的Llama 3這種更大參數的推理模型。UmC流量資訊——探索最新科技、每天知道多一點LLSUM.COM

          基于英特爾至強 6性能核處理器(代號Granite Rapids)的Llama 3下一個Token延遲UmC流量資訊——探索最新科技、每天知道多一點LLSUM.COM

          考慮到Llama 3具備更高效的編碼語言標記器(Tokenizer),測試采用了隨機選擇的prompt對Llama 3和Llama 2進行快速比較。在prompt相同的情況下,Llama 3所標記的token數量相較Llama 2減少18%。因此,即使80億參數的Llama 3模型比70億參數的Llama 2模型參數更高,在AWS m7i.metal-48xl實例上運行BF16推理時,整體prompt的推理時延幾乎相同(該評估中,Llama 3比Llama 2快1.04倍)。UmC流量資訊——探索最新科技、每天知道多一點LLSUM.COM

          本文鏈接:Llama 3模型的推理性能 延遲降低2倍_英特爾披露至強6處理器針對Metahttp://www.lensthegame.com/show-3-17157-0.html

          聲明:本網站為非營利性網站,本網頁內容由互聯網博主自發貢獻,不代表本站觀點,本站不承擔任何法律責任。天上不會到餡餅,請大家謹防詐騙!若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。

          上一篇: 2024北京國際車展展位圖公布:小米、智己“冤家聚頭”_21年4月北京車展

          下一篇: “芯”之“力”|“云啟芯篇,一云多芯激活新質生產力”主題交流會在京成功舉辦!

          熱門資訊

          推薦資訊

          • 日榜
          • 周榜
          • 月榜
          主站蜘蛛池模板: 国产视频一区二区在线播放| 综合一区自拍亚洲综合图区| 无码一区二区三区| 亚洲另类无码一区二区三区| 丝袜无码一区二区三区| 国产精品成人一区二区三区| 中文字幕一区二区三区在线观看| 无码精品前田一区二区| 亚洲AV一区二区三区四区| 午夜福利一区二区三区在线观看| 亚洲一区二区视频在线观看| 精品国产一区二区麻豆| 欧美激情一区二区三区成人| 搡老熟女老女人一区二区| 亚洲中文字幕无码一区二区三区 | 性色av无码免费一区二区三区| 国产精品va无码一区二区| 亚洲一区二区三区在线播放| 国产一区二区三区小向美奈子| 加勒比无码一区二区三区| 亚洲丰满熟女一区二区v| 亚洲福利一区二区| 国产精品制服丝袜一区| 日韩免费一区二区三区在线播放 | 正在播放国产一区| 日本韩国一区二区三区| 精品视频在线观看一区二区 | 精品视频一区二区三区在线播放| 欧美日韩精品一区二区在线视频 | 竹菊影视欧美日韩一区二区三区四区五区 | 风流老熟女一区二区三区| 免费看无码自慰一区二区| 日韩av片无码一区二区不卡电影| 国产精品一区二区久久| 欧美激情国产精品视频一区二区| 国产精品亚洲一区二区麻豆| 亚洲AV无码片一区二区三区 | 精品国产日韩亚洲一区在线| 国产成人av一区二区三区不卡| 一区二区三区免费在线视频| 成人一区二区免费视频|