設置
          • 日夜間
            隨系統
            淺色
            深色
          • 主題色

          可令 AI 自我判斷輸出內容正確性,谷歌公布模型訓練框架 ASPIRE

          2024-01-24 12:46:41 來源:

          IT之家 1 月 23 日消息,谷歌日前發布新聞稿,介紹了一款專為大語言模型設計的 ASPIRE 訓練框架,該框架號稱可以增強 AI 模型的選擇性預測能力。ruF流量資訊——探索最新科技、每天知道多一點LLSUM.COM


          ruF流量資訊——探索最新科技、每天知道多一點LLSUM.COM

          谷歌提到,當下大語言模型在自然語言理解和生成內容方面發展迅速,已被用于構建各種創新應用,但要應用于高風險決策類場合依然不妥。這是由于模型預測具有不確定性及“幻覺”可能,因此谷歌開發了一款 ASPIRE 訓練框架,為系列模型引入了“可信度”機制,即 —— 模型會輸出一系列答案,每個答案都會具有正確概率評分。ruF流量資訊——探索最新科技、每天知道多一點LLSUM.COM


          ruF流量資訊——探索最新科技、每天知道多一點LLSUM.COM

          ▲ 圖源 谷歌新聞稿(下同)ruF流量資訊——探索最新科技、每天知道多一點LLSUM.COM

          在技術層面,IT之家注意到該訓練框架主要分為三階段,分別為“特定任務調整”、“答案采樣”和“自我評估學習”。ruF流量資訊——探索最新科技、每天知道多一點LLSUM.COM

          其中“特定任務調整”階段是對已接受過基礎訓練的大型語言模型進行深入訓練,專注于強化模型的預測能力。研究人員主要為模型引入一系列可調參數,在特定任務的訓練數據集上微調預訓練語言模型,從而提升模型預測性能,讓模型能夠更好地解決特定問題。ruF流量資訊——探索最新科技、每天知道多一點LLSUM.COM


          ruF流量資訊——探索最新科技、每天知道多一點LLSUM.COM

          ruF流量資訊——探索最新科技、每天知道多一點LLSUM.COM

          第二階段為“答案采樣”,經過特定微調后,模型可以利用先前學習到的可調參數,為每個訓練問題生成不同的答案,并創建用于自我評估學習的數據集,生成一系列可信度較高的答案。研究人員同時使用“集束搜索(Beam Search)”方法及 Rouge-L 算法來評估答案的質量,并將生成的答案及評分重新輸入給模型開啟第三階段。ruF流量資訊——探索最新科技、每天知道多一點LLSUM.COM


          ruF流量資訊——探索最新科技、每天知道多一點LLSUM.COM

          而在第三階段“自我評估學習”中,研究人員為模型添加一組可調參數,專門用于提升模型自我評估能力。該階段的目標是讓模型學會“自己判斷輸出的答案準確性”,從而讓大語言模型在生成答案時,還會附上答案的正確概率評分。ruF流量資訊——探索最新科技、每天知道多一點LLSUM.COM

          谷歌研究人員使用 CoQA、TriviaQA 和 SQuAD 三個問答數據集來驗證 ASPIRE 訓練框架的成果,據稱“經過 ASPIRE 調整的 OPT-2.7B 小模型,表現遠超更大的 OPT-30B 模型”。而這項實驗結果也同時表明,只要經過適當的調整,即使是小語言模型,在部分場景下也可以超越大語言模型。ruF流量資訊——探索最新科技、每天知道多一點LLSUM.COM


          ruF流量資訊——探索最新科技、每天知道多一點LLSUM.COM

          研究人員總結稱,ASPIRE 框架訓練能夠顯著提升大語言模型輸出準確率,即使是較小的模型,也可以在經過微調后進行“準確且有自信”的預測。ruF流量資訊——探索最新科技、每天知道多一點LLSUM.COM

          本文鏈接:可令 AI 自我判斷輸出內容正確性,谷歌公布模型訓練框架 ASPIREhttp://www.lensthegame.com/show-3-7517-0.html

          聲明:本網站為非營利性網站,本網頁內容由互聯網博主自發貢獻,不代表本站觀點,本站不承擔任何法律責任。天上不會到餡餅,請大家謹防詐騙!若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。

          上一篇: 訊景發布 Radeon RX 7600 XT Speedster SWFT 210/QICK 309顯卡

          下一篇: 車聯網助力產業創新融合發展_《車聯網(智能網聯汽車)產業發展行動計劃》

          熱門資訊

          推薦資訊

          • 日榜
          • 周榜
          • 月榜
          主站蜘蛛池模板: 无码少妇丰满熟妇一区二区| 精品中文字幕一区在线| 国精品无码一区二区三区在线蜜臀| 亚洲国产成人久久综合一区| 国产精品丝袜一区二区三区| 亚洲一区二区成人| 精品爆乳一区二区三区无码av| 亚洲国产AV无码一区二区三区 | 亚洲av日韩综合一区在线观看| 好看的电影网站亚洲一区| 精品国产一区AV天美传媒| 亚洲欧美日韩中文字幕在线一区| 无码av人妻一区二区三区四区| 国产suv精品一区二区6| 国产伦理一区二区| 麻豆AV天堂一区二区香蕉| 精品一区二区三区在线观看| 肉色超薄丝袜脚交一区二区| 精品无码国产AV一区二区三区 | 国产福利在线观看一区二区| 一区二区视频在线免费观看| 免费无码VA一区二区三区| 精品伦精品一区二区三区视频| 无码精品一区二区三区在线 | 日韩动漫av在线播放一区| 无码一区二区三区在线观看| 精品国产亚洲第一区二区三区| 久久亚洲AV午夜福利精品一区| 视频一区二区三区在线观看| 亚洲av一综合av一区| 午夜视频久久久久一区| 亚洲a∨无码一区二区| 综合久久久久久中文字幕亚洲国产国产综合一区首 | 国产精品一区二区四区| 麻豆AV一区二区三区久久| 熟女大屁股白浆一区二区| 久久毛片免费看一区二区三区| 国产人妖在线观看一区二区| 亚洲AV无码一区二区三区性色| 亚洲综合在线成人一区| 少妇特黄A一区二区三区|