設置
          • 日夜間
            隨系統
            淺色
            深色
          • 主題色

          生成式AI“幻覺”困境如何破解

          2025-01-29 11:17:30 來源: 科技日報

           1wV流量資訊——探索最新科技、每天知道多一點LLSUM.COM

          圖片來源:英國《自然》網站

            ?1wV流量資訊——探索最新科技、每天知道多一點LLSUM.COM

          人工智能(AI)技術正以前所未有的速度發展,生成式AI憑借其驚人的創造力,不斷刷新人們的認知。然而,即便是看似“聰明絕頂”的AI,也難逃“幻覺”的困擾。這里的“幻覺”,指的是AI生成看似合理但實際不準確或虛假的信息。1wV流量資訊——探索最新科技、每天知道多一點LLSUM.COM

          英國《自然》雜志網站在1月22日的報道中指出,AI“幻覺”可能會引發嚴重后果,科學家正各出奇招,力求降低其發生率。這些措施包括增加事實核查、對AI進行“腦部掃描”等,以促進AI的健康、高效發展。1wV流量資訊——探索最新科技、每天知道多一點LLSUM.COM

          主因是數據模糊1wV流量資訊——探索最新科技、每天知道多一點LLSUM.COM

          各種生成式AI,包括由大語言模型驅動的聊天機器人,常常會編造信息。它們有時會模糊事實與虛構,在看似真實的陳述中夾雜錯誤信息。這既是其創造力的體現,也是其不足之處。1wV流量資訊——探索最新科技、每天知道多一點LLSUM.COM

          美國佐治亞理工學院理論計算機科學家桑托什·威姆帕拉解釋稱,大語言模型的設計原理并非輸出準確事實,而是通過模式識別生成答案。其內部復雜的運行機制迄今仍像一個“黑匣子”,人們難以洞悉其推理過程。1wV流量資訊——探索最新科技、每天知道多一點LLSUM.COM

          美國加州Vectara公司旨在減少生成式AI的“幻覺”。其聯合創始人阿姆爾·阿瓦達拉表示,在訓練過程中,這些模型會壓縮數萬億個單詞間的關系,隨后通過一個龐大的網絡模型重新展開這些信息。盡管這些模型能夠重構出接近98%的訓練內容,但剩下2%的內容卻會讓其“誤入歧途”,生成不準確或虛假信息。1wV流量資訊——探索最新科技、每天知道多一點LLSUM.COM

          導致AI出現“幻覺”的原因多種多樣,其中訓練數據中的模糊性和錯誤是常見因素。也有人認為,即使訓練數據準確無誤,AI也有可能產生“幻覺”。這種現象與某一事實的稀缺程度密切相關。因此,即使經過人類反饋調整過的聊天機器人,也無法完全避免出錯。1wV流量資訊——探索最新科技、每天知道多一點LLSUM.COM

          多領域面臨考驗1wV流量資訊——探索最新科技、每天知道多一點LLSUM.COM

          AI的“幻覺”可能會給人們的工作和生活帶來較大影響。1wV流量資訊——探索最新科技、每天知道多一點LLSUM.COM

          在新聞領域,大語言模型可能生成虛假新聞事件,擾亂信息傳播秩序,誤導公眾認知。Vectara公司針對文檔內容開展的研究表明,一些聊天機器人編造事實、虛構信息的幾率高達30%。世界經濟論壇發布的《2025年全球風險報告》顯示,錯誤和虛假信息是2025年全球面臨的五大風險之一。1wV流量資訊——探索最新科技、每天知道多一點LLSUM.COM

          在法律領域,它可能引用虛構的法律條文和案例。比如,2023年美國律師史蒂文·施瓦茨就因“輕信”ChatGPT,在法庭文件中引用了并不存在的法律案例。而在醫學領域,它可能提供錯誤的診斷和治療建議,危及患者生命。1wV流量資訊——探索最新科技、每天知道多一點LLSUM.COM

          《自然》在報道中指出,AI“幻覺”在科學參考文獻方面出現錯誤的情況也極為普遍。2024年的一項研究發現,各類聊天機器人在提及參考文獻時的出錯率在30%至90%之間。它們至少會在論文標題、第一作者或發表年份上出現偏差。雖然聊天機器人都帶有警告標簽,提醒用戶對重要信息進行二次核實。但如果用戶對聊天機器人的回復深信不疑,可能會引發一系列問題。1wV流量資訊——探索最新科技、每天知道多一點LLSUM.COM

          多舉措減少“幻覺”1wV流量資訊——探索最新科技、每天知道多一點LLSUM.COM

          為進一步提升AI的精確度,科學家正想方設法降低其“幻覺”。1wV流量資訊——探索最新科技、每天知道多一點LLSUM.COM

          例如,增加模型訓練參數和訓練時長可有效減少“幻覺”。但這種方法需要付出高昂的計算成本,并可能削弱聊天機器人的其他能力,如機器學習算法對未知數據的預測和處理能力。1wV流量資訊——探索最新科技、每天知道多一點LLSUM.COM

          此外,使用更大、更干凈的數據集進行訓練,也是降低AI模型“幻覺”出現的有效途徑。然而,當前可用數據的有限性限制了這一方法的應用。1wV流量資訊——探索最新科技、每天知道多一點LLSUM.COM

          檢索增強生成(RAG)技術也為減少AI“幻覺”提供了新思路。該方法通過讓聊天機器人在回復問題前參考給定的可信文本,從而確保回復內容的真實性,以此減少“幻覺”的產生。在醫療和法律等需要嚴格遵循經過驗證的知識的領域,RAG技術備受青睞。1wV流量資訊——探索最新科技、每天知道多一點LLSUM.COM

          不過,美國斯坦福大學計算機科學家米拉柯·蘇茲根表示,盡管RAG能提升內容真實性,但其能力有限。蘇茲根團隊的研究表明,一些為法律研究開發的、號稱“無幻覺”的RAG增強模型雖有所改進,但仍存在不足。1wV流量資訊——探索最新科技、每天知道多一點LLSUM.COM

          開發者也可以使用一個與AI訓練方式不同的獨立系統,通過網絡搜索對聊天機器人的回復進行事實核查,谷歌的“雙子星”系統便是一個典型例子。該系統提供了“雙重核查響應”功能:內容如果突出顯示為綠色,表示其已通過網絡搜索驗證;內容如果突出顯示為棕色,則表示其為有爭議或不確定的內容。但是,這種方法計算成本高昂且耗時,而且系統仍會產生“幻覺”,因為互聯網上錯誤信息泛濫。1wV流量資訊——探索最新科技、每天知道多一點LLSUM.COM

          在去年6月出版的《自然》雜志上,英國牛津大學科學家刊發論文稱,他們利用“語義熵”,通過概率來判斷大語言模型是否出現了“幻覺”。語義熵是信息熵的一種,被用于量化物理系統中所包含的信息量。通過評估AI模型在特定提示詞下生成內容的不確定性,來計算模型的困惑程度,從而為用戶或模型提供警示,提醒其采取必要的循證措施,確保更準確的答案輸出。1wV流量資訊——探索最新科技、每天知道多一點LLSUM.COM

          美國卡內基梅隆AI研究人員安迪·鄒采用的方法是在大語言模型回答問題時,繪制其內部計算節點的激活模式。他形象地稱之為“給AI做腦部掃描”。利用不同的計算節點活動模式,可以告訴我們AI模型是在“說真話”,還是在“胡說八道”。1wV流量資訊——探索最新科技、每天知道多一點LLSUM.COM

          本文鏈接:生成式AI“幻覺”困境如何破解http://www.lensthegame.com/show-11-16898-0.html

          聲明:本網站為非營利性網站,本網頁內容由互聯網博主自發貢獻,不代表本站觀點,本站不承擔任何法律責任。天上不會到餡餅,請大家謹防詐騙!若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。

          上一篇: 頂夸克遵循狹義相對論通過最強測驗

          下一篇: 新年展望:醫生、科學家最關注的科學突破

          熱門資訊

          推薦資訊

          • 日榜
          • 周榜
          • 月榜
          主站蜘蛛池模板: 色窝窝无码一区二区三区色欲| 亚洲V无码一区二区三区四区观看 亚洲爆乳精品无码一区二区三区 亚洲爆乳无码一区二区三区 | 国产成人av一区二区三区不卡| 国产怡春院无码一区二区| 国产精品污WWW一区二区三区 | 国产在线精品一区二区三区不卡 | 国产精品伦子一区二区三区| 精品一区二区三区在线成人| 国产免费无码一区二区| 久久亚洲色一区二区三区| 人妻无码一区二区视频| 精品一区二区AV天堂| 国产伦精品一区二区三区免费迷| 精品人妻一区二区三区浪潮在线| 无码人妻品一区二区三区精99| AV无码精品一区二区三区宅噜噜| 视频一区二区三区免费观看| 又紧又大又爽精品一区二区| 国产日韩精品一区二区三区 | 无码AⅤ精品一区二区三区| 国产在线一区观看| 亚洲AV无码一区二区三区在线观看 | 久久久久久人妻一区二区三区| 国产一区麻豆剧传媒果冻精品| 久久无码一区二区三区少妇| 国产在线精品一区二区三区不卡| 在线精品亚洲一区二区三区| 中文字幕永久一区二区三区在线观看| 一区二区三区在线视频播放| 中文字幕一区二区三区在线播放| 一区二区在线播放视频| 国产在线精品一区二区三区不卡| 久久青草国产精品一区| 亚洲色精品vr一区二区三区| 无码人妻精品一区二区三 | 成人精品一区久久久久| 国产免费播放一区二区| 中文字幕aⅴ人妻一区二区| 一区二区三区精品| 成人h动漫精品一区二区无码| 亚洲毛片不卡av在线播放一区|