設置
          • 日夜間
            隨系統
            淺色
            深色
          • 主題色

          101種語言即時翻譯,“巴別魚”真的來了!

          2025-01-20 08:03:00 來源: 中國科學報

           1O2流量資訊——探索最新科技、每天知道多一點LLSUM.COM

          《銀河系漫游指南》中設想的翻譯動物“巴別魚”,可能離現實更近了。科技巨頭Meta的研究人員創造了一種機器學習系統,幾乎可以立即將101種語言的語音翻譯成36種目標語言中的任何一種。1O2流量資訊——探索最新科技、每天知道多一點LLSUM.COM

          這種大規模多語言和多模態機器翻譯(SEAMLESSM4T)系統還可以將語音翻譯成文本、文本翻譯成語音、文本翻譯成文本。相關研究結果1月15日發表于《自然》。1O2流量資訊——探索最新科技、每天知道多一點LLSUM.COM

          國際外交會議的演講被用來訓練機器學習翻譯系統。圖片來源:Janek Skarzynski/AFP/Getty1O2流量資訊——探索最新科技、每天知道多一點LLSUM.COM

            ?1O2流量資訊——探索最新科技、每天知道多一點LLSUM.COM

          Meta經營著臉書、WhatsApp和Instagram等社交媒體網站。該公司表示,在向全球學術研究人員成功發布LLaMA大型語言模型后,將把SEAMLESSM4T開源用于非商業用途。1O2流量資訊——探索最新科技、每天知道多一點LLSUM.COM

          在過去幾十年里,機器翻譯取得了巨大進步,這在很大程度上歸功于在大數據集上訓練的神經網絡的引入。主要語言(尤其是英語)的訓練數據比比皆是,但許多其他語言的訓練數據卻少得可憐。這種不平等限制了機器可以訓練翻譯的語言范圍。美國康奈爾大學的計算機科學家Allison Koenecke表示:“這影響了任何不經常出現在互聯網上的語言?!?span style="display:none">1O2流量資訊——探索最新科技、每天知道多一點LLSUM.COM

          Meta的團隊在之前的語音到語音翻譯工作的基礎上,還開展了一個名為“不讓任何語言掉隊”的項目,該項目旨在為大約200種語言提供文本到文本的翻譯。根據經驗,Meta和其他地方的研究人員發現,即使在翻譯訓練數據有限的語言時,使翻譯系統多語言化也能提高它們的表現,但發生這種情況的原因尚不清楚。1O2流量資訊——探索最新科技、每天知道多一點LLSUM.COM

          該團隊從互聯網和聯合國檔案等其他來源收集了數百萬小時的語音音頻文件,以及該語音的人工翻譯。作者還收集了其中一些演講的文字記錄。1O2流量資訊——探索最新科技、每天知道多一點LLSUM.COM

          該團隊使用可靠的數據來訓練模型,以識別兩個匹配的內容。這使得研究人員能夠將大約50萬小時的音頻與文本配對,并自動將一種語言的每個片段與其他語言的對應片段進行匹配。1O2流量資訊——探索最新科技、每天知道多一點LLSUM.COM

          該系統可以將語音翻譯成語音,而無需先將其轉換為書面文本。語音合成器用于產生音頻。它可以翻譯101種語言中的任何一種語言的語音,盡管到目前為止,只能翻譯成36種語言。該系統還可以執行其他翻譯任務,例如使用不同范圍的語言進行文本到語音的翻譯。1O2流量資訊——探索最新科技、每天知道多一點LLSUM.COM

          Meta的計算機科學家、論文合著者Marta Costa-jussà表示,除了通過增加語言數量,他們還通過整合文本和語音的不同組合來提高系統的性能。“這些是改善的關鍵?!彼a充道,該系統時間延遲通常為幾秒鐘,與專業人工翻譯的表現相當。1O2流量資訊——探索最新科技、每天知道多一點LLSUM.COM

          作者表示,他們對該系統進行了微調,當翻譯中包含與原文不符的攻擊性語言時,以限制性別偏見等情況的發生。他們還對該系統進行了控制,以防止它將一種語言中無性別的術語(如英語中的“護士”)翻譯成其他語言中有性別的對應詞。1O2流量資訊——探索最新科技、每天知道多一點LLSUM.COM

          Koenecke在評論中寫道,為進一步限制自動翻譯的潛在危害,“開發人員應該考慮如何以明確模型局限性的方式顯示翻譯”,并考慮“在準確性有疑問時完全放棄輸出”。1O2流量資訊——探索最新科技、每天知道多一點LLSUM.COM

          英國吉爾福德薩里大學翻譯研究研究員Sabine Braun說,在機器翻譯被廣泛采用之前,應該對其進行更多審查,并對如何使用機器翻譯進行教育,尤其是醫療或法律等關鍵工作崗位的人。1O2流量資訊——探索最新科技、每天知道多一點LLSUM.COM

          相關論文信息:https://doi.org/10.1038/s41586-024-08359-z1O2流量資訊——探索最新科技、每天知道多一點LLSUM.COM

          本文鏈接:101種語言即時翻譯,“巴別魚”真的來了!http://www.lensthegame.com/show-11-16551-0.html

          聲明:本網站為非營利性網站,本網頁內容由互聯網博主自發貢獻,不代表本站觀點,本站不承擔任何法律責任。天上不會到餡餅,請大家謹防詐騙!若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。

          上一篇: 機器人外骨骼讓專業鋼琴家手指“起飛”

          下一篇: 《細胞》:全球最大規模研究發現跨人種“抑郁癥基因”

          熱門資訊

          推薦資訊

          • 日榜
          • 周榜
          • 月榜
          主站蜘蛛池模板: 亚洲国产日韩一区高清在线 | 国产精品一区二区三区免费| 精品无码一区二区三区在线| 亚洲一区免费在线观看| 精品国产乱子伦一区二区三区| 中文字幕无线码一区二区| 精品一区二区三区免费毛片 | 国产色精品vr一区区三区| 亚洲一区爱区精品无码| 亚洲第一区视频在线观看 | 一区二区免费国产在线观看| 日本不卡一区二区视频a| 中文字幕日韩一区二区不卡| 国产一区二区精品在线观看| 国偷自产一区二区免费视频| 日本片免费观看一区二区| 日本中文字幕在线视频一区| 伦理一区二区三区| 无码日本电影一区二区网站| 国产av福利一区二区三巨| 精品不卡一区二区| 国产福利一区二区在线视频 | 国产成人精品久久一区二区三区av | 亚洲欧美国产国产综合一区| 久99精品视频在线观看婷亚洲片国产一区一级在线 | 精品综合一区二区三区| 一区二区三区四区精品视频 | 久久婷婷久久一区二区三区| 毛片一区二区三区无码| 亚洲老妈激情一区二区三区| 爆乳无码AV一区二区三区| 中文字幕在线精品视频入口一区| 国产一区二区不卡老阿姨| 国产高清不卡一区二区| 色系一区二区三区四区五区 | 国产主播福利精品一区二区| 91video国产一区| 国产精品一区二区av| 一区二区三区波多野结衣| 中文字幕无线码一区2020青青 | 日韩中文字幕精品免费一区|