設置
          • 日夜間
            隨系統
            淺色
            深色
          • 主題色

          一個機器人一次性向所有機器人學習?全球34個實驗室聯合研究

          2024-01-13 13:51:11 來源: 澎湃新聞

           CR7流量資訊——探索最新科技、每天知道多一點LLSUM.COM

          機器人不能依賴于從互聯網上抓取訓練數據,而要從機器人數據中學習,這些數據通常由研究人員在實驗室環境中為特定任務創建。如果沒有豐富的數據,就無法讓機器人在實驗室外完成現實世界的任務。科學家希望從世界各地所有機器人共享的數據中受益,同時融入互聯網數據賦予機器人推理能力,以此開發通用機器人大腦,驅動任何機器人。CR7流量資訊——探索最新科技、每天知道多一點LLSUM.COM

          來自世界各地的機器人分享數據,幫助開發通用機器人大腦
          CR7流量資訊——探索最新科技、每天知道多一點LLSUM.COM

          大語言模型可以回答問題、寫代碼、吟詩,圖像生成系統可以創造洞穴壁畫、當代藝術。那么,能擦桌子、疊衣服、做早餐的通用機器人在哪里?如果將許多機器人的經驗匯集在一起,一個新的機器人是否可以一次性向所有機器人學習呢?CR7流量資訊——探索最新科技、每天知道多一點LLSUM.COM

          2023年,谷歌和加州大學伯克利分校的實驗室與北美、歐洲和亞洲的其他32個機器人實驗室一起開展了RT-X項目,試圖開發通用機器人大腦。這34個實驗室的目標是匯集數據、資源和代碼,使通用機器人成為現實,讓單一深度神經網絡控制不同類型的機器人。CR7流量資訊——探索最新科技、每天知道多一點LLSUM.COM

          最近,加州大學伯克利分校副教授、谷歌研究科學家謝爾蓋·萊文(Sergey Levine)等人撰文分享了這個全球項目的進展和成果。他設想也許未來機器人的新技能可以通過模型微調甚至是預訓練模型來實現,就像在不訓練ChatGPT的情況下讓它講一個故事一樣,未來可以讓機器人在蛋糕上寫“生日快樂”,而不必告訴它如何使用裱花袋或手寫文本是什么樣的。CR7流量資訊——探索最新科技、每天知道多一點LLSUM.COM

          機器人把蘋果放在罐頭和橙子中間。(00:18)
          CR7流量資訊——探索最新科技、每天知道多一點LLSUM.COM

          創造一個通用機器人CR7流量資訊——探索最新科技、每天知道多一點LLSUM.COM

          生成式人工智能利用互聯網上的大量數據訓練大模型,但這些成果并不能輕易轉移到機器人領域,因為機器人不能依賴于從互聯網上抓取訓練數據,互聯網上也沒有大量的機器人交互數據。CR7流量資訊——探索最新科技、每天知道多一點LLSUM.COM

          機器人需要從機器人數據中學習,而這些數據通常由研究人員在實驗室環境中為特定任務緩慢而乏味地創建。盡管機器人學習算法取得了巨大進步,但如果沒有豐富的數據,我們仍然無法讓機器人在實驗室之外完成現實世界的任務。CR7流量資訊——探索最新科技、每天知道多一點LLSUM.COM

          為此,科學家試圖利用多種機器人的不同數據,來解決機器人的學習問題,制造通用機器人大腦。CR7流量資訊——探索最新科技、每天知道多一點LLSUM.COM

          “一個深度神經網絡能否在來自足夠多不同機器人的數據上訓練,從而學會驅動具有不同外觀、物理特性和能力的所有機器人?如果可行,這可能會為機器人的學習解鎖大型數據集的力量。”萊文表示,RT-X數據集目前包含了22種機器人、近100萬次試驗,數據集中的機器人執行拾放物體、組裝等各種行為,這是目前真實機器人動作的最大開源數據集,研究人員可訓練機器人控制算法。CR7流量資訊——探索最新科技、每天知道多一點LLSUM.COM

          “就像一個人可以用同一個大腦開車或騎自行車一樣,在RT-X數據集上訓練的模型可以簡單地從機器人自己的攝像頭觀察中識別出它所控制的機器人類型。”萊文舉例,如果機器人的攝像頭看到UR10工業臂,該模型將發送適合UR10的命令。CR7流量資訊——探索最新科技、每天知道多一點LLSUM.COM

          為了測試模型能力,參與RT-X項目的5個實驗室,將他們獨立開發的機器人最佳控制系統跟RT-X數據集訓練出來的模型進行對比。結果顯示,統一模型比每個實驗室自己的最佳方法具有更好的性能,平均成功率提高了50%左右。CR7流量資訊——探索最新科技、每天知道多一點LLSUM.COM

          研究人員還發現,RT-X訓練出來的模型可以利用其他機器人的不同經驗來提高不同環境下的魯棒性。即使在同一個實驗室里,每次機器人嘗試一項任務時,它都會發現自己處于略有不同的情況中,因此會借鑒其他機器人在其他情況下的經驗。CR7流量資訊——探索最新科技、每天知道多一點LLSUM.COM

          創造一個會推理的機器人CR7流量資訊——探索最新科技、每天知道多一點LLSUM.COM

          復雜的語義推理很難單獨從機器人數據中學習。雖然機器人數據可以提供一系列物理能力,但像“把蘋果移到罐頭和橙子之間”這類更復雜的任務,往往需要理解圖像中物體間的語義關系、基本常識,以及和機器人物理能力沒有直接關系的其他符號知識。CR7流量資訊——探索最新科技、每天知道多一點LLSUM.COM

          因此,研究人員在RT-X項目的機器人數據中加入了一個龐大數據源:互聯網規模的圖像和文本數據。他們使用現有的視覺語言模型,這個模型類似于ChatGPT或Bard等公眾可用的模型,已精通需理解自然語言和圖像之間聯系的任務。結果發現,只要訓練這個模型,讓其對機器人指令(例如把香蕉放在盤子上)做出反應,就可以適應機器人控制。CR7流量資訊——探索最新科技、每天知道多一點LLSUM.COM

            ?CR7流量資訊——探索最新科技、每天知道多一點LLSUM.COM

          RT-X模型使用執行不同任務的特定機械臂的圖像或文本描述,輸出一系列離散動作,使任何機械臂都能完成這些任務。從世界各地的機器人實驗室收集各種機器人完成各種任務的數據,構建開源數據集,可以讓機器人變得通用CR7流量資訊——探索最新科技、每天知道多一點LLSUM.COM

          為了評估互聯網數據和多機器人數據的結合,研究人員用谷歌的移動機械臂對RT-X模型進行了嚴格泛化基準測試,機器人必須識別物體并成功地操縱物體,它還必須通過邏輯推理來響應復雜的文本命令,而運用邏輯推理就需要整合文本和圖像信息,這是人類所擅長的本領。CR7流量資訊——探索最新科技、每天知道多一點LLSUM.COM

          研究人員要求機器人執行訓練數據中沒有的任務,雖然這些任務對人類來說很簡單,但對通用機器人而言是挑戰。他們讓谷歌機器人把蘋果移到罐頭和橙子之間,這涉及空間關系推理。在另一項任務中,谷歌機器人必須解決基本數學問題。這些挑戰是為了測試機器人推理和得出結論的能力,其中,空間推理等推理能力來自視覺語言模型的網絡數據訓練,基于機器人行為的推理輸出能力來自RT-X的數據訓練。CR7流量資訊——探索最新科技、每天知道多一點LLSUM.COM

          結果顯示,包含多機器人RT-X數據的谷歌機器人,其任務泛化能力提高了三倍。這一結果表明,多機器人RT-X數據不僅有助于機器人獲得各種物理技能,還有助于更好地將這些技能與視覺語言模型中的語義和符號知識聯系起來。萊文認為,這些聯系賦予了機器人常識,有朝一日這或使得機器人能夠理解復雜而微妙的用戶命令含義,比如機器人能理解“給我拿早餐”的命令,同時執行這個動作。CR7流量資訊——探索最新科技、每天知道多一點LLSUM.COM

          模型微調或賦予機器人新技能CR7流量資訊——探索最新科技、每天知道多一點LLSUM.COM

          這些進展還只是RT-X項目的第一步。“我們希望通過這第一步,一起創造機器人的未來:通用機器人大腦可以驅動任何機器人,從世界各地所有機器人共享的數據中受益。”萊文希望更多研究人員的數據可以貢獻給RT-X數據庫,但RT-X項目不僅僅是跨實驗室共享數據,他希望RT-X發展成一個協作項目,以開發數據標準、可重復使用模型,以及新技術和算法。CR7流量資訊——探索最新科技、每天知道多一點LLSUM.COM

          “就像大語言模型已經掌握了基于語言的廣泛任務一樣,未來我們可能會使用相同的大模型作為許多現實世界機器人任務的基礎。也許機器人的新技能可以通過微調甚至是預訓練模型來實現。”萊文說,就像在不訓練ChatGPT的情況下讓它講一個故事一樣,未來可以讓機器人在蛋糕上寫“生日快樂”,而不必告訴它如何使用裱花袋或手寫文本是什么樣的。當然,還需要對這些模型進行更多研究才能讓機器人具備這種通用能力。CR7流量資訊——探索最新科技、每天知道多一點LLSUM.COM

          萊文希望進一步推動單一神經網絡控制多個機器人的前沿探索。這些進步可能包括添加來自生成環境的各種模擬數據、處理具有不同數量的手臂或手指的機器人、使用不同的傳感器套件,甚至結合操作和運動行為。“RT-X為此類工作打開了大門,但最令人興奮的技術發展仍在前方。”CR7流量資訊——探索最新科技、每天知道多一點LLSUM.COM

          本文鏈接:一個機器人一次性向所有機器人學習?全球34個實驗室聯合研究http://www.lensthegame.com/show-11-2016-0.html

          聲明:本網站為非營利性網站,本網頁內容由互聯網博主自發貢獻,不代表本站觀點,本站不承擔任何法律責任。天上不會到餡餅,請大家謹防詐騙!若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。

          上一篇: 科學家發現最古老皮膚化石

          下一篇: 基因治療新方法可像“開關”一樣精準控制基因表達

          熱門資訊

          推薦資訊

          • 日榜
          • 周榜
          • 月榜
          主站蜘蛛池模板: 亚洲Av永久无码精品一区二区 | 国产一区二区三区在线2021 | 久久精品国产一区二区三区日韩| 亚洲不卡av不卡一区二区| 日本中文一区二区三区亚洲| 免费无码VA一区二区三区| 久久99国产一区二区三区| 在线观看国产一区亚洲bd| 78成人精品电影在线播放日韩精品电影一区亚洲 | 午夜视频在线观看一区| 精品国产伦一区二区三区在线观看 | 日本一区二区视频| 3d动漫精品啪啪一区二区免费| 熟女少妇精品一区二区| 国产一区二区视频在线播放| 国产一区在线电影| 夜色阁亚洲一区二区三区| 狠狠爱无码一区二区三区| 八戒久久精品一区二区三区| 成人毛片一区二区| 日韩在线视频不卡一区二区三区| 无码一区18禁3D| 天堂成人一区二区三区| 风间由美在线亚洲一区| 国产在线不卡一区| 精品国产一区二区22| 国产成人无码一区二区在线观看 | 亚洲毛片αv无线播放一区 | 精品无码人妻一区二区三区品| 麻豆AV一区二区三区久久| 亚洲一区中文字幕在线电影网 | 武侠古典一区二区三区中文| 无码人妻久久一区二区三区蜜桃 | 亚洲毛片不卡av在线播放一区| 日韩社区一区二区三区| 熟女少妇精品一区二区| 蜜臀AV一区二区| 国产成人av一区二区三区不卡| 亚洲一区二区高清| 无码少妇精品一区二区免费动态| 亚洲一区无码中文字幕乱码|