設(shè)置
          • 日夜間
            隨系統(tǒng)
            淺色
            深色
          • 主題色

          對話天娛數(shù)科CEO賀晗:3D數(shù)據(jù)集,人形機(jī)器人競爭“新燃點”

          2024-12-13 11:56:04 來源:

          21世紀(jì)經(jīng)濟(jì)報道記者雷晨 北京報道1UW流量資訊——探索最新科技、每天知道多一點LLSUM.COM

          作為未來產(chǎn)業(yè)的前沿領(lǐng)域,人形機(jī)器人已成為全球科技和產(chǎn)業(yè)競爭的新賽道。1UW流量資訊——探索最新科技、每天知道多一點LLSUM.COM

          近期,隨著特斯拉、OpenAI、英偉達(dá)等科技巨頭的加碼布局,人形機(jī)器人賽道迎來空前熱度。1UW流量資訊——探索最新科技、每天知道多一點LLSUM.COM

          從市場空間看,據(jù)GGII預(yù)測,2030年全球市場規(guī)模將突破200億美元,中國市場規(guī)模將達(dá)到50億美元左右。特斯拉CEO埃隆·馬斯克展望,長期來看人形機(jī)器人需求量可能達(dá)100億臺。1UW流量資訊——探索最新科技、每天知道多一點LLSUM.COM

          那么,如何看待本輪的人形機(jī)器人熱?人形機(jī)器人會有怎樣的發(fā)展階段?圍繞這些問題,21世紀(jì)經(jīng)濟(jì)報道記者采訪了全國政協(xié)委員、天娛數(shù)科(002354.SZ)CEO賀晗。1UW流量資訊——探索最新科技、每天知道多一點LLSUM.COM

          人形機(jī)器人發(fā)展的三個階段

          《21世紀(jì)》:當(dāng)下人形機(jī)器人產(chǎn)業(yè)火熱,背后的原因你怎么看?1UW流量資訊——探索最新科技、每天知道多一點LLSUM.COM

          賀晗:火熱的背后是技術(shù)跨越帶來的產(chǎn)業(yè)變革浪潮。今年以來,大模型技術(shù)與機(jī)器人技術(shù)加速融合、進(jìn)化,使人形機(jī)器人成為具身智能的關(guān)鍵載體,為人形機(jī)器人帶來了革命性的變革,讓門檻大幅降低、場景快速增多,催生了“研發(fā)熱”、“應(yīng)用熱”、“投資熱”。1UW流量資訊——探索最新科技、每天知道多一點LLSUM.COM

          《21世紀(jì)》:目前,雖然產(chǎn)業(yè)火熱,但人形機(jī)器人應(yīng)用場景還比較單一,特別在日常生活中,還替代不了人,缺乏人的適應(yīng)性和場景泛化,技術(shù)的跨越體現(xiàn)在哪里?1UW流量資訊——探索最新科技、每天知道多一點LLSUM.COM

          賀晗:過去我們談人形機(jī)器人技術(shù)時,硬件談的比較多,比如電機(jī)、減速器、滾珠絲杠等,而這次的技術(shù)跨越主要是在人形機(jī)器人大腦和小腦方面,從這個角度來看,可分三個發(fā)展階段。1UW流量資訊——探索最新科技、每天知道多一點LLSUM.COM

          1.0階段:基于程序控制的演示階段。人形機(jī)器人脫胎于工業(yè)機(jī)器人,加上擬人化的外形,目的在日常生活中進(jìn)行應(yīng)用,過去大部分人形機(jī)器人行為控制與工業(yè)機(jī)器人一樣,依賴于程序控制,即通過預(yù)先編寫的程序或強化學(xué)習(xí)算法進(jìn)行控制。這些程序通常是由工程師根據(jù)特定的任務(wù)和場景進(jìn)行編寫,機(jī)器人按照指令完成簡單的動作演示。雖然強化學(xué)習(xí)技術(shù)在這一階段開始應(yīng)用,通過強化學(xué)習(xí),人形機(jī)器人能夠在模擬環(huán)境中進(jìn)行大量的試驗和探索,通過與環(huán)境的互動和不斷的試錯來改善自身的行為,學(xué)習(xí)到比較復(fù)雜的運動技能,如行走、跑步、跳躍、踢球等,但其應(yīng)用主要限于固定任務(wù)范圍內(nèi)的優(yōu)化,缺乏自主決策能力,更談不上適應(yīng)環(huán)境。這個階段的人形機(jī)器人功能比較單一,只能完成一些預(yù)先設(shè)定的任務(wù),主要應(yīng)用于科技館、展覽會等場所,作為展示科技成果的工具。例如,在一些科技展覽會上,人形機(jī)器人可以進(jìn)行特定舞蹈、武術(shù)等表演,吸引觀眾的注意力。由于程序控制的局限性,機(jī)器人的動作和行為比較僵硬,缺乏靈活性和適應(yīng)性。1UW流量資訊——探索最新科技、每天知道多一點LLSUM.COM

          2.0階段:基于大模型的模仿階段。去年以來,大模型技術(shù)一日千里、加速進(jìn)化,并與機(jī)器人運動控制技術(shù)開始深度融合,特別是在Transformer和Diffusion的快速迭代升級下,機(jī)器人模仿學(xué)習(xí)技術(shù)有了巨大突破并開始流行,如DiffusionPolicy、ACT(ActionChunkingwithTransformer)等。模仿學(xué)習(xí)技術(shù)讓人形機(jī)器人通過觀察和模仿人類的行為,直接從人類的示范中學(xué)習(xí)動作和技能,快速掌握一些復(fù)雜的操作,如穿衣、做飯、打掃衛(wèi)生等日常生活動作,以及特定領(lǐng)域的專業(yè)技能,如工業(yè)生產(chǎn)中的零件裝配、醫(yī)療護(hù)理中的簡單操作等。結(jié)合虛擬仿真平臺技術(shù),將模仿學(xué)習(xí)的數(shù)據(jù)在仿真環(huán)境進(jìn)行海量泛化訓(xùn)練,可以更好的提高泛化能力和適應(yīng)性。與強化學(xué)習(xí)相比,模仿學(xué)習(xí)不僅幫助人形機(jī)器人省去了1.0階段中復(fù)雜且耗時的編程工作,可以零代碼部署、作業(yè),還避免了強化學(xué)習(xí)中大量的試錯過程,因為它直接利用了人類提供的示范數(shù)據(jù),大幅提高了學(xué)習(xí)的效率和數(shù)據(jù)的利用率。與此同時,視覺-語言-動作(VLA)模型的發(fā)展讓人形機(jī)器人能夠更高效地完成從視覺、語言理解到推理并生成動作的全過程,將自然語言指令轉(zhuǎn)化為具體行動規(guī)劃,并具備一定泛化能力,使人形機(jī)器人成為具身智能關(guān)鍵載體,這是革命性的。1UW流量資訊——探索最新科技、每天知道多一點LLSUM.COM

          3.0階段:基于海量3D數(shù)據(jù)的智能階段。這是下一步的發(fā)展方向,從被動響應(yīng)和執(zhí)行到主動感知和決策,是這個階段的標(biāo)志。核心是海量3D數(shù)據(jù)的喂養(yǎng),讓具身智能構(gòu)建世界模型,這是真正意義上的具身智能大模型,它能創(chuàng)建對世界運作方式的內(nèi)部表征,并具備行動后果的推理能力,從而顯著提升對真實世界的感知、推理、執(zhí)行與預(yù)測能力,使機(jī)器人認(rèn)識和理解3D世界,并能夠像人類一樣進(jìn)行推理和規(guī)劃,不僅可以適應(yīng)復(fù)雜多變的環(huán)境和任務(wù)需求,更為重要的是,具備自主決策、行動與操作能力。同時,隨著多智能體協(xié)同技術(shù)的引入,未來,這一方向可能發(fā)展出更加高級的群體智能算法和多智能體系統(tǒng),使得具身智能體能夠協(xié)同完成復(fù)雜任務(wù)。1UW流量資訊——探索最新科技、每天知道多一點LLSUM.COM

          例如,在家庭陪伴場景中,機(jī)器人能夠利用3D空間數(shù)據(jù)理解家庭成員的行為,并通過世界模型進(jìn)行因果推理。如當(dāng)檢測到老人在客廳摔倒時,能夠迅速判斷位置并主動聯(lián)系急救人員,同時采取初步的急救措施。當(dāng)具身智能可以高度智能化的執(zhí)行與人類相同的任務(wù),則代表我們真正邁入了通用智能時代。1UW流量資訊——探索最新科技、每天知道多一點LLSUM.COM

          3D數(shù)據(jù)集:人形機(jī)器人競爭“新燃點”

          《21世紀(jì)》:所以說3D數(shù)據(jù)是人形機(jī)器人發(fā)展的關(guān)鍵資源?1UW流量資訊——探索最新科技、每天知道多一點LLSUM.COM

          賀晗:是的。3D數(shù)據(jù)對于提供真實人物、場景的展示、豐富的交互和決策支持至關(guān)重要,3D數(shù)據(jù)能讓AI對物理世界人與物的形態(tài)、結(jié)構(gòu)、位置、動作有更準(zhǔn)確的理解,可以在三維場景中像人類一樣對視覺信息進(jìn)行高級推理,超越二維視覺的局限。具身智能大模型極端依賴大規(guī)模、高質(zhì)量的3D數(shù)據(jù)訓(xùn)練。當(dāng)下高質(zhì)量3D數(shù)據(jù)集匱乏是產(chǎn)業(yè)痛點,全球范圍內(nèi),3D數(shù)據(jù)都處于極端重要,又極端缺乏的狀態(tài)。3D數(shù)據(jù)集正在成為競爭的核心節(jié)點。2023年10月,谷歌DeepMind聯(lián)合全球33家頂級學(xué)術(shù)實驗室共同開發(fā)OpenX-Embodiment數(shù)據(jù)集,基于該數(shù)據(jù)集訓(xùn)練了RT-X系列3D多模態(tài)大模型用于人形機(jī)器人。2024年3月,斯坦福大學(xué)、伯克利大學(xué)聯(lián)合全美多家頭部研究機(jī)構(gòu)推出DROID分布式機(jī)器人交互數(shù)據(jù)集,涵蓋3D軌跡、3D場景等。2024年3月,全球著名人工智能專家李飛飛教授領(lǐng)銜、聯(lián)合美國多所大學(xué)推出BEHAVIOR-1K具身智能數(shù)據(jù)平臺,涵蓋了50個場景、9000多個具有豐富物理和語義屬性的物體。3D數(shù)據(jù)集,在可見的未來,決定3D多模態(tài)大模型和空間智能的發(fā)展,以及全球科技競爭的走勢。1UW流量資訊——探索最新科技、每天知道多一點LLSUM.COM

          《21世紀(jì)》:天娛數(shù)科在這方面有什么布局?1UW流量資訊——探索最新科技、每天知道多一點LLSUM.COM

          賀晗:3D數(shù)據(jù)集的發(fā)展有兩個痛點,一是3D數(shù)據(jù)的獲取與處理成本高昂、流程繁雜,需要大量的時間、人力與資金投入;二是3D數(shù)據(jù)的標(biāo)準(zhǔn)化程度低,導(dǎo)致數(shù)據(jù)的兼容性較差,共享和復(fù)用難度大。1UW流量資訊——探索最新科技、每天知道多一點LLSUM.COM

          為了解決第一個問題,我們?nèi)ツ昱c合肥產(chǎn)投一起戰(zhàn)略投資了芯明。芯明是一家專注空間計算及人工智能芯片及產(chǎn)品設(shè)計的高科技企業(yè),其自研空間計算芯片是目前全球唯一單芯片集成芯片化實時3D立體視覺感知、AI、SLAM(實時定位建圖)的空間智能系統(tǒng)級芯片,采用12nm制程工藝,具備3.5TOPS的端側(cè)算力,功耗僅為約0.5W,可支持單芯片接入6路傳感器,其產(chǎn)品解決方案已在全球范圍內(nèi)應(yīng)用在泛機(jī)器人、XR、消費電子、物流無人機(jī)、3D掃描等多個前沿應(yīng)用領(lǐng)域的龍頭企業(yè)產(chǎn)品中,真正實現(xiàn)了“感算一體、多路融合、空間智能”的功能。與芯明合作后,依托其芯片和模組優(yōu)勢,我們通過多種高精度3D掃描設(shè)備,采集3D場景、模型、動作等多類數(shù)據(jù)源,大幅降低了3D數(shù)據(jù)采集成本。1UW流量資訊——探索最新科技、每天知道多一點LLSUM.COM

          為了解決第二個問題,我們?nèi)诤洗竽P汀?D數(shù)據(jù)集、可視算法,構(gòu)建了空間智能MaaS平臺,通過跨類型數(shù)據(jù)的智能解析提高數(shù)據(jù)標(biāo)準(zhǔn)化程度和易用性。目前模型與多項算法已完成中央網(wǎng)信辦生成式人工智能服務(wù)備案。平臺目前擁有超80萬組3D數(shù)據(jù)、35萬組多模態(tài)數(shù)據(jù)。今年10月份,我們采集加工形成的“人形機(jī)器人空間動捕長程數(shù)據(jù)”、“大場景空間感知模型重建數(shù)據(jù)”等5個3D具身智能數(shù)據(jù)集正式在北京國際大數(shù)據(jù)交易所完成數(shù)據(jù)資產(chǎn)登記,通過數(shù)據(jù)信息的核驗、合規(guī)審查、登記備案等環(huán)節(jié),成為全國首個完成資產(chǎn)登記的3D具身智能數(shù)據(jù)集。未來,天娛數(shù)科將在模型訓(xùn)練、數(shù)據(jù)集拓展、平臺性能優(yōu)化等方面持續(xù)努力,不斷深化AI+3D技術(shù)競爭優(yōu)勢。1UW流量資訊——探索最新科技、每天知道多一點LLSUM.COM

          《21世紀(jì)》:你對中國人形機(jī)器人產(chǎn)業(yè)發(fā)展有什么建議?1UW流量資訊——探索最新科技、每天知道多一點LLSUM.COM

          賀晗:一是加快標(biāo)準(zhǔn)制定與完善,包括硬件接口標(biāo)準(zhǔn)、軟件通信協(xié)議標(biāo)準(zhǔn)、3D數(shù)據(jù)集標(biāo)準(zhǔn)、性能標(biāo)準(zhǔn)等,確保不同企業(yè)的產(chǎn)品之間能夠?qū)崿F(xiàn)更好的兼容性和互操作性,同時大力推動標(biāo)準(zhǔn)國際化。1UW流量資訊——探索最新科技、每天知道多一點LLSUM.COM

          二是加強復(fù)合型人才培養(yǎng),目前人形機(jī)器人領(lǐng)域懂機(jī)械、自動化、程序控制的很多,懂大模型、具身智能的很少,兩者都懂的少之又少,建議在高校中設(shè)置具身智能相關(guān)專業(yè)或方向,加強多學(xué)科交叉融合,增加實踐教學(xué)環(huán)節(jié),培養(yǎng)學(xué)生的跨學(xué)科思維和實際動手能力。1UW流量資訊——探索最新科技、每天知道多一點LLSUM.COM

          三是鼓勵通用平臺建設(shè),建立從硬件到軟件、從底層到應(yīng)用層、從模型底座到3D數(shù)據(jù)集的多層次具身智能通用平臺架構(gòu),鼓勵企業(yè)、高校和科研機(jī)構(gòu)等各方在平臺上進(jìn)行技術(shù)研發(fā)、應(yīng)用創(chuàng)新和資源共享,形成良好的產(chǎn)業(yè)協(xié)同創(chuàng)新氛圍,降低創(chuàng)業(yè)門檻,避免重復(fù)“造輪子”,加速具身智能技術(shù)的推廣應(yīng)用和產(chǎn)業(yè)化進(jìn)程。1UW流量資訊——探索最新科技、每天知道多一點LLSUM.COM

          本文鏈接:對話天娛數(shù)科CEO賀晗:3D數(shù)據(jù)集,人形機(jī)器人競爭“新燃點”http://www.lensthegame.com/show-2-9709-0.html

          聲明:本網(wǎng)站為非營利性網(wǎng)站,本網(wǎng)頁內(nèi)容由互聯(lián)網(wǎng)博主自發(fā)貢獻(xiàn),不代表本站觀點,本站不承擔(dān)任何法律責(zé)任。天上不會到餡餅,請大家謹(jǐn)防詐騙!若有侵權(quán)等問題請及時與本網(wǎng)聯(lián)系,我們將在第一時間刪除處理。

          上一篇: 兩項重要團(tuán)體標(biāo)準(zhǔn)正在制定!事關(guān)數(shù)據(jù)資產(chǎn)管理及入表

          下一篇: 21深度丨OpenAI內(nèi)憂外患中的自我救贖

          熱門資訊

          推薦資訊

          • 日榜
          • 周榜
          • 月榜
          主站蜘蛛池模板: 亚洲av成人一区二区三区观看在线 | 精品无码日韩一区二区三区不卡| 一区二区三区在线看| 亚洲国产高清在线精品一区| 一区二区三区四区国产| 亚洲av午夜福利精品一区人妖| 国产一区二区三区不卡在线看| 一区二区精品在线| 亚洲男女一区二区三区| 小泽玛丽无码视频一区| 天天综合色一区二区三区| 亚洲一区精彩视频| 国产99精品一区二区三区免费 | 大香伊人久久精品一区二区| 色综合视频一区二区三区44| 日本一区午夜爱爱| 亚洲国产精品无码久久一区二区| 亚洲一区欧洲一区| AV无码精品一区二区三区宅噜噜 | 国产精品美女一区二区| 亚洲一区无码中文字幕| 91在线一区二区| 亚洲精品精华液一区二区| 亚洲中文字幕在线无码一区二区 | 99精品国产一区二区三区不卡| 久久91精品国产一区二区| 中文字幕无线码一区二区 | 亚洲综合色一区二区三区| 亚洲视频一区二区| 毛片一区二区三区无码| 国99精品无码一区二区三区| 国产伦精品一区二区三区无广告| 国产亚洲一区二区在线观看| 国产欧美一区二区精品仙草咪 | 无码国产精品一区二区免费vr| 日本一区二区三区精品视频| 久久久久成人精品一区二区 | 好看的电影网站亚洲一区| 成人精品一区久久久久| 精品欧洲av无码一区二区 | 色狠狠色狠狠综合一区|