新智元報道
LRST
【新智元導(dǎo)讀】美國東北大學(xué)和波士頓動力RAI團隊提出HEP框架,首創(chuàng)「坐標系轉(zhuǎn)移接口」,將高層策略的泛化能力與低層策略的靈活性無縫耦合,實現(xiàn)「少數(shù)據(jù)」下的高效學(xué)習(xí)與強泛化。該框架通過分層結(jié)構(gòu)、空間對稱性自然泛化和創(chuàng)新型體素編碼器,顯著提升機器人在復(fù)雜任務(wù)中的表現(xiàn)。
在機器人智能操作領(lǐng)域,數(shù)據(jù)稀缺和泛化難題長期困擾著AI的落地應(yīng)用。
大多數(shù)方法或依賴大量數(shù)據(jù),或在環(huán)境稍有變化時表現(xiàn)失靈。
如何讓AI像人一樣,僅憑少量演示,就能穩(wěn)健適應(yīng)復(fù)雜多變的真實場景?
美國東北大學(xué)和波士頓動力RAI團隊的研究人員提出HEP(HierarchicalEquivariantPolicyviaFrame?Transfer)框架,首創(chuàng)「坐標系轉(zhuǎn)移接口」,將高層策略的泛化能力與低層策略的靈活性無縫耦合,實現(xiàn)「少數(shù)據(jù)」下的高效學(xué)習(xí)與強泛化。
論文地址:https://openreview.net/pdf?id=nAv5ketrHq
項目代碼:https://codemasterzhao.github.io/HierEquiPo.github.io/
坐標系轉(zhuǎn)移接口實現(xiàn)了高層泛化能力與低層靈活性的無縫融合,為機器人少樣本、高魯棒、多場景泛化部署開辟了全新路徑。
主要貢獻
1.極簡高效的分層結(jié)構(gòu)——高層模塊負責(zé)全局子目標(keypose)預(yù)測,低層模塊基于局部坐標自主優(yōu)化軌跡;
2.空間對稱性自然泛化——在T(3)(平移)與SO(2)(平面旋轉(zhuǎn))群下均保持等變性,顯著降低對示例數(shù)量的依賴;
3.創(chuàng)新型體素編碼器——采用堆疊體素(Stacked?Voxel)+SO(2)等變網(wǎng)絡(luò),高效編碼三維視覺信息,兼顧細節(jié)與計算速度。
方法概述
HEP框架由三部分組成:
1.高層策略:它首先讀取機器人感知到的三維點云信息,然后預(yù)測出一個粗略的目標位置,也就是「關(guān)鍵姿態(tài)」。
2.坐標系轉(zhuǎn)移接口:接著,它會把全局點云和上述關(guān)鍵姿態(tài)一起,轉(zhuǎn)換到一個以關(guān)鍵姿態(tài)為中心的局部坐標系里,讓后續(xù)處理都基于這個「局部視角」進行。
3.低層策略:最后,低層策略在這個局部坐標系中,通過對體素化后的三維視覺特征進行等變擴散運算,生成連續(xù)、精細的機器人動作軌跡
開放/閉環(huán)兼容:同一接口支持一次性輸出(Open?loop)與逐步反饋(Closed?loop)兩種控制模式;
輕量高效:高層僅需預(yù)測平移向量,降低計算與學(xué)習(xí)難度,增強泛化性;低層專注細節(jié),通過坐標系轉(zhuǎn)移接口從高層強化泛化性。
核心創(chuàng)新點
坐標系轉(zhuǎn)移接口(Frame?Transfer)
設(shè)計思路:高層策略給出任務(wù)的「參考坐標」,低層策略在此基礎(chǔ)上自主優(yōu)化執(zhí)行細節(jié)。
這樣的設(shè)計不僅釋放了低層的靈活性,也將高層的泛化能力、抗干擾性自洽地傳遞到底層,實現(xiàn)了「泛化性與魯棒性」的一體式提升。
優(yōu)勢包括:
靈活性,低層可在局部坐標系內(nèi)自主調(diào)整執(zhí)行細節(jié);
泛化性,高層對全局變換的適應(yīng)能力,通過坐標系轉(zhuǎn)移接口無損傳遞到低層;
簡化高層,只需預(yù)測平移,避免在高維SE(3)空間中做精確規(guī)劃。
T(3)與SO(2)等變性的實現(xiàn)
T(3)等變示意圖
SO(2)等變示意圖
當旋轉(zhuǎn)和沿xyz軸的平移發(fā)生時,模型預(yù)測的軌跡也能確保發(fā)生相應(yīng)的平移和旋轉(zhuǎn)
高層:使用SO(2)?等變3D?U-Net對離散化平移概率圖進行預(yù)測,因此擁有SO(2)?等變性和T(3)等變性
低層:基于堆疊體素編碼器提取局部特征,結(jié)合SO(2)?等變擴散策略,因此擁有SO(2)等變性
系統(tǒng):在論文附錄中給出完整的等變性證明(Proposition?4.2&4.3)通過坐標系轉(zhuǎn)換,SO(2)等變性被保存,T(3)等變性可以從高層傳遞到低層,使得整個系統(tǒng)擁有SO(2)XT(3)的等變性
創(chuàng)新型體素編碼器(Stacked?VoxelRepresentation)級
原理:將點云按體素網(wǎng)格分組,以等變PointNet聚合每個體素內(nèi)點的特征,組成c×D×H×W的等變體素圖。
優(yōu)勢包括:
細節(jié)保留,相比傳統(tǒng)下采樣,更好保留局部幾何信息;
計算友好,點云?卷積混合結(jié)構(gòu),平衡速度與精度;
等變性,理論保證在T(3)×SO(2)變換下保持一致性。
仿真實驗
數(shù)據(jù)集:30個RLBench任務(wù),每個任務(wù)用100條演示訓(xùn)練。
對比基線:3D?Diffuser?Actor、Chained?Diffuser、Equivariant?Diffusion?Policy。
開環(huán)結(jié)果:HEP在30任務(wù)中有28項勝出,平均提升+10%。
閉環(huán)結(jié)果:在10個長程任務(wù)上,HEP平均提升+23%,顯著優(yōu)于單級方法。
消融分析
去除等變結(jié)構(gòu):性能降24%;
去除坐標系轉(zhuǎn)移:性能降16%;
去除堆疊體素:性能降10%;
充分驗證各模塊貢獻。
真實機器人實驗
分層策略在復(fù)雜長程任務(wù)上優(yōu)勢顯著
在真實機器人上,HEP分層框架僅用30條演示數(shù)據(jù),就學(xué)會了包括移鍋蓋、加清潔劑、擦洗等多步協(xié)作的魯棒「洗鍋」任務(wù),明顯優(yōu)于非分層方法。
坐標系轉(zhuǎn)移接口:泛化性與魯棒性的傳遞橋梁
理論保障:證明了坐標系轉(zhuǎn)移接口能將高層對空間變化的適應(yīng)能力無損傳遞至低層,策略整體更易擴展至新場景。
在Pick&Place任務(wù)上,HEP僅憑一次演示,低層擴散模型即可實現(xiàn)1-shot泛化學(xué)習(xí),顯著提升了數(shù)據(jù)效率。
在環(huán)境變化和引入無關(guān)物體的擾動測試下,HEP成功率較傳統(tǒng)方法提升高達60%。
接口設(shè)計帶來未來擴展可能
坐標系轉(zhuǎn)移接口對低層策略僅施加軟約束,這不僅保證了靈活性,也為未來引入VLM或Cross-embodiment等多模態(tài)、跨平臺高層策略作為決策規(guī)劃器提供了天然接口。
參考資料:
https://openreview.net/pdf?id=nAv5ketrHq
《邪君的逆天狂妃》評分逆天,同類好文值得推薦,強勢來襲
《邪君的逆天狂妃》女特工剛穿越,就被王爺抱回家,三年生九子!
《邪君的逆天狂妃》邪君跪在房外大喊“小祖宗,我再也不敢納妾了”