如何看待「同一產(chǎn)品,外賣定價(jià)比堂食高」現(xiàn)象?這種「雙軌」定價(jià)是如何產(chǎn)生的?暴露了哪些問題?
新智元報(bào)道
LRST
【新智元導(dǎo)讀】美國東北大學(xué)和波士頓動(dòng)力RAI團(tuán)隊(duì)提出HEP框架,首創(chuàng)「坐標(biāo)系轉(zhuǎn)移接口」,將高層策略的泛化能力與低層策略的靈活性無縫耦合,實(shí)現(xiàn)「少數(shù)據(jù)」下的高效學(xué)習(xí)與強(qiáng)泛化。該框架通過分層結(jié)構(gòu)、空間對(duì)稱性自然泛化和創(chuàng)新型體素編碼器,顯著提升機(jī)器人在復(fù)雜任務(wù)中的表現(xiàn)。
在機(jī)器人智能操作領(lǐng)域,數(shù)據(jù)稀缺和泛化難題長期困擾著AI的落地應(yīng)用。
大多數(shù)方法或依賴大量數(shù)據(jù),或在環(huán)境稍有變化時(shí)表現(xiàn)失靈。
如何讓AI像人一樣,僅憑少量演示,就能穩(wěn)健適應(yīng)復(fù)雜多變的真實(shí)場景?
美國東北大學(xué)和波士頓動(dòng)力RAI團(tuán)隊(duì)的研究人員提出HEP(HierarchicalEquivariantPolicyviaFrame?Transfer)框架,首創(chuàng)「坐標(biāo)系轉(zhuǎn)移接口」,將高層策略的泛化能力與低層策略的靈活性無縫耦合,實(shí)現(xiàn)「少數(shù)據(jù)」下的高效學(xué)習(xí)與強(qiáng)泛化。
論文地址:https://openreview.net/pdf?id=nAv5ketrHq
項(xiàng)目代碼:https://codemasterzhao.github.io/HierEquiPo.github.io/
坐標(biāo)系轉(zhuǎn)移接口實(shí)現(xiàn)了高層泛化能力與低層靈活性的無縫融合,為機(jī)器人少樣本、高魯棒、多場景泛化部署開辟了全新路徑。
主要貢獻(xiàn)
1.極簡高效的分層結(jié)構(gòu)——高層模塊負(fù)責(zé)全局子目標(biāo)(keypose)預(yù)測,低層模塊基于局部坐標(biāo)自主優(yōu)化軌跡;
2.空間對(duì)稱性自然泛化——在T(3)(平移)與SO(2)(平面旋轉(zhuǎn))群下均保持等變性,顯著降低對(duì)示例數(shù)量的依賴;
3.創(chuàng)新型體素編碼器——采用堆疊體素(Stacked?Voxel)+SO(2)等變網(wǎng)絡(luò),高效編碼三維視覺信息,兼顧細(xì)節(jié)與計(jì)算速度。
方法概述
HEP框架由三部分組成:
1.高層策略:它首先讀取機(jī)器人感知到的三維點(diǎn)云信息,然后預(yù)測出一個(gè)粗略的目標(biāo)位置,也就是「關(guān)鍵姿態(tài)」。
2.坐標(biāo)系轉(zhuǎn)移接口:接著,它會(huì)把全局點(diǎn)云和上述關(guān)鍵姿態(tài)一起,轉(zhuǎn)換到一個(gè)以關(guān)鍵姿態(tài)為中心的局部坐標(biāo)系里,讓后續(xù)處理都基于這個(gè)「局部視角」進(jìn)行。
3.低層策略:最后,低層策略在這個(gè)局部坐標(biāo)系中,通過對(duì)體素化后的三維視覺特征進(jìn)行等變擴(kuò)散運(yùn)算,生成連續(xù)、精細(xì)的機(jī)器人動(dòng)作軌跡
開放/閉環(huán)兼容:同一接口支持一次性輸出(Open?loop)與逐步反饋(Closed?loop)兩種控制模式;
輕量高效:高層僅需預(yù)測平移向量,降低計(jì)算與學(xué)習(xí)難度,增強(qiáng)泛化性;低層專注細(xì)節(jié),通過坐標(biāo)系轉(zhuǎn)移接口從高層強(qiáng)化泛化性。
核心創(chuàng)新點(diǎn)
坐標(biāo)系轉(zhuǎn)移接口(Frame?Transfer)
設(shè)計(jì)思路:高層策略給出任務(wù)的「參考坐標(biāo)」,低層策略在此基礎(chǔ)上自主優(yōu)化執(zhí)行細(xì)節(jié)。
這樣的設(shè)計(jì)不僅釋放了低層的靈活性,也將高層的泛化能力、抗干擾性自洽地傳遞到底層,實(shí)現(xiàn)了「泛化性與魯棒性」的一體式提升。
優(yōu)勢包括:
靈活性,低層可在局部坐標(biāo)系內(nèi)自主調(diào)整執(zhí)行細(xì)節(jié);
泛化性,高層對(duì)全局變換的適應(yīng)能力,通過坐標(biāo)系轉(zhuǎn)移接口無損傳遞到低層;
簡化高層,只需預(yù)測平移,避免在高維SE(3)空間中做精確規(guī)劃。
T(3)與SO(2)等變性的實(shí)現(xiàn)
T(3)等變示意圖
SO(2)等變示意圖
當(dāng)旋轉(zhuǎn)和沿xyz軸的平移發(fā)生時(shí),模型預(yù)測的軌跡也能確保發(fā)生相應(yīng)的平移和旋轉(zhuǎn)
高層:使用SO(2)?等變3D?U-Net對(duì)離散化平移概率圖進(jìn)行預(yù)測,因此擁有SO(2)?等變性和T(3)等變性
低層:基于堆疊體素編碼器提取局部特征,結(jié)合SO(2)?等變擴(kuò)散策略,因此擁有SO(2)等變性
系統(tǒng):在論文附錄中給出完整的等變性證明(Proposition?4.2&4.3)通過坐標(biāo)系轉(zhuǎn)換,SO(2)等變性被保存,T(3)等變性可以從高層傳遞到低層,使得整個(gè)系統(tǒng)擁有SO(2)XT(3)的等變性
創(chuàng)新型體素編碼器(Stacked?VoxelRepresentation)級(jí)
原理:將點(diǎn)云按體素網(wǎng)格分組,以等變PointNet聚合每個(gè)體素內(nèi)點(diǎn)的特征,組成c×D×H×W的等變體素圖。
優(yōu)勢包括:
細(xì)節(jié)保留,相比傳統(tǒng)下采樣,更好保留局部幾何信息;
計(jì)算友好,點(diǎn)云?卷積混合結(jié)構(gòu),平衡速度與精度;
等變性,理論保證在T(3)×SO(2)變換下保持一致性。
仿真實(shí)驗(yàn)
數(shù)據(jù)集:30個(gè)RLBench任務(wù),每個(gè)任務(wù)用100條演示訓(xùn)練。
對(duì)比基線:3D?Diffuser?Actor、Chained?Diffuser、Equivariant?Diffusion?Policy。
開環(huán)結(jié)果:HEP在30任務(wù)中有28項(xiàng)勝出,平均提升+10%。
閉環(huán)結(jié)果:在10個(gè)長程任務(wù)上,HEP平均提升+23%,顯著優(yōu)于單級(jí)方法。
消融分析
去除等變結(jié)構(gòu):性能降24%;
去除坐標(biāo)系轉(zhuǎn)移:性能降16%;
去除堆疊體素:性能降10%;
充分驗(yàn)證各模塊貢獻(xiàn)。
真實(shí)機(jī)器人實(shí)驗(yàn)
分層策略在復(fù)雜長程任務(wù)上優(yōu)勢顯著
在真實(shí)機(jī)器人上,HEP分層框架僅用30條演示數(shù)據(jù),就學(xué)會(huì)了包括移鍋蓋、加清潔劑、擦洗等多步協(xié)作的魯棒「洗鍋」任務(wù),明顯優(yōu)于非分層方法。
坐標(biāo)系轉(zhuǎn)移接口:泛化性與魯棒性的傳遞橋梁
理論保障:證明了坐標(biāo)系轉(zhuǎn)移接口能將高層對(duì)空間變化的適應(yīng)能力無損傳遞至低層,策略整體更易擴(kuò)展至新場景。
在Pick&Place任務(wù)上,HEP僅憑一次演示,低層擴(kuò)散模型即可實(shí)現(xiàn)1-shot泛化學(xué)習(xí),顯著提升了數(shù)據(jù)效率。
在環(huán)境變化和引入無關(guān)物體的擾動(dòng)測試下,HEP成功率較傳統(tǒng)方法提升高達(dá)60%。
接口設(shè)計(jì)帶來未來擴(kuò)展可能
坐標(biāo)系轉(zhuǎn)移接口對(duì)低層策略僅施加軟約束,這不僅保證了靈活性,也為未來引入VLM或Cross-embodiment等多模態(tài)、跨平臺(tái)高層策略作為決策規(guī)劃器提供了天然接口。
參考資料:
https://openreview.net/pdf?id=nAv5ketrHq