本報(bào)記者谷業(yè)凱
圖①:靈寶機(jī)器人具身算法工程師王思成在演示機(jī)器人抓取物體。圖②:靈寶機(jī)器人模仿學(xué)習(xí)算法工程師孫建涌在調(diào)試機(jī)器人夾爪。圖③:靈寶機(jī)器人具身操作中心負(fù)責(zé)人周明才對(duì)人形機(jī)器人進(jìn)行調(diào)試。以上圖片均為北京中科慧靈機(jī)器人技術(shù)有限公司提供
習(xí)近平總書(shū)記強(qiáng)調(diào),“推進(jìn)中國(guó)式現(xiàn)代化,科學(xué)技術(shù)要打頭陣,科技創(chuàng)新是必由之路”“在激烈的國(guó)際競(jìng)爭(zhēng)中,我們要開(kāi)辟發(fā)展新領(lǐng)域新賽道、塑造發(fā)展新動(dòng)能新優(yōu)勢(shì),從根本上說(shuō),還是要依靠科技創(chuàng)新”。
在高校院所、企業(yè)車(chē)間,一線科研人員瞄準(zhǔn)科技前沿,潛心研究、創(chuàng)新攻關(guān),為加快建設(shè)科技強(qiáng)國(guó),實(shí)現(xiàn)高水平科技自立自強(qiáng)持續(xù)奮斗。本版今起推出“一線探創(chuàng)新”系列報(bào)道,通過(guò)記者在科研一線的親身體驗(yàn)和近距離觀察,一起來(lái)感受和了解創(chuàng)新成果的孕育過(guò)程。
——編者
機(jī)器人拿起咖啡杯、穿針引線,甚至彈奏鋼琴,都屬于具身操作,背后有一套軟硬件系統(tǒng)支撐。作為具身智能的關(guān)鍵技術(shù)之一,具身大腦的目標(biāo)是讓機(jī)器人“心靈手巧”,從而與外界實(shí)現(xiàn)互動(dòng)。
如今,這項(xiàng)賦予機(jī)器人“靈動(dòng)感”的技術(shù),正進(jìn)入關(guān)鍵突破與激烈競(jìng)逐階段。北京海淀東升科技園里,北京中科慧靈機(jī)器人技術(shù)有限公司(以下簡(jiǎn)稱(chēng)“靈寶機(jī)器人”)的“極客”們正在這一新賽道上奮力奔跑、不斷突破。
讓機(jī)器人通過(guò)“模仿學(xué)習(xí)”掌握技能
靈寶機(jī)器人的研發(fā)現(xiàn)場(chǎng)既像不太“規(guī)范”的實(shí)驗(yàn)室,也像不那么“標(biāo)準(zhǔn)化”的生產(chǎn)車(chē)間。頂棚上的軌道縱橫交錯(cuò),各種操作臺(tái)遍布其中。記者行走其間,經(jīng)常要側(cè)身、抬腳,設(shè)備多到容納不下一條固定的步行“動(dòng)線”。
靈寶機(jī)器人成立于2023年,由中國(guó)科學(xué)院自動(dòng)化研究所研究員張正濤創(chuàng)辦,專(zhuān)注研發(fā)面向場(chǎng)景落地的通用人形機(jī)器人和具身智能產(chǎn)品。具身操作是靈寶機(jī)器人的技術(shù)專(zhuān)長(zhǎng)之一,他們研發(fā)的具身智能機(jī)器人可以用0.3毫米的螺絲刀完成筆記本電腦主板裝配,精度甚至能達(dá)到頭發(fā)絲的1/5。
像人類(lèi)的雙手一樣,具身操作需要兼具感知和操作能力。視覺(jué)語(yǔ)言動(dòng)作模型(VLA)是實(shí)現(xiàn)這兩項(xiàng)能力的重要途徑——通過(guò)融合視覺(jué)感知、語(yǔ)言理解與動(dòng)作控制來(lái)打造“端到端”決策系統(tǒng),并開(kāi)展“泛化學(xué)習(xí)”,就像一個(gè)動(dòng)作版的大語(yǔ)言模型。
在研發(fā)現(xiàn)場(chǎng),記者看到,靈寶機(jī)器人具身算法工程師王思成正在使用視覺(jué)語(yǔ)言動(dòng)作模型和一臺(tái)末端執(zhí)行器為二指夾爪的機(jī)器人,來(lái)模擬訓(xùn)練抓取動(dòng)作。
抓取是人手最基本的動(dòng)作之一。操作臺(tái)上放著一個(gè)盤(pán)子,里面盛放的是網(wǎng)球、香蕉和獼猴桃。“抓取網(wǎng)球?!蓖跛汲上仍陔娔X里敲上幾行代碼,再起身來(lái)到機(jī)器人前念出一段語(yǔ)音指令。
看似有些笨拙的訓(xùn)練過(guò)程,卻有極高的技術(shù)目標(biāo)?!皞鹘y(tǒng)的機(jī)器人抓取,要先檢測(cè)目標(biāo),再算出空間坐標(biāo),最后完成動(dòng)作,操作流程是相對(duì)固定的。”王思成解釋?zhuān)岸覀冎?,人?lèi)在抓取物體的時(shí)候可不是這樣操作的,我們既不會(huì)‘檢測(cè)’,也不會(huì)計(jì)算空間坐標(biāo),而是利用直覺(jué)和反饋產(chǎn)生動(dòng)作,我們正是要讓機(jī)器人具備這樣的能力?!?/p>
不需要設(shè)置固定的算法流程,只需輸入視覺(jué)圖像,讓機(jī)器人學(xué)習(xí)視覺(jué)圖像中哪些要素跟操作相關(guān)。簡(jiǎn)單演示幾遍,它就可以模仿、學(xué)習(xí)人類(lèi)的抓取動(dòng)作。“我們讓機(jī)器人通過(guò)‘模仿學(xué)習(xí)’掌握技能?!蓖跛汲烧f(shuō)。
目前,算法還沒(méi)那么先進(jìn),還需要收集大量數(shù)據(jù)才能讓機(jī)器人熟練地抓取?!翱隙ū热艘恳恍?,難點(diǎn)就在于怎樣用盡可能少的數(shù)據(jù),讓它學(xué)會(huì)更多技能。”王思成說(shuō),“拿抓取來(lái)說(shuō),使用一般的開(kāi)源模型要采集三四十條數(shù)據(jù)才能學(xué)會(huì),我們不斷改進(jìn)算法,現(xiàn)在5到10條數(shù)據(jù)就能學(xué)會(huì)了?!?/p>
同樣是抓取,對(duì)人類(lèi)來(lái)說(shuō),抓不同物體,動(dòng)作、力度也會(huì)有細(xì)微差別。在王思成他們的努力下,這種細(xì)微差別也能在機(jī)器人的二指夾爪上實(shí)現(xiàn)?!斑@是自適應(yīng)力控夾爪,遇到軟的物體,它的力度也會(huì)做相應(yīng)調(diào)整。也就是說(shuō)抓網(wǎng)球和獼猴桃,它的力度也是略有不同的?!蓖跛汲烧f(shuō)。
這項(xiàng)開(kāi)發(fā)工作已進(jìn)行了近1年?!拔覀円延邢嚓P(guān)論文成果發(fā)表?!备屚跛汲捎谐删透械氖?,系統(tǒng)還在“跑分”平臺(tái)上名列前茅,部分性能指標(biāo)已經(jīng)達(dá)到業(yè)內(nèi)領(lǐng)先水平。
實(shí)現(xiàn)動(dòng)態(tài)場(chǎng)景下的抓、拿、放
一只鞋被重復(fù)放置在傳送帶上,機(jī)器人將它抓起,然后放置在專(zhuān)門(mén)壓鞋的機(jī)器上。靈寶機(jī)器人模仿學(xué)習(xí)算法工程師孫建涌用一個(gè)3D鼠標(biāo),操作機(jī)器人進(jìn)行抓取訓(xùn)練,“這是制鞋場(chǎng)景下的一個(gè)標(biāo)準(zhǔn)動(dòng)作,現(xiàn)在它已經(jīng)能抓取了,但是抓得還沒(méi)有那么緊、那么好?!?/p>
自動(dòng)化設(shè)備在國(guó)內(nèi)制造業(yè)已不鮮見(jiàn),但在制鞋領(lǐng)域還不多。靈寶機(jī)器人商業(yè)化中心負(fù)責(zé)人張淼解釋?zhuān)骸拔覀冏鲞^(guò)調(diào)研,一條制鞋自動(dòng)化生產(chǎn)線需要上千萬(wàn)元投資,只適合生產(chǎn)一些銷(xiāo)量較大的‘爆款鞋’。由于柔性化程度不夠,生產(chǎn)線在不同鞋款間‘切換’的成本很高,這成為提升自動(dòng)化率的一大障礙?!?/p>
孫建涌訓(xùn)練的機(jī)器人,要適應(yīng)的正是柔性化的制鞋流程。他告訴記者:“鞋分左右腳,鞋碼在35碼到45碼之間,要在動(dòng)態(tài)場(chǎng)景下完成抓、拿、放,這些都是通過(guò)真機(jī)在線強(qiáng)化學(xué)習(xí)實(shí)現(xiàn)的?!?/p>
按照過(guò)去的思路,這套動(dòng)作需要現(xiàn)場(chǎng)采集數(shù)據(jù)、再設(shè)計(jì)一套指令?,F(xiàn)在用視覺(jué)數(shù)據(jù)和真機(jī)在線強(qiáng)化學(xué)習(xí),普通工人用3D鼠標(biāo)就可以“手把手”教機(jī)器人操作,“有點(diǎn)像‘抓娃娃’,系統(tǒng)慢慢學(xué)會(huì)后,稍微糾個(gè)錯(cuò)就行,能夠在不同款式間快速‘切換’,也極大降低了訓(xùn)練使用的門(mén)檻。”孫建涌解釋。
現(xiàn)在,訓(xùn)練這樣的機(jī)器人來(lái)抓取一款鞋,只需1小時(shí)左右。“如果沒(méi)抓到或者抓偏了,機(jī)器人還能自動(dòng)調(diào)整。這是強(qiáng)化學(xué)習(xí)相比于模仿學(xué)習(xí)的一大優(yōu)點(diǎn)。”孫建涌說(shuō),模仿學(xué)習(xí)往往是基于“成功經(jīng)驗(yàn)”,強(qiáng)化學(xué)習(xí)除了依賴(lài)“投喂”的成功經(jīng)驗(yàn),還能自己探索并覆蓋各種情況。
3個(gè)月來(lái),孫建涌所在的團(tuán)隊(duì)常在實(shí)驗(yàn)室和工廠兩頭跑?!昂芏鄦?wèn)題都要在生產(chǎn)一線解決,比如有的傳送帶比較光滑,反光就會(huì)影響視覺(jué)判斷。”孫建涌舉例,其他如傳送帶速度、相機(jī)視野里鞋的密集度等,都需要在算法層面一點(diǎn)點(diǎn)改進(jìn)。
更加柔性化以兼容更多應(yīng)用場(chǎng)景
研發(fā)現(xiàn)場(chǎng),占據(jù)“C位”的是一臺(tái)人形機(jī)器人,身上還掛著不少線纜。作為實(shí)驗(yàn)機(jī)型,很多“極限測(cè)試”都在它身上開(kāi)展。同時(shí),它也是今年北京人形機(jī)器人半程馬拉松賽上少數(shù)沒(méi)有摔倒的參賽選手之一。
在前期研發(fā)的基礎(chǔ)上,靈寶機(jī)器人團(tuán)隊(duì)很多成果已經(jīng)用在了人形機(jī)器人上。去年11月,公司發(fā)布的首款全尺寸雙足人形機(jī)器人靈寶CASBOT01,就搭載了結(jié)合具身智能、柔順力控和精密操作等技術(shù)的五指仿生靈巧手,能執(zhí)行雙指旋擰、指間夾取等操作任務(wù)。
張淼介紹,作為執(zhí)行操作任務(wù)的關(guān)鍵部件,五指仿生靈巧手單手重量800克、額定負(fù)載達(dá)5公斤,集成了觸覺(jué)、力覺(jué)和視覺(jué)的多源感知系統(tǒng)。通過(guò)優(yōu)化控制算法和動(dòng)作規(guī)劃,該靈巧手能夠模擬人手的靈活性,可有效解決精細(xì)化作業(yè)場(chǎng)景中的“靈巧”與“作業(yè)”兩大難題。
“操作是具身智能的核心能力,對(duì)于產(chǎn)業(yè)發(fā)展具有重要意義?!痹陟`寶機(jī)器人具身操作中心負(fù)責(zé)人周明才看來(lái),目前具身智能已經(jīng)實(shí)現(xiàn)了“形似”,但如何使其像人類(lèi)那樣去感知和操作,仍是一個(gè)逐步發(fā)展的過(guò)程。特別是隨著個(gè)性化需求增多,讓具身智能更加柔性化,以兼容更多應(yīng)用場(chǎng)景,是研發(fā)的一個(gè)重要目標(biāo)。
“近年來(lái),國(guó)內(nèi)具身智能發(fā)展很快,特別是產(chǎn)業(yè)鏈不斷完善。像常見(jiàn)的觸覺(jué)傳感器,有壓阻式的、電容式的,一些新的器件也逐步加入進(jìn)來(lái),可以說(shuō)處在一個(gè)‘百花齊放’的狀態(tài)。哪種技術(shù)路線最優(yōu)?我想這也是一個(gè)逐步‘收斂’的過(guò)程。但正是有了這些基礎(chǔ),我們做算法開(kāi)發(fā)才能更加得心應(yīng)手?!敝苊鞑耪f(shuō)。
靈寶機(jī)器人對(duì)產(chǎn)學(xué)研融合有著深刻的理解。周明才說(shuō):“我們會(huì)把一些最新的研究成果應(yīng)用到產(chǎn)品中去。同時(shí),我們的最新產(chǎn)品也會(huì)提供給學(xué)術(shù)界做前沿研究,這是個(gè)緊密互動(dòng)、螺旋式上升的過(guò)程。”
《人民日?qǐng)?bào)》(2025年07月28日19版)
高分書(shū)籍《養(yǎng)鳥(niǎo)三天,撿來(lái)的寵物變老公!》驚喜滿(mǎn)滿(mǎn)的情節(jié),等你來(lái)...
呆萌的白文鳥(niǎo),少女心的專(zhuān)屬寵物??手養(yǎng)鳥(niǎo)之家
從寵物到法律保護(hù):養(yǎng)鳥(niǎo)歷史與生態(tài)保護(hù)
免責(zé)聲明:本文內(nèi)容由開(kāi)放的智能模型自動(dòng)生成,僅供參考。