本報(bào)記者谷業(yè)凱
圖①:靈寶機(jī)器人具身算法工程師王思成在演示機(jī)器人抓取物體。圖②:靈寶機(jī)器人模仿學(xué)習(xí)算法工程師孫建涌在調(diào)試機(jī)器人夾爪。圖③:靈寶機(jī)器人具身操作中心負(fù)責(zé)人周明才對人形機(jī)器人進(jìn)行調(diào)試。以上圖片均為北京中科慧靈機(jī)器人技術(shù)有限公司提供
習(xí)近平總書記強(qiáng)調(diào),“推進(jìn)中國式現(xiàn)代化,科學(xué)技術(shù)要打頭陣,科技創(chuàng)新是必由之路”“在激烈的國際競爭中,我們要開辟發(fā)展新領(lǐng)域新賽道、塑造發(fā)展新動能新優(yōu)勢,從根本上說,還是要依靠科技創(chuàng)新”。
在高校院所、企業(yè)車間,一線科研人員瞄準(zhǔn)科技前沿,潛心研究、創(chuàng)新攻關(guān),為加快建設(shè)科技強(qiáng)國,實(shí)現(xiàn)高水平科技自立自強(qiáng)持續(xù)奮斗。本版今起推出“一線探創(chuàng)新”系列報(bào)道,通過記者在科研一線的親身體驗(yàn)和近距離觀察,一起來感受和了解創(chuàng)新成果的孕育過程。
——編者
機(jī)器人拿起咖啡杯、穿針引線,甚至彈奏鋼琴,都屬于具身操作,背后有一套軟硬件系統(tǒng)支撐。作為具身智能的關(guān)鍵技術(shù)之一,具身大腦的目標(biāo)是讓機(jī)器人“心靈手巧”,從而與外界實(shí)現(xiàn)互動。
如今,這項(xiàng)賦予機(jī)器人“靈動感”的技術(shù),正進(jìn)入關(guān)鍵突破與激烈競逐階段。北京海淀東升科技園里,北京中科慧靈機(jī)器人技術(shù)有限公司(以下簡稱“靈寶機(jī)器人”)的“極客”們正在這一新賽道上奮力奔跑、不斷突破。
讓機(jī)器人通過“模仿學(xué)習(xí)”掌握技能
靈寶機(jī)器人的研發(fā)現(xiàn)場既像不太“規(guī)范”的實(shí)驗(yàn)室,也像不那么“標(biāo)準(zhǔn)化”的生產(chǎn)車間。頂棚上的軌道縱橫交錯(cuò),各種操作臺遍布其中。記者行走其間,經(jīng)常要側(cè)身、抬腳,設(shè)備多到容納不下一條固定的步行“動線”。
靈寶機(jī)器人成立于2023年,由中國科學(xué)院自動化研究所研究員張正濤創(chuàng)辦,專注研發(fā)面向場景落地的通用人形機(jī)器人和具身智能產(chǎn)品。具身操作是靈寶機(jī)器人的技術(shù)專長之一,他們研發(fā)的具身智能機(jī)器人可以用0.3毫米的螺絲刀完成筆記本電腦主板裝配,精度甚至能達(dá)到頭發(fā)絲的1/5。
像人類的雙手一樣,具身操作需要兼具感知和操作能力。視覺語言動作模型(VLA)是實(shí)現(xiàn)這兩項(xiàng)能力的重要途徑——通過融合視覺感知、語言理解與動作控制來打造“端到端”決策系統(tǒng),并開展“泛化學(xué)習(xí)”,就像一個(gè)動作版的大語言模型。
在研發(fā)現(xiàn)場,記者看到,靈寶機(jī)器人具身算法工程師王思成正在使用視覺語言動作模型和一臺末端執(zhí)行器為二指夾爪的機(jī)器人,來模擬訓(xùn)練抓取動作。
抓取是人手最基本的動作之一。操作臺上放著一個(gè)盤子,里面盛放的是網(wǎng)球、香蕉和獼猴桃?!白ト【W(wǎng)球?!蓖跛汲上仍陔娔X里敲上幾行代碼,再起身來到機(jī)器人前念出一段語音指令。
看似有些笨拙的訓(xùn)練過程,卻有極高的技術(shù)目標(biāo)?!皞鹘y(tǒng)的機(jī)器人抓取,要先檢測目標(biāo),再算出空間坐標(biāo),最后完成動作,操作流程是相對固定的?!蓖跛汲山忉?,“而我們知道,人類在抓取物體的時(shí)候可不是這樣操作的,我們既不會‘檢測’,也不會計(jì)算空間坐標(biāo),而是利用直覺和反饋產(chǎn)生動作,我們正是要讓機(jī)器人具備這樣的能力?!?/p>
不需要設(shè)置固定的算法流程,只需輸入視覺圖像,讓機(jī)器人學(xué)習(xí)視覺圖像中哪些要素跟操作相關(guān)。簡單演示幾遍,它就可以模仿、學(xué)習(xí)人類的抓取動作。“我們讓機(jī)器人通過‘模仿學(xué)習(xí)’掌握技能。”王思成說。
目前,算法還沒那么先進(jìn),還需要收集大量數(shù)據(jù)才能讓機(jī)器人熟練地抓取?!翱隙ū热艘恳恍?,難點(diǎn)就在于怎樣用盡可能少的數(shù)據(jù),讓它學(xué)會更多技能?!蓖跛汲烧f,“拿抓取來說,使用一般的開源模型要采集三四十條數(shù)據(jù)才能學(xué)會,我們不斷改進(jìn)算法,現(xiàn)在5到10條數(shù)據(jù)就能學(xué)會了。”
同樣是抓取,對人類來說,抓不同物體,動作、力度也會有細(xì)微差別。在王思成他們的努力下,這種細(xì)微差別也能在機(jī)器人的二指夾爪上實(shí)現(xiàn)?!斑@是自適應(yīng)力控夾爪,遇到軟的物體,它的力度也會做相應(yīng)調(diào)整。也就是說抓網(wǎng)球和獼猴桃,它的力度也是略有不同的?!蓖跛汲烧f。
這項(xiàng)開發(fā)工作已進(jìn)行了近1年?!拔覀円延邢嚓P(guān)論文成果發(fā)表。”更讓王思成有成就感的是,系統(tǒng)還在“跑分”平臺上名列前茅,部分性能指標(biāo)已經(jīng)達(dá)到業(yè)內(nèi)領(lǐng)先水平。
實(shí)現(xiàn)動態(tài)場景下的抓、拿、放
一只鞋被重復(fù)放置在傳送帶上,機(jī)器人將它抓起,然后放置在專門壓鞋的機(jī)器上。靈寶機(jī)器人模仿學(xué)習(xí)算法工程師孫建涌用一個(gè)3D鼠標(biāo),操作機(jī)器人進(jìn)行抓取訓(xùn)練,“這是制鞋場景下的一個(gè)標(biāo)準(zhǔn)動作,現(xiàn)在它已經(jīng)能抓取了,但是抓得還沒有那么緊、那么好?!?/p>
自動化設(shè)備在國內(nèi)制造業(yè)已不鮮見,但在制鞋領(lǐng)域還不多。靈寶機(jī)器人商業(yè)化中心負(fù)責(zé)人張淼解釋:“我們做過調(diào)研,一條制鞋自動化生產(chǎn)線需要上千萬元投資,只適合生產(chǎn)一些銷量較大的‘爆款鞋’。由于柔性化程度不夠,生產(chǎn)線在不同鞋款間‘切換’的成本很高,這成為提升自動化率的一大障礙。”
孫建涌訓(xùn)練的機(jī)器人,要適應(yīng)的正是柔性化的制鞋流程。他告訴記者:“鞋分左右腳,鞋碼在35碼到45碼之間,要在動態(tài)場景下完成抓、拿、放,這些都是通過真機(jī)在線強(qiáng)化學(xué)習(xí)實(shí)現(xiàn)的?!?/p>
按照過去的思路,這套動作需要現(xiàn)場采集數(shù)據(jù)、再設(shè)計(jì)一套指令?,F(xiàn)在用視覺數(shù)據(jù)和真機(jī)在線強(qiáng)化學(xué)習(xí),普通工人用3D鼠標(biāo)就可以“手把手”教機(jī)器人操作,“有點(diǎn)像‘抓娃娃’,系統(tǒng)慢慢學(xué)會后,稍微糾個(gè)錯(cuò)就行,能夠在不同款式間快速‘切換’,也極大降低了訓(xùn)練使用的門檻?!睂O建涌解釋。
現(xiàn)在,訓(xùn)練這樣的機(jī)器人來抓取一款鞋,只需1小時(shí)左右?!叭绻麤]抓到或者抓偏了,機(jī)器人還能自動調(diào)整。這是強(qiáng)化學(xué)習(xí)相比于模仿學(xué)習(xí)的一大優(yōu)點(diǎn)?!睂O建涌說,模仿學(xué)習(xí)往往是基于“成功經(jīng)驗(yàn)”,強(qiáng)化學(xué)習(xí)除了依賴“投喂”的成功經(jīng)驗(yàn),還能自己探索并覆蓋各種情況。
3個(gè)月來,孫建涌所在的團(tuán)隊(duì)常在實(shí)驗(yàn)室和工廠兩頭跑?!昂芏鄦栴}都要在生產(chǎn)一線解決,比如有的傳送帶比較光滑,反光就會影響視覺判斷?!睂O建涌舉例,其他如傳送帶速度、相機(jī)視野里鞋的密集度等,都需要在算法層面一點(diǎn)點(diǎn)改進(jìn)。
更加柔性化以兼容更多應(yīng)用場景
研發(fā)現(xiàn)場,占據(jù)“C位”的是一臺人形機(jī)器人,身上還掛著不少線纜。作為實(shí)驗(yàn)機(jī)型,很多“極限測試”都在它身上開展。同時(shí),它也是今年北京人形機(jī)器人半程馬拉松賽上少數(shù)沒有摔倒的參賽選手之一。
在前期研發(fā)的基礎(chǔ)上,靈寶機(jī)器人團(tuán)隊(duì)很多成果已經(jīng)用在了人形機(jī)器人上。去年11月,公司發(fā)布的首款全尺寸雙足人形機(jī)器人靈寶CASBOT01,就搭載了結(jié)合具身智能、柔順力控和精密操作等技術(shù)的五指仿生靈巧手,能執(zhí)行雙指旋擰、指間夾取等操作任務(wù)。
張淼介紹,作為執(zhí)行操作任務(wù)的關(guān)鍵部件,五指仿生靈巧手單手重量800克、額定負(fù)載達(dá)5公斤,集成了觸覺、力覺和視覺的多源感知系統(tǒng)。通過優(yōu)化控制算法和動作規(guī)劃,該靈巧手能夠模擬人手的靈活性,可有效解決精細(xì)化作業(yè)場景中的“靈巧”與“作業(yè)”兩大難題。
“操作是具身智能的核心能力,對于產(chǎn)業(yè)發(fā)展具有重要意義?!痹陟`寶機(jī)器人具身操作中心負(fù)責(zé)人周明才看來,目前具身智能已經(jīng)實(shí)現(xiàn)了“形似”,但如何使其像人類那樣去感知和操作,仍是一個(gè)逐步發(fā)展的過程。特別是隨著個(gè)性化需求增多,讓具身智能更加柔性化,以兼容更多應(yīng)用場景,是研發(fā)的一個(gè)重要目標(biāo)。
“近年來,國內(nèi)具身智能發(fā)展很快,特別是產(chǎn)業(yè)鏈不斷完善。像常見的觸覺傳感器,有壓阻式的、電容式的,一些新的器件也逐步加入進(jìn)來,可以說處在一個(gè)‘百花齊放’的狀態(tài)。哪種技術(shù)路線最優(yōu)?我想這也是一個(gè)逐步‘收斂’的過程。但正是有了這些基礎(chǔ),我們做算法開發(fā)才能更加得心應(yīng)手。”周明才說。
靈寶機(jī)器人對產(chǎn)學(xué)研融合有著深刻的理解。周明才說:“我們會把一些最新的研究成果應(yīng)用到產(chǎn)品中去。同時(shí),我們的最新產(chǎn)品也會提供給學(xué)術(shù)界做前沿研究,這是個(gè)緊密互動、螺旋式上升的過程。”
《人民日報(bào)》(2025年07月28日19版)
從“爽文”到“精品”:國漫劇如何實(shí)現(xiàn)“賣點(diǎn)”升維?
例如,《仙逆》的男主人公王林原本是資質(zhì)平庸的鄉(xiāng)村少年,因意外墜崖獲得了“天逆珠”而踏入修真界,歷經(jīng)家族滅門后覺醒極境靈力,愛人的離世成為他千年修行的核心動力,王林先后成為紫系弟子、雷仙、古神,并參與封神大戰(zhàn),最終參透輪回、復(fù)活愛人,登頂仙罡大陸————?!抖妨_大陸》的唐三保留著前世對于唐門絕技的記憶,擁有被視為廢武魂的藍(lán)銀草, 第五本:《影視世界從匆匆那年開始》作者:迷失的幻境簡介:這是一本穿越在各個(gè)影視劇的書,雖然有原劇情,但更多的是新故事!經(jīng)歷的世界《匆匆那年》《古惑仔》(古惑仔因?yàn)楸环獠莶萁Y(jié)束,不影響后面閱讀)《我們結(jié)婚吧》《潛伏》《北轍南轅》《血色浪漫》《歡樂頌》《振華中學(xué)三部曲》《士兵突擊》《獵場》《精好了吧!新劇才播5集,8.4高分來襲,奇幻大劇引熬夜狂追