近期,加州大學(xué)伯克利分校副教授、PhysicalIntelligence(PI)的聯(lián)合創(chuàng)始人SergeyLevine在一篇文章中提到,“機(jī)器人數(shù)據(jù)訓(xùn)練,真實(shí)世界數(shù)據(jù)不可或缺”,引起了行業(yè)討論。
這一觀點(diǎn)之所以引發(fā)關(guān)注,是因?yàn)樗魬?zhàn)了業(yè)界部分企業(yè)“以仿真數(shù)據(jù)替代真機(jī)”的做法。在訓(xùn)練成本高昂、數(shù)據(jù)獲取難的背景下,企業(yè)該優(yōu)先依賴成本低、速度快的仿真數(shù)據(jù),還是回歸真實(shí)環(huán)境、積累高質(zhì)量的真機(jī)數(shù)據(jù),成為擺在每一家具身智能公司面前的一道關(guān)鍵技術(shù)選題。
PI 曾被視為機(jī)器人領(lǐng)域的 OpenAI,也是國(guó)內(nèi)不少企業(yè)的對(duì)標(biāo)對(duì)象。7月28日,在2025年世界人工智能大會(huì)(WAIC)現(xiàn)場(chǎng),第一財(cái)經(jīng)采訪了多位機(jī)器人企業(yè)的創(chuàng)始人和技術(shù)負(fù)責(zé)人,試圖厘清一個(gè)核心問題:在機(jī)器人進(jìn)入真實(shí)場(chǎng)景的關(guān)鍵時(shí)刻,什么樣的數(shù)據(jù)才真正有價(jià)值?
業(yè)界難定孰優(yōu)孰劣
“仿真數(shù)據(jù)很難涵蓋所有物理世界中我們希望機(jī)器人完成的任務(wù)?!敝窃獧C(jī)器人合伙人、具身業(yè)務(wù)部總裁姚卯青表示,SergeyLevine 提出的“叉勺理論”與公司在實(shí)驗(yàn)中觀察到的結(jié)論高度一致:部分局部任務(wù)可通過仿真訓(xùn)練完成,但大多數(shù)復(fù)雜任務(wù)仍需依賴真實(shí)數(shù)據(jù)。
“教會(huì)機(jī)器人使用勺子,可能要上百萬次訓(xùn)練?!币晃粎⒄构こ處熍e例說,“人類依靠經(jīng)驗(yàn)學(xué)習(xí),而機(jī)器人只能靠數(shù)據(jù)堆積?!?/p>
人類的智慧來自經(jīng)驗(yàn),而AI的智能來自數(shù)據(jù)。機(jī)器人是被海量數(shù)據(jù)“喂”聰明的。這些數(shù)據(jù)可能來自真實(shí)數(shù)據(jù)、仿真數(shù)據(jù)或互聯(lián)網(wǎng)數(shù)據(jù)。
以銀河通用為代表的仿真數(shù)據(jù)優(yōu)先派,主張自己學(xué)得更快、成本更低,甚至能在零真實(shí)數(shù)據(jù)情況下啟動(dòng)。銀河通用創(chuàng)始人王鶴曾在接受媒體采訪時(shí)提到,通過“搖操”采集數(shù)據(jù),即讓真人戴上一些采集設(shè)備來完成機(jī)器人要學(xué)的動(dòng)作,對(duì)于創(chuàng)業(yè)公司而言成本高昂,銀河通用選擇allin “Sim2Real(從仿真到真機(jī)的遷移)”,即主要依靠合成仿真數(shù)據(jù)。
在WAIC展會(huì)現(xiàn)場(chǎng),第一財(cái)經(jīng)記者看到了銀河通用的機(jī)器人正在充當(dāng)服務(wù)員,進(jìn)行物品的拿放、遞取。
“有機(jī)器人,就有數(shù)據(jù);有數(shù)據(jù),才有迭代?!鼻胬手悄蹸EO李通在接受第一財(cái)經(jīng)記者采訪時(shí)表示,相比做一兩個(gè)demo,更關(guān)鍵的是把機(jī)器人真正部署到實(shí)際崗位上,讓它們?cè)谡鎸?shí)任務(wù)中不斷工作、不斷犯錯(cuò),從而積累起對(duì)模型訓(xùn)練真正有價(jià)值的數(shù)據(jù)。
在他看來,服務(wù)業(yè)的應(yīng)用場(chǎng)景遠(yuǎn)比想象中更豐富,從餐飲、酒店、商超、機(jī)場(chǎng)、4S店、KTV到行政接待廳,每一個(gè)場(chǎng)景雖然任務(wù)各異,但底層的“動(dòng)作元素”是可以被歸類的——抓取、遞送、避障、交互等基礎(chǔ)能力構(gòu)成了崗位的操作核心。“這些元素對(duì)大模型來說是可泛化的,但前提是要有足夠豐富的真實(shí)數(shù)據(jù)支撐?!?/p>
李通強(qiáng)調(diào),“機(jī)器人必須在一個(gè)明確崗位上達(dá)到萬級(jí)部署量,才可能積累出對(duì)模型有效的數(shù)據(jù)。絕對(duì)不是一百臺(tái)、兩百臺(tái)能解決的問題。”對(duì)于機(jī)器人落地崗位的選擇,李通認(rèn)為,真正適合規(guī)模化落地的崗位,必須是相對(duì)清晰、簡(jiǎn)單、邊界明確的任務(wù),而不是“既要干這個(gè)又要干那個(gè)”的復(fù)合型操作。“像抓取、遞送這樣的基礎(chǔ)動(dòng)作,雖然看似簡(jiǎn)單,但只要在真實(shí)環(huán)境中積累足夠數(shù)據(jù),就能為大模型提供高度泛化的訓(xùn)練素材”。
真實(shí)和仿真數(shù)據(jù)孰優(yōu)孰劣,眼下或許還難以下定論。一位在WAIC現(xiàn)場(chǎng)的企業(yè)創(chuàng)始人告訴記者:“現(xiàn)在沒人能說死,因?yàn)檫€沒有人靠某種數(shù)據(jù)路徑跑出一個(gè)通用智能的完全體?!?/p>
魚和熊掌不可兼得
在機(jī)器人落地過程中,如何處理仿真與真機(jī)數(shù)據(jù)的結(jié)合,正成為行業(yè)普遍面臨的一道技術(shù)難題。靈初智能聯(lián)合創(chuàng)始人陳源培在接受第一財(cái)經(jīng)記者采訪時(shí)表示,這一問題并非首次出現(xiàn),早在2023年、2024年公司向投資人匯報(bào)時(shí),就明確指出“仿真和真機(jī)數(shù)據(jù)不能簡(jiǎn)單混合使用”。
“當(dāng)模型成長(zhǎng)到一定階段,它會(huì)自動(dòng)識(shí)別數(shù)據(jù)來源,并對(duì)不同來源的數(shù)據(jù)進(jìn)行不同程度的權(quán)重處理?!标愒磁嘟忉屨f,例如,模型會(huì)先判斷數(shù)據(jù)來自仿真還是真機(jī),再?zèng)Q定用仿真做策略搜索,還是用真機(jī)做微調(diào)。這也意味著,數(shù)據(jù)混合本身存在技術(shù)限制,因此靈初的方案是將仿真用于大規(guī)模預(yù)訓(xùn)練,再通過少量真機(jī)數(shù)據(jù)完成“最后一公里”的打磨。
北京人形機(jī)器人創(chuàng)新中心品牌負(fù)責(zé)人告訴第一財(cái)經(jīng),目前公司對(duì)機(jī)器人進(jìn)行訓(xùn)練時(shí),仿真數(shù)據(jù)和真實(shí)數(shù)據(jù)的使用比例為7:3;國(guó)家地方共建人形機(jī)器人創(chuàng)新中心相關(guān)負(fù)責(zé)人告訴第一財(cái)經(jīng),公司目前有自建的數(shù)據(jù)采集中心,真實(shí)數(shù)據(jù)使用比例較高,和仿真數(shù)據(jù)大概占比為3:1。
在數(shù)據(jù)結(jié)構(gòu)層面,業(yè)內(nèi)普遍認(rèn)為真實(shí)數(shù)據(jù)具有不可替代性,但高昂的采集成本是行業(yè)“必須面對(duì)的代價(jià)”。
智元機(jī)器人首席科學(xué)家、具身研究中心主任、上海創(chuàng)智學(xué)院副教授羅劍嵐博士表示,目前是具身智能落地的早期階段,仿真數(shù)據(jù)具備成本低、易獲得的優(yōu)勢(shì),“但仿真不是替代品,真機(jī)數(shù)據(jù)才是主舞臺(tái)。目前智元所有的多模態(tài)大模型、VLA(視覺語言動(dòng)作)模型100%使用的都是真機(jī)數(shù)據(jù)。”
無論選擇何種數(shù)據(jù)進(jìn)行機(jī)器人訓(xùn)練,業(yè)內(nèi)都面臨著“魚和熊掌不可兼得”的困境。
成立僅一年半,自變量機(jī)器人目前正處于產(chǎn)品技術(shù)驗(yàn)證(PoC)階段,與酒店、養(yǎng)老等多個(gè)行業(yè)客戶聯(lián)合開展項(xiàng)目測(cè)試,不斷驗(yàn)證其技術(shù)在真實(shí)、非結(jié)構(gòu)化環(huán)境中的高效部署能力。自變量機(jī)器人COO楊倩強(qiáng)調(diào):“我們的核心目標(biāo)不是快速商業(yè)化,而是讓機(jī)器人在真實(shí)場(chǎng)景中真正‘用起來’?!?/p>
她認(rèn)為,仿真技術(shù)目前在機(jī)器人"下半身"的訓(xùn)練中仍占據(jù)主流,例如雙足機(jī)器人的步態(tài)規(guī)劃與運(yùn)動(dòng)控制等領(lǐng)域,仿真提供了不可或缺的低成本測(cè)試環(huán)境,其價(jià)值是毋庸置疑的。然而,當(dāng)任務(wù)重心從"下半身"的移動(dòng)轉(zhuǎn)移到"上半身"的精細(xì)操作——即與商業(yè)應(yīng)用緊密結(jié)合的、與物理世界進(jìn)行復(fù)雜交互的任務(wù)時(shí),依靠仿真能夠到達(dá)的操作能力就非常有限。她告訴記者,一旦進(jìn)入長(zhǎng)鏈條、柔性和高度接觸的交互任務(wù),比如完成制作香囊、貼標(biāo)、遞送,仿真所需的工程開銷、調(diào)參周期和計(jì)算成本是巨大的,甚至是不可能完成的?!跋啾戎拢覀兏鼉A向于直接在真實(shí)世界進(jìn)行端到端的數(shù)據(jù)采集和訓(xùn)練,用較少人力在較短周期內(nèi)完成訓(xùn)練與部署?!?/p>
“我們從訓(xùn)練到調(diào)優(yōu),只用了大約一周,就讓機(jī)器人完成了完整制作任務(wù)。”她介紹說,“你可以認(rèn)為它的單條數(shù)據(jù)很長(zhǎng)、成本高,但放在這個(gè)復(fù)雜任務(wù)的學(xué)習(xí)效率上來看,仿真反而更‘劃不來’?!?/p>
楊倩指出:“最終算得過賬的,不只是采購(gòu)成本,而是它在真實(shí)場(chǎng)景中能不能真正替代人來做事,甚至長(zhǎng)期在人效比上能不能跑贏?!?/p>
當(dāng)被問及如何看待同行對(duì)仿真路徑的堅(jiān)持時(shí),楊倩表示:“與其在仿真世界里反復(fù)調(diào)參,不如讓機(jī)器人直接在真實(shí)世界里試錯(cuò)成長(zhǎng)。”在她看來,“任務(wù)定義”才是決定數(shù)據(jù)價(jià)值的核心變量,“真實(shí)數(shù)據(jù)并不一定貴,仿真數(shù)據(jù)也未必便宜”。
智元機(jī)器人同樣明確押注真實(shí)數(shù)據(jù)。目前,智元通過自建專業(yè)數(shù)采工廠,形成全球最大數(shù)據(jù)集AgiBotWorld并開源,姚卯青說:“面對(duì)具身智能數(shù)據(jù)的荒漠,我們選擇栽下第一棵樹,愿其能成為一片森林。”同時(shí),智元還發(fā)布行業(yè)首個(gè)通用具身基座模型——啟元大模型,擁有“一腦多形”能力,可適配其他異構(gòu)機(jī)器人本體。
延伸閱讀:與 真機(jī)太貴機(jī)器人:數(shù)據(jù)最|優(yōu)《解出現(xiàn)了》嗎 的相關(guān)文章