近期,加州大學伯克利分校副教授、PhysicalIntelligence(PI)的聯(lián)合創(chuàng)始人SergeyLevine在一篇文章中提到,“機器人數(shù)據(jù)訓練,真實世界數(shù)據(jù)不可或缺”,引起了行業(yè)討論。
這一觀點之所以引發(fā)關注,是因為它挑戰(zhàn)了業(yè)界部分企業(yè)“以仿真數(shù)據(jù)替代真機”的做法。在訓練成本高昂、數(shù)據(jù)獲取難的背景下,企業(yè)該優(yōu)先依賴成本低、速度快的仿真數(shù)據(jù),還是回歸真實環(huán)境、積累高質(zhì)量的真機數(shù)據(jù),成為擺在每一家具身智能公司面前的一道關鍵技術選題。
PI 曾被視為機器人領域的 OpenAI,也是國內(nèi)不少企業(yè)的對標對象。7月28日,在2025年世界人工智能大會(WAIC)現(xiàn)場,第一財經(jīng)采訪了多位機器人企業(yè)的創(chuàng)始人和技術負責人,試圖厘清一個核心問題:在機器人進入真實場景的關鍵時刻,什么樣的數(shù)據(jù)才真正有價值?
業(yè)界難定孰優(yōu)孰劣
“仿真數(shù)據(jù)很難涵蓋所有物理世界中我們希望機器人完成的任務?!敝窃獧C器人合伙人、具身業(yè)務部總裁姚卯青表示,SergeyLevine 提出的“叉勺理論”與公司在實驗中觀察到的結(jié)論高度一致:部分局部任務可通過仿真訓練完成,但大多數(shù)復雜任務仍需依賴真實數(shù)據(jù)。
“教會機器人使用勺子,可能要上百萬次訓練?!币晃粎⒄构こ處熍e例說,“人類依靠經(jīng)驗學習,而機器人只能靠數(shù)據(jù)堆積?!?/p>
人類的智慧來自經(jīng)驗,而AI的智能來自數(shù)據(jù)。機器人是被海量數(shù)據(jù)“喂”聰明的。這些數(shù)據(jù)可能來自真實數(shù)據(jù)、仿真數(shù)據(jù)或互聯(lián)網(wǎng)數(shù)據(jù)。
以銀河通用為代表的仿真數(shù)據(jù)優(yōu)先派,主張自己學得更快、成本更低,甚至能在零真實數(shù)據(jù)情況下啟動。銀河通用創(chuàng)始人王鶴曾在接受媒體采訪時提到,通過“搖操”采集數(shù)據(jù),即讓真人戴上一些采集設備來完成機器人要學的動作,對于創(chuàng)業(yè)公司而言成本高昂,銀河通用選擇allin “Sim2Real(從仿真到真機的遷移)”,即主要依靠合成仿真數(shù)據(jù)。
在WAIC展會現(xiàn)場,第一財經(jīng)記者看到了銀河通用的機器人正在充當服務員,進行物品的拿放、遞取。
“有機器人,就有數(shù)據(jù);有數(shù)據(jù),才有迭代?!鼻胬手悄蹸EO李通在接受第一財經(jīng)記者采訪時表示,相比做一兩個demo,更關鍵的是把機器人真正部署到實際崗位上,讓它們在真實任務中不斷工作、不斷犯錯,從而積累起對模型訓練真正有價值的數(shù)據(jù)。
在他看來,服務業(yè)的應用場景遠比想象中更豐富,從餐飲、酒店、商超、機場、4S店、KTV到行政接待廳,每一個場景雖然任務各異,但底層的“動作元素”是可以被歸類的——抓取、遞送、避障、交互等基礎能力構(gòu)成了崗位的操作核心?!斑@些元素對大模型來說是可泛化的,但前提是要有足夠豐富的真實數(shù)據(jù)支撐?!?/p>
李通強調(diào),“機器人必須在一個明確崗位上達到萬級部署量,才可能積累出對模型有效的數(shù)據(jù)。絕對不是一百臺、兩百臺能解決的問題?!睂τ跈C器人落地崗位的選擇,李通認為,真正適合規(guī)?;涞氐膷徫?,必須是相對清晰、簡單、邊界明確的任務,而不是“既要干這個又要干那個”的復合型操作。“像抓取、遞送這樣的基礎動作,雖然看似簡單,但只要在真實環(huán)境中積累足夠數(shù)據(jù),就能為大模型提供高度泛化的訓練素材”。
真實和仿真數(shù)據(jù)孰優(yōu)孰劣,眼下或許還難以下定論。一位在WAIC現(xiàn)場的企業(yè)創(chuàng)始人告訴記者:“現(xiàn)在沒人能說死,因為還沒有人靠某種數(shù)據(jù)路徑跑出一個通用智能的完全體?!?/p>
魚和熊掌不可兼得
在機器人落地過程中,如何處理仿真與真機數(shù)據(jù)的結(jié)合,正成為行業(yè)普遍面臨的一道技術難題。靈初智能聯(lián)合創(chuàng)始人陳源培在接受第一財經(jīng)記者采訪時表示,這一問題并非首次出現(xiàn),早在2023年、2024年公司向投資人匯報時,就明確指出“仿真和真機數(shù)據(jù)不能簡單混合使用”。
“當模型成長到一定階段,它會自動識別數(shù)據(jù)來源,并對不同來源的數(shù)據(jù)進行不同程度的權(quán)重處理?!标愒磁嘟忉屨f,例如,模型會先判斷數(shù)據(jù)來自仿真還是真機,再決定用仿真做策略搜索,還是用真機做微調(diào)。這也意味著,數(shù)據(jù)混合本身存在技術限制,因此靈初的方案是將仿真用于大規(guī)模預訓練,再通過少量真機數(shù)據(jù)完成“最后一公里”的打磨。
北京人形機器人創(chuàng)新中心品牌負責人告訴第一財經(jīng),目前公司對機器人進行訓練時,仿真數(shù)據(jù)和真實數(shù)據(jù)的使用比例為7:3;國家地方共建人形機器人創(chuàng)新中心相關負責人告訴第一財經(jīng),公司目前有自建的數(shù)據(jù)采集中心,真實數(shù)據(jù)使用比例較高,和仿真數(shù)據(jù)大概占比為3:1。
在數(shù)據(jù)結(jié)構(gòu)層面,業(yè)內(nèi)普遍認為真實數(shù)據(jù)具有不可替代性,但高昂的采集成本是行業(yè)“必須面對的代價”。
智元機器人首席科學家、具身研究中心主任、上海創(chuàng)智學院副教授羅劍嵐博士表示,目前是具身智能落地的早期階段,仿真數(shù)據(jù)具備成本低、易獲得的優(yōu)勢,“但仿真不是替代品,真機數(shù)據(jù)才是主舞臺。目前智元所有的多模態(tài)大模型、VLA(視覺語言動作)模型100%使用的都是真機數(shù)據(jù)?!?/p>
無論選擇何種數(shù)據(jù)進行機器人訓練,業(yè)內(nèi)都面臨著“魚和熊掌不可兼得”的困境。
成立僅一年半,自變量機器人目前正處于產(chǎn)品技術驗證(PoC)階段,與酒店、養(yǎng)老等多個行業(yè)客戶聯(lián)合開展項目測試,不斷驗證其技術在真實、非結(jié)構(gòu)化環(huán)境中的高效部署能力。自變量機器人COO楊倩強調(diào):“我們的核心目標不是快速商業(yè)化,而是讓機器人在真實場景中真正‘用起來’?!?/p>
她認為,仿真技術目前在機器人"下半身"的訓練中仍占據(jù)主流,例如雙足機器人的步態(tài)規(guī)劃與運動控制等領域,仿真提供了不可或缺的低成本測試環(huán)境,其價值是毋庸置疑的。然而,當任務重心從"下半身"的移動轉(zhuǎn)移到"上半身"的精細操作——即與商業(yè)應用緊密結(jié)合的、與物理世界進行復雜交互的任務時,依靠仿真能夠到達的操作能力就非常有限。她告訴記者,一旦進入長鏈條、柔性和高度接觸的交互任務,比如完成制作香囊、貼標、遞送,仿真所需的工程開銷、調(diào)參周期和計算成本是巨大的,甚至是不可能完成的?!跋啾戎?,我們更傾向于直接在真實世界進行端到端的數(shù)據(jù)采集和訓練,用較少人力在較短周期內(nèi)完成訓練與部署。”
“我們從訓練到調(diào)優(yōu),只用了大約一周,就讓機器人完成了完整制作任務?!彼榻B說,“你可以認為它的單條數(shù)據(jù)很長、成本高,但放在這個復雜任務的學習效率上來看,仿真反而更‘劃不來’?!?/p>
楊倩指出:“最終算得過賬的,不只是采購成本,而是它在真實場景中能不能真正替代人來做事,甚至長期在人效比上能不能跑贏?!?/p>
當被問及如何看待同行對仿真路徑的堅持時,楊倩表示:“與其在仿真世界里反復調(diào)參,不如讓機器人直接在真實世界里試錯成長。”在她看來,“任務定義”才是決定數(shù)據(jù)價值的核心變量,“真實數(shù)據(jù)并不一定貴,仿真數(shù)據(jù)也未必便宜”。
智元機器人同樣明確押注真實數(shù)據(jù)。目前,智元通過自建專業(yè)數(shù)采工廠,形成全球最大數(shù)據(jù)集AgiBotWorld并開源,姚卯青說:“面對具身智能數(shù)據(jù)的荒漠,我們選擇栽下第一棵樹,愿其能成為一片森林。”同時,智元還發(fā)布行業(yè)首個通用具身基座模型——啟元大模型,擁有“一腦多形”能力,可適配其他異構(gòu)機器人本體。
免責聲明:本文內(nèi)容由開放的智能模型自動生成,僅供參考。