作者|PRO郵箱|pro@pingwest.com
這是一場(chǎng)關(guān)于人形機(jī)器人產(chǎn)業(yè)理想與現(xiàn)實(shí)的最坦誠(chéng)的對(duì)話。
6月5日,在北京前沿國(guó)際人工智能研究院旗下“月光社”舉辦的“走進(jìn)松延動(dòng)力”研討活動(dòng)中,北京前沿國(guó)際研究院理事長(zhǎng)、英諾天使基金合伙人王晟,松延動(dòng)力創(chuàng)始人&董事長(zhǎng)姜哲源、靈御智能創(chuàng)始人&CEO金戈,與硅星人創(chuàng)始人&CEO駱軼航一起探討了人形機(jī)器人產(chǎn)業(yè)面臨的核心矛盾、產(chǎn)業(yè)現(xiàn)階段聚焦務(wù)實(shí)落地領(lǐng)域、技術(shù)層面挑戰(zhàn)、行業(yè)共識(shí)等關(guān)鍵問(wèn)題。
以下為對(duì)話實(shí)錄整理。
駱軼航:今天的話題聚焦兩點(diǎn):一是公眾和產(chǎn)業(yè)如何認(rèn)識(shí)當(dāng)前機(jī)器人產(chǎn)業(yè)現(xiàn)狀、對(duì)齊對(duì)人形機(jī)器人產(chǎn)業(yè)發(fā)展的預(yù)期;二是爭(zhēng)取形成對(duì)具身智能和人形機(jī)器人產(chǎn)業(yè)發(fā)展的一些共識(shí)。
松延動(dòng)力參加了北京亦莊的第一屆機(jī)器人馬拉松長(zhǎng)跑比賽,獲得了亞軍。在那之后,松延的人形機(jī)器人N2接單接到手軟??梢?jiàn),公眾了解機(jī)器人基本是通過(guò)機(jī)器人表演(空翻、跑步、俯臥撐、踢足球、應(yīng)急救援),在此基礎(chǔ)上形成對(duì)機(jī)器人的預(yù)期和能力想象,并因此購(gòu)買(mǎi)。
能不能請(qǐng)姜哲源講講:競(jìng)技比賽用的機(jī)器人和交付給客戶的機(jī)器人之間,是否有外界不知道的差異?這種落差是否必然存在?如何解決?
公眾看到的人形機(jī)器人,與現(xiàn)實(shí)當(dāng)中的人形機(jī)器人,有哪些不一樣?
姜哲源:謝謝駱少。我可以從成本管理分析的角度講這事。確實(shí)大家看到視頻里機(jī)器人能做空翻、跳躍、打拳等各種神奇動(dòng)作,但買(mǎi)回家后只能走、揮手、握手。為什么會(huì)這樣呢?不是公司造假或騙客戶。我們?cè)隈R拉松比賽的機(jī)器人和交付客戶的機(jī)器人,除了里邊的程序差別外,幾乎一模一樣。唯一的改動(dòng),我們?cè)隈R拉松的機(jī)器人后面引出一根線,方便換電池。馬拉松21公里,肯定需換一次電池。拔電池后整機(jī)就下電了,下電之后意味著電腦關(guān)機(jī);插新電池后需兩三分鐘啟動(dòng)。所以為省時(shí)間,我們引出一根線:用另一塊電池接線上確保機(jī)器有電,再把原電池拔下來(lái),換上新電池后拔掉線,每次省兩三分鐘。
這是我們比賽準(zhǔn)備的一個(gè)策略,除此之外沒(méi)有任何差別。我相信宇樹(shù)在國(guó)際比賽中的機(jī)器人跟交給客戶的硬件沒(méi)有任何差別。那為什么從能力上講看著有這么大的差異呢?最主要原因在于我們不知道客戶怎么用,開(kāi)放太多能力給客戶的話,我們也不知道他們?cè)趺从眠@個(gè)機(jī)器人。比如說(shuō)如果我們把空翻放給客戶,我們很難確保客戶不會(huì)每天連著翻個(gè)100來(lái)次,這樣售后成本完全兜不住了,我們不能說(shuō)你不允許用這個(gè)功能,你不能用太多這個(gè)功能,因此我們不敢給客戶放空翻功能。
另外是安全性的考量,機(jī)器人空翻,一旦翻失敗了別砸著人,這是很?chē)?yán)重的問(wèn)題。因此我們交給客戶的機(jī)器人從硬件本體來(lái)講,跟我們參賽的基本上沒(méi)有任何差別,但是我們的機(jī)器人上不敢放太多高動(dòng)態(tài)的動(dòng)作,差別就是在這兒。
駱軼航:金戈在做機(jī)器人的“智能”部分,這幾個(gè)月一直在探索機(jī)器人“大腦”和"小腦”的完善,類(lèi)似機(jī)器人馬拉松比賽這種方式,對(duì)公眾、客戶甚至產(chǎn)業(yè)界人士認(rèn)知機(jī)器人產(chǎn)業(yè)的現(xiàn)狀和潛力,有哪些好處?有哪些副作用?
金戈:感謝駱少,也感謝北京前沿國(guó)際人工智能研究院給了這個(gè)機(jī)會(huì)。我們公司是和清華大學(xué)自動(dòng)系合作主要做機(jī)器人上肢的控制,尤其是解決仿生臂、靈巧手的控制問(wèn)題。我們希望機(jī)器人能盡快進(jìn)入到家庭、各行各業(yè),幫我們干活和做事,解決一些操作的問(wèn)題。
人們很大程度希望它能夠自動(dòng)的、不需要人工干預(yù)的完成這些任務(wù),我們希望在這個(gè)方向上去做努力做貢獻(xiàn)。在現(xiàn)有端到端感知規(guī)劃模型成功率不高的現(xiàn)實(shí)情況下,有沒(méi)有其他的兜底方案,幫助解決在使用場(chǎng)景中成功率不高或可靠性不佳的情況?這是目前我們?cè)谠噲D解決的問(wèn)題。
回到您剛才的問(wèn)題,我認(rèn)為現(xiàn)有的用比賽的方式讓公眾認(rèn)識(shí)到機(jī)器人真實(shí)的智能、機(jī)器人硬件以及能力上限的水平,是非常好的一種方式。因?yàn)槟壳皺C(jī)器人還處于一個(gè)初期的階段,是機(jī)器人公司的早期研發(fā)階段,它沒(méi)有什么可以在生產(chǎn)生活中展示給公眾的窗口,目前展示給公眾的窗只有兩個(gè):一是機(jī)器人公司發(fā)布的宣傳片和宣傳視頻,當(dāng)然是精選出來(lái)的、經(jīng)過(guò)剪輯的成功部分。這可能會(huì)讓公眾有超過(guò)機(jī)器人實(shí)際能力的的期待。比賽則是另一種模擬真實(shí)場(chǎng)景,展示能力上限的好方式。大家經(jīng)??吹叫麄髌龅枚己芷?,但比賽的時(shí)候表現(xiàn)可能更接近真是能力的表現(xiàn)。
比賽創(chuàng)造了類(lèi)似實(shí)際的場(chǎng)景。因?yàn)楝F(xiàn)有機(jī)器人的可靠性直接用于生產(chǎn),會(huì)帶來(lái)一些不確定的后果影響生產(chǎn)結(jié)果,但比賽不會(huì)有這樣的問(wèn)題,比賽剛好創(chuàng)造一個(gè)虛擬環(huán)境,最大程度表達(dá)機(jī)器人能力上限。這有助于公眾更準(zhǔn)確認(rèn)識(shí)到今天機(jī)器人的能力水平,從而有準(zhǔn)確期待,這種準(zhǔn)確期待非常有助于機(jī)器人更快應(yīng)用到各行各業(yè)。
甲方過(guò)高期待會(huì)導(dǎo)致乙方無(wú)法實(shí)現(xiàn)的痛苦,因此我們希望甲方能清晰的理解目前機(jī)器人能做到什么不能做到什么。
王晟:這個(gè)問(wèn)題特別有意思。我們知道在二戰(zhàn)結(jié)束時(shí),范內(nèi)瓦·布什給羅斯??偨y(tǒng)寫(xiě)了一個(gè)科技發(fā)展規(guī)劃,叫《科學(xué)無(wú)盡的前沿》,這個(gè)規(guī)劃使得科技成為美國(guó)的國(guó)家事業(yè),成為美國(guó)科技政策的藍(lán)圖,美國(guó)因此建立了持續(xù)的科技創(chuàng)新動(dòng)力。
美國(guó)科學(xué)促進(jìn)會(huì)首席執(zhí)行官、《科學(xué)》雜志執(zhí)行主編拉什·D.霍爾特寫(xiě)了再版序言,霍爾特對(duì)范內(nèi)瓦做了高度評(píng)價(jià),但也指出了《前沿》唯一的不足就是脫離了人民群眾,把科學(xué)變成了一群極少數(shù)科學(xué)家做的事。而現(xiàn)在這個(gè)時(shí)代,媒介互聯(lián)網(wǎng)信息的平權(quán),知識(shí)平權(quán)、認(rèn)知平權(quán),需要結(jié)合大眾,所以我覺(jué)得這不是一件壞事。我們得讓大眾了解、大眾知道、大眾關(guān)注才能更好地促進(jìn)科學(xué)的進(jìn)步。
我們知道李飛飛每年都做一個(gè)AI報(bào)告,對(duì)全球各地對(duì)AI發(fā)展預(yù)期的樂(lè)觀性進(jìn)行調(diào)研,中國(guó)對(duì)AI的樂(lè)觀性排名第一。中國(guó)人認(rèn)為AI會(huì)給大家?guī)?lái)更好的生活,老百姓樂(lè)觀性可能超過(guò)75%。美國(guó)是極度悲觀,65%的人認(rèn)為AI會(huì)讓我失業(yè),讓我變得更加不好,只有35%的人持有樂(lè)觀態(tài)度,這可能對(duì)AI真正的落地會(huì)有蠻大的影響。如果沒(méi)有這些機(jī)器人賽事的曝光,對(duì)機(jī)器人企業(yè)來(lái)講,就更是閉門(mén)造車(chē)。
駱軼航:作為一個(gè)投資人,您怎么看一個(gè)機(jī)器人公司是不是一個(gè)值得投資的標(biāo)的?
王晟:這一波的具身智能和機(jī)器人,包括機(jī)器人的AI,有些人選擇下注,有些人選擇不下注,這背后有很多原因。在我們來(lái)看,什么樣的機(jī)器人公司值得投資?一是相對(duì)樂(lè)觀,另一個(gè)是理性,有扎實(shí)的知識(shí)儲(chǔ)備和認(rèn)知,以及很強(qiáng)的邏輯思考能力,能對(duì)未來(lái)技術(shù)范式的發(fā)展做一定的預(yù)測(cè),預(yù)測(cè)可能不準(zhǔn)確,但相信理性思考之后的結(jié)果,誰(shuí)符合,就相信他做的事情大概率是對(duì)的。
剩下的無(wú)非是團(tuán)隊(duì)優(yōu)秀不優(yōu)秀,其實(shí)團(tuán)隊(duì)優(yōu)秀很難評(píng)價(jià)。我們過(guò)去做過(guò)愚蠢的事情,列了非常多的維度打分,毫無(wú)用處。投資決策的基礎(chǔ)是:必須見(jiàn)過(guò)足夠多的好東西,就好比藝術(shù)家、美食家和文玩收藏家,見(jiàn)過(guò)的、體驗(yàn)過(guò)的好東西足夠多,就知道好不好。很多投資人其實(shí)沒(méi)有見(jiàn)過(guò)好東西。
而我們希望80%的項(xiàng)目我們都見(jiàn)過(guò)和聊過(guò),你見(jiàn)過(guò)什么是好東西,才對(duì)好東西有選擇權(quán)。
駱軼航:紅杉早期有一個(gè)著名投資哲學(xué):押注賽道而非賽手。但是投大語(yǔ)言模型、多模態(tài)模型和機(jī)器人產(chǎn)業(yè)時(shí),這個(gè)策略可能就失效了。因?yàn)橐还P投資錢(qián)一上來(lái)就很多,幾千萬(wàn)上億人民幣,所以押注賽手本人很重要。松延動(dòng)力和靈御智能,一個(gè)專(zhuān)注機(jī)器人本體和強(qiáng)化學(xué)習(xí),一個(gè)專(zhuān)注機(jī)器人上臂的智能化,你投這兩個(gè)賽手的原因是什么?
王晟:哲源做松延動(dòng)力,他做了很多不符合他這個(gè)年齡(注:姜哲源生于1998年)的一些巨大的人生決策。不止一次,我們看到他做了極其勇敢的選擇和決策。優(yōu)秀的人可能非常多,但你只能投資你欣賞的和喜歡的人。這個(gè)人很優(yōu)秀,但就是跟你聊不來(lái),這種情況我們經(jīng)常見(jiàn)。
投靈御智能也很有意思。因?yàn)橛⒅Z基金總是對(duì)未來(lái)半年到一年的AI和機(jī)器人具身智能做一些預(yù)判,我們每次下注都在產(chǎn)業(yè)大共識(shí)形成的前幾個(gè)月就投了,投完之后幾個(gè)月,產(chǎn)業(yè)大共識(shí)來(lái)了,估值就會(huì)漲得很快。靈御智能就是我們希望投的一個(gè),因?yàn)樗鯨2的具身智能解決方案。我們現(xiàn)在下注的所有具身智能公司都是奔著L4去的,直接替人進(jìn)工廠,疊被子進(jìn)家庭,把人踢掉,省很多錢(qián),但非常難做。
就好比自動(dòng)駕駛一樣,馬斯克在2017年Tesla發(fā)布會(huì)說(shuō)明年我們會(huì)實(shí)現(xiàn)全自動(dòng)駕駛,L4級(jí)別的滿世界跑,現(xiàn)在快10年了也沒(méi)完全實(shí)現(xiàn)。因?yàn)橛辛爽F(xiàn)在的L2自動(dòng)駕駛階段,特斯拉才強(qiáng)大。通過(guò)L2輔助駕駛了,收集很多數(shù)據(jù),持續(xù)用于模型訓(xùn)練,從而變成世界上最強(qiáng)大的自動(dòng)駕駛公司。換句話時(shí)髦的話,我們跟金戈和他的靈御智能有“共振”。
2025年是人形機(jī)器人的商業(yè)化元年,需要做什么?
駱軼航:我想了解一下機(jī)器人客戶的具體情況。我們現(xiàn)在能想到的客戶門(mén)類(lèi):第一類(lèi)是展示、表演、教育、科研實(shí)驗(yàn),客戶以機(jī)器人本體做基礎(chǔ),搞算法和研發(fā)。第二是機(jī)器人領(lǐng)域的國(guó)外同行,買(mǎi)中國(guó)機(jī)器人去搞研究,拆開(kāi)了看它們是怎么做的;第三才是真實(shí)客戶場(chǎng)景。哲源能講講現(xiàn)有客戶種類(lèi)各占多少比例,以及我們更在意的哪類(lèi)客戶么?
姜哲源:具體的比例或許不太方便透露,但大致可分為四大類(lèi):科研、教育、商演和文旅展廳。這四大領(lǐng)域基本上是當(dāng)下主要的落地場(chǎng)景。
雖然我不提及具體比例數(shù)字,但最大的兩塊是教育和商業(yè)演出。一直以來(lái),教育就是人形機(jī)器人或足式機(jī)器人的一個(gè)應(yīng)用方向。為找到合適的應(yīng)用場(chǎng)景,便將其作為教具,或是課程配套的實(shí)驗(yàn)器材,銷(xiāo)售給學(xué)校以及有課程教育需求的客戶。
商演是今年剛剛興起的領(lǐng)域。大家可以看到,許多人形機(jī)器人出現(xiàn)在不同的場(chǎng)合,比如商場(chǎng)開(kāi)業(yè)、周年慶典,以及婚慶等場(chǎng)景,以租賃的形式進(jìn)行商業(yè)演出。
另外,比較有趣的是展廳方面的應(yīng)用。我們?cè)静⑽搭A(yù)估到這會(huì)是一個(gè)較大的需求,后來(lái)發(fā)現(xiàn)該領(lǐng)域的需求量并不小。我們?cè)菊J(rèn)為,在展廳使用輪式機(jī)器人進(jìn)行講解即可,為何要選用雙足機(jī)器人呢?后來(lái)我們與客戶溝通詢問(wèn)他們?yōu)槭裁床毁I(mǎi)輪式機(jī)器人時(shí),他們說(shuō)輪式的科技感不足,堅(jiān)持要人形的。
所以今年在這個(gè)熱度下催生了很多場(chǎng)景。另外,我們還發(fā)現(xiàn)了一些別人看不到的場(chǎng)景,但暫時(shí)無(wú)法公開(kāi)。因?yàn)槲覀兊膬r(jià)格最初下探到了一個(gè)可能沒(méi)人觸及過(guò)的范圍,3.99萬(wàn),也就是5萬(wàn)以內(nèi)的價(jià)格帶。這個(gè)價(jià)格帶讓我們發(fā)掘出了一堆價(jià)格較高時(shí)看不到的場(chǎng)景。明年我們可能會(huì)在這些方向發(fā)力,到時(shí)候可能會(huì)有更多應(yīng)用場(chǎng)景出現(xiàn)。
剛才您提到了“真實(shí)應(yīng)用場(chǎng)景”這個(gè)詞,難道這些不就是真實(shí)應(yīng)用場(chǎng)景嗎?我覺(jué)得挺真實(shí)的啊。或者說(shuō),一個(gè)場(chǎng)景是否真實(shí)取決于它是否可持續(xù)。比如商演,今年春晚、馬拉松這類(lèi)活動(dòng)催生了這個(gè)市場(chǎng),商演市場(chǎng)熱度可能會(huì)下降,但不會(huì)消失。就像舞龍、舞獅,傳承這么多年依舊存在,熱度也沒(méi)有降下去甚至消失,對(duì)吧?還有展覽展示這類(lèi)純展示需求,杜莎夫人蠟像館都經(jīng)營(yíng)這么多年了,也有它的商業(yè)價(jià)值。所以關(guān)鍵要看這些市場(chǎng)板塊的價(jià)值是否高。
駱軼航:所以價(jià)格一下子扎到3萬(wàn)9甚至更低,就是為了想把客戶使用的各種可能性和場(chǎng)景都充分挖掘出來(lái)?
姜哲源:關(guān)于人形機(jī)器人本體賽道的投資,在2023年主要看團(tuán)隊(duì)背景,有沒(méi)有科學(xué)家。到了2024年主要看Demo,了解能應(yīng)用什么樣的技術(shù)。2025年,就主要關(guān)注商業(yè)化落地了。
其實(shí)在2024年初,我們的Demo做得相當(dāng)不錯(cuò),雖然沒(méi)有公開(kāi)發(fā)布,但在行業(yè)內(nèi)大家都知道。不過(guò),我們公司一直比較低調(diào),從不做宣傳,以前在100篇機(jī)器人行業(yè)的報(bào)道里可能都見(jiàn)不到我們一次。
今年剛過(guò)完年那段時(shí)間,公司基本零訂單,銷(xiāo)售團(tuán)隊(duì)和營(yíng)銷(xiāo)團(tuán)隊(duì)都沒(méi)有組建起來(lái),什么都缺。但我們心里清楚2025年最重要的是商業(yè)化,當(dāng)時(shí)我們認(rèn)為可行的方向是借助線上渠道獲取流量,以此推進(jìn)商業(yè)化。所以當(dāng)時(shí)我們希望將產(chǎn)品能力和定價(jià)等因素綜合起來(lái),讓它成為一個(gè)有話題性的事情,最好能在圈子內(nèi)甚至出圈,成為出圈的一個(gè)話題。
我們給N2定了3.99萬(wàn)的價(jià)格,這個(gè)價(jià)格比同行低至他們的1/5左右。我們認(rèn)為這個(gè)價(jià)格最重要的是有話題性。而且我們核算過(guò),雖然毛利率不算特別高,但還是能掙錢(qián)的,所以覺(jué)得可行。我們當(dāng)時(shí)定這個(gè)價(jià)格,想著總比一整年沒(méi)有商業(yè)化進(jìn)展要好,于是就這么干了,發(fā)布了這個(gè)相對(duì)較低的售價(jià)。
駱軼航:這其實(shí)是個(gè)重大的決策。不過(guò)在實(shí)際運(yùn)行和工況中,一個(gè)機(jī)器人不管是跑、俯臥撐、行走、空翻等等,它最常見(jiàn)的故障點(diǎn)可能有哪些?比如傳感器突然失靈,或者讓機(jī)器人連著做幾十個(gè)后空翻之后它就燒壞了,再或者像半馬比賽中很多被做成花絮的場(chǎng)景,機(jī)器人跌倒和“虛脫”等,它們是什么原因?qū)е碌??我們能把這些問(wèn)題解決到什么程度?如何管理客戶對(duì)未來(lái)的預(yù)期?可以從機(jī)器本體及其智能化方面來(lái)講講。
姜哲源:必須得講這個(gè)問(wèn)題。那我先說(shuō)說(shuō)從本體角度看哪些地方容易出故障:我們當(dāng)時(shí)參加馬拉松時(shí)遇到的最大問(wèn)題就是線束容易松動(dòng),這個(gè)問(wèn)題我在很多場(chǎng)合都提過(guò)。當(dāng)時(shí)胳膊上的線特別容易松,而且不是線束里的電源線松,是信號(hào)線松。只要信號(hào)線虛接,就可能出現(xiàn)誤碼,誤碼積累多了,這一路就會(huì)直接關(guān)閉。這樣胳膊就會(huì)失去一路電機(jī)信號(hào),進(jìn)而導(dǎo)致整個(gè)運(yùn)動(dòng)控制出現(xiàn)問(wèn)題。
這是之前我們遇到了一個(gè)比較常見(jiàn)的問(wèn)題。但在馬拉松比賽期間,由于時(shí)間緊迫,實(shí)在來(lái)不及解決。當(dāng)時(shí)我們剛完成一個(gè)項(xiàng)目demo,整個(gè)團(tuán)隊(duì)都疲憊不堪,而且只有一個(gè)月的時(shí)間準(zhǔn)備馬拉松,所以確實(shí)沒(méi)工夫處理這個(gè)問(wèn)題。馬拉松結(jié)束后的兩周,我們把這個(gè)問(wèn)題徹底解決了。我們重新設(shè)置了線束,還進(jìn)行了大量測(cè)試,最終徹底解決了這個(gè)問(wèn)題。我覺(jué)得這算低級(jí)錯(cuò)誤,不是常見(jiàn)問(wèn)題,也不具有普適性,是我們公司自己沒(méi)做好。
另外有個(gè)特別容易出問(wèn)題的地方,很多人形機(jī)器人公司應(yīng)該都有同感,就是腳踝。人容易崴腳,機(jī)器人的腳踝也特別容易壞。剛開(kāi)始的時(shí)候,腳踝電機(jī)很容易出問(wèn)題,走一段時(shí)間行星架可能就變形了,變形后電機(jī)可能會(huì)卡死,或者間隙變得很大,會(huì)引發(fā)各種問(wèn)題。后來(lái)我們對(duì)電機(jī)進(jìn)行了大幅強(qiáng)化,也對(duì)傳動(dòng)連桿進(jìn)行了大幅強(qiáng)化,還替換了軸承、軸等部件的材質(zhì)和選型。最后解決了腳踝的問(wèn)題,其實(shí)在馬拉松比賽前就把這個(gè)問(wèn)題搞定了。
馬拉松比賽前,我記得有一次半夜搞了一場(chǎng)活動(dòng),就是開(kāi)放賽道讓大家測(cè)試的比賽。當(dāng)時(shí)我們的機(jī)器人跑的時(shí)候,跑到12公里,腳踝電機(jī)那塊的螺絲斷了。之后我們加了幾個(gè)銷(xiāo)子,把問(wèn)題解決了。不過(guò)直到現(xiàn)在,腳踝還是最容易出問(wèn)題的部位。雖然它的壽命比原來(lái)長(zhǎng)了好幾倍,但到了相應(yīng)時(shí)間,最先壞的還是腳踝。
另外,過(guò)熱也是個(gè)比較麻煩的問(wèn)題。我們的情況要好一些,因?yàn)槲覀兊臋C(jī)器人有一定的冗余設(shè)計(jì),所用關(guān)節(jié)尺寸和機(jī)器人本體尺寸的設(shè)計(jì)是高爆發(fā)、冗余的狀態(tài)。所以我們機(jī)器人過(guò)熱的情況還好。
我覺(jué)得這是目前遇到的幾個(gè)容易出問(wèn)題的點(diǎn)。人形機(jī)器人行業(yè)要沉淀心態(tài),好好做產(chǎn)品、做測(cè)試,把該測(cè)的項(xiàng)目都測(cè)完,走完所有流程,再推出新一代產(chǎn)品。我覺(jué)得這才是整個(gè)行業(yè)更健康、更理性的做法。
駱軼航:大家都把溫度降一降。
金戈:我從上肢操作的角度講講。我覺(jué)得這可能不是故障問(wèn)題,而是現(xiàn)有技術(shù)的限制?,F(xiàn)有技術(shù)下,讓機(jī)器人智能操作存在一個(gè)矛盾,即操作成功率和操作速度、效率的矛盾。某些流傳很廣的機(jī)器人Demo,乍一看很驚艷,機(jī)器人能自己收拾家務(wù)等,但仔細(xì)看右下角會(huì)標(biāo)注8倍速。這意味著為了保證一定的成功率,機(jī)器人的工作速度要大幅下降遠(yuǎn)遠(yuǎn)低于人類(lèi)效率,這就讓機(jī)器人離實(shí)際應(yīng)用還有距離。
我們希望機(jī)器人工作得又快又高效,但這樣成功率就難以保證。你可以把這看作故障,也可以認(rèn)為是現(xiàn)階段機(jī)器人智能的局限。從論文和最先進(jìn)的研究來(lái)看,在相對(duì)泛化的垂直場(chǎng)景中,機(jī)器人工作的成功率暫時(shí)能達(dá)到80%多就很不錯(cuò)了。而且這還是在動(dòng)作有所放慢的情況下。
我們提出的解決方案是,在成功率只有80%多的情況下,能否讓機(jī)器人投入實(shí)用。汽車(chē)行業(yè)有類(lèi)似應(yīng)用,汽車(chē)只能在高速公路或封閉道路上自動(dòng)駕駛,不能行駛的路段就找人接管。所以我們提出了L2混合駕駛方案,希望機(jī)器人能自我判斷。如果對(duì)某項(xiàng)操作沒(méi)把握,或者操作失敗了,可以呼叫人來(lái)接管或處理。用這種兜底方案解決目前模型成功率不可靠的問(wèn)題。
如果說(shuō)機(jī)器人投入使用面臨硬件挑戰(zhàn),我覺(jué)得網(wǎng)絡(luò)環(huán)境是個(gè)比較大的挑戰(zhàn)。中國(guó)的網(wǎng)絡(luò)環(huán)境建設(shè)很優(yōu)質(zhì),正常情況下完全能滿足需求。但如果網(wǎng)絡(luò)環(huán)境波動(dòng)或受到攻擊,機(jī)器人的操作和行為就會(huì)受影響,這需要通過(guò)算法優(yōu)化來(lái)解決,目前我們也在努力攻克這個(gè)問(wèn)題。
機(jī)器人行業(yè)產(chǎn)業(yè)鏈長(zhǎng),很多企業(yè)面臨多方面的技術(shù)挑戰(zhàn),只有產(chǎn)業(yè)鏈上的企業(yè)共同提升技術(shù),才能更快實(shí)現(xiàn)機(jī)器人進(jìn)入千家萬(wàn)戶的目標(biāo)。
關(guān)于技術(shù)瓶頸和技術(shù)路徑,人形機(jī)器人產(chǎn)業(yè)有共識(shí)了嗎?
駱軼航:接下來(lái)這兩個(gè)話題涉及軟件側(cè)和模型側(cè)。我對(duì)從L0到L4這樣的仿汽車(chē)自動(dòng)駕駛等級(jí)來(lái)衡量機(jī)器人智能化很感興趣。過(guò)去一年外界看,機(jī)器人產(chǎn)業(yè)在模型化、多模態(tài)模型和模型訓(xùn)練方面進(jìn)展不大,一些問(wèn)題依然存在,比如在仿真環(huán)境中收集數(shù)據(jù)、訓(xùn)練數(shù)據(jù)和優(yōu)化算法等,過(guò)去一年,模型側(cè)似乎遇到了瓶頸。是用仿真數(shù)據(jù)還是真實(shí)數(shù)據(jù)?
大家普遍認(rèn)為大語(yǔ)言模型是機(jī)器人的大腦,識(shí)別動(dòng)作、模態(tài)、意圖和處理意圖的是小腦?,F(xiàn)在的主要堵點(diǎn)和卡點(diǎn)在哪?是數(shù)據(jù)量不足,仿真數(shù)據(jù)質(zhì)量有問(wèn)題,仿真數(shù)據(jù)的獲取方式不同于大語(yǔ)言模型語(yǔ)料的獲取,總之進(jìn)展確實(shí)不大。
金戈:目前業(yè)界基本達(dá)成共識(shí),大概五六個(gè)月前還沒(méi)這么明確,現(xiàn)在大家都認(rèn)為數(shù)據(jù)不足是核心問(wèn)題。大模型的三要素是算法、算力和數(shù)據(jù),數(shù)據(jù)是關(guān)鍵,巧婦難為無(wú)米之炊,解決數(shù)據(jù)不足是當(dāng)務(wù)之急。我們看到很多企業(yè)在建機(jī)器人數(shù)據(jù)采集中心,收集真機(jī)數(shù)據(jù)和仿真數(shù)據(jù)。
另外要強(qiáng)調(diào)的是,真機(jī)數(shù)據(jù)和仿真數(shù)據(jù)并不沖突,它們相互補(bǔ)充,都面臨挑戰(zhàn)。收集真機(jī)數(shù)據(jù)需要大量機(jī)器人,成本和難度高。仿真數(shù)據(jù)也有挑戰(zhàn),機(jī)器人仿真比汽車(chē)仿真難,汽車(chē)仿真只要保證汽車(chē)不撞到東西就行,只關(guān)注汽車(chē)的形狀和大??;而機(jī)器人操作要和物體強(qiáng)互動(dòng),仿真物體的形狀、物理量、重量、粘度、軟硬和摩擦等都要準(zhǔn)確。建立仿真數(shù)據(jù)需要時(shí)間和成本,雖然比建真實(shí)物體成本低,但也不容易。
現(xiàn)在大家已經(jīng)發(fā)現(xiàn)了堵點(diǎn),全球都在從不同方向解決數(shù)據(jù)問(wèn)題,比如仿真、合成和真機(jī)數(shù)據(jù)收集等。就像《流浪地球》里的超飽和救援,大家從不同角度一起解決數(shù)據(jù)問(wèn)題,我們的目標(biāo)是去掉堵點(diǎn),提升機(jī)器人智能。
姜哲源:我非常同意金總的觀點(diǎn)。補(bǔ)充一下,現(xiàn)在各地有數(shù)據(jù)工廠模式,這是個(gè)很好的嘗試,發(fā)揮了我國(guó)規(guī)?;a(chǎn)的優(yōu)勢(shì)。但數(shù)據(jù)除了規(guī)模,多樣性也很重要。
我常舉一個(gè)例子,訓(xùn)練一個(gè)簡(jiǎn)單的圖像分類(lèi)模型,一個(gè)數(shù)據(jù)集有10張不同圖片,另一個(gè)有1億張相同圖片,顯然10張不同圖片的數(shù)據(jù)集效果更好。所以我不確定數(shù)據(jù)工廠模式能否取得好效果,因?yàn)槠鋱?chǎng)景單一,長(zhǎng)期來(lái)看會(huì)出現(xiàn)邊際效應(yīng)遞減的情況。我覺(jué)得應(yīng)該到真實(shí)場(chǎng)景中收集數(shù)據(jù),這值得上肢賽道的同行思考。
第二是關(guān)于仿真數(shù)據(jù)。我的觀點(diǎn)是,單純用仿真數(shù)據(jù)肯定不行。仿真機(jī)器人走路、跑步,拿硬質(zhì)物品可能沒(méi)問(wèn)題,甚至一些先進(jìn)的仿真器能模擬軟體和流體,但舉一個(gè)極端例子,讓仿真器模擬炒西紅柿雞蛋,模擬蛋液從液態(tài)變成固態(tài)的過(guò)程,這個(gè)是一個(gè)難度極其之大的事情,對(duì)當(dāng)下而言不具備可行性。所以全靠仿真數(shù)據(jù)是不行的。
駱軼航:最后我們收個(gè)尾。大語(yǔ)言模型去年沒(méi)共識(shí),今年對(duì)做Agent有了一定共識(shí)。對(duì)于具身機(jī)器人,包括人形機(jī)器人產(chǎn)業(yè),目前哪些方面有共識(shí)的苗頭?或者我們認(rèn)為哪些方面最應(yīng)該形成共識(shí)?
王晟:我認(rèn)為共識(shí)是動(dòng)態(tài)的,機(jī)器人產(chǎn)業(yè)一直有共識(shí),但共識(shí)一直在變。剛形成一個(gè)共識(shí),可能很快就被瓦解,變成落后的共識(shí)。
比如投資方法論的共識(shí)。2023年下半年,投資方向是人形機(jī)器人、基礎(chǔ)運(yùn)控和本體等,2024年開(kāi)始投資具身智能,先投小腦,再投大腦,現(xiàn)在又搞端到端。技術(shù)范式也從傳統(tǒng)音控到強(qiáng)化學(xué)習(xí)、模仿、到現(xiàn)在的VLA。這些都是共識(shí),都不長(zhǎng)久,這說(shuō)明這個(gè)產(chǎn)業(yè)還不成熟。
所以未來(lái)還會(huì)快速產(chǎn)生小或中度的共識(shí),但像大語(yǔ)言模型這樣的超級(jí)共識(shí),還需要很長(zhǎng)時(shí)間。從投資角度看,明年大家不能只拼demo了,產(chǎn)品要能落地,有實(shí)際應(yīng)用場(chǎng)景,能提供價(jià)值,光表演不行。
姜哲源:晟總從宏觀層面講了產(chǎn)業(yè)共識(shí)情況,我說(shuō)說(shuō)我們細(xì)分賽道的小共識(shí)?,F(xiàn)在運(yùn)動(dòng)控制用深度強(qiáng)化學(xué)習(xí)已經(jīng)是絕對(duì)共識(shí)。2023年還有人質(zhì)疑四足機(jī)器人的運(yùn)控方法不能用到這里,現(xiàn)在沒(méi)人提這個(gè)問(wèn)題了。硬件方面,目前低成本新機(jī)器人的硬件架構(gòu)基本基于準(zhǔn)直驅(qū)電驅(qū)關(guān)節(jié)。以前有人質(zhì)疑是不是用液壓或其他類(lèi)型關(guān)節(jié),現(xiàn)在至少在低成本機(jī)器人上,準(zhǔn)直驅(qū)關(guān)節(jié)技術(shù)成了共識(shí)。準(zhǔn)直驅(qū)關(guān)節(jié)減速比相對(duì)較低,用電流環(huán)做力控,成本低、系統(tǒng)簡(jiǎn)單可靠。不過(guò)未來(lái)可能會(huì)有新的技術(shù)成為共識(shí),目前這種方法是有效的。
金戈:我非常贊同晟總和姜總的觀點(diǎn)。我覺(jué)得現(xiàn)在行業(yè)還處于早期,不確定性多,技術(shù)方向沒(méi)收斂,很多方面還在探索。從模型和上肢操作角度看,大家發(fā)現(xiàn)數(shù)據(jù)短缺是一個(gè)共識(shí),另一個(gè)共識(shí)是,不能只依靠數(shù)據(jù)工廠在實(shí)驗(yàn)室采集數(shù)據(jù),要讓機(jī)器人盡快投入生產(chǎn)生活,比如工廠、商業(yè)場(chǎng)景,在實(shí)際場(chǎng)景中獲取數(shù)據(jù),提升模型能力,就像自動(dòng)駕駛汽車(chē)先上路跑起來(lái)一樣。
駱軼航:感謝大家的討論,在制造業(yè)發(fā)達(dá)、對(duì)人工智能發(fā)展樂(lè)觀、注重科學(xué)和效率的中國(guó),機(jī)器人產(chǎn)業(yè)走向千行百業(yè)和千家萬(wàn)戶,很可能是我們中國(guó)人擁抱AGI的方式。
點(diǎn)個(gè)愛(ài)心,再走吧
主角是吸血鬼的小說(shuō)推薦
推薦3本吸血鬼系小甜文,主推《晚安吸血鬼大人》,他霸道又溫柔
1V1獨(dú)寵甜文:偏執(zhí)哥哥,病嬌吸血鬼,忠犬大神眾多男神紛紛來(lái)襲
免責(zé)聲明:本文內(nèi)容由開(kāi)放的智能模型自動(dòng)生成,僅供參考。