邱淑紫
作者|PRO郵箱|pro@pingwest.com
這是一場關(guān)于人形機(jī)器人產(chǎn)業(yè)理想與現(xiàn)實(shí)的最坦誠的對話。
6月5日,在北京前沿國際人工智能研究院旗下“月光社”舉辦的“走進(jìn)松延動(dòng)力”研討活動(dòng)中,北京前沿國際研究院理事長、英諾天使基金合伙人王晟,松延動(dòng)力創(chuàng)始人&董事長姜哲源、靈御智能創(chuàng)始人&CEO金戈,與硅星人創(chuàng)始人&CEO駱軼航一起探討了人形機(jī)器人產(chǎn)業(yè)面臨的核心矛盾、產(chǎn)業(yè)現(xiàn)階段聚焦務(wù)實(shí)落地領(lǐng)域、技術(shù)層面挑戰(zhàn)、行業(yè)共識等關(guān)鍵問題。
以下為對話實(shí)錄整理。
駱軼航:今天的話題聚焦兩點(diǎn):一是公眾和產(chǎn)業(yè)如何認(rèn)識當(dāng)前機(jī)器人產(chǎn)業(yè)現(xiàn)狀、對齊對人形機(jī)器人產(chǎn)業(yè)發(fā)展的預(yù)期;二是爭取形成對具身智能和人形機(jī)器人產(chǎn)業(yè)發(fā)展的一些共識。
松延動(dòng)力參加了北京亦莊的第一屆機(jī)器人馬拉松長跑比賽,獲得了亞軍。在那之后,松延的人形機(jī)器人N2接單接到手軟??梢?,公眾了解機(jī)器人基本是通過機(jī)器人表演(空翻、跑步、俯臥撐、踢足球、應(yīng)急救援),在此基礎(chǔ)上形成對機(jī)器人的預(yù)期和能力想象,并因此購買。
能不能請姜哲源講講:競技比賽用的機(jī)器人和交付給客戶的機(jī)器人之間,是否有外界不知道的差異?這種落差是否必然存在?如何解決?
公眾看到的人形機(jī)器人,與現(xiàn)實(shí)當(dāng)中的人形機(jī)器人,有哪些不一樣?
姜哲源:謝謝駱少。我可以從成本管理分析的角度講這事。確實(shí)大家看到視頻里機(jī)器人能做空翻、跳躍、打拳等各種神奇動(dòng)作,但買回家后只能走、揮手、握手。為什么會這樣呢?不是公司造假或騙客戶。我們在馬拉松比賽的機(jī)器人和交付客戶的機(jī)器人,除了里邊的程序差別外,幾乎一模一樣。唯一的改動(dòng),我們在馬拉松的機(jī)器人后面引出一根線,方便換電池。馬拉松21公里,肯定需換一次電池。拔電池后整機(jī)就下電了,下電之后意味著電腦關(guān)機(jī);插新電池后需兩三分鐘啟動(dòng)。所以為省時(shí)間,我們引出一根線:用另一塊電池接線上確保機(jī)器有電,再把原電池拔下來,換上新電池后拔掉線,每次省兩三分鐘。
這是我們比賽準(zhǔn)備的一個(gè)策略,除此之外沒有任何差別。我相信宇樹在國際比賽中的機(jī)器人跟交給客戶的硬件沒有任何差別。那為什么從能力上講看著有這么大的差異呢?最主要原因在于我們不知道客戶怎么用,開放太多能力給客戶的話,我們也不知道他們怎么用這個(gè)機(jī)器人。比如說如果我們把空翻放給客戶,我們很難確??蛻舨粫刻爝B著翻個(gè)100來次,這樣售后成本完全兜不住了,我們不能說你不允許用這個(gè)功能,你不能用太多這個(gè)功能,因此我們不敢給客戶放空翻功能。
另外是安全性的考量,機(jī)器人空翻,一旦翻失敗了別砸著人,這是很嚴(yán)重的問題。因此我們交給客戶的機(jī)器人從硬件本體來講,跟我們參賽的基本上沒有任何差別,但是我們的機(jī)器人上不敢放太多高動(dòng)態(tài)的動(dòng)作,差別就是在這兒。
駱軼航:金戈在做機(jī)器人的“智能”部分,這幾個(gè)月一直在探索機(jī)器人“大腦”和"小腦”的完善,類似機(jī)器人馬拉松比賽這種方式,對公眾、客戶甚至產(chǎn)業(yè)界人士認(rèn)知機(jī)器人產(chǎn)業(yè)的現(xiàn)狀和潛力,有哪些好處?有哪些副作用?
金戈:感謝駱少,也感謝北京前沿國際人工智能研究院給了這個(gè)機(jī)會。我們公司是和清華大學(xué)自動(dòng)系合作主要做機(jī)器人上肢的控制,尤其是解決仿生臂、靈巧手的控制問題。我們希望機(jī)器人能盡快進(jìn)入到家庭、各行各業(yè),幫我們干活和做事,解決一些操作的問題。
人們很大程度希望它能夠自動(dòng)的、不需要人工干預(yù)的完成這些任務(wù),我們希望在這個(gè)方向上去做努力做貢獻(xiàn)。在現(xiàn)有端到端感知規(guī)劃模型成功率不高的現(xiàn)實(shí)情況下,有沒有其他的兜底方案,幫助解決在使用場景中成功率不高或可靠性不佳的情況?這是目前我們在試圖解決的問題。
回到您剛才的問題,我認(rèn)為現(xiàn)有的用比賽的方式讓公眾認(rèn)識到機(jī)器人真實(shí)的智能、機(jī)器人硬件以及能力上限的水平,是非常好的一種方式。因?yàn)槟壳皺C(jī)器人還處于一個(gè)初期的階段,是機(jī)器人公司的早期研發(fā)階段,它沒有什么可以在生產(chǎn)生活中展示給公眾的窗口,目前展示給公眾的窗只有兩個(gè):一是機(jī)器人公司發(fā)布的宣傳片和宣傳視頻,當(dāng)然是精選出來的、經(jīng)過剪輯的成功部分。這可能會讓公眾有超過機(jī)器人實(shí)際能力的的期待。比賽則是另一種模擬真實(shí)場景,展示能力上限的好方式。大家經(jīng)??吹叫麄髌龅枚己芷?,但比賽的時(shí)候表現(xiàn)可能更接近真是能力的表現(xiàn)。
比賽創(chuàng)造了類似實(shí)際的場景。因?yàn)楝F(xiàn)有機(jī)器人的可靠性直接用于生產(chǎn),會帶來一些不確定的后果影響生產(chǎn)結(jié)果,但比賽不會有這樣的問題,比賽剛好創(chuàng)造一個(gè)虛擬環(huán)境,最大程度表達(dá)機(jī)器人能力上限。這有助于公眾更準(zhǔn)確認(rèn)識到今天機(jī)器人的能力水平,從而有準(zhǔn)確期待,這種準(zhǔn)確期待非常有助于機(jī)器人更快應(yīng)用到各行各業(yè)。
甲方過高期待會導(dǎo)致乙方無法實(shí)現(xiàn)的痛苦,因此我們希望甲方能清晰的理解目前機(jī)器人能做到什么不能做到什么。
王晟:這個(gè)問題特別有意思。我們知道在二戰(zhàn)結(jié)束時(shí),范內(nèi)瓦·布什給羅斯??偨y(tǒng)寫了一個(gè)科技發(fā)展規(guī)劃,叫《科學(xué)無盡的前沿》,這個(gè)規(guī)劃使得科技成為美國的國家事業(yè),成為美國科技政策的藍(lán)圖,美國因此建立了持續(xù)的科技創(chuàng)新動(dòng)力。
美國科學(xué)促進(jìn)會首席執(zhí)行官、《科學(xué)》雜志執(zhí)行主編拉什·D.霍爾特寫了再版序言,霍爾特對范內(nèi)瓦做了高度評價(jià),但也指出了《前沿》唯一的不足就是脫離了人民群眾,把科學(xué)變成了一群極少數(shù)科學(xué)家做的事。而現(xiàn)在這個(gè)時(shí)代,媒介互聯(lián)網(wǎng)信息的平權(quán),知識平權(quán)、認(rèn)知平權(quán),需要結(jié)合大眾,所以我覺得這不是一件壞事。我們得讓大眾了解、大眾知道、大眾關(guān)注才能更好地促進(jìn)科學(xué)的進(jìn)步。
我們知道李飛飛每年都做一個(gè)AI報(bào)告,對全球各地對AI發(fā)展預(yù)期的樂觀性進(jìn)行調(diào)研,中國對AI的樂觀性排名第一。中國人認(rèn)為AI會給大家?guī)砀玫纳睿习傩諛酚^性可能超過75%。美國是極度悲觀,65%的人認(rèn)為AI會讓我失業(yè),讓我變得更加不好,只有35%的人持有樂觀態(tài)度,這可能對AI真正的落地會有蠻大的影響。如果沒有這些機(jī)器人賽事的曝光,對機(jī)器人企業(yè)來講,就更是閉門造車。
駱軼航:作為一個(gè)投資人,您怎么看一個(gè)機(jī)器人公司是不是一個(gè)值得投資的標(biāo)的?
王晟:這一波的具身智能和機(jī)器人,包括機(jī)器人的AI,有些人選擇下注,有些人選擇不下注,這背后有很多原因。在我們來看,什么樣的機(jī)器人公司值得投資?一是相對樂觀,另一個(gè)是理性,有扎實(shí)的知識儲備和認(rèn)知,以及很強(qiáng)的邏輯思考能力,能對未來技術(shù)范式的發(fā)展做一定的預(yù)測,預(yù)測可能不準(zhǔn)確,但相信理性思考之后的結(jié)果,誰符合,就相信他做的事情大概率是對的。
剩下的無非是團(tuán)隊(duì)優(yōu)秀不優(yōu)秀,其實(shí)團(tuán)隊(duì)優(yōu)秀很難評價(jià)。我們過去做過愚蠢的事情,列了非常多的維度打分,毫無用處。投資決策的基礎(chǔ)是:必須見過足夠多的好東西,就好比藝術(shù)家、美食家和文玩收藏家,見過的、體驗(yàn)過的好東西足夠多,就知道好不好。很多投資人其實(shí)沒有見過好東西。
而我們希望80%的項(xiàng)目我們都見過和聊過,你見過什么是好東西,才對好東西有選擇權(quán)。
駱軼航:紅杉早期有一個(gè)著名投資哲學(xué):押注賽道而非賽手。但是投大語言模型、多模態(tài)模型和機(jī)器人產(chǎn)業(yè)時(shí),這個(gè)策略可能就失效了。因?yàn)橐还P投資錢一上來就很多,幾千萬上億人民幣,所以押注賽手本人很重要。松延動(dòng)力和靈御智能,一個(gè)專注機(jī)器人本體和強(qiáng)化學(xué)習(xí),一個(gè)專注機(jī)器人上臂的智能化,你投這兩個(gè)賽手的原因是什么?
王晟:哲源做松延動(dòng)力,他做了很多不符合他這個(gè)年齡(注:姜哲源生于1998年)的一些巨大的人生決策。不止一次,我們看到他做了極其勇敢的選擇和決策。優(yōu)秀的人可能非常多,但你只能投資你欣賞的和喜歡的人。這個(gè)人很優(yōu)秀,但就是跟你聊不來,這種情況我們經(jīng)常見。
投靈御智能也很有意思。因?yàn)橛⒅Z基金總是對未來半年到一年的AI和機(jī)器人具身智能做一些預(yù)判,我們每次下注都在產(chǎn)業(yè)大共識形成的前幾個(gè)月就投了,投完之后幾個(gè)月,產(chǎn)業(yè)大共識來了,估值就會漲得很快。靈御智能就是我們希望投的一個(gè),因?yàn)樗鯨2的具身智能解決方案。我們現(xiàn)在下注的所有具身智能公司都是奔著L4去的,直接替人進(jìn)工廠,疊被子進(jìn)家庭,把人踢掉,省很多錢,但非常難做。
就好比自動(dòng)駕駛一樣,馬斯克在2017年Tesla發(fā)布會說明年我們會實(shí)現(xiàn)全自動(dòng)駕駛,L4級別的滿世界跑,現(xiàn)在快10年了也沒完全實(shí)現(xiàn)。因?yàn)橛辛爽F(xiàn)在的L2自動(dòng)駕駛階段,特斯拉才強(qiáng)大。通過L2輔助駕駛了,收集很多數(shù)據(jù),持續(xù)用于模型訓(xùn)練,從而變成世界上最強(qiáng)大的自動(dòng)駕駛公司。換句話時(shí)髦的話,我們跟金戈和他的靈御智能有“共振”。
2025年是人形機(jī)器人的商業(yè)化元年,需要做什么?
駱軼航:我想了解一下機(jī)器人客戶的具體情況。我們現(xiàn)在能想到的客戶門類:第一類是展示、表演、教育、科研實(shí)驗(yàn),客戶以機(jī)器人本體做基礎(chǔ),搞算法和研發(fā)。第二是機(jī)器人領(lǐng)域的國外同行,買中國機(jī)器人去搞研究,拆開了看它們是怎么做的;第三才是真實(shí)客戶場景。哲源能講講現(xiàn)有客戶種類各占多少比例,以及我們更在意的哪類客戶么?
姜哲源:具體的比例或許不太方便透露,但大致可分為四大類:科研、教育、商演和文旅展廳。這四大領(lǐng)域基本上是當(dāng)下主要的落地場景。
雖然我不提及具體比例數(shù)字,但最大的兩塊是教育和商業(yè)演出。一直以來,教育就是人形機(jī)器人或足式機(jī)器人的一個(gè)應(yīng)用方向。為找到合適的應(yīng)用場景,便將其作為教具,或是課程配套的實(shí)驗(yàn)器材,銷售給學(xué)校以及有課程教育需求的客戶。
商演是今年剛剛興起的領(lǐng)域。大家可以看到,許多人形機(jī)器人出現(xiàn)在不同的場合,比如商場開業(yè)、周年慶典,以及婚慶等場景,以租賃的形式進(jìn)行商業(yè)演出。
另外,比較有趣的是展廳方面的應(yīng)用。我們原本并未預(yù)估到這會是一個(gè)較大的需求,后來發(fā)現(xiàn)該領(lǐng)域的需求量并不小。我們原本認(rèn)為,在展廳使用輪式機(jī)器人進(jìn)行講解即可,為何要選用雙足機(jī)器人呢?后來我們與客戶溝通詢問他們?yōu)槭裁床毁I輪式機(jī)器人時(shí),他們說輪式的科技感不足,堅(jiān)持要人形的。
所以今年在這個(gè)熱度下催生了很多場景。另外,我們還發(fā)現(xiàn)了一些別人看不到的場景,但暫時(shí)無法公開。因?yàn)槲覀兊膬r(jià)格最初下探到了一個(gè)可能沒人觸及過的范圍,3.99萬,也就是5萬以內(nèi)的價(jià)格帶。這個(gè)價(jià)格帶讓我們發(fā)掘出了一堆價(jià)格較高時(shí)看不到的場景。明年我們可能會在這些方向發(fā)力,到時(shí)候可能會有更多應(yīng)用場景出現(xiàn)。
剛才您提到了“真實(shí)應(yīng)用場景”這個(gè)詞,難道這些不就是真實(shí)應(yīng)用場景嗎?我覺得挺真實(shí)的啊。或者說,一個(gè)場景是否真實(shí)取決于它是否可持續(xù)。比如商演,今年春晚、馬拉松這類活動(dòng)催生了這個(gè)市場,商演市場熱度可能會下降,但不會消失。就像舞龍、舞獅,傳承這么多年依舊存在,熱度也沒有降下去甚至消失,對吧?還有展覽展示這類純展示需求,杜莎夫人蠟像館都經(jīng)營這么多年了,也有它的商業(yè)價(jià)值。所以關(guān)鍵要看這些市場板塊的價(jià)值是否高。
駱軼航:所以價(jià)格一下子扎到3萬9甚至更低,就是為了想把客戶使用的各種可能性和場景都充分挖掘出來?
姜哲源:關(guān)于人形機(jī)器人本體賽道的投資,在2023年主要看團(tuán)隊(duì)背景,有沒有科學(xué)家。到了2024年主要看Demo,了解能應(yīng)用什么樣的技術(shù)。2025年,就主要關(guān)注商業(yè)化落地了。
其實(shí)在2024年初,我們的Demo做得相當(dāng)不錯(cuò),雖然沒有公開發(fā)布,但在行業(yè)內(nèi)大家都知道。不過,我們公司一直比較低調(diào),從不做宣傳,以前在100篇機(jī)器人行業(yè)的報(bào)道里可能都見不到我們一次。
今年剛過完年那段時(shí)間,公司基本零訂單,銷售團(tuán)隊(duì)和營銷團(tuán)隊(duì)都沒有組建起來,什么都缺。但我們心里清楚2025年最重要的是商業(yè)化,當(dāng)時(shí)我們認(rèn)為可行的方向是借助線上渠道獲取流量,以此推進(jìn)商業(yè)化。所以當(dāng)時(shí)我們希望將產(chǎn)品能力和定價(jià)等因素綜合起來,讓它成為一個(gè)有話題性的事情,最好能在圈子內(nèi)甚至出圈,成為出圈的一個(gè)話題。
我們給N2定了3.99萬的價(jià)格,這個(gè)價(jià)格比同行低至他們的1/5左右。我們認(rèn)為這個(gè)價(jià)格最重要的是有話題性。而且我們核算過,雖然毛利率不算特別高,但還是能掙錢的,所以覺得可行。我們當(dāng)時(shí)定這個(gè)價(jià)格,想著總比一整年沒有商業(yè)化進(jìn)展要好,于是就這么干了,發(fā)布了這個(gè)相對較低的售價(jià)。
駱軼航:這其實(shí)是個(gè)重大的決策。不過在實(shí)際運(yùn)行和工況中,一個(gè)機(jī)器人不管是跑、俯臥撐、行走、空翻等等,它最常見的故障點(diǎn)可能有哪些?比如傳感器突然失靈,或者讓機(jī)器人連著做幾十個(gè)后空翻之后它就燒壞了,再或者像半馬比賽中很多被做成花絮的場景,機(jī)器人跌倒和“虛脫”等,它們是什么原因?qū)е碌??我們能把這些問題解決到什么程度?如何管理客戶對未來的預(yù)期?可以從機(jī)器本體及其智能化方面來講講。
姜哲源:必須得講這個(gè)問題。那我先說說從本體角度看哪些地方容易出故障:我們當(dāng)時(shí)參加馬拉松時(shí)遇到的最大問題就是線束容易松動(dòng),這個(gè)問題我在很多場合都提過。當(dāng)時(shí)胳膊上的線特別容易松,而且不是線束里的電源線松,是信號線松。只要信號線虛接,就可能出現(xiàn)誤碼,誤碼積累多了,這一路就會直接關(guān)閉。這樣胳膊就會失去一路電機(jī)信號,進(jìn)而導(dǎo)致整個(gè)運(yùn)動(dòng)控制出現(xiàn)問題。
這是之前我們遇到了一個(gè)比較常見的問題。但在馬拉松比賽期間,由于時(shí)間緊迫,實(shí)在來不及解決。當(dāng)時(shí)我們剛完成一個(gè)項(xiàng)目demo,整個(gè)團(tuán)隊(duì)都疲憊不堪,而且只有一個(gè)月的時(shí)間準(zhǔn)備馬拉松,所以確實(shí)沒工夫處理這個(gè)問題。馬拉松結(jié)束后的兩周,我們把這個(gè)問題徹底解決了。我們重新設(shè)置了線束,還進(jìn)行了大量測試,最終徹底解決了這個(gè)問題。我覺得這算低級錯(cuò)誤,不是常見問題,也不具有普適性,是我們公司自己沒做好。
另外有個(gè)特別容易出問題的地方,很多人形機(jī)器人公司應(yīng)該都有同感,就是腳踝。人容易崴腳,機(jī)器人的腳踝也特別容易壞。剛開始的時(shí)候,腳踝電機(jī)很容易出問題,走一段時(shí)間行星架可能就變形了,變形后電機(jī)可能會卡死,或者間隙變得很大,會引發(fā)各種問題。后來我們對電機(jī)進(jìn)行了大幅強(qiáng)化,也對傳動(dòng)連桿進(jìn)行了大幅強(qiáng)化,還替換了軸承、軸等部件的材質(zhì)和選型。最后解決了腳踝的問題,其實(shí)在馬拉松比賽前就把這個(gè)問題搞定了。
馬拉松比賽前,我記得有一次半夜搞了一場活動(dòng),就是開放賽道讓大家測試的比賽。當(dāng)時(shí)我們的機(jī)器人跑的時(shí)候,跑到12公里,腳踝電機(jī)那塊的螺絲斷了。之后我們加了幾個(gè)銷子,把問題解決了。不過直到現(xiàn)在,腳踝還是最容易出問題的部位。雖然它的壽命比原來長了好幾倍,但到了相應(yīng)時(shí)間,最先壞的還是腳踝。
另外,過熱也是個(gè)比較麻煩的問題。我們的情況要好一些,因?yàn)槲覀兊臋C(jī)器人有一定的冗余設(shè)計(jì),所用關(guān)節(jié)尺寸和機(jī)器人本體尺寸的設(shè)計(jì)是高爆發(fā)、冗余的狀態(tài)。所以我們機(jī)器人過熱的情況還好。
我覺得這是目前遇到的幾個(gè)容易出問題的點(diǎn)。人形機(jī)器人行業(yè)要沉淀心態(tài),好好做產(chǎn)品、做測試,把該測的項(xiàng)目都測完,走完所有流程,再推出新一代產(chǎn)品。我覺得這才是整個(gè)行業(yè)更健康、更理性的做法。
駱軼航:大家都把溫度降一降。
金戈:我從上肢操作的角度講講。我覺得這可能不是故障問題,而是現(xiàn)有技術(shù)的限制?,F(xiàn)有技術(shù)下,讓機(jī)器人智能操作存在一個(gè)矛盾,即操作成功率和操作速度、效率的矛盾。某些流傳很廣的機(jī)器人Demo,乍一看很驚艷,機(jī)器人能自己收拾家務(wù)等,但仔細(xì)看右下角會標(biāo)注8倍速。這意味著為了保證一定的成功率,機(jī)器人的工作速度要大幅下降遠(yuǎn)遠(yuǎn)低于人類效率,這就讓機(jī)器人離實(shí)際應(yīng)用還有距離。
我們希望機(jī)器人工作得又快又高效,但這樣成功率就難以保證。你可以把這看作故障,也可以認(rèn)為是現(xiàn)階段機(jī)器人智能的局限。從論文和最先進(jìn)的研究來看,在相對泛化的垂直場景中,機(jī)器人工作的成功率暫時(shí)能達(dá)到80%多就很不錯(cuò)了。而且這還是在動(dòng)作有所放慢的情況下。
我們提出的解決方案是,在成功率只有80%多的情況下,能否讓機(jī)器人投入實(shí)用。汽車行業(yè)有類似應(yīng)用,汽車只能在高速公路或封閉道路上自動(dòng)駕駛,不能行駛的路段就找人接管。所以我們提出了L2混合駕駛方案,希望機(jī)器人能自我判斷。如果對某項(xiàng)操作沒把握,或者操作失敗了,可以呼叫人來接管或處理。用這種兜底方案解決目前模型成功率不可靠的問題。
如果說機(jī)器人投入使用面臨硬件挑戰(zhàn),我覺得網(wǎng)絡(luò)環(huán)境是個(gè)比較大的挑戰(zhàn)。中國的網(wǎng)絡(luò)環(huán)境建設(shè)很優(yōu)質(zhì),正常情況下完全能滿足需求。但如果網(wǎng)絡(luò)環(huán)境波動(dòng)或受到攻擊,機(jī)器人的操作和行為就會受影響,這需要通過算法優(yōu)化來解決,目前我們也在努力攻克這個(gè)問題。
機(jī)器人行業(yè)產(chǎn)業(yè)鏈長,很多企業(yè)面臨多方面的技術(shù)挑戰(zhàn),只有產(chǎn)業(yè)鏈上的企業(yè)共同提升技術(shù),才能更快實(shí)現(xiàn)機(jī)器人進(jìn)入千家萬戶的目標(biāo)。
關(guān)于技術(shù)瓶頸和技術(shù)路徑,人形機(jī)器人產(chǎn)業(yè)有共識了嗎?
駱軼航:接下來這兩個(gè)話題涉及軟件側(cè)和模型側(cè)。我對從L0到L4這樣的仿汽車自動(dòng)駕駛等級來衡量機(jī)器人智能化很感興趣。過去一年外界看,機(jī)器人產(chǎn)業(yè)在模型化、多模態(tài)模型和模型訓(xùn)練方面進(jìn)展不大,一些問題依然存在,比如在仿真環(huán)境中收集數(shù)據(jù)、訓(xùn)練數(shù)據(jù)和優(yōu)化算法等,過去一年,模型側(cè)似乎遇到了瓶頸。是用仿真數(shù)據(jù)還是真實(shí)數(shù)據(jù)?
大家普遍認(rèn)為大語言模型是機(jī)器人的大腦,識別動(dòng)作、模態(tài)、意圖和處理意圖的是小腦。現(xiàn)在的主要堵點(diǎn)和卡點(diǎn)在哪?是數(shù)據(jù)量不足,仿真數(shù)據(jù)質(zhì)量有問題,仿真數(shù)據(jù)的獲取方式不同于大語言模型語料的獲取,總之進(jìn)展確實(shí)不大。
金戈:目前業(yè)界基本達(dá)成共識,大概五六個(gè)月前還沒這么明確,現(xiàn)在大家都認(rèn)為數(shù)據(jù)不足是核心問題。大模型的三要素是算法、算力和數(shù)據(jù),數(shù)據(jù)是關(guān)鍵,巧婦難為無米之炊,解決數(shù)據(jù)不足是當(dāng)務(wù)之急。我們看到很多企業(yè)在建機(jī)器人數(shù)據(jù)采集中心,收集真機(jī)數(shù)據(jù)和仿真數(shù)據(jù)。
另外要強(qiáng)調(diào)的是,真機(jī)數(shù)據(jù)和仿真數(shù)據(jù)并不沖突,它們相互補(bǔ)充,都面臨挑戰(zhàn)。收集真機(jī)數(shù)據(jù)需要大量機(jī)器人,成本和難度高。仿真數(shù)據(jù)也有挑戰(zhàn),機(jī)器人仿真比汽車仿真難,汽車仿真只要保證汽車不撞到東西就行,只關(guān)注汽車的形狀和大?。欢鴻C(jī)器人操作要和物體強(qiáng)互動(dòng),仿真物體的形狀、物理量、重量、粘度、軟硬和摩擦等都要準(zhǔn)確。建立仿真數(shù)據(jù)需要時(shí)間和成本,雖然比建真實(shí)物體成本低,但也不容易。
現(xiàn)在大家已經(jīng)發(fā)現(xiàn)了堵點(diǎn),全球都在從不同方向解決數(shù)據(jù)問題,比如仿真、合成和真機(jī)數(shù)據(jù)收集等。就像《流浪地球》里的超飽和救援,大家從不同角度一起解決數(shù)據(jù)問題,我們的目標(biāo)是去掉堵點(diǎn),提升機(jī)器人智能。
姜哲源:我非常同意金總的觀點(diǎn)。補(bǔ)充一下,現(xiàn)在各地有數(shù)據(jù)工廠模式,這是個(gè)很好的嘗試,發(fā)揮了我國規(guī)?;a(chǎn)的優(yōu)勢。但數(shù)據(jù)除了規(guī)模,多樣性也很重要。
我常舉一個(gè)例子,訓(xùn)練一個(gè)簡單的圖像分類模型,一個(gè)數(shù)據(jù)集有10張不同圖片,另一個(gè)有1億張相同圖片,顯然10張不同圖片的數(shù)據(jù)集效果更好。所以我不確定數(shù)據(jù)工廠模式能否取得好效果,因?yàn)槠鋱鼍皢我?,長期來看會出現(xiàn)邊際效應(yīng)遞減的情況。我覺得應(yīng)該到真實(shí)場景中收集數(shù)據(jù),這值得上肢賽道的同行思考。
第二是關(guān)于仿真數(shù)據(jù)。我的觀點(diǎn)是,單純用仿真數(shù)據(jù)肯定不行。仿真機(jī)器人走路、跑步,拿硬質(zhì)物品可能沒問題,甚至一些先進(jìn)的仿真器能模擬軟體和流體,但舉一個(gè)極端例子,讓仿真器模擬炒西紅柿雞蛋,模擬蛋液從液態(tài)變成固態(tài)的過程,這個(gè)是一個(gè)難度極其之大的事情,對當(dāng)下而言不具備可行性。所以全靠仿真數(shù)據(jù)是不行的。
駱軼航:最后我們收個(gè)尾。大語言模型去年沒共識,今年對做Agent有了一定共識。對于具身機(jī)器人,包括人形機(jī)器人產(chǎn)業(yè),目前哪些方面有共識的苗頭?或者我們認(rèn)為哪些方面最應(yīng)該形成共識?
王晟:我認(rèn)為共識是動(dòng)態(tài)的,機(jī)器人產(chǎn)業(yè)一直有共識,但共識一直在變。剛形成一個(gè)共識,可能很快就被瓦解,變成落后的共識。
比如投資方法論的共識。2023年下半年,投資方向是人形機(jī)器人、基礎(chǔ)運(yùn)控和本體等,2024年開始投資具身智能,先投小腦,再投大腦,現(xiàn)在又搞端到端。技術(shù)范式也從傳統(tǒng)音控到強(qiáng)化學(xué)習(xí)、模仿、到現(xiàn)在的VLA。這些都是共識,都不長久,這說明這個(gè)產(chǎn)業(yè)還不成熟。
所以未來還會快速產(chǎn)生小或中度的共識,但像大語言模型這樣的超級共識,還需要很長時(shí)間。從投資角度看,明年大家不能只拼demo了,產(chǎn)品要能落地,有實(shí)際應(yīng)用場景,能提供價(jià)值,光表演不行。
姜哲源:晟總從宏觀層面講了產(chǎn)業(yè)共識情況,我說說我們細(xì)分賽道的小共識?,F(xiàn)在運(yùn)動(dòng)控制用深度強(qiáng)化學(xué)習(xí)已經(jīng)是絕對共識。2023年還有人質(zhì)疑四足機(jī)器人的運(yùn)控方法不能用到這里,現(xiàn)在沒人提這個(gè)問題了。硬件方面,目前低成本新機(jī)器人的硬件架構(gòu)基本基于準(zhǔn)直驅(qū)電驅(qū)關(guān)節(jié)。以前有人質(zhì)疑是不是用液壓或其他類型關(guān)節(jié),現(xiàn)在至少在低成本機(jī)器人上,準(zhǔn)直驅(qū)關(guān)節(jié)技術(shù)成了共識。準(zhǔn)直驅(qū)關(guān)節(jié)減速比相對較低,用電流環(huán)做力控,成本低、系統(tǒng)簡單可靠。不過未來可能會有新的技術(shù)成為共識,目前這種方法是有效的。
金戈:我非常贊同晟總和姜總的觀點(diǎn)。我覺得現(xiàn)在行業(yè)還處于早期,不確定性多,技術(shù)方向沒收斂,很多方面還在探索。從模型和上肢操作角度看,大家發(fā)現(xiàn)數(shù)據(jù)短缺是一個(gè)共識,另一個(gè)共識是,不能只依靠數(shù)據(jù)工廠在實(shí)驗(yàn)室采集數(shù)據(jù),要讓機(jī)器人盡快投入生產(chǎn)生活,比如工廠、商業(yè)場景,在實(shí)際場景中獲取數(shù)據(jù),提升模型能力,就像自動(dòng)駕駛汽車先上路跑起來一樣。
駱軼航:感謝大家的討論,在制造業(yè)發(fā)達(dá)、對人工智能發(fā)展樂觀、注重科學(xué)和效率的中國,機(jī)器人產(chǎn)業(yè)走向千行百業(yè)和千家萬戶,很可能是我們中國人擁抱AGI的方式。
點(diǎn)個(gè)愛心,再走吧
熬夜加班三天面癱?25歲女生親述:病毒潛伏20年,一夜毀容
還有一種情況叫“帶狀皰疹相關(guān)面癱”,也就是病毒感染引起的_。這類面癱通常比較嚴(yán)重,恢復(fù)慢,甚至伴隨耳痛、耳鳴等癥狀-。有些患者在面癱前幾天還會長水泡,但很多人并沒意識到這是病毒的問題。這里就涉及一個(gè)誤區(qū):不少人以為面癱是“歪風(fēng)邪氣”入體,甚至去找人拔罐、刮痧、貼膏藥??擅姘c是神經(jīng)炎癥或病毒感染引起等我繼續(xù)說。
女子連續(xù)3天熬夜加班致面癱,當(dāng)代青年“健康負(fù)債”的紅色警報(bào)
男醫(yī)生貪涼導(dǎo)致面癱的事件,雖然看似荒誕,但實(shí)際上是生活的一面鏡子。它告訴我們:在追求舒適的同時(shí),要懂得“度”的藝術(shù);在面對身體的“信號”時(shí),要學(xué)會“傾聽”;而“貪涼”其實(shí)也是“貪心”的一種表現(xiàn)-——。只有把握好“度”,我們才能“面帶笑容”,健康常伴__。所以,朋友們,下次遇到“涼快”的誘惑時(shí),記得:..
1.62億粉絲頂流“面癱哥”突遭逮捕!全球網(wǎng)友炸鍋:他犯了什么罪?
要知道,亨特綜合征可不是小毛病,它約占急性面神經(jīng)麻痹病因的7%,是非創(chuàng)傷性面癱最常見的病因之一__。主要癥狀表現(xiàn)為患側(cè)周圍性面癱、耳痛以及外耳道皰疹。雖然70 - 80 歲的人群發(fā)病率最高,但如今,像小林這樣年輕的“受害者”也越來越多了|-。這起事件,就像一記警鐘,重重地敲在了我們每個(gè)人心上。在現(xiàn)代到此結(jié)束了?。
來源:紅網(wǎng)
作者:趙一蓉
編輯:林怡婷
本文為紅辣椒評論 原創(chuàng)文章,僅系作者個(gè)人觀點(diǎn),不代表紅網(wǎng)立場。轉(zhuǎn)載請附原文出處鏈接和本聲明。