21世紀(jì)經(jīng)濟報道記者孔海麗、實習(xí)生吳佳蕓北京報道
2025年世界人工智能大會(WAIC)期間,搭載騰訊Tairos平臺的宇樹人形機器人G1和騰訊首席科學(xué)家張正友有一場互動,當(dāng)張正友發(fā)出“站到我身邊來”的指令時,機器人準(zhǔn)確理解方位含義,流暢移動定位。
重要的是,全程沒有人工遙控干預(yù)。這一幕,是騰訊RoboticsX實驗室最新發(fā)布的具身智能開放平臺Tairos的能力縮影。
WAIC期間,耕耘許久的騰訊首次對外公開了在具身智能領(lǐng)域的路線圖。面對沸騰的行業(yè),騰訊選擇了一條獨特路徑——做行業(yè)的“鈦螺絲”。
與常見的科技公司高調(diào)商業(yè)化路徑不同,Tairos平臺的基調(diào)與騰訊整體路徑保持一致,如馬化騰所說,在具身智能領(lǐng)域,騰訊希望成為所有機器人廠商的合作伙伴,而不是取而代之做硬件,“這和我們的整體戰(zhàn)略目標(biāo)一致”。
“2018年初騰訊RoboticsX成立時沒有任何商業(yè)化的目的?!睆堈烟寡裕骸爱?dāng)時國內(nèi)甚至找不到成熟的機器人硬件廠家,我們不得不既做硬件又做軟件?!倍?023年下半年起,ChatGPT引爆的AI大模型熱潮催生出大量機器人創(chuàng)業(yè)公司,產(chǎn)業(yè)格局驟變。
然而,距離落地還有很長一段路要走。
張正友說,從基礎(chǔ)模型到真機部署,每一個環(huán)節(jié),都藏著不少"坑"。
具身智能的落地,不僅僅是算法問題、或者模型能力的問題,而是一個復(fù)雜、環(huán)環(huán)相扣的系統(tǒng)工程挑戰(zhàn),需要打通數(shù)據(jù)、訓(xùn)練、調(diào)試、部署的全鏈條。
從宏觀的角度來看,機器人對3D世界的認(rèn)知,以及動態(tài)世界的建模,還處于初步階段。具身智能需要更大的泛化能力,才能讓“身”與“智”協(xié)同進(jìn)化,無縫地適應(yīng)多變的環(huán)境。
走訪了六十幾家機器人企業(yè)后,團隊發(fā)現(xiàn)軟件能力是機器人走向場景落地的共性痛點,業(yè)內(nèi)普遍缺乏好的模型和仿真工具。
騰訊的具身智能開放平臺Tairos“鈦螺絲”想做這件事。
Tairos包括一套云端服務(wù)和三個具身模型,多模態(tài)感知模型、規(guī)劃大模型和感知行動聯(lián)合大模型。
這三個大模型,分別是機器人的“左腦”、“右腦”和“小腦”,負(fù)責(zé)讓機器人理解目標(biāo)任務(wù)和所處環(huán)境,從而執(zhí)行操作。
規(guī)劃大模型支持復(fù)雜任務(wù)規(guī)劃,多模態(tài)感知大模型融合視覺、位置等環(huán)境信息,而感知-行動聯(lián)合大模型實現(xiàn)操作和運動能力。
云服務(wù)層則讓開發(fā)者可以通過云平臺完成仿真、訓(xùn)練、數(shù)據(jù)管理等關(guān)鍵環(huán)節(jié),并通過SDK/API靈活對接硬件。
這個面向機器人本體開發(fā)商的平臺,是團隊為具身智能廠商打造的“工具”,旨在解決基礎(chǔ)模型、場景數(shù)據(jù)采集、訓(xùn)練仿真和真機部署四個環(huán)節(jié)的落地難題。
張正友用Windows的生態(tài)成功類比Tairos的愿景:“如果平臺不能與不同廠家良好兼容,就不可能發(fā)展起來?!睘榇耍v訊在發(fā)布前已深度聯(lián)合宇樹、越疆、帕西尼等頭部硬件伙伴打磨平臺,確保其真正解決行業(yè)痛點。
進(jìn)入人形機器人“量產(chǎn)元年”,騰訊的具身智能戰(zhàn)略分為兩部分:投資和前沿探索。今年以來,騰訊已投資智元機器人和宇樹科技至少兩家具身智能機器人公司,早前也投資了樂聚和優(yōu)必選。
而另一邊,對于親自下場做具身智能,RoboticsX實驗室選擇先做原型和平臺,再根據(jù)市場需求推進(jìn)產(chǎn)品化,并對機器人本體的具體形態(tài)保持開放態(tài)度。
“本體是一個值得探索的過程?!睆堈阎赋?,做機器人不是為了仿生,而是為了在人居環(huán)境里實現(xiàn)更高效、更理想的形態(tài)。若以“人形”作為機器人的標(biāo)準(zhǔn)形態(tài),可能會限制行業(yè)的想象力。
對于行業(yè)的未來,張正友說,“過熱”是一個好現(xiàn)象,參與的人越來越多,行業(yè)發(fā)展就會越來越快。當(dāng)前行業(yè)處于探索過程,尤其是對本體形態(tài)的探索。在這一過程中,RoboticsX實驗室像是一把“螺絲刀”,為機器人本體廠商打磨基礎(chǔ),邁向行業(yè)爆發(fā)iPhone時刻。
WAIC期間,張正友首次公開分享了騰訊RoboticsX實驗室在具身智能領(lǐng)域的探索與對行業(yè)的判斷,這也是騰訊為數(shù)不多的對外釋放關(guān)于具身智能的業(yè)務(wù)邏輯。以下為對話實錄,經(jīng)
做行業(yè)的“鈦螺絲”
21世紀(jì):騰訊說要做硬件廠商的合作伙伴,現(xiàn)階段會把大部分精力和資源放在哪些能力上的提升?
張正友:我們從去年底開始在做這個事情之前,先認(rèn)真調(diào)研了行業(yè),累計到現(xiàn)在差不多跑過六十幾家企業(yè)。我們已經(jīng)走訪了全國的廠家,深圳、上海、北京,整個華東地區(qū),還有西部地區(qū)。
我們真正出去的時候,其實發(fā)現(xiàn)中國大量的機器人企業(yè),它硬件其實是可以做得很好的。但具身智能在投入這一塊其實是非常大的。我們初期會去選取一些高配合度的種子企業(yè),然后深度地聯(lián)合去做一些case。
今年上半年的想法就是說我們先去找一些企業(yè)去打磨產(chǎn)品,這其實也是過往騰訊做產(chǎn)品的思路,就是不能一下子鋪太多的,一定是像1.0版本,要去找?guī)讉€企業(yè)深入落地。一部分產(chǎn)品標(biāo)準(zhǔn)化了之后,就可以慢慢地開始鋪量。
21世紀(jì):騰訊什么方面的能力、優(yōu)勢可以幫助到他們?
張正友:具身智能以及今天發(fā)布的三個模型,規(guī)劃、多模態(tài)感知和感知行動大模型,每一個模塊他們都可以去用。然后還有仿真平臺,他們可以上傳他們自己的機器人,在仿真平臺里面嘗試一下。
我們的模型既可以在真實機器人上面運作,也可以在仿真環(huán)境里面用。在仿真環(huán)境里,如果遇到完成不了的任務(wù),它會直接送到后面強化學(xué)習(xí)去改進(jìn)它的規(guī)劃大模型。因為我們不可能把世界上所有的可能的任務(wù)都想清楚的。最后我們希望用平臺的每個人、每個廠家可以把訓(xùn)練好的、針對他們本體的模型拿去,部署到真機上去。
21世紀(jì):所以現(xiàn)階段的重點還是在模塊化能力上的提升?
張正友:模型能力還有仿真環(huán)境,這里面其實難的地方挺多的。
比方說在操作里面,力感知和觸覺感知是非常重要的,像觸覺傳感器沒有標(biāo)準(zhǔn)化,那在仿真里面如何讓觸覺很真實的仿真出來?像人的觸覺,空間分辨率在1毫米左右,在仿真環(huán)境里面現(xiàn)在還達(dá)不到這么好的分辨率。
每個模塊無論是感知規(guī)劃,大腦小腦,感知行動聯(lián)合大模型,仿真、數(shù)據(jù)采集,每個環(huán)節(jié)都有很多需要提升的地方。
21世紀(jì):對整個行業(yè)來說,還有哪些是在機器人落地方面比較難、急需補足的地方?
張正友:從技術(shù)角度看落地的話,對3D的世界認(rèn)知,動態(tài)世界包括物體、材料各方面的建模,就是世界模型,還是處于初步的階段。
然后規(guī)劃,像大語言模型它也能做一些規(guī)劃,但它的規(guī)劃因為是通過文本來理解世界,所以沒那么深。大語言模型會把世界上所有的各種各樣的知識都放進(jìn)去,但是針對現(xiàn)實世界,有很多東西是用文字描述不出來的。
比方說動物它沒有語言,但是它還能還是能夠在3D世界里面很好地活下來,不需要語言。就是說規(guī)劃方面,沒有3D世界的理解,可能很多情況下都做不好。
再講到感知行動大模型,像觸覺感知,這些目前還是很缺乏的。多模態(tài)感知里面,圖像和視頻,或者是語音或者文本這些都是很標(biāo)準(zhǔn)化的。但是觸覺傳感器,我們從實驗室成立以后就覺得觸覺非常重要,經(jīng)過7年研究,現(xiàn)在還沒有達(dá)到真正能夠標(biāo)準(zhǔn)化的程度。當(dāng)然還有其他公司已經(jīng)參與到觸覺傳感器的研發(fā),所以很多都需要大家一起努力,整個行業(yè)一起努力。
產(chǎn)品化與商業(yè)化探索
21世紀(jì):今年具身智能那么火,落地的可能性變大很多,你們對商業(yè)化的態(tài)度會不會有所改變?
張正友:騰訊RoboticsX實驗室2018年初成立的時候沒任何商業(yè)化的目的,因為那時候情況很不一樣,那時候你看看能不能找到一個能夠做機器人的硬件廠家?一個都沒有,所以我們那時候就必須要自己從頭既做硬件又做軟件,各方面的全部都要做。
從2023年下半年開始,整個機器人行業(yè)就有很大的變化,一個是ChatGPT引起AI大模型的關(guān)注,很多機器人企業(yè)就出來了,很多創(chuàng)業(yè)公司。我們那時候就是啥都要做,他們有些比較關(guān)注機器狗或者是人形機器人,還有一些觸覺傳感器、靈巧手,有很多機器人本體。
形勢已經(jīng)變化了,從騰訊角度來看,我們需要跟這些機器人廠家一起去打磨我們的技術(shù)。另外,前沿探索還是很重要,我們還會繼續(xù)前沿探索,但有些能力是希望能夠跟機器人本體廠家一起,和應(yīng)用廠家一起去往前來提升的。
與其說商業(yè)化,其實我們現(xiàn)在的方向是一個產(chǎn)品化。我們做了很長時間的前沿探索,積累了大量經(jīng)驗,和一些成熟的技術(shù)成果,現(xiàn)在更多希望能把這些變成一個產(chǎn)品。之前更多是供內(nèi)部來科研使用,未來更多想把這些科研成果變成產(chǎn)品,供給市場上的機器人廠商和第三方的廠家,讓他們?nèi)バ纬伤麄冏约捍虬梢粋€更完整的產(chǎn)品。
要區(qū)分產(chǎn)品化和商業(yè)化。我是做研究的科學(xué)家,商業(yè)化聽起來就是要去賺錢,但是我們是不賺錢的。Tairos特地強調(diào)我們自己不是以賺錢為目的的,我們希望把我們變成一個比較穩(wěn)定的產(chǎn)品來賦能機器人的行業(yè)。
21世紀(jì):現(xiàn)在很多公司希望做商業(yè)量產(chǎn),騰訊沒有選擇這樣做,是怎樣考慮的?
張正友:騰訊公司的角度,比如要不要做一個機器狗?從我的角度是不支持去做的,不值得去做的,我自己也不會做,因為還有更大的目標(biāo)在支撐著我們。
比如養(yǎng)老,能不能把機器人具身智能技術(shù)和本體里面某些核心技術(shù),比如說觸覺傳感器、定制皮膚這些能力能不能繼續(xù)往前推進(jìn)?離這個還很遠(yuǎn),我加入騰訊成立機器人實驗室,那時候規(guī)劃的是十年時間,現(xiàn)在七年已經(jīng)過去了,三年以后就差不多。不管怎么樣,要達(dá)到那個效果,我才可能希望養(yǎng)老各方面都能做起來。假如我一開始停留在Max腿輪一體化機器狗上面,那后面就沒精力去做其他東西了。
21世紀(jì):騰訊在研發(fā)上如何平衡長期的前沿探索和中短期應(yīng)用場景關(guān)系?
張正友:前沿探索有很多不確定性,假如是通過什么時候一定要交付什么產(chǎn)品,往往會做成hardcode(“寫死”)的東西了。舉個不好的例子,比如現(xiàn)在所有東西都要跑馬拉松,馬拉松有的時候可能有些技術(shù)到了,那就硬做一些東西,或者一些遙控,那就做得不好了。這個地方為什么一定要足夠多的自由度,做前沿探索必須要往前推進(jìn)。
21世紀(jì):機器人到底到了什么階段?會不會整個行業(yè)有點過于樂觀?
張正友:行業(yè)過熱這看怎么定義,因為大家看到這個前景很吸引人,我更多講的是投資角度。有些公眾對于機器人服務(wù)人、融入到人類社會、融入到生產(chǎn)和生活中有很大的熱情。
這個熱情我覺得對于我們來說是一件好事,也是對我們提出了更高要求,也給我們提供了很多試驗場。參與人越來越多,行業(yè)發(fā)展會越來越快。
如果大家不知道這件事情,不會有一天跟我說你們機器人能不能干這個、干那個,其實我們也缺少很多這種挑戰(zhàn)。至少對于我們從業(yè)者來說是一件好事情。
21世紀(jì):騰訊在具身智能這波浪潮里面的節(jié)奏是怎樣的?
張正友:從某種角度來講我們做得很早,我們是探索性前沿研究的,本來就應(yīng)該早?,F(xiàn)在有些能力我們覺得能夠支撐到行業(yè)發(fā)展,所以把這些能力開放出來,所以這個不晚。我們還需要繼續(xù)做前沿研究,因為現(xiàn)在開放出來的技術(shù)還是剛才講的,現(xiàn)在具身智能只是在初步階段,還有很長的路需要走。假如說是iPhone做了多少年還在往前推進(jìn),這個很難估計,我估計三五年,我2018年講的十年規(guī)劃。
商道_第01集
商道國語_免費在線觀看完整版_電視劇_大海影視
《商道》第01集免費在線播放-全集韓劇-韓國電影網(wǎng)
免責(zé)聲明:本文內(nèi)容由開放的智能模型自動生成,僅供參考。