機(jī)器之心報(bào)道
杜偉
一年一度的世界人工智能大會(huì)現(xiàn)場(chǎng)探展,我們被這個(gè)「閑不住」的人形機(jī)器人圈粉了。
2025年行至過(guò)半,人工智能領(lǐng)域的前沿?zé)狳c(diǎn)屢屢破圈,其中具身智能(EmbodiedAI)及其載體在國(guó)內(nèi)格外受到了關(guān)注,尤其是人形機(jī)器人。
從年初春晚舞臺(tái)上的扭秧歌轉(zhuǎn)手絹、到四五月先后舉辦全球首屆人形機(jī)器人馬拉松比賽、全球首個(gè)人形機(jī)器人格斗大賽,得益于AI算法和機(jī)器學(xué)習(xí)等技術(shù)的進(jìn)步,具身機(jī)器人展現(xiàn)出了越來(lái)越強(qiáng)的靈活性以及環(huán)境適應(yīng)、感知決策行動(dòng)能力。
在2025年世界人工智能大會(huì)(WAIC)現(xiàn)場(chǎng),包括人形機(jī)器人在內(nèi)的具身智能展區(qū)無(wú)疑是全場(chǎng)焦點(diǎn)。形態(tài)各異、「張牙舞爪」的各式機(jī)器人被現(xiàn)場(chǎng)觀眾圍得水泄不通,它們樂(lè)此不疲,秀起看家本領(lǐng)。
其中,一家「忙碌中」的展臺(tái)吸引了我們駐足,里面的人形機(jī)器人正像人類(lèi)服務(wù)生一樣,接受下單之后,從冰箱里取出飲料,并遞給觀眾。
我們觀察到,從識(shí)別到用戶(hù)指令、到定位目標(biāo)、再到抓取、遞送飲料,全程一氣呵成,完全由VLA模型自主推理實(shí)現(xiàn),智能化程度令人嘆為觀止。
深入了解之后,我們發(fā)現(xiàn),這是一家去年2月成立的具身智能創(chuàng)業(yè)公司「千尋智能」。該公司致力于研發(fā)通用人形機(jī)器人和下一代具身大模型,締造新一代智慧勞動(dòng)力。
千尋智能展臺(tái)上的這款人形機(jī)器人正是該公司六月正式發(fā)布的「Moz1」,它是國(guó)內(nèi)首個(gè)高精度全身力控的具身智能機(jī)器人,擁有26個(gè)自由度(不含靈巧手),一體化關(guān)節(jié)的功率密度比特斯拉人形機(jī)器人Optimus還高15%,在速度、精度、安全性和仿生力控方面都達(dá)到了行業(yè)最高水平。
紙面實(shí)力如此強(qiáng)悍,Moz1還能帶來(lái)哪些驚喜?在千尋智能展臺(tái),我們見(jiàn)識(shí)到了它更多驚艷的技能。
人形機(jī)器人Moz1「秀翻」WAIC全場(chǎng)
在WAIC現(xiàn)場(chǎng),機(jī)器人帶來(lái)的震撼幾乎時(shí)時(shí)都在上演。
我們首先來(lái)到了千尋智能Moz1的運(yùn)動(dòng)控制區(qū)
在這里,Moz1正在展示其卓越的整機(jī)協(xié)調(diào)性、動(dòng)態(tài)平衡性、動(dòng)作穩(wěn)定性、智能規(guī)劃等多個(gè)關(guān)鍵維度的核心能力。
看,Moz1秀起了太空步,全身隨意動(dòng)作但手臂拿水不撒:
智能S型極限壓彎也不在話下:
由此可見(jiàn),人形機(jī)器人在動(dòng)態(tài)環(huán)境中的適應(yīng)能力有了質(zhì)的提升。
接下來(lái)走向遙操作區(qū),Moz1的人機(jī)協(xié)作能力一覽無(wú)余。
在現(xiàn)場(chǎng)技術(shù)人員的指揮下大顯身手,Moz1玩起了掌上迷宮走珠:
還能搭積木:
秀起舞姿:
這意味著,Moz1在精細(xì)任務(wù)操作過(guò)程中的靈活性與精準(zhǔn)度拉滿了。
最后是機(jī)械臂疊衣區(qū),柔性物體操作顯然難不住它。
抓取、折疊、堆高,亂衣秒變豆腐塊:
一番體驗(yàn)下來(lái),最大的感受是:
如今的機(jī)器人不再滿足只完成預(yù)設(shè)任務(wù),還能根據(jù)環(huán)境變化做出智能決策,進(jìn)行自我優(yōu)化和調(diào)整,提升自身在真實(shí)環(huán)境與任務(wù)中的靈活性和應(yīng)對(duì)效率。
一句話,人形機(jī)器人的進(jìn)化速度正在超出我們的想象。對(duì)于千尋智能來(lái)說(shuō),支撐起這一切的背后是其全棧自研具身機(jī)器人技術(shù)以及軟硬協(xié)同推進(jìn)的體系化積累。
打造「腦體并進(jìn)」通用機(jī)器人框架
從創(chuàng)立之初,千尋智能便以同時(shí)打造「下一代具身大模型與通用人形機(jī)器人」為目標(biāo),機(jī)器人大腦與本體并舉。大模型負(fù)責(zé)學(xué)習(xí)與決策,機(jī)器人本體承擔(dān)感知與執(zhí)行,兩者協(xié)同進(jìn)化,打破軟硬件脫節(jié)的行業(yè)通病,開(kāi)發(fā)真正可泛化、落地的通用機(jī)器人。
其中,在模型層面采用端到端VLA(視覺(jué)-語(yǔ)言-動(dòng)作)技術(shù)路線,這也是近年來(lái)具身大模型領(lǐng)域的主流架構(gòu),如Figure的Helix、1X的RedwoodAI。通過(guò)打通感知、理解和執(zhí)行三大關(guān)鍵環(huán)節(jié),這一路線加速實(shí)現(xiàn)從理解世界到高效行動(dòng)的「通才具身智能體」,顯著提升機(jī)器人在真實(shí)世界的泛化與任務(wù)完成能力。
千尋智能瞄準(zhǔn)了通用機(jī)器人的這一現(xiàn)實(shí)可行落地框架,并于今年3月發(fā)布了自研的VLA模型Spiritv1,在適應(yīng)復(fù)雜多變環(huán)境和多樣化任務(wù)連續(xù)操作方面實(shí)現(xiàn)了代際躍升。如WAIC現(xiàn)場(chǎng)展示的那樣,該AI模型賦能的機(jī)械臂在國(guó)內(nèi)首次實(shí)現(xiàn)疊衣服的全流程順暢操作,一舉攻克柔性物體長(zhǎng)程操作這一行業(yè)難題。
此后,Spiritv1持續(xù)迭代升級(jí),探索并驗(yàn)證在更多真實(shí)任務(wù)場(chǎng)景中的實(shí)用性與魯棒性。上個(gè)月發(fā)布的全力控人形機(jī)器人Moz1便搭載了該自研模型,這也是其在機(jī)器人本體層面的重要落地成果,標(biāo)志著從「腦」到「體」的閉環(huán)系統(tǒng)已具備實(shí)戰(zhàn)部署能力。
在強(qiáng)大泛化能力的加持下,Moz1可以精準(zhǔn)完成桌面整理、扔垃圾、座椅歸位、擦黑板等辦公室多場(chǎng)景任務(wù),適應(yīng)性越來(lái)越強(qiáng),儼然一副「打雜小能手」的樣子。
整理桌面
扔垃圾
座椅歸位
擦黑板
可以預(yù)見(jiàn),隨著Moz1積累更多真實(shí)世界的交互經(jīng)驗(yàn),可以為后續(xù)承擔(dān)更高復(fù)雜度的協(xié)作任務(wù)打下基礎(chǔ)。未來(lái),Moz1有望從「能干活」進(jìn)化到「會(huì)思考」,成為辦公環(huán)境中的全能助理將不再只是夢(mèng)想。
Moz1「集多能力于一身」
當(dāng)然,除了軟件層面高度智能化、自主化的大腦之外,Moz1同樣在硬件領(lǐng)域?qū)崿F(xiàn)了多項(xiàng)突破性進(jìn)展,為其「行為像人」做足了工程落地上的準(zhǔn)備。包括如下:
全身配置26個(gè)自由度,賦予Moz1更強(qiáng)的靈活性和操作范圍,勝任精細(xì)化、多姿態(tài)任務(wù);搭載全球功率密度最高的一體化力控關(guān)節(jié),實(shí)現(xiàn)高輸出、高響應(yīng)動(dòng)力表現(xiàn),并兼顧輕量化與緊湊結(jié)構(gòu);國(guó)內(nèi)領(lǐng)先的高精高速WBC(全身運(yùn)動(dòng)控制)系統(tǒng),優(yōu)化手腳聯(lián)動(dòng)、軀干配合等復(fù)雜動(dòng)作規(guī)劃;負(fù)載自重比達(dá)1:1,與自身重量相當(dāng)?shù)呢?fù)載能力使其在實(shí)際任務(wù)中具備更強(qiáng)實(shí)用性。
配合性能強(qiáng)大且深度融合的大小腦,Moz1實(shí)現(xiàn)了多模態(tài)感知交互與全身協(xié)同。此外,Moz1還做到了全身零延時(shí)遙操作,配合自研的多維度數(shù)采設(shè)備,能夠高效完成數(shù)據(jù)采集,并支撐模型小時(shí)級(jí)迭代。這樣一來(lái),Moz1從一臺(tái)單純的執(zhí)行機(jī)器化身為「邊干邊學(xué)」的數(shù)據(jù)閉環(huán)系統(tǒng)。
種種軟硬件突破,貫穿從算法模型到本體設(shè)計(jì)、從運(yùn)動(dòng)控制到任務(wù)執(zhí)行的全棧式優(yōu)化,使得Moz1具備了第一梯隊(duì)實(shí)力。這種「AI模型進(jìn)化+硬件性能突破」的深度協(xié)同模式,構(gòu)筑起了千尋智能在具身智能賽道的核心技術(shù)壁壘和差異化優(yōu)勢(shì)
Spiritv1以及Moz1,是千尋智能成立一年多來(lái)交出的一份優(yōu)秀答卷。未來(lái),千尋智能一方面繼續(xù)探索VLA模型與機(jī)器人本體在更多復(fù)雜環(huán)境與真實(shí)任務(wù)中的深度耦合與協(xié)同演進(jìn),進(jìn)一步提升系統(tǒng)的泛化能力與執(zhí)行穩(wěn)定性。
另一方面,在商業(yè)化布局上以需求為導(dǎo)向,深入制造業(yè)、服務(wù)業(yè)等上百個(gè)核心場(chǎng)景(如辦公場(chǎng)景、家庭場(chǎng)景)展開(kāi)調(diào)研,瞄準(zhǔn)真實(shí)產(chǎn)業(yè)痛點(diǎn)并轉(zhuǎn)化為產(chǎn)品定義的核心參數(shù),形成「場(chǎng)景需求—技術(shù)攻關(guān)—產(chǎn)品落地—市場(chǎng)反饋」的閉環(huán)開(kāi)發(fā)邏輯,推動(dòng)具身智能從技術(shù)驗(yàn)證走向大規(guī)模商業(yè)應(yīng)用。
而作為行業(yè)少有的兼?zhèn)洹缸匝写竽P汀C(jī)器人本體、場(chǎng)景落地」全鏈路能力的創(chuàng)企,千尋智能的這種前瞻性布局,既契合了行業(yè)對(duì)機(jī)器人高度靈活性、通用性和自適應(yīng)性的需求,并朝著更智能、跨場(chǎng)景應(yīng)用方向演進(jìn)。
資本持續(xù)加碼,押注的不只是技術(shù)
ChatGPT推出以來(lái),除了大模型,資本也在尋找下一個(gè)爆點(diǎn),其中能夠理解世界、進(jìn)行推理并執(zhí)行任務(wù)的具身機(jī)器人被認(rèn)為有望掀起下一波AI浪潮。
最后一兩年,在國(guó)內(nèi),無(wú)論是宇樹(shù)機(jī)器人這樣的頂流明星,還是千尋智能、智元機(jī)器人、星動(dòng)紀(jì)元等具身智能新勢(shì)力,都受到了資本的高度青睞與追捧,進(jìn)入到一個(gè)融資集中爆發(fā)期。
就以千尋智能來(lái)說(shuō),成立不到一年半的時(shí)間,這家具身智能新秀憑借行業(yè)領(lǐng)先的AI+機(jī)器人全棧技術(shù)實(shí)力,先后完成了多輪融資,包括這周官宣的近6億元PreA+輪融資,由京東領(lǐng)投,中網(wǎng)投、浙江省科創(chuàng)母基金、華泰紫金、復(fù)星銳正等知名機(jī)構(gòu)跟投。同時(shí)順為資本、華控基金等老股東追加了投資。
一眾資本對(duì)千尋智能的高度認(rèn)可,靠的不單單是其領(lǐng)先的大模型技術(shù)和成熟的機(jī)器人產(chǎn)品,具身智能的賽道紅利以及創(chuàng)始團(tuán)隊(duì)的影響同樣不可忽視。
據(jù)此前高盛預(yù)測(cè),到2035年,全球人形機(jī)器人市場(chǎng)規(guī)模有望達(dá)到1540億美元。這意味著巨大的增量市場(chǎng)空間等著包括中國(guó)在內(nèi)全球機(jī)器人玩家挖掘,資本持續(xù)看漲在意料之中。
不久前,英偉達(dá)CEO黃仁勛在參加第三屆鏈博會(huì)期間,表示他對(duì)中國(guó)機(jī)器人發(fā)展非常樂(lè)觀,「中國(guó)擁有三大獨(dú)特優(yōu)勢(shì),包括卓越的人工智能技術(shù)、擅長(zhǎng)機(jī)電一體化、大規(guī)模制造業(yè)基地提供龐大的潛在市場(chǎng)」。老黃的這番言論一定程度上道出了中國(guó)在具身智能領(lǐng)域迅速崛起的原因。
隨著大模型與機(jī)器人深度融合,像千尋智能這樣的本土機(jī)器人企業(yè)憑借AI技術(shù)的積累、強(qiáng)大的硬件制造能力和豐富的應(yīng)用場(chǎng)景,正在形成從底層技術(shù)到終端產(chǎn)品的完整生態(tài)閉環(huán)。加上創(chuàng)始人兼CEO韓峰濤、聯(lián)合創(chuàng)始人高陽(yáng)與鄭靈茵擁有的豐富全球市場(chǎng)實(shí)踐經(jīng)驗(yàn),形成「技術(shù)研發(fā)—產(chǎn)品量產(chǎn)—市場(chǎng)驗(yàn)證」全鏈路,在具身智能賽道的激烈競(jìng)爭(zhēng)中走出一條高效的成長(zhǎng)路徑。
屆時(shí),人形機(jī)器人在形態(tài)和技能上又會(huì)玩出什么新花樣,我們拭目以待。
文中視頻鏈接:https://mp.weixin.qq.com/s/htBN5Md4ISGkp7-GtgNFxA