宇樹(shù)機(jī)器人G1牽著G02機(jī)器狗在騰訊展位溜達(dá),眾擎PM01機(jī)器人在京東展位蹦跶……今年世界人工智能大會(huì)(WAIC),除了場(chǎng)館流量擔(dān)當(dāng)智元和宇樹(shù)機(jī)器人之外,互聯(lián)網(wǎng)大廠和機(jī)器人的聯(lián)動(dòng)也吸引了人群圍觀。
宇樹(shù)機(jī)器人G1牽著G02機(jī)器狗在騰訊展位溜達(dá)。
出現(xiàn)上述場(chǎng)景的背后是大廠在加速機(jī)器人領(lǐng)域的布局。南都N視頻記者梳理發(fā)現(xiàn),今年以來(lái),騰訊、阿里、美團(tuán)、百度、京東、小米7家大廠對(duì)具身智能企業(yè)總共投出23筆資金。
大廠布局具身智能的策略除了買(mǎi)買(mǎi)買(mǎi),還有搭建相關(guān)團(tuán)隊(duì)。目前,美團(tuán)、騰訊、京東、網(wǎng)易都搭建了自己的機(jī)器人團(tuán)隊(duì)。
在今年的WAIC上,大廠具身智能團(tuán)隊(duì)開(kāi)始交卷。騰訊、網(wǎng)易、商湯都推出了自己的行業(yè)模型產(chǎn)品,向行業(yè)伙伴開(kāi)放。京東推出了附身智能品牌JoyInside,并在此次大會(huì)上官宣了與眾多機(jī)器人企業(yè)的合作。
借助投資和推出具身智能產(chǎn)品“猛掐生態(tài)位”的同時(shí),大廠的布局各有側(cè)重。
騰訊、京東、商湯戰(zhàn)略級(jí)發(fā)布
7月27日,騰訊終于甩出一張具身智能“大牌”,宣布旗下RoboticsX實(shí)驗(yàn)室與福田實(shí)驗(yàn)室聯(lián)合發(fā)布具身智能開(kāi)放平臺(tái)Tairos“鈦螺絲”,首創(chuàng)以模塊化方式提供大模型、開(kāi)發(fā)工具和數(shù)據(jù)服務(wù)的具身智能軟件平臺(tái),通過(guò)即插即用的方式面向機(jī)器人行業(yè)開(kāi)放。
“我們可能會(huì)看到,有些機(jī)器人跑步頭掉了還在跑,手臂斷了還想去抓個(gè)東西,你可以很明顯地感覺(jué)到它連自己的身體狀態(tài)都沒(méi)有感知,并不是具身智能。”騰訊首席科學(xué)家、騰訊RoboticsX實(shí)驗(yàn)室主任、福田實(shí)驗(yàn)室主任張正友在接受南方都市報(bào)等媒體采訪時(shí)談道,針對(duì)目前具身智能的落地現(xiàn)狀,開(kāi)放平臺(tái)Tairos想做的是賦能整個(gè)機(jī)器人行業(yè)。
據(jù)介紹,該平臺(tái)為機(jī)器人本體與應(yīng)用開(kāi)發(fā)商補(bǔ)齊關(guān)鍵軟件能力,包含模型算法和云服務(wù)兩大組成部分。模型層面包含了多模態(tài)感知模型、規(guī)劃大模型以及感知行動(dòng)聯(lián)合大模型。云服務(wù)平臺(tái)則包含了仿真平臺(tái)、數(shù)據(jù)平臺(tái)以及開(kāi)發(fā)工具等,平臺(tái)通過(guò)標(biāo)準(zhǔn)化接口調(diào)用及軟件開(kāi)發(fā)工具包(SDK)的方式對(duì)外提供服務(wù)。
這些能力被當(dāng)天在騰訊發(fā)布會(huì)上的宇樹(shù)G1機(jī)器人表現(xiàn)得淋漓盡致——搭載開(kāi)放平臺(tái)Tairos的G1能自主走到演講臺(tái)上,還能在張正友的呼喚下來(lái)到其身邊,并準(zhǔn)確識(shí)別出講臺(tái)上“有一個(gè)電腦、一束花、兩個(gè)麥克風(fēng)”,也能拒絕張正友幫其拿筆記本的要求,坦言自己的機(jī)械手目前“攬不了瓷器活”。
搭載Tairos平臺(tái)的G1機(jī)器人與騰訊首席科學(xué)家張正友互動(dòng)。
與騰訊的路線類(lèi)似,在WAIC2025大模型論壇上,商湯科技也發(fā)布了“悟能”具身智能平臺(tái)。該平臺(tái)以商湯具身世界模型為核心引擎,依托商湯大裝置提供端側(cè)和云側(cè)算力支持,能夠?yàn)闄C(jī)器人、智能設(shè)備提供強(qiáng)大的感知、視覺(jué)導(dǎo)航及多模態(tài)交互能力,推動(dòng)智能終端向更高層次的自主化與智能化演進(jìn)。
據(jù)了解,用戶只需用一句自然語(yǔ)言描述場(chǎng)景,它就能為訓(xùn)練具身智能生成符合物理規(guī)則、多視角統(tǒng)一、真實(shí)世界還原度極高的多視角視頻。商湯用具身世界模型破解仿真數(shù)據(jù)輸出的難題,來(lái)賦能各種場(chǎng)景的機(jī)器人和機(jī)器狗。
京東今年在具身智能領(lǐng)域的能見(jiàn)度已越來(lái)越高。今年5月先是參與了大熱選手智元機(jī)器人的融資,隨后在7月連投三家機(jī)器人企業(yè)。在此次的WAIC上,京東還宣布其附身智能品牌JoyInside與數(shù)十家機(jī)器人企業(yè)達(dá)成合作,包括陪伴類(lèi)產(chǎn)品Fuzozo芙崽、火火兔,教育領(lǐng)域的元蘿卜AI、心大陸、Folotoy、嚕咔博士以及產(chǎn)業(yè)領(lǐng)域的眾擎、云深處、魔法原子等。
京東宣布其附身智能品牌JoyInside與數(shù)十家機(jī)器人企業(yè)達(dá)成合作。
在合作形式上,JoyInside將角色大模型驅(qū)動(dòng)對(duì)話智能體植入機(jī)器人、AI玩具等智能硬件,驅(qū)動(dòng)機(jī)器人生成與語(yǔ)義內(nèi)容高度協(xié)調(diào)統(tǒng)一的動(dòng)作,據(jù)了解,目前JoyInside為機(jī)器人、AI玩具、智能硬件等企業(yè)限時(shí)免費(fèi)開(kāi)放接入服務(wù)。
網(wǎng)易旗下工程機(jī)械智能化品牌網(wǎng)易靈動(dòng),則在此次WAIC正式推出了其全球首個(gè)專(zhuān)為露天礦山挖掘機(jī)裝車(chē)場(chǎng)景打造的具身智能模型——“靈掘”,并開(kāi)源了“靈掘”數(shù)據(jù)集,發(fā)布了“靈掘”的端到端訓(xùn)練框架“機(jī)械智心”。相比其他大廠,網(wǎng)易此次發(fā)布的方向更聚焦和垂直,南都N視頻記者了解到,“靈掘”的訓(xùn)練數(shù)據(jù)直接來(lái)自真實(shí)礦山作業(yè)場(chǎng)景,在內(nèi)蒙古某露天煤礦的嚴(yán)苛環(huán)境中,“靈掘”單機(jī)裝車(chē)效率已達(dá)人工80%,近70%作業(yè)時(shí)間無(wú)需人為干預(yù)。
大廠自建團(tuán)隊(duì)開(kāi)始交卷
今年以來(lái),隨著AI大模型企業(yè)進(jìn)入“大逃殺”階段,互聯(lián)網(wǎng)大廠的資金逐步流向被AI大模型深度影響的具身智能行業(yè)。南都記者梳理發(fā)現(xiàn),截至發(fā)稿,騰訊、阿里、美團(tuán)、百度、京東和小米7家大廠已對(duì)具身智能企業(yè)投出共23筆資金。其中,阿里最為激進(jìn),投出6筆,其次是美團(tuán),有5筆,京東投出4筆,騰訊和百度各投了3筆,小米2筆。
(南都N視頻記者根據(jù)IT桔子梳理)
除了押注具身智能初創(chuàng)企業(yè),美團(tuán)、騰訊、京東、網(wǎng)易也搭建了自己的機(jī)器人團(tuán)隊(duì)。另外有未經(jīng)證實(shí)的消息稱,商湯科技將成立獨(dú)立的具身智能公司,核心班底已經(jīng)初步搭建,由首席科學(xué)家王曉剛、陶大程等人領(lǐng)銜。在今年的WAIC上,大廠搭建的內(nèi)部機(jī)器人團(tuán)隊(duì)開(kāi)始對(duì)外推出產(chǎn)品。
京東在今年3月成立了相關(guān)業(yè)務(wù)部門(mén)切入具身智能領(lǐng)域,側(cè)重家用場(chǎng)景。當(dāng)時(shí)接近京東的人士表示,京東非常重視人工智能、自動(dòng)化以及機(jī)器人等領(lǐng)域的創(chuàng)新和應(yīng)用,內(nèi)部也有多支團(tuán)隊(duì)布局具身智能等前沿方向的研發(fā)。
7月在完成對(duì)3家機(jī)器人企業(yè)的投資后,京東方面向南都記者透露,附身智能品牌JoyInside也是京東內(nèi)部的一支重要力量。目前,京東在具身智能領(lǐng)域的布局集中在三個(gè)層面:一是京東依托過(guò)往的3C平臺(tái)優(yōu)勢(shì)提前布局機(jī)器人消費(fèi)入口,未來(lái)有望與頭部機(jī)器人企業(yè)開(kāi)展采購(gòu)和營(yíng)銷(xiāo)的合作;二是京東依托供應(yīng)鏈、數(shù)字人交互領(lǐng)域等大量數(shù)據(jù),沉淀了自己的產(chǎn)業(yè)大模型,未來(lái)該模型或能應(yīng)用在機(jī)器人上;三是京東自身也有物流、服務(wù)等場(chǎng)景,未來(lái)或可與投資企業(yè)構(gòu)成更多合作。
騰訊此次發(fā)布的具身智能開(kāi)放平臺(tái)Tairos出自RoboticsX實(shí)驗(yàn)室。該實(shí)驗(yàn)室成立于2018年,據(jù)張正友透露,“(團(tuán)隊(duì)成員)有些是偏前沿探索的,有些偏產(chǎn)品,有些則直接負(fù)責(zé)對(duì)外合作。合作伙伴提出一些要求我們做不了,當(dāng)做不了的要求有通用性時(shí)就會(huì)成為前沿研究的課題。”
騰訊方面強(qiáng)調(diào),目前在做Tairos時(shí)更強(qiáng)調(diào)用此前積累下來(lái)的經(jīng)驗(yàn)和成熟技術(shù)成果,作為產(chǎn)品提供給機(jī)器人廠商和第三方廠家,讓他們?nèi)バ纬勺约焊暾漠a(chǎn)品。目前,開(kāi)放平臺(tái)Tairos首批合作伙伴包括越疆科技、樂(lè)聚機(jī)器人、帕西尼感知科技、擎朗智能、眾擎機(jī)器人科技、宇樹(shù)科技等多家機(jī)器人公司。
談及未來(lái)兩三年的布局,網(wǎng)易靈動(dòng)業(yè)務(wù)負(fù)責(zé)人楊新偉向南都N視頻記者表示,網(wǎng)易伏羲不做本體。“中國(guó)不缺少工程機(jī)械供應(yīng)商,但在人工智能的浪潮下缺的是智能化的團(tuán)隊(duì)。我們?cè)敢馊プ龉こ虣C(jī)械智能化的大腦,跟合作伙伴一起為客戶提供解決方案。在可見(jiàn)的幾年內(nèi)我們不會(huì)做本體?!?/p>
南都記者了解到,目前網(wǎng)易伏羲在具身智能上有多方面布局。除了機(jī)器人品牌網(wǎng)易靈動(dòng),主要產(chǎn)品還包括智慧礦山挖掘機(jī)器人、攪拌站無(wú)人裝載機(jī)器人和港口清艙裝載機(jī)器人等等;底座平臺(tái)靈眾包云平臺(tái)則主要聚焦提供數(shù)據(jù)標(biāo)注服務(wù)。
商湯科技聯(lián)合創(chuàng)始人、執(zhí)行董事、首席科學(xué)家林達(dá)華此次在WAIC上透露,機(jī)器人和汽車(chē)有很多不同的特點(diǎn),但是從技術(shù)路徑上來(lái)看是相通的,而商湯在這一塊已經(jīng)有非常多的積累,未來(lái)也有很大機(jī)會(huì)。盡管商湯目前仍然只定位做機(jī)器人的大腦,但未來(lái)小腦、本體等方向也有可能涉及?!拔磥?lái)我們?cè)诤涂蛻簟⑸鷳B(tài)接觸的過(guò)程中,會(huì)逐漸豐富和完善技術(shù)體系,提供更多端到端的價(jià)值。但是具體做什么,我們會(huì)隨著時(shí)間不斷地調(diào)整判斷,與時(shí)俱進(jìn)?!?/p>
與騰訊有所不同,商湯科技推出“悟能”具身智能平臺(tái)時(shí)就強(qiáng)調(diào)研發(fā)與商業(yè)愿景要對(duì)齊。林達(dá)華透露,商湯內(nèi)部會(huì)以商業(yè)落地來(lái)校正商湯整體在具身智能上的科研布局航向,最終在商業(yè)上希望能形成強(qiáng)大的支撐和突破。
大廠猛掐生態(tài)位,頭部機(jī)器人企業(yè)狂奔
互聯(lián)網(wǎng)大廠在自己做硬件和投資之間,大多選擇了后者。
大廠并不是沒(méi)有動(dòng)過(guò)做硬件的心思。以騰訊為例,根據(jù)公開(kāi)信息,RoboticsX成立于2018年,2020年11月發(fā)布了當(dāng)時(shí)國(guó)內(nèi)首個(gè)能完成梅花樁復(fù)雜挑戰(zhàn)的四足機(jī)器人Jamoca和自平衡輪式移動(dòng)機(jī)器人;2021年3月發(fā)布了首個(gè)軟硬件全自研多模態(tài)四足機(jī)器人max,有腿也有輪還能雙腿站立。2023年起騰訊RoboticsX的產(chǎn)品就從整機(jī)開(kāi)始向機(jī)器人部件如靈巧手、擬人機(jī)械臂遷移,隨后是多模態(tài)感知規(guī)劃技術(shù)等模型技術(shù)。
回想RoboticsX剛成立的2018年,張正友坦言情況和現(xiàn)在相差很多?!澳菚r(shí)候你想找到一個(gè)能做機(jī)器人的硬件廠商?簡(jiǎn)直是沒(méi)有,所以我們既做硬件又做軟件,還要做智能各方面的規(guī)劃?!?/p>
張正友表示,2023年下半年開(kāi)始,整個(gè)機(jī)器人行業(yè)發(fā)生了很大變化,這些變化也促使騰訊在具身智能方面的戰(zhàn)略開(kāi)始調(diào)整。“一是ChatGPT引起AI大模型的關(guān)注,很多機(jī)器人企業(yè)、創(chuàng)業(yè)公司出現(xiàn)。從騰訊的角度,我們需要跟這些機(jī)器人硬件本體廠家一起打磨具身智能技術(shù),同時(shí)前沿探索還是很重要,但有些能力我們希望能跟機(jī)器人本體廠家一起去提升?!?/p>
總體來(lái)看,目前大廠在具身智能的布局方向還是偏數(shù)據(jù)、平臺(tái)和模型,這也是過(guò)往大廠的積累所在。知名數(shù)字經(jīng)濟(jì)學(xué)者、工信部信息通信經(jīng)濟(jì)專(zhuān)家委員會(huì)委員盤(pán)和林認(rèn)為,具身智能如今處于“掐生態(tài)位”的階段,互聯(lián)網(wǎng)大廠下場(chǎng),是為了在未來(lái)具身智能生態(tài)中占據(jù)關(guān)鍵位置。具身智能分為三層,決策層,感知層和控制執(zhí)行層,大多數(shù)互聯(lián)網(wǎng)大廠瞄準(zhǔn)的是決策層,因?yàn)檫@是這些大廠AI算法能力的延伸。
與此同時(shí),有頭部玩家指出,在具身智能初創(chuàng)企業(yè)的硬件壁壘上,互聯(lián)網(wǎng)大廠很難突破。北京大學(xué)助理教授、銀河通用機(jī)器人創(chuàng)始人及CTO、智源學(xué)者王鶴在本次WAIC提到,在基礎(chǔ)大模型上,互聯(lián)網(wǎng)大廠有很多互聯(lián)網(wǎng)用戶交互的渠道,獲取用戶的方式越多,獲取數(shù)量就越多,這些是初創(chuàng)公司很難競(jìng)爭(zhēng)的,但干活的大模型必須實(shí)現(xiàn)對(duì)非標(biāo)硬件的打造。“今天的互聯(lián)網(wǎng)大廠對(duì)硬件特別是對(duì)人形機(jī)器人動(dòng)輒上千個(gè)的硬件沒(méi)有完整的供應(yīng)鏈,大廠的大體量做事方式也是慢半拍的,在這件事情上目前初創(chuàng)企業(yè)有非常好的機(jī)會(huì)?!?/p>
在他身邊,一位觀眾在ipad上點(diǎn)單無(wú)糖可樂(lè)后,銀河通用Galbot機(jī)器人從貨架上精準(zhǔn)卸下一瓶飲料遞到取貨桌前,接著操作下一個(gè)訂單——農(nóng)夫山泉。值得一提的是,美團(tuán)早在去年年底就和銀河通用簽署了戰(zhàn)略合作協(xié)議,共同打造全球首個(gè)人形機(jī)器人智慧藥房解決方案,Galbot機(jī)器人可以完成取貨、送貨、補(bǔ)貨等工作,并自主規(guī)劃取送路徑,實(shí)現(xiàn)24小時(shí)無(wú)人值守。
銀河通用Galbot機(jī)器人在取貨、送貨。
在行業(yè)內(nèi),也有已具備全棧式布局能力的機(jī)器人人企業(yè)跑出。
在WAIC的“智啟具身論壇”上,智元機(jī)器人合伙人&具身業(yè)務(wù)部總裁姚卯青介紹,目前智元已經(jīng)打通了機(jī)器人本體、運(yùn)動(dòng)智能、交互智能、作業(yè)智能,實(shí)現(xiàn)“一體三智”全棧閉環(huán)發(fā)展,并構(gòu)建“數(shù)據(jù)-模型-本體-場(chǎng)景”四輪驅(qū)動(dòng)的具身智能飛輪體系。南都記者了解到,智元通過(guò)自建專(zhuān)業(yè)數(shù)采工廠已形成全球最大數(shù)據(jù)集AgiBotWorld并開(kāi)源,此次WAIC還發(fā)布了行業(yè)首個(gè)通用具身基座模型——啟元大模型,擁有“一腦多形”能力,可適配其他異構(gòu)機(jī)器人本體,并發(fā)布行業(yè)首個(gè)真正面向真實(shí)世界雙臂機(jī)器人的世界模型開(kāi)源平臺(tái)“GenieEnvisioner”。
“現(xiàn)階段的問(wèn)題在于,大多數(shù)大廠缺少感知層和控制層的經(jīng)驗(yàn),平臺(tái)算法和實(shí)際應(yīng)用需求方面存在脫節(jié),未來(lái)這些大廠會(huì)定向并購(gòu)一些感知層和執(zhí)行控制層的企業(yè),來(lái)完善自身具身智能生態(tài)?!北P(pán)和林告訴南都N視頻記者。
采寫(xiě)/攝影:南都N視頻記者林文琪發(fā)自上海
PS教程:矯正偏色的人物照片,還原“真相”??有FUN設(shè)計(jì)
電腦、Photoshopcc2019、素材圖片一張(偏色的人物圖片一張)方法/步驟:1、打開(kāi)人物素材圖片,首先,我們來(lái)觀察一下矯正前的人物照片,很明顯的,偏黃偏紅偏暖色,矯正偏色的辦法有很多,但原理都是一樣的,都是利用互補(bǔ)色此消彼長(zhǎng)的一個(gè)關(guān)系進(jìn)行矯正的。2、我們來(lái)看一下三原色圖,既然原圖偏紅偏黃,也就意味著我們后期要 在這篇教程中,我以Photoshop CC 2018為例進(jìn)行演示,但請(qǐng)注意,其他版本的Photoshop同樣適用,操作步驟大同小異_。Photoshop給照片添加圓角邊框效果l 打開(kāi)素材圖片文件在Photoshop中打開(kāi)我們的素材文件,將背景圖層復(fù)制一份-_。關(guān)于復(fù)制圖層,大家可以直接點(diǎn)頂部菜單欄的“圖層”,然后點(diǎn)“復(fù)制圖層”?;蛘?,直接將背景層拖有幫助請(qǐng)點(diǎn)贊|-。ps怎樣把模糊的照片變得清晰?