課本里的化學(xué)之父,為什么被送上斷頭臺(tái)?【歷史調(diào)研室79】
媒體實(shí)探少林寺迎新住持后首個(gè)周末:幾乎無(wú)收費(fèi)項(xiàng)目,游客量不減
作者:周源/華爾街見(jiàn)聞
最近有消息稱(chēng),小鵬機(jī)器人中心新成立智能擬態(tài)部,將目光鎖定于機(jī)器人多模態(tài)領(lǐng)域,研究方向涵蓋具身智能原生多模態(tài)大模型、世界模型、空間智能等前沿范疇。
公開(kāi)消息顯示,掌舵該部門(mén)的葛藝瀟履歷奪目。
葛藝瀟曾在騰訊ARCLab擔(dān)任技術(shù)專(zhuān)家,年僅28歲便晉升為騰訊T12技術(shù)專(zhuān)家級(jí),在多模態(tài)領(lǐng)域建樹(shù)頗豐,2023年和2024年連續(xù)兩年榮膺騰訊技術(shù)突破獎(jiǎng)。
在本科畢業(yè)于華中科技大學(xué)自動(dòng)化學(xué)院后,葛藝瀟進(jìn)入香港中文大學(xué)MMLab攻讀博士學(xué)位,聚焦計(jì)算機(jī)視覺(jué)中的表征學(xué)習(xí)研究,在NeurIPS、ICLR、ECCV等國(guó)際頂級(jí)會(huì)議發(fā)表多篇論文。
當(dāng)前包括葛藝瀟在內(nèi),該部門(mén)僅有3名成員,但這只是起步。目前該部門(mén)已開(kāi)啟社招、校招和實(shí)習(xí)招聘,招聘崗位為“研究科學(xué)家(多模態(tài)方向)”,從職位描述“構(gòu)建行業(yè)領(lǐng)先的具身智能原生多模態(tài)大模型、世界模型,具備應(yīng)用于通用人形機(jī)器人乃至更多具身場(chǎng)景下的潛力”、以及“打造技術(shù)影響力,引領(lǐng)國(guó)際行業(yè)發(fā)展”中,能深切感受到小鵬對(duì)這個(gè)新部門(mén)寄予的厚望。
三大研究方向
在機(jī)器人技術(shù)演進(jìn)歷程中,傳統(tǒng)機(jī)器人在感知與交互層面存在明顯短板,僅能基于單一或少數(shù)幾種信息源開(kāi)展工作,這極大限制了在復(fù)雜環(huán)境中的作業(yè)能力。
首先是具身智能原生多模態(tài)大模型的出現(xiàn),有望從根本上改變這一局面。
這致力于賦予機(jī)器人全方位感知與交互能力,使機(jī)器人如同人類(lèi)一般,能同步處理視覺(jué)、聽(tīng)覺(jué)、觸覺(jué)等多元感知信息。
以家庭服務(wù)場(chǎng)景為例,當(dāng)前多數(shù)家用機(jī)器人僅能執(zhí)行簡(jiǎn)單的清掃任務(wù),面對(duì)復(fù)雜指令往往無(wú)所適從。
若具身智能原生多模態(tài)大模型取得實(shí)質(zhì)性進(jìn)展,機(jī)器人將可精準(zhǔn)識(shí)別主人的語(yǔ)音指令、手部動(dòng)作,同時(shí)感知周?chē)h(huán)境中的障礙物,進(jìn)而流暢完成諸如收拾房間、照顧老人等復(fù)雜且細(xì)致的任務(wù)。
在工業(yè)生產(chǎn)場(chǎng)景,機(jī)器人能綜合視覺(jué)識(shí)別零部件形狀與位置、觸覺(jué)感知裝配力度,實(shí)現(xiàn)產(chǎn)品組裝的高效與精準(zhǔn),顯著提升生產(chǎn)效率與質(zhì)量。
從技術(shù)原理看,該模型需要突破多模態(tài)數(shù)據(jù)融合、統(tǒng)一表征學(xué)習(xí)等難題,構(gòu)建能對(duì)多種感知信息進(jìn)行協(xié)同處理的架構(gòu)體系,這對(duì)算法設(shè)計(jì)與算力支撐提出極高要求。
其次,世界模型的構(gòu)建,旨在讓機(jī)器人通過(guò)觀察與交互,深度理解世界的運(yùn)作規(guī)律。
過(guò)往機(jī)器人在執(zhí)行任務(wù)時(shí),嚴(yán)重依賴(lài)預(yù)設(shè)程序,面對(duì)環(huán)境變化或新任務(wù)時(shí)靈活性不足,而世界模型能幫助機(jī)器人推測(cè)感知未觸及的世界狀態(tài)信息,并對(duì)未來(lái)狀態(tài)變化做出合理預(yù)測(cè)。
在工廠環(huán)境中,機(jī)器人借助世界模型,能深入了解工廠布局、設(shè)備運(yùn)行機(jī)制,提前預(yù)判執(zhí)行操作時(shí)可能出現(xiàn)的問(wèn)題,如零件供應(yīng)延遲、操作流程沖突等,從而提前調(diào)整工作節(jié)奏與方式,提升生產(chǎn)效率與準(zhǔn)確性。
當(dāng)機(jī)器人置身新環(huán)境或面對(duì)新任務(wù)時(shí),世界模型使其能依據(jù)已有知識(shí)經(jīng)驗(yàn)進(jìn)行推理、嘗試,擺脫對(duì)預(yù)設(shè)程序的過(guò)度依賴(lài)。
比如在物流倉(cāng)庫(kù),機(jī)器人可依據(jù)世界模型理解貨物存儲(chǔ)規(guī)則、搬運(yùn)流程,在貨物擺放位置改變時(shí),迅速規(guī)劃新的搬運(yùn)路徑,高效完成貨物搬運(yùn)任務(wù)。
從技術(shù)實(shí)現(xiàn)角度,世界模型需要整合大量環(huán)境數(shù)據(jù),運(yùn)用機(jī)器學(xué)習(xí)、強(qiáng)化學(xué)習(xí)等方法構(gòu)建能準(zhǔn)確反映環(huán)境動(dòng)態(tài)變化的模型結(jié)構(gòu),實(shí)現(xiàn)對(duì)復(fù)雜環(huán)境的精確建模與預(yù)測(cè)。
第三,空間智能聚焦于機(jī)器人對(duì)三維空間信息的精準(zhǔn)理解與高效運(yùn)用。
在物流倉(cāng)儲(chǔ)、建筑施工等實(shí)際場(chǎng)景中,機(jī)器人需要對(duì)三維空間中的物體做精準(zhǔn)感知與操作。
目前,多數(shù)機(jī)器人在空間感知與操作上精度有限,難以滿足復(fù)雜任務(wù)需求。
具備強(qiáng)大空間智能的機(jī)器人能精確判斷物體的位置、形狀、大小及其空間關(guān)系,高效完成各類(lèi)空間任務(wù)。
在建筑施工現(xiàn)場(chǎng),機(jī)器人可借助空間智能識(shí)別建筑材料位置,規(guī)劃吊運(yùn)路線,精準(zhǔn)完成材料運(yùn)輸,避免與施工人員、其他設(shè)備碰撞;在物流倉(cāng)儲(chǔ)中,機(jī)器人能快速定位貨物存儲(chǔ)位置,優(yōu)化貨物搬運(yùn)路徑,提高倉(cāng)儲(chǔ)空間利用率與貨物出入庫(kù)效率。
從技術(shù)層面剖析,空間智能涉及三維視覺(jué)感知、空間推理、路徑規(guī)劃等多個(gè)關(guān)鍵技術(shù)環(huán)節(jié),需要研發(fā)先進(jìn)的傳感器技術(shù)、算法模型以及實(shí)時(shí)計(jì)算能力,以確保機(jī)器人能實(shí)時(shí)、準(zhǔn)確地處理復(fù)雜的空間信息。
多模態(tài)的戰(zhàn)略?xún)r(jià)值
小鵬汽車(chē)董事長(zhǎng)何小鵬今年3月透露,小鵬汽車(chē)已在人形機(jī)器人產(chǎn)業(yè)深耕5年,未來(lái)可能還需投入20年,計(jì)劃投入500億元甚至上千億元。
何小鵬還提到小鵬汽車(chē)計(jì)劃2026年量產(chǎn)面向工業(yè)場(chǎng)景的L3級(jí)人形機(jī)器人,實(shí)現(xiàn)手、腳、眼、腦全向協(xié)同能力。
在5月財(cái)報(bào)電話會(huì)議上,何小鵬披露將在第五代機(jī)器人上部署圖靈芯片,大幅提升機(jī)器人端側(cè)算力,并跨越行業(yè)常用的強(qiáng)化學(xué)習(xí)小模型和分段式端到端技術(shù)路線,直接復(fù)用小鵬物理世界基座模型的VLA架構(gòu),充分利用云端AI基礎(chǔ)設(shè)施,提高機(jī)器人智能水平。
此次成立智能擬態(tài)部主攻多模態(tài),是小鵬在機(jī)器人領(lǐng)域長(zhǎng)期戰(zhàn)略布局的關(guān)鍵落子。
多模態(tài)技術(shù)堪稱(chēng)提升機(jī)器人智能的核心要素,它打破了傳統(tǒng)機(jī)器人感知與交互的局限,讓機(jī)器人從多個(gè)維度感知世界,獲取更豐富、全面的信息,進(jìn)而做出更合理、智能的決策,極大拓展了機(jī)器人的應(yīng)用場(chǎng)景與實(shí)用價(jià)值。
從戰(zhàn)略層面看,小鵬通過(guò)聚焦多模態(tài)技術(shù),有望在機(jī)器人領(lǐng)域構(gòu)建差異化競(jìng)爭(zhēng)優(yōu)勢(shì),為未來(lái)在智能出行、家庭服務(wù)、工業(yè)生產(chǎn)等多領(lǐng)域的拓展奠定堅(jiān)實(shí)基礎(chǔ)。
具身智能原生多模態(tài)大模型、世界模型、空間智能等研究方向處于行業(yè)前沿,技術(shù)難度極大。
在算法優(yōu)化方面,需要突破現(xiàn)有算法局限,開(kāi)發(fā)能高效處理多模態(tài)數(shù)據(jù)、實(shí)現(xiàn)精準(zhǔn)預(yù)測(cè)與決策的新算法;算力支持上,面對(duì)海量數(shù)據(jù)處理與復(fù)雜模型運(yùn)算需求,當(dāng)前算力水平捉襟見(jiàn)肘,亟待提升硬件性能與優(yōu)化計(jì)算架構(gòu)。
還有數(shù)據(jù)質(zhì)量,高質(zhì)量、多樣化且標(biāo)注精準(zhǔn)的數(shù)據(jù)是模型訓(xùn)練的基石,但獲取與整理此類(lèi)數(shù)據(jù)面臨諸多困難,如數(shù)據(jù)采集成本高、標(biāo)注準(zhǔn)確性難以保證等。
從行業(yè)競(jìng)爭(zhēng)態(tài)勢(shì)看,機(jī)器人領(lǐng)域技術(shù)路線競(jìng)爭(zhēng)激烈,各大企業(yè)與科研機(jī)構(gòu)紛紛布局。
小鵬以多模態(tài)為切入點(diǎn),雖避開(kāi)部分與巨頭的正面交鋒,但該技術(shù)路徑的可行性尚未得到充分驗(yàn)證,發(fā)展成果存在不確定性。
但要是一旦小鵬在多模態(tài)技術(shù)上取得突破,將可能重塑行業(yè)格局,推動(dòng)機(jī)器人行業(yè)向更智能、更高效的方向發(fā)展,為行業(yè)發(fā)展注入新活力與思路。
小甜文:強(qiáng)推《暖風(fēng)不及你情深》墨景深vs季暖,邪魅雅痞VS鬼靈精
繼《暖風(fēng)不及你情深》后的經(jīng)典小說(shuō),女主智商在線,男主很撩很蘇
高干文,大愛(ài)《暖風(fēng)不及你情深》,男主又蘇又撩,女主智商在線!