智通財經(jīng)APP獲悉,國金證券發(fā)布研報稱,當(dāng)前具身智能真正缺乏的是第三階段的生物智能——模擬學(xué)習(xí)的能力,而物理AI正是構(gòu)建模擬學(xué)習(xí)的核心。通過梳理生物智能五階段的演變,該行認為人形機器人產(chǎn)業(yè)雖處早期,但模型側(cè)發(fā)展迅速,物理AI將成為解決機器人與物理世界交互最后一環(huán)的關(guān)鍵技術(shù)。重視3D數(shù)據(jù)資產(chǎn)+物理仿真引擎雙主線,看好中國物理AI稀缺資產(chǎn)。
國金證券主要觀點如下:
從生物智能五階段映射具身智能,模擬、規(guī)劃能力是當(dāng)前缺失環(huán)節(jié)
具身智能發(fā)展至今,從物理形態(tài)到大腦機理,機器人無一不在以“仿生”的脈絡(luò)發(fā)展演繹。該行認為,雖然目前人形機器人的產(chǎn)業(yè)發(fā)展階段尚處早期,但市場往往會高估原子層面的變化,而低估比特層面的變化——具身智能模型側(cè)的發(fā)展日新月異,因而該行試圖在本篇報告中詳細梳理生物智能五階段的變化,并逐階段地映射產(chǎn)業(yè)界的產(chǎn)品形態(tài)與模型算法。生物體億萬斯年的演化歷程,蘊含著解讀目前具身智能發(fā)展階段的鑰匙,該行認為,當(dāng)前具身智能真正缺乏的是第三階段的生物智能——模擬學(xué)習(xí)的能力,而物理AI正是構(gòu)建模擬學(xué)習(xí)的核心。
復(fù)盤智能駕駛模型算法演繹歷史,世界模型≈空間智能+物理AI
正如“線蟲學(xué)會轉(zhuǎn)向”是生物智能的起點,“行動導(dǎo)航”也是“具身智能”的起點,因而理解智能駕駛算法模型的演繹,對于理解機器人具身智能模型的發(fā)展階段及卡點,具有奠基性意義。同時由于具身智能產(chǎn)業(yè)尚處初期,業(yè)內(nèi)眾多明星創(chuàng)業(yè)公司的核心創(chuàng)始團隊均有過長期智能駕駛行業(yè)的從業(yè)經(jīng)驗,因而核心人才的遷移也必然伴隨核心算法、思想的遷移。
通過梳理復(fù)盤以特斯拉FSD為代表的智駕算法模型的演繹歷史,該行可以得出幾個結(jié)論:1)BEV架構(gòu)實現(xiàn)了2D圖像到3D空間的擴展,使得模型具備了初級空間智能的能力(這一點在理想、華為等車企身上更多是通過激光雷達實現(xiàn)的);2)傳統(tǒng)端到端算法的實質(zhì)是一個無模型的強化學(xué)習(xí),是快思考的系統(tǒng)1;3)現(xiàn)階段智駕中頻繁出現(xiàn)的VLM、VLA實質(zhì)是一個基于模型的強化學(xué)習(xí),是慢思考的系統(tǒng)2;4)是否應(yīng)用基于模型的強化學(xué)習(xí),對于智能駕駛而言也許僅僅是一個“好用”與“可用”之間的區(qū)別,而對于一臺通用人形機器人而言,則會直接導(dǎo)致“可用”與“不可用”的區(qū)別,而建立系統(tǒng)2的關(guān)鍵正在于模擬與規(guī)劃的能力,也即物理AI的仿真能力。
2025年CES上,英偉達發(fā)布Cosmos世界模型平臺,該行認為,世界模型≈空間智能+物理AI,也就是需要讓模型具備理解、生成3D幾何關(guān)系、距離等空間信息的能力,同時需要讓模型在3D空間中符合真實世界物理規(guī)律地與其他物體之間發(fā)生交互。
空間智能:讓模型理解3D空間中不同物體之間的幾何比例關(guān)系與位置距離信息
由于互聯(lián)網(wǎng)中并不直接存在海量的3D數(shù)據(jù),因而現(xiàn)階段的LLM與VLM仍然局限于對于文字、圖像&視頻等信息的生成與理解,而如果希望實現(xiàn)對于3D空間數(shù)據(jù)的Scaleup,目前而言有真實數(shù)據(jù)采集與仿真合成數(shù)據(jù)兩條路線。通過真實數(shù)據(jù)采集獲取的3D空間數(shù)據(jù)雖然質(zhì)量更高,但數(shù)據(jù)成本其實是房租+人力,規(guī)模效應(yīng)不強,較難降本且極為耗時。而通過Real2Sim2Real方式獲得的仿真合成數(shù)據(jù)的成本,則是GPU的仿真計算與渲染成本,降本路徑服從摩爾定律,且原始數(shù)據(jù)一般取材于真實物理空間,數(shù)據(jù)質(zhì)量并不低,是一條更有性價比且可以極大縮短數(shù)據(jù)采集時間的路徑。
物理AI:解決機器人與物理世界交互的最后一環(huán)
對于具身智能機器人而言,最后一個核心環(huán)節(jié)是嵌入模型的機器人需要與外部世界的物體發(fā)生真實的物理交互。這件事對于掃地機、割草機、智能駕駛汽車而言都不必須,原因是廣義的行動導(dǎo)航(或者智能駕駛)天然是反物理交互的,智能汽車唯一與外界的高頻物理交互是輪胎與地面的摩擦,除此之外可能發(fā)生的物理交互都是智駕模型竭力避免出現(xiàn)的(如追尾、撞人、剮蹭等),而機器人無論是家用服務(wù)場景還是工廠內(nèi)的勞動力替代場景,都需要高頻與外部環(huán)境進行交互,包括抓取水杯、搬運箱子等。而一旦涉及到物理交互,就會存在力反饋信息,需要服從合格的物理定律,否則將會產(chǎn)生嚴(yán)重的人身傷害及財產(chǎn)損失。物理AI正是在這樣的背景之下誕生,要去回應(yīng)當(dāng)前機器人產(chǎn)業(yè)“缺數(shù)據(jù)”的難題。
風(fēng)險提示
通用機器人Day1L4路線缺乏商業(yè)化基礎(chǔ)的風(fēng)險;仿真合成數(shù)據(jù)質(zhì)量不及預(yù)期的風(fēng)險;模型及軟件解決方案三方公司長期產(chǎn)業(yè)鏈話語權(quán)較低的風(fēng)險。
與麥共饕、面團的藝術(shù)與焙烤學(xué)的工藝??焙烤食品博士杜德春
30年賭命,50%全球市場:12億“牛磺酸王”的眼淚與笑聲
第29屆中國義烏國際小商品(標(biāo)準(zhǔn))博覽會譜寫新篇章
免責(zé)聲明:本文內(nèi)容由開放的智能模型自動生成,僅供參考。