中國人工智能,再一次成為世界焦點。
7月26日—28日,2025世界人工智能大會(WAIC2025)在上海舉行。今年展覽面積首次突破7萬平方米,吸引800余家企業(yè)參展,集中發(fā)布3000余項前沿展品,包括40余款大模型、50余款AI終端產(chǎn)品、60余款智能機器人及100余款“全球首發(fā)”或“中國首秀”新品。
智能機器人,再一次成為“燃爆”全場的明星產(chǎn)品。
作為大會的“老朋友”,今年京東帶來了全新升級大模型品牌JoyAI,并全方位展示了京東在多場景的智能化解決方案,助力產(chǎn)業(yè)加速走向深度應用。從能高情商交互的人形機器人到企業(yè)高定的時尚數(shù)字人主播,從重塑企業(yè)工作流程的智能體搭子到低門檻、高可用的智能編碼助手,深度應用正在重塑人工智能生產(chǎn)力。
尤其是在今年熱門的機器人賽道上,京東動作頻頻。例如7月21日,京東被曝在智能機器人領(lǐng)域連下三城,完成三家具身智能領(lǐng)域頭部企業(yè)的投資,包括千尋智能、逐際動力和眾擎機器人等。京東正在不斷加碼,積極投入這一賽道。
“現(xiàn)在每家都有一輛車,以后也許每家都會有一個人形機器人或者其他更多形態(tài)的機器人?!痹诮衲甏髸希〇|集團高級副總裁、京東集團探索研究院副院長何曉冬對觀察者網(wǎng)等媒體表示,具身智能機器人正在從傳統(tǒng)意義上的工業(yè)場景,走向陪伴、服務等生活場景,規(guī)模上將擴大一兩個數(shù)量級,對用戶體驗影響也是最大的。
“未來的空間幾乎是無限的?!?/p>
具身智能應具備三大核心能力
早在2023年世界人工智能大會期間,何曉冬就在與觀察者網(wǎng)對話時表示,未來通用人工智能有兩個方向要走,一個方向是多模態(tài),大模型必須具有視覺能力,未來甚至可以更進一步延伸向嗅覺、觸覺;另外一個方向是走向具身智能,包括機器人、機械臂、無人車等,讓通用人工智能走向物理世界。
這些趨勢判斷,今天基本都成為了現(xiàn)實。
那么何為具身智能?
在何曉冬看來,從廣義上來講,智能和物理機器的結(jié)合,包括兩足人形、四足狗或其他形態(tài),都屬于具身智能的范疇。但如果要更確切地定義它,那么具身智能需具備三個核心模塊:
其一是擁有可控制運動的“小腦”,可以在物理世界行動——因為機器的運動能力,非常影響其體驗;其二是智慧的“大腦”,只擁有運動能力的機器仍是單調(diào)的,但有了“大腦”以后,它的感知能力、交互能力就會提升很多,可體驗性也會上升不少。
“第三點大家關(guān)注的比較少,但是很重要:I/O(輸入/輸出)交互能力。具身智能機器人,它涉及三個體系的交互:機器人、(客觀物理)世界和用戶。用戶的命令、需求、體驗要能夠讓機器人感受得到,機器人還能給出回饋,這就需要I/O交互能力。它和‘小腦’、‘大腦’共同構(gòu)成了具身智能的核心模塊?!?/p>
在何曉冬看來,未來具身智能的應用場景會非常廣闊。何曉冬指出,以前人們說得比較多的,是具身智能偏工業(yè)場景的應用——包括京東自己做物流、倉儲,這些場景應用了很多?,F(xiàn)在人們看到具身智能已經(jīng)開始走入更通用的生活場景,包括人形機器人、機器狗,從工業(yè)應用走上了陪伴,家庭服務等領(lǐng)域。
“這塊空間我認為是會比原來大更多的,可能會大一到兩個數(shù)量級都不止,對用戶體驗也是最直接的?!?/p>
“京東非常看好具身智能這個賽道和方向”
這是被曝密集投資機器人企業(yè)后,京東首次談論其動作背后的思考。
何曉冬對觀察者網(wǎng)等媒體表示,一方面,大力投資機器人企業(yè)是因為“看好這個方向”;另一方面,京東希望跟合作伙伴一起用最快的速度把整個這個行業(yè)發(fā)展起來——這也是京東提出“附身智能”背后的原因。
“京東對具身智能的觀念是開放的,不局限在人形機器人,所有在物理世界能夠跟用戶交互、還有一定情商智商的機器人,都是京東合作的方向?!焙螘远f,京東有自己的應用場景,包括物流、工業(yè),以及對普通消費者的家庭服務,比如家政、金融。有大量的應用場景是京東想做的。
“我們想通過附身智能這種合作方式,能夠給更多的合作伙伴增加能力,加快整個行業(yè)的發(fā)展?!?/p>
何曉冬透露,京東對具身智能的投入和戰(zhàn)略性認知是長遠的。首先,具身智能是未來一個很重要的賽道,是戰(zhàn)略性的,京東對此有很大的投入;再者,具身智能是京東整個服務生態(tài)的一部分,京東整體生態(tài)會從中具身智能的發(fā)展上受益;最后,京東的視野是開放的,具備“大腦”+“小腦”+“I/O”能力的,都在京東具身智能的范疇之內(nèi)。
在發(fā)展中解決問題,樂觀看待中國具身智能
談到今年WAIC的“機器人熱”,何曉冬表示,公眾對前沿技術(shù)的技術(shù)的期望是非常高的,所以很容易在世界人工智能大會這樣一個全球性的節(jié)點上引爆。
不過他也同時指出,真正的生活和實際應用上,具身智能要走入尋常人家庭,還有很多問題需要解決。
“比如說,我們現(xiàn)在比較關(guān)注的是機器人的手部能力。機器人要做服務的話,很多手部的操作必須要解決。雖然手很小,但手的關(guān)節(jié)很多,關(guān)節(jié)靈活度要求比腳多很多。我們也能看到:機器人前滾翻、后滾翻各種動作很流暢,但是看自由度難度的話,其難度比不過一只手。這塊其實是我們要關(guān)心的,還有很多工作要做?!?/p>
在何曉冬看來,另一個問題在于,大模型現(xiàn)在還沒有充分跟機器人結(jié)合。很多人經(jīng)常談到“空間智能”,讓機器人能夠有感知空間和思考判斷的能力?!氨热纾覀兡懿荒茏寵C器人進入房間,看一圈就知道誰在什么地方?再比如,我讓機器人把桌上的水杯拿過來,他能不能知道我說的是哪個水杯,精準定位?都還有很多問題需要解決?!?/p>
不過,何曉冬坦言,他本人對中國具身智能的發(fā)展持樂觀態(tài)度——任何產(chǎn)業(yè)只要開始走入用戶以后,特別是C端用戶以后,它的迭代速度就會非??臁@正是發(fā)生在中國各行各業(yè)的事情。
“就像自動駕駛,早期大家有很多討論,到底是應該先做L2還是先做L3?先用模擬數(shù)據(jù)還是真實數(shù)據(jù)?最后你看特斯拉先上L2,用上攝像頭,開始大量收集數(shù)據(jù)。數(shù)據(jù)上來以后,這兩年技術(shù)的進步是非常明顯的。所以我估計機器人可能也會走類似的路徑。”
(發(fā)言由現(xiàn)場錄音整理,未經(jīng)當事人審訂)
免責聲明:本文內(nèi)容由開放的智能模型自動生成,僅供參考。