作者:周源/華爾街見聞
7月27日,在2025世界人工智能大會(huì)(WAIC)大模型論壇上,商湯科技推出“悟能”具身智能平臺(tái):以商湯具身世界模型為核心引擎,依托商湯大裝置提供端側(cè)和云側(cè)算力支持,能為機(jī)器人、智能設(shè)備提供感知、視覺導(dǎo)航及多模態(tài)交互能力;同時(shí),該平臺(tái)支持嵌入到端側(cè)芯片和機(jī)器人等終端硬件。
這是商湯在具身智能領(lǐng)域的具體實(shí)踐,也為智能設(shè)備發(fā)展提供新的技術(shù)選項(xiàng)。
商湯“悟能”具身智能平臺(tái)的核心引擎是具身世界模型,這是一套復(fù)雜動(dòng)態(tài)系統(tǒng):非簡(jiǎn)單靜態(tài)復(fù)制物理世界,而是通過(guò)持續(xù)學(xué)習(xí)和整合海量數(shù)據(jù),構(gòu)建一個(gè)能實(shí)時(shí)反映物理世界變化的數(shù)字化鏡像,類似于物理世界的數(shù)字化入口。
這些海量數(shù)據(jù)涵蓋了物理環(huán)境的空間結(jié)構(gòu)、物體的物理屬性、各類事件的發(fā)生規(guī)律、以及人類的行為模式等多方面信息。
商湯具身世界模型的運(yùn)作邏輯,類似于人類對(duì)世界的認(rèn)知過(guò)程。
人類通過(guò)眼耳鼻等感官獲取信息,在大腦中形成對(duì)世界的理解并指導(dǎo)行動(dòng),而具身世界模型則通過(guò)傳感器等設(shè)備收集環(huán)境數(shù)據(jù),經(jīng)過(guò)算法處理形成對(duì)世界的“認(rèn)知”,進(jìn)而為智能設(shè)備提供決策依據(jù)。
這個(gè)模型能根據(jù)新輸入的數(shù)據(jù)不斷更新自身“認(rèn)知”,就像人類在經(jīng)歷新事物后會(huì)調(diào)整對(duì)世界的看法一樣。
依靠商湯大裝置提供的端側(cè)和云側(cè)算力支撐,“悟能”具身智能平臺(tái)能為機(jī)器人及智能設(shè)備提供感知、視覺導(dǎo)航和多模態(tài)交互等基礎(chǔ)能力。
在感知層,平臺(tái)整合各類傳感器數(shù)據(jù),借助具身世界模型分析環(huán)境信息。
比如在家庭場(chǎng)景,搭載“悟能”具身智能平臺(tái)的機(jī)器人,有能力識(shí)別家具布局、家庭成員及溫濕度等;在辦公環(huán)境,也能區(qū)分辦公設(shè)備和文件資料。
這種感知受光線、遮擋等環(huán)境因素影響明顯,“悟能”平臺(tái)的感知能力正是通過(guò)設(shè)備與環(huán)境的持續(xù)交互逐步完善;在常規(guī)環(huán)境條件下,能穩(wěn)定輸出環(huán)境信息。
視覺導(dǎo)航功能,主要解決設(shè)備自主移動(dòng)問(wèn)題。該平臺(tái)通過(guò)具身世界模型解析空間,為機(jī)器人規(guī)劃路徑避開障礙物。
在倉(cāng)庫(kù)等結(jié)構(gòu)化環(huán)境中,物流機(jī)器人可借此平臺(tái)完成貨物轉(zhuǎn)運(yùn);室內(nèi)走廊場(chǎng)景,服務(wù)機(jī)器人能沿設(shè)定路線行進(jìn),在預(yù)設(shè)場(chǎng)景內(nèi)可實(shí)現(xiàn)精準(zhǔn)的點(diǎn)對(duì)點(diǎn)移動(dòng)。
多模態(tài)交互支持語(yǔ)音與視覺方式。語(yǔ)音可傳達(dá)基礎(chǔ)指令,視覺能識(shí)別簡(jiǎn)單手勢(shì)和表情輔助,以理解用戶意圖。
智能音箱通過(guò)平臺(tái),既能響應(yīng)語(yǔ)音指令,也能依手勢(shì)調(diào)音量,在日常基礎(chǔ)交互場(chǎng)景中可滿足用戶的常規(guī)操作需求。
“悟能”具身智能平臺(tái)的硬件適配具有靈活性,可應(yīng)用于人形機(jī)器人、服務(wù)機(jī)器人及部分智能設(shè)備。
這樣的適配性,讓平臺(tái)能在不同場(chǎng)景測(cè)試應(yīng)用,為硬件廠商提供技術(shù)集成選擇。
技術(shù)哲學(xué)家劉易斯?芒福德在《技術(shù)與文明》中強(qiáng)調(diào),技術(shù)并非是外在于人類生活的存在,而是深度嵌入并塑造了人類生活的方方面面。
“悟能”具身智能平臺(tái)正是通過(guò)適配不同硬件,在實(shí)際場(chǎng)景中發(fā)揮作用,深入改變或重塑人類生活。
從技術(shù)體驗(yàn)角度看,平臺(tái)支持嵌入端側(cè)芯片,實(shí)際應(yīng)用價(jià)值顯著:能減少對(duì)云端算力依賴,設(shè)備在網(wǎng)絡(luò)不穩(wěn)定時(shí)仍能維持基本功能;端側(cè)處理加快響應(yīng)速度,降低數(shù)據(jù)傳輸延遲。
以智能家居設(shè)備為例,智能門鎖嵌入平臺(tái)后,本地處理人臉信息速度提升,減少數(shù)據(jù)上傳云端需求,時(shí)延降低,在家庭安防場(chǎng)景中體驗(yàn)更好,功能表現(xiàn)更穩(wěn)定。
應(yīng)用場(chǎng)景包括家庭、辦公和工業(yè)領(lǐng)域:家庭機(jī)器人可協(xié)助做清潔、搬運(yùn)等簡(jiǎn)單家務(wù);辦公場(chǎng)景,智能設(shè)備輔助文件分類、會(huì)議室預(yù)約;工業(yè)環(huán)境,機(jī)器人參與零部件搬運(yùn)、基礎(chǔ)質(zhì)檢。
商湯科技董事長(zhǎng)兼CEO徐立,在現(xiàn)場(chǎng)展示了搭載具身世界引擎的人形機(jī)器人講解《長(zhǎng)安的荔枝》PPT的效果,該機(jī)器人語(yǔ)言自然幽默,可自動(dòng)翻頁(yè)并回答各類問(wèn)題,還能做階段性小結(jié)。
這個(gè)展示直觀呈現(xiàn)平臺(tái)交互功能,體現(xiàn)當(dāng)前具身智能的實(shí)際水平。
在技術(shù)發(fā)展方面,“悟能”平臺(tái)的感知全面性、導(dǎo)航適應(yīng)性和交互深度,都有明確優(yōu)化方向。未來(lái),商湯將通過(guò)收集應(yīng)用數(shù)據(jù)迭代具身世界模型,提升平臺(tái)穩(wěn)定性和適用性。
此過(guò)程中,行業(yè)合作至關(guān)重要,具身智能領(lǐng)域,企業(yè)合作匯聚優(yōu)勢(shì)能將有效推動(dòng)技術(shù)進(jìn)步。具身智能作為人工智能發(fā)展方向,進(jìn)步依賴技術(shù)積累和場(chǎng)景驗(yàn)證。
“悟能”平臺(tái)是商湯的一次實(shí)踐,實(shí)際價(jià)值將在后續(xù)應(yīng)用中逐步顯現(xiàn)。
對(duì)行業(yè)而言,這種探索推動(dòng)具身智能從概念走向?qū)嵺`,為智能設(shè)備發(fā)展提供更多技術(shù)路徑。
站在用戶角度,平臺(tái)價(jià)值體現(xiàn)在使用體驗(yàn)。機(jī)器人和智能設(shè)備能否解決實(shí)際問(wèn)題、保持穩(wěn)定可靠,是衡量?jī)r(jià)值的關(guān)鍵。
“悟能”平臺(tái)現(xiàn)有功能為需求實(shí)現(xiàn)提供可能,將通過(guò)持續(xù)改進(jìn)貼近用戶期待。
在技術(shù)落地過(guò)程中,成本控制是關(guān)鍵環(huán)節(jié)。
平臺(tái)集成成本、設(shè)備制造成本影響普及程度,商湯及合作方正探索在保證功能前提下降低成本的路徑。
總體而言,“悟能”具身智能平臺(tái)是人工智能在具身領(lǐng)域的具體實(shí)踐,具備一定技術(shù)特點(diǎn)和應(yīng)用潛力,同時(shí)面臨技術(shù)完善、場(chǎng)景適配、成本控制等現(xiàn)實(shí)課題。
這類平臺(tái)的發(fā)展,取決于技術(shù)迭代速度、市場(chǎng)反饋及行業(yè)合作深度,需要時(shí)間來(lái)呈現(xiàn)最終效果。
穿越到一片異界大陸后 揚(yáng)天開局得到系統(tǒng), 復(fù)制了項(xiàng)羽的血脈, 由此開啟開掛之旅 幫助項(xiàng)羽打倒劉邦, 隨著劍客到達(dá)長(zhǎng)安不夜城, 一些列歷險(xiǎn)后, 發(fā)現(xiàn)了神明和人類統(tǒng)治者沆瀣一氣的陰謀 延伸閱讀:與 :!! 的相關(guān)文章