7月27日,在以“大愛無疆?模塑未來”為主題的WAIC2025大模型論壇上,商湯科技正式發(fā)布了頗具亮點(diǎn)的「悟能」具身智能平臺(tái)。
該平臺(tái)以商湯具身世界模型作為核心引擎,借助商湯大裝置所提供的端側(cè)與云側(cè)算力支持,能夠?yàn)闄C(jī)器人、智能設(shè)備賦予強(qiáng)大的感知能力、視覺導(dǎo)航能力以及多模態(tài)交互能力,助力智能終端朝著更高水平的自主化和智能化方向發(fā)展。
「悟能」具身智能平臺(tái)可對(duì)機(jī)器人等各類終端硬件進(jìn)行賦能,使其具備對(duì)世間萬物的感知和理解能力。同時(shí),該平臺(tái)支持嵌入到端側(cè)芯片中,擁有出色的場景適配能力。
在論壇現(xiàn)場,商湯科技董事長兼首席執(zhí)行官徐立展示了搭載具身世界引擎的人形機(jī)器人。這款機(jī)器人在講解“長安的荔枝”PPT時(shí)表現(xiàn)出色,語言自然流暢且風(fēng)趣幽默,不僅能夠自動(dòng)翻頁,還能對(duì)各類問題進(jìn)行解答,并進(jìn)行階段性的小結(jié)。
商湯具身世界模型具備生成多視角視頻的能力,并且能夠保證視頻良好的時(shí)間一致性和空間一致性。這使得機(jī)器能夠?qū)φ鎸?shí)世界進(jìn)行理解、生成和編輯,在空間層面實(shí)現(xiàn)與世界的交互,讓“在真實(shí)街道場景中體驗(yàn)‘極品飛車’”這樣的場景成為現(xiàn)實(shí)。
此外,商湯具身世界模型還能構(gòu)建出面向人、物、場的4D真實(shí)世界。當(dāng)用戶輸入簡單提示詞,如“在廚房區(qū)域的架子上找東西”“進(jìn)入娛樂室、向右轉(zhuǎn),然后打開通往院子的門”等,具身世界模型就能自主完成位姿、動(dòng)作骨架和指令的生成。
徐立稱:“商湯希望「悟能」具身智能平臺(tái)能夠助力各類具身智能企業(yè),幫助它們實(shí)現(xiàn)與現(xiàn)實(shí)世界交互的夢想?!?/p>