在人工智能快速演進的當下,具身智能作為感知、行動和交互能力的融合,正逐漸成為技術創(chuàng)新的新方向。
商湯科技正加大在這一領域的布局。近日,在WAIC2025大模型論壇上,商湯正式發(fā)布其“悟能”具身智能平臺,標志著商湯在推動具身智能發(fā)展方面的又一進展。
據悉,“悟能”以商湯具身世界模型為核心引擎,依托商湯大裝置提供端側和云側算力支持,能夠為機器人、智能設備提供感知、視覺導航及多模態(tài)交互能力;“悟能”還可賦能機器人等各種終端硬件,實現對世界萬物的感知理解能力,并支持嵌入到端側芯片,具備較強的場景適配性。此外,“悟能”還能生成多視角視頻,確保較為良好的時間一致性和空間一致性,讓機器能夠理解、生成、編輯真實世界,在空間層面實現世界交互。
更關鍵的是,商湯具身世界模型能構建面向人、物、場的4D真實世界,用戶僅需輸入簡單的提示詞,比如“在廚房區(qū)域的架子上找東西”,“進入娛樂室、向右轉,然后打開通往院子的門”等,具身世界模型就能自主進行位姿、動作骨架和指令的生成。
商湯科技董事長兼CEO徐立在論壇上表示,“商湯‘開悟’世界模型,由日日新V6.5賦能,而‘開悟’世界模型也是視頻生成模型,但它考慮了時間、空間的一致性?!?/p>
徐立進一步解釋稱,比如自動駕駛需采集大量復雜視角,如七路攝像頭typo數據,開悟模型僅憑自然語言描述,即可生成逼真的七路攝像頭視角模擬數據。
“現在任何人都可以通過自然語言描述場景,生成符合3D物理規(guī)則、特定視角的視頻片段。我們要求的不是視頻質量達到電影級別,而是符合物理規(guī)則、物理定律,并且能夠真正意義上切進用戶的使用場景,讓你在真實世界開上極品飛車?!毙炝⒈硎?,而這部分能力,完全可以擴展到機器人的學習和應用中。
值得一提的是,商湯在具身智能領域的探索并非首次。
今年4月,商湯在其2025技術交流日上已展示了基于SenseCore2.0大裝置訓練的具身智能成果,并與傅利葉、松應科技等公司達成戰(zhàn)略合作。
展覽期間,商湯科技還發(fā)布了日日新V6.5多模態(tài)大模型。據悉,日日新6.5獨創(chuàng)了圖文交錯思維鏈,跨模態(tài)推理精度有較大提升。
具體來看,傳統(tǒng)的多模態(tài)推理模型,在推理之前會將圖像轉變成文本解讀,后續(xù)的推理過程就變成了純文本。而在圖文交錯思維鏈當中,圖像會以本體的形式參與到整個推理過程。
在展覽現場,商湯還展示了一款搭載日日新V6.5多模態(tài)大模型的人形機器人。該機器人能夠進行自然流暢的PPT講解,并以生動有趣的互動對話吸引了大量參觀者注意。
有分析指出,通過這一系列的創(chuàng)新和技術積累,商湯正在逐步消除機器人和智能設備的“冷感”,讓它們能夠更好地融入人的日常生活,并在更復雜的環(huán)境中實現自主互動。這也是商湯AI技術逐步成為提升生產力的重要工具的體現。
而隨著多模態(tài)技術的不斷突破,具身智能也將不斷賦能機器人和智能設備,在各行各業(yè)中發(fā)揮越來越重要的作用。
編輯精選私藏讀物《嫡女蠻后》,磕cp停不下來了!
若是沒有上一世她從楚染薇那里嘗到的蝕骨之痛,她或許會被楚染薇的把戲給騙了,可是,她此時竟然病的如此巧合!楚家主母歿了,可是身邊此時除了她這個長女外竟然無人哭喪!反而全都跑去了楚染薇那里——。血模糊了指尖,陷進掌中,楚靈兒咬牙想道:“楚染薇,欠我的你還沒有還,這次你死了也就罷了,否則要是查到我娘的死因跟你有 楚丞相歷經風雨多年,在朝堂上什么樣的爾虞我詐沒見過|——。此時便也有些清醒,催促道,“先不過問緣由,先請大夫將解藥給小女兒開了|。靈兒,你隨我出來_|?!薄袄蠣斈荒芫瓦@樣放過大小姐??!”星兒手里端著盤子苦苦哀求,那一副小模樣,當真是在護主心切??墒浅爝b并不吃這一套,攬過靈兒的肩膀,快步走了出是什么——_。寵文,女帝早朝突然干嘔,九個攝政王逼她入墻角問“孩子是誰的”