在人工智能快速演進的當下,具身智能作為感知、行動和交互能力的融合,正逐漸成為技術創(chuàng)新的新方向。
商湯科技正加大在這一領域的布局。近日,在WAIC2025大模型論壇上,商湯正式發(fā)布其“悟能”具身智能平臺,標志著商湯在推動具身智能發(fā)展方面的又一進展。
據悉,“悟能”以商湯具身世界模型為核心引擎,依托商湯大裝置提供端側和云側算力支持,能夠為機器人、智能設備提供感知、視覺導航及多模態(tài)交互能力;“悟能”還可賦能機器人等各種終端硬件,實現(xiàn)對世界萬物的感知理解能力,并支持嵌入到端側芯片,具備較強的場景適配性。此外,“悟能”還能生成多視角視頻,確保較為良好的時間一致性和空間一致性,讓機器能夠理解、生成、編輯真實世界,在空間層面實現(xiàn)世界交互。
更關鍵的是,商湯具身世界模型能構建面向人、物、場的4D真實世界,用戶僅需輸入簡單的提示詞,比如“在廚房區(qū)域的架子上找東西”,“進入娛樂室、向右轉,然后打開通往院子的門”等,具身世界模型就能自主進行位姿、動作骨架和指令的生成。
商湯科技董事長兼CEO徐立在論壇上表示,“商湯‘開悟’世界模型,由日日新V6.5賦能,而‘開悟’世界模型也是視頻生成模型,但它考慮了時間、空間的一致性?!?/p>
徐立進一步解釋稱,比如自動駕駛需采集大量復雜視角,如七路攝像頭typo數據,開悟模型僅憑自然語言描述,即可生成逼真的七路攝像頭視角模擬數據。
“現(xiàn)在任何人都可以通過自然語言描述場景,生成符合3D物理規(guī)則、特定視角的視頻片段。我們要求的不是視頻質量達到電影級別,而是符合物理規(guī)則、物理定律,并且能夠真正意義上切進用戶的使用場景,讓你在真實世界開上極品飛車。”徐立表示,而這部分能力,完全可以擴展到機器人的學習和應用中。
值得一提的是,商湯在具身智能領域的探索并非首次。
今年4月,商湯在其2025技術交流日上已展示了基于SenseCore2.0大裝置訓練的具身智能成果,并與傅利葉、松應科技等公司達成戰(zhàn)略合作。
展覽期間,商湯科技還發(fā)布了日日新V6.5多模態(tài)大模型。據悉,日日新6.5獨創(chuàng)了圖文交錯思維鏈,跨模態(tài)推理精度有較大提升。
具體來看,傳統(tǒng)的多模態(tài)推理模型,在推理之前會將圖像轉變成文本解讀,后續(xù)的推理過程就變成了純文本。而在圖文交錯思維鏈當中,圖像會以本體的形式參與到整個推理過程。
在展覽現(xiàn)場,商湯還展示了一款搭載日日新V6.5多模態(tài)大模型的人形機器人。該機器人能夠進行自然流暢的PPT講解,并以生動有趣的互動對話吸引了大量參觀者注意。
有分析指出,通過這一系列的創(chuàng)新和技術積累,商湯正在逐步消除機器人和智能設備的“冷感”,讓它們能夠更好地融入人的日常生活,并在更復雜的環(huán)境中實現(xiàn)自主互動。這也是商湯AI技術逐步成為提升生產力的重要工具的體現(xiàn)。
而隨著多模態(tài)技術的不斷突破,具身智能也將不斷賦能機器人和智能設備,在各行各業(yè)中發(fā)揮越來越重要的作用。
諸天流神作《幻想世界大穿越》,探索無盡世界,窺探成神之謎!
主角本是一位即將畢業(yè)高中生,某天覺醒了神秘的穿越異能,能穿越到人類作品誕生的幻想世界。先到《永無止境》世界,通過(NZT)藥劑獲取超凡智慧。在到《超體》里面CPH4和露西的血液和干細胞解決副作用,能正常開啟超頻狀態(tài)。從笑傲和天龍世界,修行內功,踏上進化之路。在狂蟒之災世界,拿到長生的鑰匙-_。X戰(zhàn)警世界, 辰一十一的《明尊》總算更新了-。自從2022元旦之后他開始斷更,不知不覺已經過去快兩年兩個月了。這中間他倒也有露過面,更是在去年六月的時候半步復活,說是完成了手里定制的活,就去更新明尊。而為了恢復一下手感,也試著更新一下《幻想世界大穿越》的番外。只是大家也都看到了,大穿越的番外雖然也有更新,..13本已完結科技側諸天流小說,艦隊縱橫星海,基地遍布萬界