多模態(tài)信息感知與處理的能力,是AGI的核心要求,也是從語言模型邁向AGI的必由之路。
從多模態(tài)感知、推理,再到交互,多模態(tài)智能的演進(jìn)將驅(qū)動AI下一階段的發(fā)展。
2025年7月27日,由全國工商聯(lián)人工智能委員會主辦,商湯科技承辦的【大愛無疆·模塑未來】WAIC2025大模型論壇上,商湯科技發(fā)布全新「日日新SenseNovaV6.5」(簡稱“日日新V6.5”)大模型體系,多模態(tài)基座大模型迎來突破性升級,帶來AI從“生產(chǎn)力工具”到“生產(chǎn)力”的跨越。商湯旗下核心產(chǎn)品商湯小浣熊也完成智能體升級。
1950年,圖靈通過“模仿游戲”將AI定義為“類人能力”,但實際的AI一直未能擺脫“工具”的范疇,一度陷入發(fā)展低谷。而在大模型時代,AI憑借多模態(tài)融合能力的突破,逐步觸達(dá)AGI邊界,真正開始向“類人”標(biāo)準(zhǔn)靠近。
全國工商聯(lián)人工智能委員會主席團(tuán)首任輪值主席、商湯科技董事長兼首席執(zhí)行官徐立表示:“商湯科技始終探尋人工智能本質(zhì),以技術(shù)創(chuàng)新激發(fā)最大智能,推動AI完成從“工具”到‘人’的躍遷,成為真正的生產(chǎn)力。”
Part1:
日日新V6.5煥新:突破性升級觸碰“理解的深度”
據(jù)現(xiàn)場介紹,商湯「日日新V6.5」多模態(tài)基座大模型帶來三大突破性升級:
強推理:圖文交錯多模態(tài)思維鏈,推理性能比肩Gemini2.5Pro、Claude4-sonnet;
高效率:多模態(tài)架構(gòu)優(yōu)化,性價比提升3倍以上;
智能體:數(shù)據(jù)分析大幅領(lǐng)先,支持端到端的場景落地,實現(xiàn)價值閉環(huán)。
通過多模態(tài)思維鏈數(shù)據(jù)進(jìn)階圖文交錯思維鏈數(shù)據(jù)合成,商湯「日日新V6.5」多模態(tài)推理與交互性能實現(xiàn)了大幅提升:
【核心指標(biāo)】文本推理能力和多模態(tài)推理大幅提升,超越Gemini2.5Pro、Claude4-sonnet;多模態(tài)交互能力超越Gemini2.5Flash和GPT-4o,各方面性能突出
商湯「日日新V6.5」率先突破圖文交錯思維鏈技術(shù),在大模型中引入形象思維,成為國內(nèi)首個實現(xiàn)圖文交錯思維的商業(yè)級大模型。
在人類的思考中,形象思維和邏輯思維同等重要,兩者有機結(jié)合才能形成全面的思維能力。所謂“一圖勝千言”,一幅圖往往比大段文字更能引發(fā)有效思考。當(dāng)前,主流的多模態(tài)模型雖然已經(jīng)實現(xiàn)了在輸入端融合多種模態(tài),但思考推理過程依然主要依賴語言推理,圖形和空間推理仍存在短板。
多模態(tài)思維鏈構(gòu)造的關(guān)鍵在于信息的圖形化表達(dá),相比純文本思維鏈更具挑戰(zhàn),不僅要呈現(xiàn)文字思考過程,還需生成作為思考節(jié)點的圖像,難以通過純?nèi)斯し绞酱笠?guī)模實現(xiàn)。商湯研發(fā)團(tuán)隊先基于對思維過程的理解構(gòu)造種子數(shù)據(jù),經(jīng)監(jiān)督微調(diào)(SFT)訓(xùn)練讓模型初步具備圖文交錯思考能力,再通過多輪強化學(xué)習(xí)顯著提升多模態(tài)推理能力。
同時,商湯還改進(jìn)了多模態(tài)模型的融合架構(gòu),促進(jìn)跨模態(tài)早期融合。新的架構(gòu)采用了顯著變輕的視覺編碼器,以及深而窄的主干模型,使得視覺表征在前饋計算早期就與語言進(jìn)行對齊和交融,從而使感知更高效,模態(tài)融合更深。
據(jù)商湯表示,得益于模型架構(gòu)的改進(jìn),商湯「日日新V6.5」在實現(xiàn)成本優(yōu)化的同時,預(yù)訓(xùn)練吞吐量提升了20%以上,強化學(xué)習(xí)效率提升了40%,推理吞吐量提升了35%以上,取得性能和成本的完美平衡。相較「日日新V6.0」,「日日新V6.5」將性價比提升了3倍。
Part2:
AI是生產(chǎn)力:商湯小浣熊,辦公最強智能體登場
大語言模型已成為當(dāng)下不少人的工作輔助工具,但僅靠大語言模型,不足以讓AI完成從“工具”向“人”的躍升。
人類的日常任務(wù)活動,天然涉及對文本、圖像、視頻、網(wǎng)頁等多模態(tài)信息的處理。從生產(chǎn)力工具到生產(chǎn)力,關(guān)鍵就在于多模態(tài)信息的輸入、處理與輸出能力。
基于「日日新V6.5」強大的多模態(tài)數(shù)據(jù)分析能力,商湯小浣熊全面升級:能夠勝任多模態(tài)復(fù)雜輸入,進(jìn)行多模態(tài)融合深入分析,給出多模態(tài)結(jié)果輸出,實現(xiàn)專業(yè)的可視化呈現(xiàn),打造“辦公場景的AI生產(chǎn)力”,讓AI實現(xiàn)從「生產(chǎn)力工具」到「生產(chǎn)力」的跨越。
同時,商湯小浣熊始終保持世界領(lǐng)先的復(fù)雜數(shù)據(jù)分析能力。據(jù)現(xiàn)場介紹,在客戶場景的綜合測試中,小浣熊達(dá)到在數(shù)據(jù)分析和智能體領(lǐng)域的國際標(biāo)桿Claude4Opus的水平,大幅領(lǐng)先OpenAIo3等模型。其中,在時序計算、數(shù)據(jù)匹配、數(shù)理計算和異常檢測等任務(wù)中,準(zhǔn)確率均可接近100%。
現(xiàn)實辦公場景中,數(shù)據(jù)輸入形式極為復(fù)雜。在數(shù)據(jù)分析場景中,截圖、文檔和PDF等各類樣式的文檔屢見不鮮,而其中結(jié)構(gòu)化信息及表格僅占約70%。即便是看似基礎(chǔ)的Excel表格,也常包含合并單元格、缺失值、嵌套子表格及內(nèi)嵌圖表等復(fù)雜元素,大幅提升處理難度。
商湯小浣熊能夠以多模態(tài)思維實現(xiàn)全局分析,通過思維鏈構(gòu)造進(jìn)行多步思考與反思,最終輸出結(jié)構(gòu)化的結(jié)果。
事實上一個表格看著簡單,背后的邏輯因果卻非常復(fù)雜,如今商湯小浣熊可以讓復(fù)雜表格簡單化。
用戶上傳包含合并單元格、缺失值、子表格、內(nèi)嵌圖表及外部圖片的復(fù)雜Excel表格。商湯小浣熊能夠精準(zhǔn)解析表格內(nèi)容,建立子表格間的邏輯關(guān)聯(lián),最終生成完整的分析報告。
另一個復(fù)雜輸入的用戶案例,小商戶在抖音等視頻平臺刷到有用的表格內(nèi)容,截圖后上傳。商湯小浣熊可以通過圖片信息分解任務(wù)并去除干擾,提取表格信息,一鍵導(dǎo)出可編輯的Excel表格供用戶填寫,輸入、分析、輸出全程都有多模態(tài)能力支持順暢進(jìn)行。
傳統(tǒng)AI工具多扮演輔助角色,核心工作仍依賴用戶主導(dǎo)完成;而商湯小浣熊實現(xiàn)了交互范式的升級——由AI主動承擔(dān)核心任務(wù),并通過精準(zhǔn)提問和用戶確認(rèn)關(guān)鍵信息,交互邏輯如同同事協(xié)作。
由AI主動承擔(dān)核心任務(wù),并通過精準(zhǔn)提問和用戶確認(rèn)關(guān)鍵信息,交互邏輯如同同事協(xié)作。
商湯小浣熊如今推出的任務(wù)規(guī)劃功能,其新穎的交互模式更利于用戶理解,以前段時間大火的“蘇超”為例。
用戶上傳圖像表格,要求分析“蘇超”TOP球員。商湯小浣熊會自動抓取網(wǎng)上信息,并依托專家知識生成任務(wù)清單(如確定“TOP5”標(biāo)準(zhǔn),分析青訓(xùn)成績等)進(jìn)行系統(tǒng)性分析,最終生成高質(zhì)量分析文檔,還可導(dǎo)出為Excel、PPT、HTML等可編輯格式。整體流程如下↓↓↓
具體分解步驟:當(dāng)接收任務(wù)后,小浣熊會主動梳理任務(wù)細(xì)節(jié),就關(guān)鍵節(jié)點向用戶提出明確問題(如“是否需要按以下1、2、3點推進(jìn)?”),以確保任務(wù)方向準(zhǔn)確,真正實現(xiàn)“AI主導(dǎo)干活、用戶決策把關(guān)”的高效模式↓↓↓
接下來就能依據(jù)專家知識生成任務(wù)清單(如確定“TOP5”標(biāo)準(zhǔn),分析青訓(xùn)成績等)進(jìn)行系統(tǒng)性分析,下一步該做什么、可以怎么商量著做一目了然↓↓↓
專業(yè)數(shù)據(jù)+工具調(diào)用,實現(xiàn)高質(zhì)量內(nèi)容過程↓↓↓
最終生成高質(zhì)量分析文檔,還可導(dǎo)出為Excel、PPT、HTML等可編輯格式↓↓↓
憑借強大的復(fù)雜任務(wù)處理能力,商湯小浣熊加速向行業(yè)滲透,此次推出了面向兩大具體場景的特制版本——教育版和金融版。
據(jù)現(xiàn)場介紹,商湯小浣熊教育版可智能分析學(xué)生學(xué)習(xí)表現(xiàn)、課程效果、學(xué)習(xí)行為模式分析,目前已覆蓋500+院校、10余種教育場景、25萬+教師和學(xué)生,幫助學(xué)生提升學(xué)習(xí)效率15~30%,并已在多所學(xué)校協(xié)助教研團(tuán)隊,降低學(xué)業(yè)焦慮發(fā)生率40%,課堂參與度提高2.1倍,資源錯配率降低30%,心理健康干預(yù)及時性提升了50%。
商湯小浣熊金融版可為金融業(yè)提供知識助手、智能問數(shù)、多模態(tài)智能理賠產(chǎn)品與解決方案,構(gòu)建金融領(lǐng)域的“人機協(xié)同”智能決策新范式。
截至目前,“商湯小浣熊家族”產(chǎn)品矩陣廣泛服務(wù)多行業(yè)企業(yè),用戶數(shù)量實現(xiàn)1000萬+。
以多模態(tài)技術(shù)激活A(yù)I生產(chǎn)力,商湯日日新大模型將持續(xù)進(jìn)化,與行業(yè)共同奔赴下一階段AI進(jìn)化的新征程,加速通往AGI時代。
戰(zhàn)神大陸天驕爭鋒,主角殺伐果決,橫掃九天成就無上神皇之位
《九天神皇》作者:葉之凡第一章葉星辰戰(zhàn)神大陸,人們皆是以修煉戰(zhàn)氣為主,強大的戰(zhàn)將一拳就能轟碎一座城門,恐怖的戰(zhàn)王可以飛天遁地,無敵的戰(zhàn)神可以活到一千歲……這是一個以戰(zhàn)氣為主的世界,這是一個以成為戰(zhàn)神為至高榮耀的大陸?!_蘭王國。王城,林府后院————。夜涼如水,星光璀璨-_。一間簡陋的屋子里,一名少年躺在簡陋的木板床上到此結(jié)束了?|。 不,現(xiàn)在應(yīng)該叫他葉星辰。葉星辰原本是地球上的一個孤兒,因為自幼得了癌癥,所以只活到了十六歲-。但讓他沒想到的是,他竟然轉(zhuǎn)世重生到了戰(zhàn)神大陸,而且還占據(jù)了一個名叫林星辰的少年的身體。林星辰是林家家主林霸天醉酒后與一名侍女所生的私生子,上不了臺面,根本沒有什么身份和地位|。在林星辰很小的時候,林霸是什么。小說:戰(zhàn)神大陸天驕爭霸,他一路殺伐成就九天無上神皇之位