純語言模型的能力或觸頂,多模態(tài)融合才可能最終通往AGI(通用人工智能)?在專注基模研發(fā)和商業(yè)落地Agent(智能體)之間,該如何抉擇?除了從閉源走向開源,大模型產(chǎn)業(yè)界在生態(tài)協(xié)同上還能做些什么?
“模型之問”
今年WAIC的重大創(chuàng)新,在于切中數(shù)學(xué)、科學(xué)、模型要害,提出“AI三問”。7月27日,由商湯科技承辦的一場大模型論壇,邀請來自階躍星辰、上海人工智能實驗室、第四范式、智譜等大模型公司大咖進(jìn)行技術(shù)交流,“模型之問”貫穿始終。記者發(fā)現(xiàn),在這場基本集齊上?!八拇蠡!钡默F(xiàn)場,多個靈魂拷問后,大模型上海隊的抉擇,反倒凸顯出它們“留在牌桌”上的暫時領(lǐng)先優(yōu)勢。
全球出圈
自ChatGPT在2022年11月30日一夜爆火后,大語言模型廠商們在對標(biāo)路上狂奔兩年。然而它們所有的努力,幾乎被今年初發(fā)布的DeepSeek-R1抹平。好在行業(yè)反轉(zhuǎn)很快出現(xiàn)。權(quán)威機(jī)構(gòu)預(yù)測,語言模型將在2028年耗盡人類文本數(shù)據(jù)。與此同時,DeepSeek-R1等語言大模型不時傳出邊際效益遞減趨勢?;诖?,業(yè)內(nèi)愈發(fā)意識到,多模態(tài)大模型可能是邁向AGI的入場券。為此,OpenAI、谷歌、Meta等科技巨頭陸續(xù)發(fā)布了GPT-4.5、Gemini2.5Pro、Llama4等多個性能強(qiáng)大的多模態(tài)基模。但巨頭們沒想到,今年以來,來自中國上海的多模態(tài)模型此起彼伏地出圈。如成立于2014年的商湯科技,以計算機(jī)視覺起家,近兩年果斷進(jìn)行大模型技術(shù)革新,是極少數(shù)能迅速轉(zhuǎn)彎、從視覺算法跨越到大模型技術(shù)周期且保持算法領(lǐng)先的AI公司。今年4月,商湯發(fā)布新一代6200億參數(shù)多模態(tài)大模型“日日新V6”,其多模態(tài)綜合能力看齊GPT-4.5,局部還有超越,并且率先引入長思維鏈,將多模態(tài)與深度思考結(jié)合起來。比如,面對四張描繪“烏龜羨慕長頸鹿脖子長”的連環(huán)畫,“日日新V6”能完整講述故事,并在結(jié)尾升華為“長頸鹿有它的優(yōu)勢,但你也有你的價值”?!叭杖招耉6”發(fā)布短短三個半月后,商湯在此次WAIC上發(fā)布其“日日新V6.5”。商湯科技董事長兼CEO徐立說,相比V6版本,“日日新V6.5”的強(qiáng)化學(xué)習(xí)效率增加了40%,性價比提升了三倍,使模型應(yīng)用有更大利潤空間?!耙詥文昃S度看,一年內(nèi)模型推理成本下降十倍大有可能”。
商湯在此次WAIC上發(fā)布其“日日新V6.5”
取得如此戰(zhàn)績,需要底層架構(gòu)、高質(zhì)量數(shù)據(jù)清洗、上層算法的整體創(chuàng)新。相比于積淀深厚且迅速轉(zhuǎn)向的上海老牌AI公司,不到4歲的Minimax和剛滿2歲的階躍星辰,則在創(chuàng)業(yè)之初就錨定多模態(tài)。如階躍星辰,堅信多模態(tài)是通往AGI的必經(jīng)之路,2023年4月成立迄今,已發(fā)布基模超過20款,且多模態(tài)占比70%,是業(yè)內(nèi)公認(rèn)的“多模態(tài)卷王”。7月25日,階躍星辰發(fā)布其新一代基模Step3,擁有強(qiáng)大視覺感知和復(fù)雜推理能力。比如,能敏銳識別圖中隱蔽的字母;又如,即便菜單反光嚴(yán)重,仍能準(zhǔn)確還原菜單內(nèi)容;再如,結(jié)合微信群聊天記錄,輸入購物小票,模型即能聰明計算AA制消費(fèi)分?jǐn)偂?/p>
階躍星辰是業(yè)內(nèi)公認(rèn)“多模態(tài)卷王”
而上月,上海獨(dú)角獸MiniMax則發(fā)布了全球首個開源大規(guī)?;旌霞軜?gòu)推理模型——MiniMax-M1,目前在權(quán)威評測榜單已位列全球開源模型第二;MiniMax同期發(fā)布的視頻生成大模型Hailuo02,因?qū)崿F(xiàn)了對物理世界規(guī)律的極致理解,可直接叫板谷歌第三代視頻生成模型Veo3。過往AI視頻模型中難以解決的體操、雜技等復(fù)雜運(yùn)動中常出現(xiàn)的運(yùn)動主體肢體錯亂、五官扭曲等“翻車”狀況,在Hailuo02中都被消滅。目前,MiniMax視頻生成應(yīng)用HailuoAI已力壓海外的Sora、Runway等產(chǎn)品,持續(xù)保持全球第一,并幫助200個國家和地區(qū)的創(chuàng)作者生成了超過3.7億個視頻。
谷歌Veo3和Hailuo02各自生成“貓?zhí)币曨l對比,谷歌Veo3視頻中貓直接入水,Hailuo02視頻中的貓在空中完整翻轉(zhuǎn)三周半后入水,動作全程符合邏輯。
曬“朋友圈”
盡管高頻出圈,仍要面臨選擇——是向左,持續(xù)投入基模研發(fā)?還是向右,快速構(gòu)建商業(yè)閉環(huán)?對于這樣的“模型之問”,無論是來自北京的智譜、第四范式,還是大模型上海隊,都有相同態(tài)度——既要又要。正如同屬國內(nèi)大模型第一梯隊的智譜清言背后智譜華章科技股份有限公司總裁王紹蘭所言:持續(xù)的基模研發(fā),關(guān)乎決心?!暗绻竽P鸵恢弊黾兝碚撗芯慷蛔錾虡I(yè)化落地,怎么證明大模型真正改變產(chǎn)業(yè)呢?”
事實上,迫于內(nèi)部成本與外部競爭,國內(nèi)外大模型公司無不在加速收斂。國內(nèi)百模大戰(zhàn)也已經(jīng)收縮為個位數(shù)競爭。大模型上海隊在基模研發(fā)上、造血盈利上都不拉垮,這屬實可貴。
比如,商湯科技應(yīng)用于代碼、辦公領(lǐng)域的生產(chǎn)力工具“小浣熊”,現(xiàn)已擁有超過1000萬家行業(yè)用戶。今年WAIC大會,商湯展區(qū)秀出其“朋友圈”,都是日日新大模型所賦能的智能硬件,包括了元蘿卜AI下棋機(jī)器人,以及鈦虎、傅利葉、LUMOS鹿明等多個品牌的人形機(jī)器人,以及小米眼鏡等,涉及教育培訓(xùn)、家庭陪伴、景區(qū)導(dǎo)覽等多個應(yīng)用場景。
小浣熊已擁有超過1000萬家行業(yè)用戶
傅利葉機(jī)器人是商湯重要客戶
徐立還特別演示了日日新大模型賦能下人形機(jī)器人講解《長安的荔枝》案例。機(jī)器人講解時,可自行翻頁P(yáng)PT,其解說風(fēng)格詼諧幽默,可以被打斷,可識別意圖,還有全局記憶,即便被多次“扯遠(yuǎn)”,依舊能回到最初話題,應(yīng)用落地潛力巨大。
具身智能講解“長安的荔枝”
階躍星辰的商業(yè)化進(jìn)程也不錯,已與車、手機(jī)、具身智能領(lǐng)域的頭部廠商合作,部分旗艦機(jī)型進(jìn)入量產(chǎn),包括吉利銀河M9、曾被馬斯克點(diǎn)贊的家庭情感機(jī)器人TCLAIMe等。階躍日前也公開透露,今年全年收入預(yù)計近10億元。
模芯聯(lián)動
“大模型發(fā)展至今,已經(jīng)不是一個單純的技術(shù)問題,也不再是單家公司做某一款產(chǎn)品的問題,而是需要共同創(chuàng)造一個社區(qū),以通往AGI的未來,生態(tài)發(fā)揮著重要作用?!备髂P凸镜莱鲂穆?。在此次“模型之問”論壇上,商湯科技聯(lián)合華為、庫帕思、海光、寒武紀(jì)、曦望Sunrise、壁仞科技、麒麟軟件、摩爾線程等十余家國產(chǎn)生態(tài)伙伴,共同發(fā)布“商湯大裝置算力Mall”。此舉,在當(dāng)前大模型時代對算力需求持續(xù)激增、算力供應(yīng)鏈安全挑戰(zhàn)日益嚴(yán)峻背景下尤顯意義。種種跡象表明,國產(chǎn)模型與國產(chǎn)算力之間,正在加速雙向奔赴。7月25日,階躍星辰發(fā)布Step3時,也同時宣布聯(lián)合近十家芯片及基礎(chǔ)設(shè)施廠商,發(fā)起“模芯生態(tài)創(chuàng)新聯(lián)盟”。其中,燧原科技受邀成為首批成員,且運(yùn)行Step3也已初步實現(xiàn)。據(jù)測算,Step3在國產(chǎn)芯片上“跑”,模型成本是友商(DeepSeek)的三分之一。
燧原科技是“模芯生態(tài)創(chuàng)新聯(lián)盟”首批成員
根據(jù)燧原科技創(chuàng)始人趙立東的判斷,未來模型對推理算力的需求,將是訓(xùn)練算力的百倍甚至千倍。與此同時,算力基礎(chǔ)設(shè)施正在走向系統(tǒng)化,相關(guān)的軟硬件技術(shù),包括超節(jié)點(diǎn)、網(wǎng)絡(luò)技術(shù)、全光互聯(lián)、低精度、分布式并行計算、虛擬化等,已不再是芯片公司單獨(dú)可以完成,而是需要跨行業(yè)的協(xié)作,多方聚力,構(gòu)建系統(tǒng)化解決方案。趙立東說,燧原科技擁抱與眾多伙伴的合作,已在算力基建、算力調(diào)度、算力服務(wù)、算力應(yīng)用等多個方面深入攜手,共同在國產(chǎn)智算關(guān)鍵領(lǐng)域?qū)で笃凭帧?/p>
但大模型發(fā)展是一場長跑,其決賽季遠(yuǎn)未到來。面對平均每三個月就能帶來“行業(yè)一震”,大模型上海隊都表示,其目標(biāo)只有一個——保持敬畏,繼續(xù)留在牌桌上。
小說:踩死螞蟻獲神器寶箱,李玄夜異界橫著走,寶箱開到手軟!
小說:神界執(zhí)行官重生凡間,修正開掛人生,寶箱系統(tǒng)助他無敵
十分暢銷的《宇宙最強(qiáng)寶箱系統(tǒng)》,讓人意想不到的對白,連刷N遍都贊...
免責(zé)聲明:本文內(nèi)容由開放的智能模型自動生成,僅供參考。