來(lái)源:英才商業(yè)
從“AI應(yīng)用”到“全棧AI”,AI老兵未老,已悄然成長(zhǎng)!
國(guó)產(chǎn)人工智能產(chǎn)業(yè)確實(shí)進(jìn)入了一個(gè)高速發(fā)展階段。
今年WAIC2025上國(guó)產(chǎn)AI廠(chǎng)商的“井噴”著實(shí)讓市場(chǎng)見(jiàn)識(shí)到了,什么叫“百花齊放”。從AI大模型的智譜AI、百川智能、月之暗面,到AI基建的無(wú)問(wèn)芯穹、硅基流動(dòng)再到AI應(yīng)用冪律智能等。不禁讓人想起彼時(shí)那些初代的人工智能巨頭們,比如國(guó)內(nèi)“AI四小龍”之首的商湯科技(00020.HK),在大模型日新月異的舞臺(tái)上,似乎光環(huán)暗淡不少,商湯老了嗎?
01商湯大跌背后,是AI應(yīng)用到全棧AI的陣痛期!
從資本市場(chǎng)角度來(lái)看,表現(xiàn)確實(shí)不盡如人意,原因?yàn)楹危?021年底,正值A(chǔ)I視覺(jué)產(chǎn)業(yè)的高光期,商湯科技成功登陸港交所,創(chuàng)下當(dāng)時(shí)國(guó)內(nèi)AI企業(yè)最大規(guī)模IPO。上市即巔峰,市值一度突破3200億港幣,也曾是全球估值最高的AI應(yīng)用廠(chǎng)商。這個(gè)預(yù)期主要基于公司2021年的業(yè)績(jī)高點(diǎn),憑借國(guó)內(nèi)多年市占率第一的計(jì)算機(jī)視覺(jué)產(chǎn)品,2021年公司營(yíng)收達(dá)到47億,雖然巨虧170多億,但作為初代國(guó)產(chǎn)AI,龍頭+稀缺性+業(yè)績(jī)預(yù)期,市場(chǎng)對(duì)于商湯給予了較高的市場(chǎng)預(yù)期。
但問(wèn)題在于,商湯那時(shí)候核心的AI產(chǎn)品應(yīng)用于智慧商業(yè)和智慧城市場(chǎng)景,這兩塊的收入占總營(yíng)收比重達(dá)到了87%。換言之,公司營(yíng)收對(duì)政府項(xiàng)目的依賴(lài)度非常高,而政府項(xiàng)目的特點(diǎn)就是交付周期長(zhǎng)、賬期長(zhǎng),而且更關(guān)鍵的是受到地方財(cái)政支出的影響,而2022-2023年恰逢地方財(cái)政進(jìn)入轉(zhuǎn)型期并開(kāi)始收緊,沒(méi)想到這么快就受到了影響。
了解地方財(cái)政的應(yīng)該都知道,近三十年地方財(cái)政的收入來(lái)源除了稅收,最核心的來(lái)源就是“土地出讓金”,巔峰時(shí)曾占到我國(guó)地方財(cái)政收入的84.02%,即地方八成以上收入來(lái)源于賣(mài)地。2022-2023年算是一個(gè)轉(zhuǎn)折點(diǎn),當(dāng)時(shí)資本市場(chǎng)還炒作過(guò)一陣“央國(guó)企價(jià)值重估”概念,目的就是希望將地方政府的“土地財(cái)政”轉(zhuǎn)型“股權(quán)財(cái)政”,地方財(cái)政轉(zhuǎn)型,首當(dāng)其沖的就是削減支出,帶來(lái)的結(jié)果就是2023年財(cái)政緊縮,導(dǎo)致商湯科技的政府訂單銳減,當(dāng)年智慧城市收入驟降27%,地方財(cái)政在智慧城市等方面的支出減少預(yù)期下,商湯股價(jià)便出現(xiàn)了斷崖式下跌。
智慧商業(yè)方面,商湯科技的項(xiàng)目在核心服務(wù)模式上與SaaS(軟件即服務(wù))高度相似,可以被認(rèn)為是一種“AI增強(qiáng)型的SaaS”或“AIaaS(AI即服務(wù))”模式。然而無(wú)論怎么樣,這種企業(yè)付費(fèi)的商業(yè)模式就比較難發(fā)展和推廣,一方面是國(guó)內(nèi)對(duì)軟件的付費(fèi)意識(shí)不強(qiáng),其次就是這種側(cè)重于流程或中間環(huán)節(jié)的工具/服務(wù),少有人為過(guò)程來(lái)做較高的定價(jià),更多企業(yè)都是結(jié)果導(dǎo)向,這也成為商湯早期做AI應(yīng)用的軟肋。
核心業(yè)務(wù)一個(gè)大幅收縮,一個(gè)推廣難度大。適逢2022年末,OpenAI推出的ChatGPT引發(fā)了全球?qū)ι墒紸I的熱情,也給商湯轉(zhuǎn)型帶來(lái)了契機(jī),2023年商湯科技果斷調(diào)整戰(zhàn)略方向,將業(yè)務(wù)轉(zhuǎn)向至生成式AI。與此同時(shí),公司也將業(yè)務(wù)重組調(diào)整為生成式AI、傳統(tǒng)AI和智能汽車(chē)三個(gè)板塊。2024年底,商湯科技再度將業(yè)務(wù)重組為生成式AI、智能汽車(chē)及視覺(jué)AI。
多次調(diào)整之后,生成式AI已成為商湯的核心敘事。
2024年年報(bào)顯示,公司生成式AI的收入達(dá)到24.04億元,同比增長(zhǎng)103.1%,占營(yíng)收的比重也從2023年的34.8%大幅提升至2024年的63.7%,成為第一大業(yè)績(jī)驅(qū)動(dòng)因素。相比之下,商湯起家的視覺(jué)AI業(yè)務(wù)在同年收入大幅下滑39.5%至11.12億元,營(yíng)收占比則從2023年的53.9%降至29.5%;智能汽車(chē)收入亦下降33.2%至2.56億元,營(yíng)收占比亦從11.3%降至6.8%。
如何理解商湯科技的生成式AI業(yè)務(wù)?
從AI發(fā)展階段來(lái)看,商湯科技的視覺(jué)AI和智能汽車(chē)業(yè)務(wù)算是AI1.0的感知AI階段,核心在于對(duì)環(huán)境和特定信息識(shí)別,依賴(lài)傳感器(攝像頭、麥克風(fēng)等)采集環(huán)境數(shù)據(jù),充當(dāng)AI的“眼睛和耳朵”,主要進(jìn)行感知,對(duì)識(shí)別后形成被動(dòng)響應(yīng)的指令,僅分析輸入信息,不具備復(fù)雜的推理能力,不會(huì)生成新內(nèi)容。舉個(gè)例子,比如大門(mén)的人臉識(shí)別系統(tǒng),僅需要輸入家人面部特征的少量數(shù)據(jù)即可,當(dāng)視覺(jué)傳感器捕獲符合數(shù)據(jù)的面孔就會(huì)開(kāi)門(mén);
而生成式AI是AI發(fā)展的2.0階段,也是當(dāng)前主流,核心就是需要海量的數(shù)據(jù)進(jìn)行訓(xùn)練,就是讓AI大量學(xué)習(xí)已有知識(shí),然后根據(jù)不同任務(wù)、不同環(huán)境等進(jìn)行推理,生成新的內(nèi)容。商湯生成式AI的盈利模式偏向于算力租賃和MaaS(Model-as-a-Service),與互聯(lián)網(wǎng)云服務(wù)廠(chǎng)商一樣,其中算力租賃其實(shí)很好理解,就是現(xiàn)在越來(lái)越多的廠(chǎng)商開(kāi)始使用各種各樣的AI大模型,對(duì)于沒(méi)有自建算力中心的終端廠(chǎng)商,就可以租用商湯的算力對(duì)自己的大模型進(jìn)行訓(xùn)練。
實(shí)際上早在2018年前后,商湯就已經(jīng)開(kāi)始每年投入數(shù)十億到SenseCore大裝置上,截至2024年年底,商湯背后總算力已經(jīng)達(dá)到23,000PetaFLOPS,覆蓋京津冀、長(zhǎng)三角、粵港澳等全國(guó)重點(diǎn)區(qū)域,支持動(dòng)態(tài)調(diào)度;同時(shí)還建設(shè)了上海臨港AIDC智算中心,是國(guó)內(nèi)首個(gè)5A級(jí)智算中心,可支撐20多個(gè)千億級(jí)大模型同時(shí)訓(xùn)練。商湯這一資本投入,并未獲得市場(chǎng)的認(rèn)同,原本就大幅虧損,巨額投入反而讓商湯的現(xiàn)金流吃緊。不過(guò),隨著大模型的爆發(fā)式發(fā)展,算力需求高增,商湯所持有的算力能力也成為一種稀缺資源。
全球的資本市場(chǎng)似乎對(duì)自建算力都不太感冒,像Meta、Google和AWS這種云服務(wù)廠(chǎng)商,雖然一直在上修算力建設(shè)上的資本開(kāi)支,但一看股價(jià)走勢(shì),基本沒(méi)出現(xiàn)過(guò)多驚人的漲幅,或許是短期在業(yè)績(jī)上的體現(xiàn)并不明顯,不過(guò)全球“堆”算力卻養(yǎng)肥了一批算力產(chǎn)業(yè)鏈,比如算力芯片、服務(wù)器、PCB、光模塊等“賣(mài)水人”。
商湯另一種盈利模式就是MaaS。就是在自有大模型基礎(chǔ)上進(jìn)行微調(diào),再通過(guò)垂直行業(yè)的數(shù)據(jù)進(jìn)行大量訓(xùn)練,形成專(zhuān)用大模型,再按照用戶(hù)對(duì)“云+端”兩種模式需求獲得收入。比如“大醫(yī)”模型,主要是服務(wù)醫(yī)療領(lǐng)域,商湯本身在計(jì)算機(jī)視覺(jué)領(lǐng)域就很強(qiáng),再借助海量的醫(yī)療知識(shí)和影像數(shù)據(jù)培養(yǎng)出了多模態(tài)能力極強(qiáng)的大模型,可以提供專(zhuān)業(yè)的醫(yī)療知識(shí)服務(wù),更重要的是具備CT、MR和病理等多種醫(yī)學(xué)圖像的識(shí)別能力;還有在周末人工智能大會(huì)發(fā)布的“開(kāi)悟”世界模型,就是由商湯日日新V6.5大模型賦能而來(lái)。
02如何理解具身AI?商湯又能做什么?
可能很多人都有一個(gè)認(rèn)知誤區(qū):在AI高速發(fā)展背后,數(shù)據(jù)大爆發(fā)帶來(lái)的AI需求指數(shù)級(jí)增長(zhǎng),然而數(shù)據(jù)即使每天都在增長(zhǎng),也并非是無(wú)窮無(wú)盡的。
實(shí)際上高質(zhì)量數(shù)據(jù)是不足的,而相對(duì)有限的高質(zhì)量數(shù)據(jù)正是訓(xùn)練LLM(大語(yǔ)言模型)重要“養(yǎng)分”之一,當(dāng)然也可以通過(guò)算法優(yōu)化來(lái)強(qiáng)化文本數(shù)據(jù)質(zhì)量,但上限明顯。
根據(jù)2024年研究機(jī)構(gòu)EpochAI通過(guò)分析互聯(lián)網(wǎng)公共文本數(shù)據(jù)總量與AI訓(xùn)練需求增速,預(yù)測(cè)到未來(lái)10年內(nèi),數(shù)據(jù)增長(zhǎng)的速度無(wú)法支撐起大模型的擴(kuò)展,LLM會(huì)在2028年耗盡互聯(lián)網(wǎng)上的所有文本數(shù)據(jù),機(jī)構(gòu)預(yù)測(cè)互聯(lián)網(wǎng)高質(zhì)量文本的年增速不足5%,將遠(yuǎn)低于AI數(shù)據(jù)需求的指數(shù)級(jí)增長(zhǎng)。
目前大模型對(duì)文本數(shù)據(jù)消耗速度驚人,以ChatGPT為例,2021年的GPT-3的訓(xùn)練消耗了約3000億Token的文本數(shù)據(jù),2023年的GPT-4訓(xùn)練已經(jīng)消耗了約13萬(wàn)億Token的文本數(shù)據(jù)(13萬(wàn)億token什么概念,相當(dāng)于1萬(wàn)套《四庫(kù)全書(shū)》的文本總量,一套8億漢字),而GPT-5等下一代模型的需求量可能翻倍,根據(jù)《華爾街日?qǐng)?bào)》的報(bào)道,OpenAI在訓(xùn)練GPT-5時(shí)已經(jīng)遇到了文本數(shù)據(jù)不足的問(wèn)題,正在考慮使用Youtube公開(kāi)視頻轉(zhuǎn)錄出的文本。
正如OA在訓(xùn)練方式的變化,視頻轉(zhuǎn)錄文本訓(xùn)練大模型意味著圖片和視頻數(shù)據(jù)還有巨大的挖掘空間。目前市場(chǎng)預(yù)期大模型消耗數(shù)據(jù)的一個(gè)順序是文本→圖片→視頻,而從文本到圖片和視頻的訓(xùn)練和推理就需要使用多模態(tài)大模型,即同時(shí)處理、理解并融合多種數(shù)據(jù)類(lèi)型(模態(tài))的人工智能模型,而商湯早期機(jī)器視覺(jué)的技術(shù)優(yōu)勢(shì)或許可以發(fā)揮到淋漓盡致。
相比于先從視頻轉(zhuǎn)錄出文字,然后用文本訓(xùn)練。商湯視覺(jué)感知+語(yǔ)言能力的多模態(tài)大模型似乎更像人類(lèi)的“感官協(xié)同”的思維模式,舉個(gè)簡(jiǎn)單的例子:早上出門(mén),手機(jī)落在家里的桌子上,我們的大腦內(nèi)形成的是“手機(jī)在桌子上”這一文本信息與“手機(jī)靜置在桌面上”的畫(huà)面會(huì)同步出現(xiàn)在大腦內(nèi)。當(dāng)然很多頭部大模型廠(chǎng)商也都在開(kāi)發(fā)多模態(tài)大模型。
生成式AI進(jìn)階到具身AI,筆者的愚拙理解是:生成式AI類(lèi)似于人類(lèi)的學(xué)習(xí)階段,我們從小學(xué)到大學(xué)的學(xué)習(xí)中,盡可能地大量汲取通用或?qū)S梅矫娴闹R(shí),從教科書(shū)(文本)到實(shí)習(xí)(圖片和視頻)都是在訓(xùn)練和簡(jiǎn)單推理的過(guò)程;而具身AI就相當(dāng)于走向工作崗位,在實(shí)時(shí)場(chǎng)景的交互實(shí)踐中,根據(jù)復(fù)雜的時(shí)序數(shù)據(jù),盡可能做出最優(yōu)的推理和決策。
這也對(duì)應(yīng)了大模型廠(chǎng)商的一種思考:當(dāng)書(shū)本與互聯(lián)網(wǎng)知識(shí)窮盡時(shí),下一代的智能將從何處獲取新的數(shù)據(jù)?經(jīng)典的宏微觀經(jīng)濟(jì)學(xué)加一起也就不過(guò)千頁(yè),但實(shí)際生活中,經(jīng)濟(jì)學(xué)復(fù)雜且龐大,未來(lái)每一次最優(yōu)的決策都是基于上一次并非最優(yōu)決策過(guò)程的總結(jié)和學(xué)習(xí)。我們稱(chēng)之為“經(jīng)驗(yàn)”“經(jīng)歷”,而這些“經(jīng)歷”正是從生成式AI進(jìn)化到具身AI期間,大模型在所處垂直領(lǐng)域交互中獲得的新數(shù)據(jù),用于自我訓(xùn)練和推理。
人形機(jī)器人和汽車(chē)智能化發(fā)展都是具身AI最好的落地應(yīng)用。除了多模態(tài)的大模型算法和軟件,終端的“感官”技術(shù)支持也相當(dāng)重要。表面看商湯雖然在資本市場(chǎng)表現(xiàn)比較一般,但在AI發(fā)展浪潮中并未落后。左手計(jì)算機(jī)視覺(jué)(CV)的技術(shù)+模型,右手是通用大模型,背后還有自建的國(guó)內(nèi)領(lǐng)先的算力中心和自研的推理芯片等硬件支持。這些足以支撐商湯在AI端側(cè)爆發(fā)預(yù)期下的發(fā)展。
曾經(jīng)的“AI四小龍之首”還沒(méi)老,反而悄悄地完成了從“AI應(yīng)用”廠(chǎng)商到“全棧AI”的升級(jí)。
免責(zé)聲明:本文內(nèi)容由開(kāi)放的智能模型自動(dòng)生成,僅供參考。