來源:英才商業(yè)
從“AI應用”到“全棧AI”,AI老兵未老,已悄然成長!
國產人工智能產業(yè)確實進入了一個高速發(fā)展階段。
今年WAIC2025上國產AI廠商的“井噴”著實讓市場見識到了,什么叫“百花齊放”。從AI大模型的智譜AI、百川智能、月之暗面,到AI基建的無問芯穹、硅基流動再到AI應用冪律智能等。不禁讓人想起彼時那些初代的人工智能巨頭們,比如國內“AI四小龍”之首的商湯科技(00020.HK),在大模型日新月異的舞臺上,似乎光環(huán)暗淡不少,商湯老了嗎?
01商湯大跌背后,是AI應用到全棧AI的陣痛期!
從資本市場角度來看,表現確實不盡如人意,原因為何?2021年底,正值AI視覺產業(yè)的高光期,商湯科技成功登陸港交所,創(chuàng)下當時國內AI企業(yè)最大規(guī)模IPO。上市即巔峰,市值一度突破3200億港幣,也曾是全球估值最高的AI應用廠商。這個預期主要基于公司2021年的業(yè)績高點,憑借國內多年市占率第一的計算機視覺產品,2021年公司營收達到47億,雖然巨虧170多億,但作為初代國產AI,龍頭+稀缺性+業(yè)績預期,市場對于商湯給予了較高的市場預期。
但問題在于,商湯那時候核心的AI產品應用于智慧商業(yè)和智慧城市場景,這兩塊的收入占總營收比重達到了87%。換言之,公司營收對政府項目的依賴度非常高,而政府項目的特點就是交付周期長、賬期長,而且更關鍵的是受到地方財政支出的影響,而2022-2023年恰逢地方財政進入轉型期并開始收緊,沒想到這么快就受到了影響。
了解地方財政的應該都知道,近三十年地方財政的收入來源除了稅收,最核心的來源就是“土地出讓金”,巔峰時曾占到我國地方財政收入的84.02%,即地方八成以上收入來源于賣地。2022-2023年算是一個轉折點,當時資本市場還炒作過一陣“央國企價值重估”概念,目的就是希望將地方政府的“土地財政”轉型“股權財政”,地方財政轉型,首當其沖的就是削減支出,帶來的結果就是2023年財政緊縮,導致商湯科技的政府訂單銳減,當年智慧城市收入驟降27%,地方財政在智慧城市等方面的支出減少預期下,商湯股價便出現了斷崖式下跌。
智慧商業(yè)方面,商湯科技的項目在核心服務模式上與SaaS(軟件即服務)高度相似,可以被認為是一種“AI增強型的SaaS”或“AIaaS(AI即服務)”模式。然而無論怎么樣,這種企業(yè)付費的商業(yè)模式就比較難發(fā)展和推廣,一方面是國內對軟件的付費意識不強,其次就是這種側重于流程或中間環(huán)節(jié)的工具/服務,少有人為過程來做較高的定價,更多企業(yè)都是結果導向,這也成為商湯早期做AI應用的軟肋。
核心業(yè)務一個大幅收縮,一個推廣難度大。適逢2022年末,OpenAI推出的ChatGPT引發(fā)了全球對生成式AI的熱情,也給商湯轉型帶來了契機,2023年商湯科技果斷調整戰(zhàn)略方向,將業(yè)務轉向至生成式AI。與此同時,公司也將業(yè)務重組調整為生成式AI、傳統(tǒng)AI和智能汽車三個板塊。2024年底,商湯科技再度將業(yè)務重組為生成式AI、智能汽車及視覺AI。
多次調整之后,生成式AI已成為商湯的核心敘事。
2024年年報顯示,公司生成式AI的收入達到24.04億元,同比增長103.1%,占營收的比重也從2023年的34.8%大幅提升至2024年的63.7%,成為第一大業(yè)績驅動因素。相比之下,商湯起家的視覺AI業(yè)務在同年收入大幅下滑39.5%至11.12億元,營收占比則從2023年的53.9%降至29.5%;智能汽車收入亦下降33.2%至2.56億元,營收占比亦從11.3%降至6.8%。
如何理解商湯科技的生成式AI業(yè)務?
從AI發(fā)展階段來看,商湯科技的視覺AI和智能汽車業(yè)務算是AI1.0的感知AI階段,核心在于對環(huán)境和特定信息識別,依賴傳感器(攝像頭、麥克風等)采集環(huán)境數據,充當AI的“眼睛和耳朵”,主要進行感知,對識別后形成被動響應的指令,僅分析輸入信息,不具備復雜的推理能力,不會生成新內容。舉個例子,比如大門的人臉識別系統(tǒng),僅需要輸入家人面部特征的少量數據即可,當視覺傳感器捕獲符合數據的面孔就會開門;
而生成式AI是AI發(fā)展的2.0階段,也是當前主流,核心就是需要海量的數據進行訓練,就是讓AI大量學習已有知識,然后根據不同任務、不同環(huán)境等進行推理,生成新的內容。商湯生成式AI的盈利模式偏向于算力租賃和MaaS(Model-as-a-Service),與互聯(lián)網云服務廠商一樣,其中算力租賃其實很好理解,就是現在越來越多的廠商開始使用各種各樣的AI大模型,對于沒有自建算力中心的終端廠商,就可以租用商湯的算力對自己的大模型進行訓練。
實際上早在2018年前后,商湯就已經開始每年投入數十億到SenseCore大裝置上,截至2024年年底,商湯背后總算力已經達到23,000PetaFLOPS,覆蓋京津冀、長三角、粵港澳等全國重點區(qū)域,支持動態(tài)調度;同時還建設了上海臨港AIDC智算中心,是國內首個5A級智算中心,可支撐20多個千億級大模型同時訓練。商湯這一資本投入,并未獲得市場的認同,原本就大幅虧損,巨額投入反而讓商湯的現金流吃緊。不過,隨著大模型的爆發(fā)式發(fā)展,算力需求高增,商湯所持有的算力能力也成為一種稀缺資源。
全球的資本市場似乎對自建算力都不太感冒,像Meta、Google和AWS這種云服務廠商,雖然一直在上修算力建設上的資本開支,但一看股價走勢,基本沒出現過多驚人的漲幅,或許是短期在業(yè)績上的體現并不明顯,不過全球“堆”算力卻養(yǎng)肥了一批算力產業(yè)鏈,比如算力芯片、服務器、PCB、光模塊等“賣水人”。
商湯另一種盈利模式就是MaaS。就是在自有大模型基礎上進行微調,再通過垂直行業(yè)的數據進行大量訓練,形成專用大模型,再按照用戶對“云+端”兩種模式需求獲得收入。比如“大醫(yī)”模型,主要是服務醫(yī)療領域,商湯本身在計算機視覺領域就很強,再借助海量的醫(yī)療知識和影像數據培養(yǎng)出了多模態(tài)能力極強的大模型,可以提供專業(yè)的醫(yī)療知識服務,更重要的是具備CT、MR和病理等多種醫(yī)學圖像的識別能力;還有在周末人工智能大會發(fā)布的“開悟”世界模型,就是由商湯日日新V6.5大模型賦能而來。
02如何理解具身AI?商湯又能做什么?
可能很多人都有一個認知誤區(qū):在AI高速發(fā)展背后,數據大爆發(fā)帶來的AI需求指數級增長,然而數據即使每天都在增長,也并非是無窮無盡的。
實際上高質量數據是不足的,而相對有限的高質量數據正是訓練LLM(大語言模型)重要“養(yǎng)分”之一,當然也可以通過算法優(yōu)化來強化文本數據質量,但上限明顯。
根據2024年研究機構EpochAI通過分析互聯(lián)網公共文本數據總量與AI訓練需求增速,預測到未來10年內,數據增長的速度無法支撐起大模型的擴展,LLM會在2028年耗盡互聯(lián)網上的所有文本數據,機構預測互聯(lián)網高質量文本的年增速不足5%,將遠低于AI數據需求的指數級增長。
目前大模型對文本數據消耗速度驚人,以ChatGPT為例,2021年的GPT-3的訓練消耗了約3000億Token的文本數據,2023年的GPT-4訓練已經消耗了約13萬億Token的文本數據(13萬億token什么概念,相當于1萬套《四庫全書》的文本總量,一套8億漢字),而GPT-5等下一代模型的需求量可能翻倍,根據《華爾街日報》的報道,OpenAI在訓練GPT-5時已經遇到了文本數據不足的問題,正在考慮使用Youtube公開視頻轉錄出的文本。
正如OA在訓練方式的變化,視頻轉錄文本訓練大模型意味著圖片和視頻數據還有巨大的挖掘空間。目前市場預期大模型消耗數據的一個順序是文本→圖片→視頻,而從文本到圖片和視頻的訓練和推理就需要使用多模態(tài)大模型,即同時處理、理解并融合多種數據類型(模態(tài))的人工智能模型,而商湯早期機器視覺的技術優(yōu)勢或許可以發(fā)揮到淋漓盡致。
相比于先從視頻轉錄出文字,然后用文本訓練。商湯視覺感知+語言能力的多模態(tài)大模型似乎更像人類的“感官協(xié)同”的思維模式,舉個簡單的例子:早上出門,手機落在家里的桌子上,我們的大腦內形成的是“手機在桌子上”這一文本信息與“手機靜置在桌面上”的畫面會同步出現在大腦內。當然很多頭部大模型廠商也都在開發(fā)多模態(tài)大模型。
生成式AI進階到具身AI,筆者的愚拙理解是:生成式AI類似于人類的學習階段,我們從小學到大學的學習中,盡可能地大量汲取通用或專用方面的知識,從教科書(文本)到實習(圖片和視頻)都是在訓練和簡單推理的過程;而具身AI就相當于走向工作崗位,在實時場景的交互實踐中,根據復雜的時序數據,盡可能做出最優(yōu)的推理和決策。
這也對應了大模型廠商的一種思考:當書本與互聯(lián)網知識窮盡時,下一代的智能將從何處獲取新的數據?經典的宏微觀經濟學加一起也就不過千頁,但實際生活中,經濟學復雜且龐大,未來每一次最優(yōu)的決策都是基于上一次并非最優(yōu)決策過程的總結和學習。我們稱之為“經驗”“經歷”,而這些“經歷”正是從生成式AI進化到具身AI期間,大模型在所處垂直領域交互中獲得的新數據,用于自我訓練和推理。
人形機器人和汽車智能化發(fā)展都是具身AI最好的落地應用。除了多模態(tài)的大模型算法和軟件,終端的“感官”技術支持也相當重要。表面看商湯雖然在資本市場表現比較一般,但在AI發(fā)展浪潮中并未落后。左手計算機視覺(CV)的技術+模型,右手是通用大模型,背后還有自建的國內領先的算力中心和自研的推理芯片等硬件支持。這些足以支撐商湯在AI端側爆發(fā)預期下的發(fā)展。
曾經的“AI四小龍之首”還沒老,反而悄悄地完成了從“AI應用”廠商到“全棧AI”的升級。
厭倦了勾心斗角?她選擇快穿養(yǎng)老,享受悠閑人生
5本快穿文:五塊錢招一名弱雞龍?zhí)?男女不限先搶先得
她穿書到末世,收購所有超市囤滿空間,帶上爺爺奶奶進空間躲末世