潘智侑
智東西AI前瞻(公眾號(hào):zhidxcomAI)作者江宇編輯漠影
智東西AI前瞻7月28日?qǐng)?bào)道,今日,在2025世界人工智能大會(huì)(WAIC)期間,啟明創(chuàng)投主管合伙人周志峰發(fā)表主題演講《技術(shù)向上生長(zhǎng),應(yīng)用向下扎根——AI共振周期暨2025AI十大展望發(fā)布》,發(fā)布了“AI十大展望”。
該報(bào)告覆蓋了從基礎(chǔ)模型、多模態(tài)智能體、AI基礎(chǔ)設(shè)施到新型交互與機(jī)器人應(yīng)用等多個(gè)方向,系統(tǒng)梳理了未來(lái)12至24個(gè)月內(nèi)值得關(guān)注的關(guān)鍵技術(shù)與落地趨勢(shì),構(gòu)成了一份面向下一個(gè)AI周期的重要趨勢(shì)圖譜。
在這份年度報(bào)告中,啟明創(chuàng)投將未來(lái)一到兩年的發(fā)展趨勢(shì)概括為“能力突破”與“應(yīng)用深化”兩個(gè)方面。
啟明創(chuàng)投判斷,未來(lái)12到24個(gè)月,大模型領(lǐng)域或?qū)⒂瓉?lái)一次決定性躍遷:基礎(chǔ)模型上下文窗口或拓展至200萬(wàn)Token,通用視頻模型有望實(shí)現(xiàn)生成、推理、理解一體化,徹底改變內(nèi)容創(chuàng)作與人機(jī)交互方式。
如果這些能力得以兌現(xiàn),其直接產(chǎn)物將是“數(shù)字員工”的真正誕生——Agent不再只是工具,而將深入企業(yè)內(nèi)部流程去交付結(jié)果;多模態(tài)智能體也將在高復(fù)雜場(chǎng)景中完成推理與執(zhí)行。
同時(shí),國(guó)產(chǎn)AI芯片將迎來(lái)“國(guó)設(shè)”+“國(guó)造”的大規(guī)模交付,AI原生硬件或?qū)⒃诓糠謭?chǎng)景從手機(jī)上轉(zhuǎn)移出用戶的部分需求,具身智能產(chǎn)品如通用機(jī)器人也有望率先在制造業(yè)和物流業(yè)的揀選、搬運(yùn)和組裝等場(chǎng)景實(shí)現(xiàn)商業(yè)部署。
以下是周志峰演講實(shí)錄(智東西在不影響原意的前提下進(jìn)行了處理):
一、AI投資熱度不減,技術(shù)與應(yīng)用進(jìn)入“共振”周期
一年一度,一期一會(huì)。首先特別開(kāi)心,又能在WAIC啟明創(chuàng)投的創(chuàng)業(yè)與投資論壇上,跟各位新老朋友,無(wú)論是線下參加還是線上看直播的,再次聚在一起。熟悉我們論壇的人都知道,每年都是我來(lái)開(kāi)始這個(gè)“序曲”,引出后續(xù)的演講與討論。
今年我的題目叫“技術(shù)向上生長(zhǎng),應(yīng)用向下扎根”。為什么起這個(gè)名字?我記得2023年我們第一次論壇的時(shí)候,我跟大家分享過(guò)我的感受:做AI投資人最大的感受就是“累”。
當(dāng)時(shí)美國(guó)大模型公司密集發(fā)布新模型,我經(jīng)常凌晨三四點(diǎn)起床,為了搶那些公司發(fā)布會(huì)之后有限的邀請(qǐng)碼,趕緊去試試最新的大模型技術(shù)。
去年我說(shuō),AI越來(lái)越熱鬧,但在任何一個(gè)“大浪潮”熱鬧的時(shí)候,噪音特別多。作為一個(gè)投資人,如何“讓自己安靜下來(lái)”?你真正能夠有自己的獨(dú)立判斷、有自己的思考去進(jìn)行布局,是一件特別不容易的事。
而今年,我覺(jué)得AI產(chǎn)業(yè)又到了一個(gè)新的階段:一方面,技術(shù)還在往上快速增長(zhǎng),沒(méi)有明顯的天花板;另一方面,技術(shù)在性能、成本方面變得“可用”,我們也看到“大規(guī)模的應(yīng)用已經(jīng)開(kāi)始落地”,就像“樹(shù)根一樣”深深扎根、扎實(shí)生長(zhǎng),在創(chuàng)造巨大的價(jià)值。
所以今年AI處在一個(gè)很特別的“周期”——“AI技術(shù)與應(yīng)用的共振周期”。啟明創(chuàng)投在整個(gè)AI產(chǎn)業(yè)鏈上有很多布局,我們投了很多中國(guó)AI領(lǐng)域的企業(yè)。
但我們的信息和觀點(diǎn),并不是“閉門(mén)造車(chē)”自己想出來(lái)的,而是整合了來(lái)自產(chǎn)業(yè)界“一手信息”的成果,這也是我今天十分鐘分享的基礎(chǔ)。從投資人角度講,我依然愿意“累”,因?yàn)檫@是最熱門(mén)的賽道。
大家可以看看,2025年AI占了全球50%以上的投資份額。一個(gè)領(lǐng)域占全球一半的投資,這說(shuō)明:即使AI大模型已經(jīng)成長(zhǎng)了兩三年,大家仍然認(rèn)為“它的潛力依然巨大”。越來(lái)越多投資人,用“真金白銀去投票”,持續(xù)投入到AI中。
這半年甚至一年,很多人在問(wèn):“是不是預(yù)訓(xùn)練這條路快走到頭了,大模型的天花板差不多了?ScalingLaw是不是不靈了?”但從資本的“投票”來(lái)看,不是這樣的。2024年,模型公司拿到了330億美元,占全年全球風(fēng)險(xiǎn)投資的近20%。
二、大模型關(guān)鍵能力躍遷,推理與多模態(tài)成技術(shù)主線
這也說(shuō)明,大模型依然在高速發(fā)展。過(guò)去12個(gè)月,大模型有了很多新突破,比如MOE架構(gòu)、合成數(shù)據(jù)、更長(zhǎng)的上下文窗口等等。如果讓我總結(jié)一兩個(gè)最關(guān)鍵的技術(shù)進(jìn)展,第一個(gè)一定是推理能力。
以前的大模型是靠幾萬(wàn)億個(gè)token做預(yù)訓(xùn)練,壓縮信息。當(dāng)你提問(wèn)時(shí),它只是把“信息轉(zhuǎn)移”給我們?nèi)祟愑脩?。而現(xiàn)在,有了推理能力之后,它能做更深入的邏輯思維,“向前推理,向后反思”,具備了非常復(fù)雜的一些能力。效果非常明顯。
去年這個(gè)時(shí)候,我們?cè)谥vGPT-4o,當(dāng)時(shí),它是最強(qiáng)的模型。但如果用人類智商測(cè)試標(biāo)準(zhǔn),它的成績(jī)不到70分。還記得《阿甘正傳》里的主角ForestGump嗎?他的智商是75,是一位“輕度的智障者”。所以當(dāng)時(shí)的大模型,也只是“人類的輕度智障者”水平,只能做一些簡(jiǎn)單的應(yīng)用,做不了復(fù)雜任務(wù)。
但現(xiàn)在,最新的推理模型,比如上周五發(fā)布的“階躍星辰Step-3”模型,智商已達(dá)到120左右。這意味著什么?全球80億人,有87%的人的智商在90-120分之間。也就是說(shuō),大模型已經(jīng)超越了80%以上人類的智商水平。這是非常重大的進(jìn)展。
另一個(gè)關(guān)鍵是“多模態(tài)”。過(guò)去,我們說(shuō)“大語(yǔ)言模型”,但語(yǔ)言只是人感知和交互的一個(gè)維度。如果能融入語(yǔ)音、圖像、視頻,甚至未來(lái)的物聯(lián)網(wǎng)多維信息,那模型對(duì)世界的感知與交互就會(huì)變得更加豐富多彩。
除了語(yǔ)言主導(dǎo)的模型外,圖像和視頻生成模型的進(jìn)展也很大。今年5月,谷歌發(fā)布的“Veo3”,已經(jīng)能生成非常真實(shí)的視頻,還能自動(dòng)加音效、對(duì)白、背景噪音,讓你感覺(jué)“就像是一個(gè)真實(shí)世界的視頻記錄”。
我們投資的生數(shù)科技,此前也發(fā)布了新一代視頻模型。它可以支持輸入“最多七個(gè)主體”(人、動(dòng)物、汽車(chē)等)的參考圖片,且在生成的視頻中保持這些主體的“高度一致性”。
三、Agent進(jìn)化走向“七月定律”,AI產(chǎn)品應(yīng)用邁向全球
再來(lái)說(shuō)說(shuō)Agent。這是從今年3月開(kāi)始最火的話題。Agent爆火,其實(shí)是因?yàn)榛A(chǔ)模型能力提升了:上下文窗口更大、能使用外部工具,核心還是“推理能力”的增強(qiáng)?,F(xiàn)在甚至出現(xiàn)了“智能體的摩爾定律”——任務(wù)處理復(fù)雜度每七個(gè)月翻一倍。我們可以期待Agent再經(jīng)歷一、兩個(gè)“七個(gè)月周期”后,會(huì)達(dá)到什么樣的智能水平。
今年1月,DeepSeekV3/R1模型發(fā)布,震驚全球。它在“推理成本”上做得非常好,僅為OpenAI對(duì)應(yīng)模型的5%。此后,全球大模型團(tuán)隊(duì)都在壓低成本。谷歌比DeepSeek還降了不少,階躍星辰最新模型的推理成本又比DeepSeek更低?,F(xiàn)在主流的大模型,即使沒(méi)有做蒸餾,完整尺寸大模型的推理成本也已經(jīng)降到每百萬(wàn)Token約1美元,比去年下降了近100倍。
講完技術(shù),我們?cè)倏磻?yīng)用層。大家熟悉的ChatGPT這個(gè)產(chǎn)品,是這波AI浪潮的點(diǎn)火器。2023年7月,我們第一次在WAIC召開(kāi)論壇時(shí),ChatGPT周活用戶不到1億;到2024年舉辦論壇時(shí)是2億;而現(xiàn)在已經(jīng)“差不多八、九億周活用戶”了。AI應(yīng)用發(fā)展速度非??臁?/p>
哈佛商業(yè)評(píng)論最近也總結(jié)了一個(gè)趨勢(shì)——AI產(chǎn)品從輔助創(chuàng)意走向深層互動(dòng)。過(guò)去我們用AI在做圖、寫(xiě)文案時(shí)產(chǎn)生創(chuàng)意,參考它的idea。但現(xiàn)在,療愈陪伴產(chǎn)品成了最常用的應(yīng)用,真正幫助用戶尋找情緒出口,成為一個(gè)數(shù)字化的陪伴者。
Token調(diào)用量也反映了應(yīng)用熱度,比如豆包,12個(gè)月內(nèi)調(diào)用量增長(zhǎng)了超過(guò)100多倍。
硬件方面也有進(jìn)展。我們投的“未來(lái)智能”推出的翻譯耳機(jī),用戶已突破100萬(wàn)。PlaudAI這個(gè)華人團(tuán)隊(duì)主攻北美市場(chǎng),也剛剛突破百萬(wàn)用戶。
人形機(jī)器人在中國(guó)開(kāi)始率先落地。比如兩周前,優(yōu)必選剛簽了全球最大的人形機(jī)器人訂單;智元與宇樹(shù)也中標(biāo)了真實(shí)落地場(chǎng)景。
還有一個(gè)趨勢(shì)是“全球化”。過(guò)去互聯(lián)網(wǎng)公司是“本地稱王,再拓海外”;但現(xiàn)在,AI產(chǎn)品“生而全球”。比如快手的可靈AI,網(wǎng)頁(yè)端80%流量來(lái)自海外。生數(shù)科技的視頻生成平臺(tái)ViduAI,上線3個(gè)月用戶超1000萬(wàn),其中80%以上也來(lái)自海外。
四、十大預(yù)測(cè):基礎(chǔ)突破、應(yīng)用轉(zhuǎn)向與硬件新形態(tài)
我們每次分享的最后,也是最重要的環(huán)節(jié),我們?cè)俅翁魬?zhàn)一下自己,跟大家聊聊我們對(duì)接下來(lái)12個(gè)月到18個(gè)月的十大展望。
1、基礎(chǔ)模型上下文窗口突破
今年的展望,第一個(gè)是關(guān)于基礎(chǔ)模型。我們認(rèn)為基礎(chǔ)模型會(huì)有很多創(chuàng)新,但有一點(diǎn),就是12個(gè)月內(nèi),中國(guó)和美國(guó)的頭部基礎(chǔ)模型就會(huì)達(dá)到一個(gè)200萬(wàn)Token的上下文窗口。從供給端看,注意力機(jī)制等架構(gòu)的創(chuàng)新正在推動(dòng)長(zhǎng)文本能力迅速突破;而從需求端看,只有上下文窗口更長(zhǎng),才能生成出真正有細(xì)節(jié)、有連貫性的、貼合語(yǔ)境的高質(zhì)量?jī)?nèi)容。
2、通用視頻模型進(jìn)入實(shí)用期
第二個(gè)是關(guān)于多模態(tài)模型。其實(shí)不光是我們啟明自己的判斷,我們也結(jié)合了很多企業(yè)家、科學(xué)家、創(chuàng)新者的智慧。
在這個(gè)領(lǐng)域,我們判斷未來(lái)一到兩年之內(nèi),會(huì)出現(xiàn)真正的通用視頻模型,可以處理在視頻模態(tài)下的多種任務(wù),包括生成、推理和任務(wù)理解,促進(jìn)“內(nèi)容生成”以及“交互方式”的革新。
3、Agent邁入“數(shù)字員工”時(shí)代
那下一個(gè)是關(guān)于AIAgent。AIAgent也是現(xiàn)在非常熱的話題。我們判斷在未來(lái)12到14個(gè)月,Agent的形態(tài)將從“工具的輔助”走向“真正的任務(wù)承接”。
在未來(lái),我們認(rèn)為兩年之內(nèi)會(huì)有真正意義上的“首批數(shù)字員工”進(jìn)入企業(yè)內(nèi)部,廣泛參與企業(yè)的研發(fā)、銷售、運(yùn)營(yíng)和客戶服務(wù)等重要環(huán)節(jié)。這意味著AIAgent不再僅作為助手存在,而是從“成本工具”走向了“價(jià)值創(chuàng)造”,具備主動(dòng)承擔(dān)OKR、主動(dòng)反饋、協(xié)同作業(yè)等能力。
4、多模態(tài)Agent將不斷走向?qū)嵱没?/p>
多模態(tài)Agent將能夠融合視覺(jué)、語(yǔ)音、傳感器等多源輸入,進(jìn)行復(fù)雜推理、工具調(diào)用與任務(wù)執(zhí)行,在醫(yī)療、金融、法律等行業(yè)率先實(shí)現(xiàn)突破。
5、更多國(guó)設(shè)國(guó)造的GPU開(kāi)啟批量交付
然后下面是關(guān)于AI的基礎(chǔ)設(shè)施,第一個(gè)是關(guān)于芯片。我們認(rèn)為未來(lái)12個(gè)月到18個(gè)月內(nèi),有望看到越來(lái)越多所謂“國(guó)設(shè)”且“國(guó)造”的GPU問(wèn)世。
不光是中國(guó)團(tuán)隊(duì)設(shè)計(jì)的GPU,而且是在中國(guó)的供應(yīng)鏈中生產(chǎn)的GPU,能夠真正走向市場(chǎng),批量交付。這將是對(duì)中國(guó)AI行業(yè)一個(gè)巨大的好消息。
但與此同時(shí),我們也會(huì)看到很多新一代去顛覆傳統(tǒng)GPU的“馮諾依曼架構(gòu)”的AI芯片出現(xiàn)。比如說(shuō)3D內(nèi)存堆疊、通算融合等新一代AI芯片,也會(huì)慢慢走向市場(chǎng)、嶄露頭角。
6、AIInfra側(cè)將大幅降低Token成本
接下來(lái)是我們對(duì)另一個(gè)AI基礎(chǔ)設(shè)施層的判斷。過(guò)去兩年推理成本已下降了超百倍,我們判斷這個(gè)趨勢(shì)還會(huì)繼續(xù)。
未來(lái)12到24個(gè)月,Token的消耗量還會(huì)再提高1到2個(gè)數(shù)量級(jí)。集群推理優(yōu)化、終端推理優(yōu)化,和軟硬件協(xié)同優(yōu)化,將成為AI基礎(chǔ)設(shè)施進(jìn)一步降低Token成本的關(guān)鍵路徑。
7、AI催生“非屏幕中心”的新型硬件
再說(shuō)說(shuō)應(yīng)用,我們比較確信未來(lái)很快會(huì)看到一次“范式轉(zhuǎn)移”。也就是說(shuō),過(guò)去或現(xiàn)在我們主要的應(yīng)用,都是基于手機(jī),基于“人+屏幕”的人機(jī)交互方式。手機(jī)這種屏幕中心的人機(jī)交互方式,已經(jīng)越來(lái)越跟不上AI能力的發(fā)展。
未來(lái)會(huì)出現(xiàn)很多更自然、更符合人性的“人機(jī)交互方式”,改變我們使用手機(jī)的習(xí)慣。也許會(huì)很快出現(xiàn)一種“能承載AI能力、又符合人性的交互”的新硬件形態(tài)。就像當(dāng)年手機(jī),在15年前、20年前把PC上的很多人類需求“轉(zhuǎn)移”出來(lái)一樣,新一代的硬件,也會(huì)把我們今天很多人類需求從手機(jī)上“轉(zhuǎn)移出來(lái)”。
8、垂類切入成為創(chuàng)業(yè)破局關(guān)鍵
從我們投資人、創(chuàng)業(yè)者的角度,我們其實(shí)比較喜歡“gonarrowandgodeep”。我們的策略就是:應(yīng)該找一個(gè)垂直細(xì)分場(chǎng)景,把它做深做透。這樣企業(yè)才能更有效地與大廠形成差異化競(jìng)爭(zhēng),走出所謂大廠的“巨人陰影”。
9、AI-BPO模式崛起
另外一個(gè)關(guān)于AI應(yīng)用的預(yù)測(cè),我們也看到,過(guò)去幾年,從賣(mài)license,到賣(mài)訂閱,各種商業(yè)模式越來(lái)越豐富。而現(xiàn)在我們看到一種新模式正在異軍突起,即“AIBPO”——也就是AI驅(qū)動(dòng)的業(yè)務(wù)外包。
AIBPO(業(yè)務(wù)外包)模式將在未來(lái)12-24個(gè)月實(shí)現(xiàn)商業(yè)化突破,從“交付工具”走向“交付結(jié)果”,并通過(guò)“按結(jié)果付費(fèi)”的方式,在金融、客服、營(yíng)銷、電商等流程標(biāo)準(zhǔn)化行業(yè)快速擴(kuò)張。
10、具身智能將在三個(gè)場(chǎng)景率先落地
最后一個(gè)預(yù)測(cè),是這幾個(gè)月最熱的“具身智能”。很多媒體都在問(wèn)我:“你們覺(jué)得具身智能機(jī)器人,最先會(huì)在哪些真正有用的場(chǎng)景落地?而不是只是舞臺(tái)表演?”我們大膽預(yù)測(cè),未來(lái)12至18個(gè)月內(nèi),會(huì)在挑選、搬運(yùn)和組裝三個(gè)場(chǎng)景率先落地,而且是“規(guī)?;涞亍薄艺f(shuō)的“規(guī)?;笔恰吧锨_(tái)、上萬(wàn)臺(tái)”的落地。
我們覺(jué)得這點(diǎn)非常關(guān)鍵。只有在一些細(xì)分場(chǎng)景落地之后,才會(huì)形成“從模型、本體到場(chǎng)景數(shù)據(jù)”的飛輪效應(yīng),推動(dòng)整個(gè)具身智能技術(shù)高速向前發(fā)展。
來(lái)源:紅網(wǎng)
作者:黃心俐
編輯:吳佩霖
本文為紅辣椒評(píng)論 原創(chuàng)文章,僅系作者個(gè)人觀點(diǎn),不代表紅網(wǎng)立場(chǎng)。轉(zhuǎn)載請(qǐng)附原文出處鏈接和本聲明。