智東西AI前瞻(公眾號:zhidxcomAI)作者江宇編輯漠影
智東西AI前瞻7月28日報道,今日,在2025世界人工智能大會(WAIC)期間,啟明創(chuàng)投主管合伙人周志峰發(fā)表主題演講《技術(shù)向上生長,應(yīng)用向下扎根——AI共振周期暨2025AI十大展望發(fā)布》,發(fā)布了“AI十大展望”。
該報告覆蓋了從基礎(chǔ)模型、多模態(tài)智能體、AI基礎(chǔ)設(shè)施到新型交互與機(jī)器人應(yīng)用等多個方向,系統(tǒng)梳理了未來12至24個月內(nèi)值得關(guān)注的關(guān)鍵技術(shù)與落地趨勢,構(gòu)成了一份面向下一個AI周期的重要趨勢圖譜。
在這份年度報告中,啟明創(chuàng)投將未來一到兩年的發(fā)展趨勢概括為“能力突破”與“應(yīng)用深化”兩個方面。
啟明創(chuàng)投判斷,未來12到24個月,大模型領(lǐng)域或?qū)⒂瓉硪淮螞Q定性躍遷:基礎(chǔ)模型上下文窗口或拓展至200萬Token,通用視頻模型有望實現(xiàn)生成、推理、理解一體化,徹底改變內(nèi)容創(chuàng)作與人機(jī)交互方式。
如果這些能力得以兌現(xiàn),其直接產(chǎn)物將是“數(shù)字員工”的真正誕生——Agent不再只是工具,而將深入企業(yè)內(nèi)部流程去交付結(jié)果;多模態(tài)智能體也將在高復(fù)雜場景中完成推理與執(zhí)行。
同時,國產(chǎn)AI芯片將迎來“國設(shè)”+“國造”的大規(guī)模交付,AI原生硬件或?qū)⒃诓糠謭鼍皬氖謾C(jī)上轉(zhuǎn)移出用戶的部分需求,具身智能產(chǎn)品如通用機(jī)器人也有望率先在制造業(yè)和物流業(yè)的揀選、搬運和組裝等場景實現(xiàn)商業(yè)部署。
以下是周志峰演講實錄(智東西在不影響原意的前提下進(jìn)行了處理):
一、AI投資熱度不減,技術(shù)與應(yīng)用進(jìn)入“共振”周期
一年一度,一期一會。首先特別開心,又能在WAIC啟明創(chuàng)投的創(chuàng)業(yè)與投資論壇上,跟各位新老朋友,無論是線下參加還是線上看直播的,再次聚在一起。熟悉我們論壇的人都知道,每年都是我來開始這個“序曲”,引出后續(xù)的演講與討論。
今年我的題目叫“技術(shù)向上生長,應(yīng)用向下扎根”。為什么起這個名字?我記得2023年我們第一次論壇的時候,我跟大家分享過我的感受:做AI投資人最大的感受就是“累”。
當(dāng)時美國大模型公司密集發(fā)布新模型,我經(jīng)常凌晨三四點起床,為了搶那些公司發(fā)布會之后有限的邀請碼,趕緊去試試最新的大模型技術(shù)。
去年我說,AI越來越熱鬧,但在任何一個“大浪潮”熱鬧的時候,噪音特別多。作為一個投資人,如何“讓自己安靜下來”?你真正能夠有自己的獨立判斷、有自己的思考去進(jìn)行布局,是一件特別不容易的事。
而今年,我覺得AI產(chǎn)業(yè)又到了一個新的階段:一方面,技術(shù)還在往上快速增長,沒有明顯的天花板;另一方面,技術(shù)在性能、成本方面變得“可用”,我們也看到“大規(guī)模的應(yīng)用已經(jīng)開始落地”,就像“樹根一樣”深深扎根、扎實生長,在創(chuàng)造巨大的價值。
所以今年AI處在一個很特別的“周期”——“AI技術(shù)與應(yīng)用的共振周期”。啟明創(chuàng)投在整個AI產(chǎn)業(yè)鏈上有很多布局,我們投了很多中國AI領(lǐng)域的企業(yè)。
但我們的信息和觀點,并不是“閉門造車”自己想出來的,而是整合了來自產(chǎn)業(yè)界“一手信息”的成果,這也是我今天十分鐘分享的基礎(chǔ)。從投資人角度講,我依然愿意“累”,因為這是最熱門的賽道。
大家可以看看,2025年AI占了全球50%以上的投資份額。一個領(lǐng)域占全球一半的投資,這說明:即使AI大模型已經(jīng)成長了兩三年,大家仍然認(rèn)為“它的潛力依然巨大”。越來越多投資人,用“真金白銀去投票”,持續(xù)投入到AI中。
這半年甚至一年,很多人在問:“是不是預(yù)訓(xùn)練這條路快走到頭了,大模型的天花板差不多了?ScalingLaw是不是不靈了?”但從資本的“投票”來看,不是這樣的。2024年,模型公司拿到了330億美元,占全年全球風(fēng)險投資的近20%。
二、大模型關(guān)鍵能力躍遷,推理與多模態(tài)成技術(shù)主線
這也說明,大模型依然在高速發(fā)展。過去12個月,大模型有了很多新突破,比如MOE架構(gòu)、合成數(shù)據(jù)、更長的上下文窗口等等。如果讓我總結(jié)一兩個最關(guān)鍵的技術(shù)進(jìn)展,第一個一定是推理能力。
以前的大模型是靠幾萬億個token做預(yù)訓(xùn)練,壓縮信息。當(dāng)你提問時,它只是把“信息轉(zhuǎn)移”給我們?nèi)祟愑脩?。而現(xiàn)在,有了推理能力之后,它能做更深入的邏輯思維,“向前推理,向后反思”,具備了非常復(fù)雜的一些能力。效果非常明顯。
去年這個時候,我們在講GPT-4o,當(dāng)時,它是最強(qiáng)的模型。但如果用人類智商測試標(biāo)準(zhǔn),它的成績不到70分。還記得《阿甘正傳》里的主角ForestGump嗎?他的智商是75,是一位“輕度的智障者”。所以當(dāng)時的大模型,也只是“人類的輕度智障者”水平,只能做一些簡單的應(yīng)用,做不了復(fù)雜任務(wù)。
但現(xiàn)在,最新的推理模型,比如上周五發(fā)布的“階躍星辰Step-3”模型,智商已達(dá)到120左右。這意味著什么?全球80億人,有87%的人的智商在90-120分之間。也就是說,大模型已經(jīng)超越了80%以上人類的智商水平。這是非常重大的進(jìn)展。
另一個關(guān)鍵是“多模態(tài)”。過去,我們說“大語言模型”,但語言只是人感知和交互的一個維度。如果能融入語音、圖像、視頻,甚至未來的物聯(lián)網(wǎng)多維信息,那模型對世界的感知與交互就會變得更加豐富多彩。
除了語言主導(dǎo)的模型外,圖像和視頻生成模型的進(jìn)展也很大。今年5月,谷歌發(fā)布的“Veo3”,已經(jīng)能生成非常真實的視頻,還能自動加音效、對白、背景噪音,讓你感覺“就像是一個真實世界的視頻記錄”。
我們投資的生數(shù)科技,此前也發(fā)布了新一代視頻模型。它可以支持輸入“最多七個主體”(人、動物、汽車等)的參考圖片,且在生成的視頻中保持這些主體的“高度一致性”。
三、Agent進(jìn)化走向“七月定律”,AI產(chǎn)品應(yīng)用邁向全球
再來說說Agent。這是從今年3月開始最火的話題。Agent爆火,其實是因為基礎(chǔ)模型能力提升了:上下文窗口更大、能使用外部工具,核心還是“推理能力”的增強(qiáng)。現(xiàn)在甚至出現(xiàn)了“智能體的摩爾定律”——任務(wù)處理復(fù)雜度每七個月翻一倍。我們可以期待Agent再經(jīng)歷一、兩個“七個月周期”后,會達(dá)到什么樣的智能水平。
今年1月,DeepSeekV3/R1模型發(fā)布,震驚全球。它在“推理成本”上做得非常好,僅為OpenAI對應(yīng)模型的5%。此后,全球大模型團(tuán)隊都在壓低成本。谷歌比DeepSeek還降了不少,階躍星辰最新模型的推理成本又比DeepSeek更低?,F(xiàn)在主流的大模型,即使沒有做蒸餾,完整尺寸大模型的推理成本也已經(jīng)降到每百萬Token約1美元,比去年下降了近100倍。
講完技術(shù),我們再看應(yīng)用層。大家熟悉的ChatGPT這個產(chǎn)品,是這波AI浪潮的點火器。2023年7月,我們第一次在WAIC召開論壇時,ChatGPT周活用戶不到1億;到2024年舉辦論壇時是2億;而現(xiàn)在已經(jīng)“差不多八、九億周活用戶”了。AI應(yīng)用發(fā)展速度非???。
哈佛商業(yè)評論最近也總結(jié)了一個趨勢——AI產(chǎn)品從輔助創(chuàng)意走向深層互動。過去我們用AI在做圖、寫文案時產(chǎn)生創(chuàng)意,參考它的idea。但現(xiàn)在,療愈陪伴產(chǎn)品成了最常用的應(yīng)用,真正幫助用戶尋找情緒出口,成為一個數(shù)字化的陪伴者。
Token調(diào)用量也反映了應(yīng)用熱度,比如豆包,12個月內(nèi)調(diào)用量增長了超過100多倍。
硬件方面也有進(jìn)展。我們投的“未來智能”推出的翻譯耳機(jī),用戶已突破100萬。PlaudAI這個華人團(tuán)隊主攻北美市場,也剛剛突破百萬用戶。
人形機(jī)器人在中國開始率先落地。比如兩周前,優(yōu)必選剛簽了全球最大的人形機(jī)器人訂單;智元與宇樹也中標(biāo)了真實落地場景。
還有一個趨勢是“全球化”。過去互聯(lián)網(wǎng)公司是“本地稱王,再拓海外”;但現(xiàn)在,AI產(chǎn)品“生而全球”。比如快手的可靈AI,網(wǎng)頁端80%流量來自海外。生數(shù)科技的視頻生成平臺ViduAI,上線3個月用戶超1000萬,其中80%以上也來自海外。
四、十大預(yù)測:基礎(chǔ)突破、應(yīng)用轉(zhuǎn)向與硬件新形態(tài)
我們每次分享的最后,也是最重要的環(huán)節(jié),我們再次挑戰(zhàn)一下自己,跟大家聊聊我們對接下來12個月到18個月的十大展望。
1、基礎(chǔ)模型上下文窗口突破
今年的展望,第一個是關(guān)于基礎(chǔ)模型。我們認(rèn)為基礎(chǔ)模型會有很多創(chuàng)新,但有一點,就是12個月內(nèi),中國和美國的頭部基礎(chǔ)模型就會達(dá)到一個200萬Token的上下文窗口。從供給端看,注意力機(jī)制等架構(gòu)的創(chuàng)新正在推動長文本能力迅速突破;而從需求端看,只有上下文窗口更長,才能生成出真正有細(xì)節(jié)、有連貫性的、貼合語境的高質(zhì)量內(nèi)容。
2、通用視頻模型進(jìn)入實用期
第二個是關(guān)于多模態(tài)模型。其實不光是我們啟明自己的判斷,我們也結(jié)合了很多企業(yè)家、科學(xué)家、創(chuàng)新者的智慧。
在這個領(lǐng)域,我們判斷未來一到兩年之內(nèi),會出現(xiàn)真正的通用視頻模型,可以處理在視頻模態(tài)下的多種任務(wù),包括生成、推理和任務(wù)理解,促進(jìn)“內(nèi)容生成”以及“交互方式”的革新。
3、Agent邁入“數(shù)字員工”時代
那下一個是關(guān)于AIAgent。AIAgent也是現(xiàn)在非常熱的話題。我們判斷在未來12到14個月,Agent的形態(tài)將從“工具的輔助”走向“真正的任務(wù)承接”。
在未來,我們認(rèn)為兩年之內(nèi)會有真正意義上的“首批數(shù)字員工”進(jìn)入企業(yè)內(nèi)部,廣泛參與企業(yè)的研發(fā)、銷售、運營和客戶服務(wù)等重要環(huán)節(jié)。這意味著AIAgent不再僅作為助手存在,而是從“成本工具”走向了“價值創(chuàng)造”,具備主動承擔(dān)OKR、主動反饋、協(xié)同作業(yè)等能力。
4、多模態(tài)Agent將不斷走向?qū)嵱没?/p>
多模態(tài)Agent將能夠融合視覺、語音、傳感器等多源輸入,進(jìn)行復(fù)雜推理、工具調(diào)用與任務(wù)執(zhí)行,在醫(yī)療、金融、法律等行業(yè)率先實現(xiàn)突破。
5、更多國設(shè)國造的GPU開啟批量交付
然后下面是關(guān)于AI的基礎(chǔ)設(shè)施,第一個是關(guān)于芯片。我們認(rèn)為未來12個月到18個月內(nèi),有望看到越來越多所謂“國設(shè)”且“國造”的GPU問世。
不光是中國團(tuán)隊設(shè)計的GPU,而且是在中國的供應(yīng)鏈中生產(chǎn)的GPU,能夠真正走向市場,批量交付。這將是對中國AI行業(yè)一個巨大的好消息。
但與此同時,我們也會看到很多新一代去顛覆傳統(tǒng)GPU的“馮諾依曼架構(gòu)”的AI芯片出現(xiàn)。比如說3D內(nèi)存堆疊、通算融合等新一代AI芯片,也會慢慢走向市場、嶄露頭角。
6、AIInfra側(cè)將大幅降低Token成本
接下來是我們對另一個AI基礎(chǔ)設(shè)施層的判斷。過去兩年推理成本已下降了超百倍,我們判斷這個趨勢還會繼續(xù)。
未來12到24個月,Token的消耗量還會再提高1到2個數(shù)量級。集群推理優(yōu)化、終端推理優(yōu)化,和軟硬件協(xié)同優(yōu)化,將成為AI基礎(chǔ)設(shè)施進(jìn)一步降低Token成本的關(guān)鍵路徑。
7、AI催生“非屏幕中心”的新型硬件
再說說應(yīng)用,我們比較確信未來很快會看到一次“范式轉(zhuǎn)移”。也就是說,過去或現(xiàn)在我們主要的應(yīng)用,都是基于手機(jī),基于“人+屏幕”的人機(jī)交互方式。手機(jī)這種屏幕中心的人機(jī)交互方式,已經(jīng)越來越跟不上AI能力的發(fā)展。
未來會出現(xiàn)很多更自然、更符合人性的“人機(jī)交互方式”,改變我們使用手機(jī)的習(xí)慣。也許會很快出現(xiàn)一種“能承載AI能力、又符合人性的交互”的新硬件形態(tài)。就像當(dāng)年手機(jī),在15年前、20年前把PC上的很多人類需求“轉(zhuǎn)移”出來一樣,新一代的硬件,也會把我們今天很多人類需求從手機(jī)上“轉(zhuǎn)移出來”。
8、垂類切入成為創(chuàng)業(yè)破局關(guān)鍵
從我們投資人、創(chuàng)業(yè)者的角度,我們其實比較喜歡“gonarrowandgodeep”。我們的策略就是:應(yīng)該找一個垂直細(xì)分場景,把它做深做透。這樣企業(yè)才能更有效地與大廠形成差異化競爭,走出所謂大廠的“巨人陰影”。
9、AI-BPO模式崛起
另外一個關(guān)于AI應(yīng)用的預(yù)測,我們也看到,過去幾年,從賣license,到賣訂閱,各種商業(yè)模式越來越豐富。而現(xiàn)在我們看到一種新模式正在異軍突起,即“AIBPO”——也就是AI驅(qū)動的業(yè)務(wù)外包。
AIBPO(業(yè)務(wù)外包)模式將在未來12-24個月實現(xiàn)商業(yè)化突破,從“交付工具”走向“交付結(jié)果”,并通過“按結(jié)果付費”的方式,在金融、客服、營銷、電商等流程標(biāo)準(zhǔn)化行業(yè)快速擴(kuò)張。
10、具身智能將在三個場景率先落地
最后一個預(yù)測,是這幾個月最熱的“具身智能”。很多媒體都在問我:“你們覺得具身智能機(jī)器人,最先會在哪些真正有用的場景落地?而不是只是舞臺表演?”我們大膽預(yù)測,未來12至18個月內(nèi),會在挑選、搬運和組裝三個場景率先落地,而且是“規(guī)?;涞亍薄艺f的“規(guī)?;笔恰吧锨_、上萬臺”的落地。
我們覺得這點非常關(guān)鍵。只有在一些細(xì)分場景落地之后,才會形成“從模型、本體到場景數(shù)據(jù)”的飛輪效應(yīng),推動整個具身智能技術(shù)高速向前發(fā)展。
小說:穿越三國成系統(tǒng)宿主,本以為無敵,卻被猛將追得滿街跑
唐雨蹲在地上,雙手抱著趙信的腦袋,雖美眸之中滿是慌張,但卻仍有理智,吩咐道:“飄兒,趕緊去找朱童。他是個獵戶,尋常打獵也會采取草藥,應(yīng)該知道些急救辦法?!憋h兒便是方才給給唐雨出頭的彪悍丫頭,聽得這話,急忙點頭答應(yīng)一聲,撒開小腳丫子往外飛奔-——。此時的趙信對外面發(fā)生的事情一概不知,腦袋的劇烈疼痛,同時伴隨著諸多 他想起曾經(jīng)看過一本名叫《四方記聞》的古書,作者則是鶴鳴山的一位長老,里面記載了長老在外游歷遇到的很多實事-。其中有這樣一個經(jīng)歷,一位獵戶有天打了一只狐貍,肉吃了,剝下來的狐貍皮給媳婦做成了一件小皮襖,但是從此之后獵戶的媳婦就有了異常,每到晚上都會哭鬧,在哭鬧的過程中還會埋怨獵戶,那種幽怨和恨有幫助請點贊|。小說:新皇征召天行者戰(zhàn)魔皇,武考之際竟要招親?