生成式AI的問世讓整體社會(huì)對(duì)于算力的需求有了質(zhì)的飛躍,尤其是當(dāng)生成式快速發(fā)展的當(dāng)下,AI已經(jīng)從大模型走向了智能體、具身智能的時(shí)代。每個(gè)企業(yè)、每個(gè)人都有了更多對(duì)于智算的需求。
一方面,AI的影響下,原有算力正在經(jīng)歷不斷被顛覆的過程;另一方面,AI的賦能下,對(duì)于底層算力基礎(chǔ)設(shè)施也帶來智能化改造的機(jī)會(huì)。
算力需求正在發(fā)生變化
據(jù)IDC數(shù)據(jù)顯示,2024年全球人工智能服務(wù)器市場(chǎng)規(guī)模為1251億美元,2025年將增至1587億美元,2028年有望達(dá)到2227億美元,其中生成式人工智能服務(wù)器占比將從2025年的29.6%提升至2028年的37.7%。
聚焦中國算力市場(chǎng),IDC數(shù)據(jù)顯示,2025年,中國智能算力規(guī)模將達(dá)到1037.3EFLOPS,預(yù)計(jì)2028年將達(dá)到2781.9EFLOPS;中國通用算力規(guī)模將達(dá)到85.8EFLOPS,預(yù)計(jì)2028年將達(dá)到140.1EFLOPS,對(duì)此,IDC中國副總裁周震剛曾告訴筆者,從增加趨勢(shì)上分析,2023-2028年,中國智能算力五年年復(fù)合增長率預(yù)計(jì)將達(dá)到46.2%,通用算力預(yù)計(jì)將達(dá)到18.8%,“從數(shù)據(jù)上不難看出,目前,用戶對(duì)于算力的需求,絕大部分的增量將產(chǎn)生在智能算力方面?!敝苷饎倧?qiáng)調(diào)。
在模型參數(shù)不斷增加的情況下,單集群訓(xùn)練大模型已經(jīng)略顯“吃力”,跨域、跨集群混訓(xùn)大模型已經(jīng)成為當(dāng)下訓(xùn)練大模型的趨勢(shì)。比如,日前,上海人工智能實(shí)驗(yàn)室發(fā)布DeepLink超大規(guī)??缬蚧煊?xùn)技術(shù)方案,支持千公里多智算中心跨域長穩(wěn)混訓(xùn)千億參數(shù)大模型,例如跨越1500公里連接上海和濟(jì)南之間的智算中心,實(shí)現(xiàn)北京、上海與貴州等多地智算中心互聯(lián)和大模型混訓(xùn)等。
而實(shí)現(xiàn)跨域混訓(xùn)模型產(chǎn)品一方面是模型訓(xùn)練技術(shù)上的提升,另一方面也離不開近年來算網(wǎng)的建設(shè),國家數(shù)據(jù)局局長劉烈宏曾在2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會(huì)上表示,截至2024年6月底,“東數(shù)西算”八大國家樞紐節(jié)點(diǎn)直接投資超過435億元,拉動(dòng)投資超過2000億元,機(jī)架總規(guī)模超過195萬架,整體上架率達(dá)63%左右?!皷|數(shù)西算”工程正式啟動(dòng)以來,東西部樞紐節(jié)點(diǎn)間網(wǎng)絡(luò)時(shí)延已基本滿足20毫秒要求,新建數(shù)據(jù)中心PUE(電能利用效率)最低降至1.04,東部算力需求有序向西部遷移,算力集聚效應(yīng)初步顯現(xiàn)。
不過在跨集群、跨域模型混訓(xùn)的過程中,企業(yè)也面臨很多問題,對(duì)此,并行科技AI云事業(yè)部總經(jīng)理趙鴻冰告訴筆者,跨集群混訓(xùn)大多時(shí)候就意味著需要鏈接不同的算力服務(wù)供應(yīng)商,供應(yīng)商之間的協(xié)議接口如何打通是技術(shù)層面首當(dāng)其沖要面對(duì)的問題,“這就考驗(yàn)了算力服務(wù)商的服務(wù)能力?!壁w鴻冰強(qiáng)調(diào)。
除了技術(shù)層面的問題之外,商業(yè)利益的問題也是不容忽視的一個(gè)挑戰(zhàn)。原先商業(yè)模式下,用戶絕大部分模型訓(xùn)練處于一個(gè)算力服務(wù)商內(nèi),即便算力不夠,外接部分其余算力服務(wù)商,在算力計(jì)價(jià)方面也好操作,但是混合之后,雖然用戶不知道,也不需要知道自己用了哪家服務(wù)商的算力,在用戶側(cè)沒有感受,但在服務(wù)商這一側(cè),如何做好算力調(diào)度平臺(tái)內(nèi)的商業(yè)利益劃分,在趙鴻冰看來,也是當(dāng)前需要面對(duì)的一個(gè)現(xiàn)實(shí)問題。
另一方面,伴隨著AI大模型的發(fā)展,用戶對(duì)于算力的需求從原先的單純的訓(xùn)練需求,逐漸轉(zhuǎn)向問訓(xùn)練、推理算力都有,“而且從目前需求上來看,在DeepSeek問世之后,推理算力的需求越來越大?!壁w鴻冰進(jìn)一步指出,“總體而言,算力行業(yè)正從‘規(guī)模驅(qū)動(dòng)’轉(zhuǎn)向‘效率驅(qū)動(dòng)’,技術(shù)門檻降低將吸引更多參與者,形成多元化競(jìng)爭格局?!?/p>
無獨(dú)有偶,清程極智CEO湯雄超也對(duì)筆者表示,通過本屆WAIC可以看出,AI技術(shù)的主要方向,已經(jīng)成預(yù)訓(xùn)練轉(zhuǎn)向了后訓(xùn)練及推理階段,“算力需求也正在從訓(xùn)練側(cè),轉(zhuǎn)向推理側(cè)?!睖鄢赋?。
這種需求的改變也推動(dòng)了算力服務(wù)模式的改變,對(duì)此,趙鴻冰告訴鈦媒體APP,算力服務(wù)模式正在從傳統(tǒng)IaaS(基礎(chǔ)設(shè)施即服務(wù))向MaaS(模型即服務(wù))升級(jí),在這個(gè)過程中,從業(yè)務(wù)場(chǎng)景方面來看,將會(huì)更面向行業(yè)落地,云廠商通過預(yù)置DeepSeek優(yōu)化模型提供端到端解決方案,降低客戶算力采購復(fù)雜度。
而在此次WAIC期間,也有不少云服務(wù)商推出了一些新的算力服務(wù)理念,以浪潮云為例,浪潮云從過去以集中提供通用算力為主,到現(xiàn)在適應(yīng)客戶對(duì)算力服務(wù)小型化、專業(yè)化、分散化的需求,建設(shè)了人工智能工廠,為客戶提供個(gè)性化、定制化的算力服務(wù)。
據(jù)展區(qū)工作人員介紹,浪潮人工智能工廠作為新型人工智能基礎(chǔ)設(shè)施,是國內(nèi)首個(gè)面向行業(yè)場(chǎng)景,具備工業(yè)化、標(biāo)準(zhǔn)化、規(guī)?;a(chǎn)能力的人工智能生產(chǎn)流水線,重點(diǎn)解決人工智能全生命周期的標(biāo)準(zhǔn)化、自動(dòng)化和規(guī)?;a(chǎn)問題?!澳壳埃顺比斯ぶ悄芄S已沉淀61道工序、113套工具,并基于工匠中心持續(xù)提升生產(chǎn)能力與水平,同時(shí)依托工廠化運(yùn)營模式,廣泛匯聚人工智能產(chǎn)業(yè)鏈上下游生態(tài),打造產(chǎn)業(yè)核心載體與創(chuàng)新引擎?!痹撁ぷ魅藛T對(duì)筆者表示。
算網(wǎng)建設(shè)是關(guān)鍵
在算力需求變化的過程中,企業(yè)在對(duì)算力的認(rèn)知也存在了一些偏差與誤區(qū)。對(duì)此,趙鴻冰告訴筆者,原先,企業(yè)自建算力基礎(chǔ)設(shè)施可能是一個(gè)比較“劃算”的應(yīng)用算力的形態(tài),但這種模式在現(xiàn)階段存在了一定弊端。“首先,企業(yè)選擇自建算力基礎(chǔ)設(shè)施的過程中,一次性投入很大,尤其是要能支撐起當(dāng)前AI算力需求的硬件投入是十分龐大的,且周期很長,不能滿足企業(yè)短時(shí)間的業(yè)務(wù)需求,”趙鴻冰進(jìn)一步指出,“其次,對(duì)于大多數(shù)企業(yè)而言,業(yè)務(wù)規(guī)模沒有達(dá)到那么大量的需求,建設(shè)好的機(jī)房利用率很低,有一些甚至不足30%,這對(duì)于企業(yè)而言,相當(dāng)于‘花大錢,半小事’,十分不劃算?!?/p>
除此之外,湯雄超也告訴筆者,AI發(fā)展火爆的當(dāng)下,絕大多數(shù)企業(yè)管理對(duì)算力基礎(chǔ)設(shè)施有了一定了解,但有不少管理者過于注重字面上性能的指標(biāo),缺少對(duì)于場(chǎng)景深入的認(rèn)知,“例如,這個(gè)場(chǎng)景下,算力是偶爾被使用,還是需要頻繁調(diào)??;是偏探索型的業(yè)務(wù),還是企業(yè)日常核心業(yè)務(wù)....企業(yè)需要針對(duì)不同的場(chǎng)景選擇合適的算力,才能將‘好鋼用在刀刃上’?!睖鄢赋?。
針對(duì)此,趙鴻冰與湯雄超都認(rèn)為,企業(yè)需要平衡好可用性與價(jià)錢之間的關(guān)系,尋找到適合企業(yè)長久發(fā)展的,最具性價(jià)比的算力發(fā)展方式。
另一方面,趙鴻冰還補(bǔ)充到,目前選擇算力平臺(tái)負(fù)載業(yè)務(wù)的企業(yè)越來越多,這也對(duì)算力服務(wù)商構(gòu)建算力調(diào)度平臺(tái)提出了更高的要求,“這些要求中,最為緊要的是高性能通信的要求,只有通信的性能足夠強(qiáng),才能真正實(shí)現(xiàn)良好的調(diào)度效果?!壁w鴻冰強(qiáng)調(diào)。
算力網(wǎng)絡(luò)作為數(shù)字化時(shí)代的重要基礎(chǔ)設(shè)施,其建設(shè)和發(fā)展對(duì)于推動(dòng)各行業(yè)的創(chuàng)新和發(fā)展具有至關(guān)重要的意義。算力網(wǎng)絡(luò)正在往AI化、分布化方向演進(jìn)。這個(gè)過程中,多節(jié)點(diǎn)、多模式、廣分布的算力網(wǎng)絡(luò)將是未來算力網(wǎng)絡(luò)發(fā)展的終極形態(tài)。在這種算力模式下,不同的計(jì)算存儲(chǔ)資源池承擔(dān)不同的計(jì)算任務(wù)并相互協(xié)同,極大提升算力網(wǎng)絡(luò)的性能。
當(dāng)前隨著AI技術(shù)的發(fā)展,傳統(tǒng)的算力網(wǎng)絡(luò)已經(jīng)發(fā)展成為AI算力網(wǎng)絡(luò)。而算力網(wǎng)絡(luò)隨著建設(shè)進(jìn)度與使用條件的演進(jìn),逐漸發(fā)展成為三種算力網(wǎng)絡(luò):單集群算力網(wǎng)絡(luò)、多鏈路互聯(lián)多集群算力網(wǎng)絡(luò)、分布式廣域多集群算力網(wǎng)絡(luò)。單集群算力網(wǎng)絡(luò)當(dāng)前已經(jīng)有諸多成功建設(shè)案例,并且已經(jīng)是諸多基礎(chǔ)設(shè)施供應(yīng)商的大部分算力網(wǎng)絡(luò)。
然而,隨著AI等技術(shù)需求的發(fā)展,單集群的算力網(wǎng)絡(luò)已經(jīng)無法滿足AI訓(xùn)練的算力網(wǎng)絡(luò)需求,分布式算力網(wǎng)絡(luò)開始逐漸引起重視。分布式多集群算力網(wǎng)絡(luò)分為兩個(gè)階段,其一是Meta提出的基于多鏈路互聯(lián)適合于同園區(qū)建設(shè)的分布式多鏈路互聯(lián)多集群算力網(wǎng)絡(luò),其二是當(dāng)前諸多廠商提出的跨廣域網(wǎng)的多集群算力網(wǎng)絡(luò)。在這種發(fā)展模式下,RoCE網(wǎng)絡(luò)(RDMAoverConvergedEthernet,一種基于以太網(wǎng)的高性能通信網(wǎng)絡(luò))、UEC(?超以太網(wǎng)聯(lián)盟UniversalEthernetConsortium技術(shù))等已經(jīng)成為必不可少的技術(shù)需求。
除了網(wǎng)絡(luò)之外,湯雄超告訴筆者,智算行業(yè)發(fā)展還離不開算力平臺(tái)的優(yōu)化,“通過軟硬件協(xié)同優(yōu)化,能更好地激發(fā)出以GPU為代表的硬件設(shè)備的能力,從而以更低成本的芯片,發(fā)揮出更接近,甚至超過國際一流芯片水平的能力?!睖鄢瑥?qiáng)調(diào)。
綠色算力如何實(shí)現(xiàn)?
算力需求的增加,在帶來了算網(wǎng)建設(shè)需求之外,也為數(shù)據(jù)中心的節(jié)能減排提出了更高的要求。
根據(jù)IDC測(cè)算,預(yù)計(jì)到2027年,AI數(shù)據(jù)中心容量的復(fù)合年增長率(CAGR)將達(dá)到40.5%,與此同時(shí)AI數(shù)據(jù)中心的能源消耗預(yù)計(jì)將以44.7%的CAGR增長,到2027年達(dá)到146.2太瓦時(shí)(TWh)。
面對(duì)如此之高的能耗與國家層面的碳中和目標(biāo),數(shù)據(jù)中心的綠色化已經(jīng)出發(fā)“在路上”多年。從技術(shù)角度出發(fā),一方面,新的冷媒的應(yīng)用成為了數(shù)據(jù)中心降低能耗的主要手段,比如液冷技術(shù)就在近幾年在數(shù)據(jù)中心內(nèi)大火;
另一方面,數(shù)據(jù)中心選址也成為降低能耗的關(guān)鍵,比如華為就選擇“挖山”建設(shè)數(shù)據(jù)中心,將機(jī)房放在山體內(nèi),以降低供冷消耗,而海蘭信則選擇將數(shù)據(jù)中心建設(shè)在水中,通過海水帶走多余的熱量,一方面能有效降低數(shù)據(jù)中心能耗,另一方面還能回收相對(duì)“熱品位”較高的海水的熱量,余熱回收會(huì)進(jìn)行副業(yè)的賦能與發(fā)展。
上海海蘭云科技有限公司總經(jīng)理蘇洋在WAIC期間與筆者分享了海蘭信在海底數(shù)據(jù)中心方面建設(shè)的經(jīng)驗(yàn)與心得。蘇洋表示,將數(shù)據(jù)中心部署在海底,一方面可以有效的降低數(shù)據(jù)中心PUE(能源使用效率),另一方面,還能降低數(shù)據(jù)中心的故障率。
在節(jié)能減排,降低PUE方面,據(jù)了解,海蘭信位于海南陵水的項(xiàng)目,運(yùn)行PUE低至1.076,較傳統(tǒng)陸地?cái)?shù)據(jù)中心(平均PUE1.5)節(jié)能30%-40%,水資源消耗近乎為零。除此之外,蘇洋還向筆者介紹了水下數(shù)據(jù)中心+海上風(fēng)電的IDC模式。據(jù)了解,海蘭信推動(dòng)的“海上風(fēng)電+海底數(shù)據(jù)中心”示范工程,2025年在上海臨港開工,預(yù)計(jì)9月投運(yùn),投產(chǎn)后綠電直供率達(dá)97%,建設(shè)成本降低30%。
不僅于此,IDC服務(wù)商還可以通過對(duì)散熱后的海水進(jìn)行余熱回收,結(jié)合周邊養(yǎng)魚業(yè)、熱能發(fā)電等產(chǎn)業(yè),形成完整的產(chǎn)業(yè)閉環(huán),助力相關(guān)產(chǎn)業(yè)的發(fā)展。
在降低故障率方面,有數(shù)據(jù)統(tǒng)計(jì)顯示,數(shù)據(jù)中心內(nèi)部有超過一半的故障是由運(yùn)維人員操作不當(dāng)導(dǎo)致的,而位于水下的數(shù)據(jù)中心日常沒有人員進(jìn)入,通過抗腐蝕密封的系統(tǒng)與冗余的設(shè)計(jì),保障設(shè)備在深海高壓環(huán)境下的穩(wěn)定性。
除了在冷媒與建設(shè)位置兩個(gè)方面實(shí)現(xiàn)數(shù)據(jù)中心的節(jié)能減排之外,作為AI底層基礎(chǔ)設(shè)施支撐的數(shù)據(jù)中心,也享受到了AI的“反哺”。數(shù)據(jù)中心也步入了智能化轉(zhuǎn)型的新階段。對(duì)此,劉洋告訴筆者,目前海蘭信已經(jīng)從多元電力融合/調(diào)度、AI運(yùn)維、海上低空無人機(jī)配送備件、無人機(jī)監(jiān)測(cè)IDC運(yùn)行情況等方面著手,力圖打造一個(gè)完全無人化的“黑燈”數(shù)據(jù)中心。
隨著AI大模型向智能體躍遷,算力需求也必將進(jìn)一步快速增長,進(jìn)而推動(dòng)算力行業(yè)從“規(guī)模驅(qū)動(dòng)”向“效率驅(qū)動(dòng)”加速轉(zhuǎn)型。此時(shí),算網(wǎng)建設(shè)與綠色算力成為行業(yè)破局關(guān)鍵。(本文首發(fā)于鈦媒體APP,作者|張申宇,編輯丨蓋虹達(dá))
9月11日-14日由鈦媒體集團(tuán)、ITValue聯(lián)合主辦的2025ITValueSummit數(shù)字價(jià)值年會(huì)將以「AI落地場(chǎng)景真相」為主題,與新老朋友重聚三亞,并在全年圍繞1場(chǎng)年度演講,5大ToB明星IP持續(xù)內(nèi)容“造血”,設(shè)計(jì)N個(gè)場(chǎng)景的想象空間,打造1本《AI落地場(chǎng)景指南》,一同解決AI實(shí)際落地應(yīng)用背后的“10大問題”,探索數(shù)字經(jīng)濟(jì)時(shí)代的變革和機(jī)遇。(點(diǎn)擊進(jìn)入了解更多大會(huì)報(bào)名信息)
評(píng)!加入創(chuàng)新場(chǎng)景50榜單評(píng)選2025年度「創(chuàng)新場(chǎng)景TOP50」榜單評(píng)選征集啟動(dòng)申報(bào)日期:即日起~8月22日止公開投票及專家評(píng)審:2025年8月23日起~8月31日止申報(bào)鏈接:https://m.tmtpost.com/post/cj50(請(qǐng)使用PC端申報(bào),暫不支持手機(jī)端)
延伸閱讀:與 綠色化和“算網(wǎng)建設(shè)”是關(guān):鍵丨T——oB產(chǎn)業(yè)觀察 的相關(guān)文章