中國(guó)算力產(chǎn)業(yè)正經(jīng)歷一場(chǎng)前所未有的從“受制于人”到“自主可控”的破局之戰(zhàn)。2025WAIC展會(huì)集中展現(xiàn)了國(guó)產(chǎn)算力在超節(jié)點(diǎn)架構(gòu)、光互連、異構(gòu)協(xié)同以及算力集群化、全鏈路國(guó)產(chǎn)化等方面的重大突破,這是一場(chǎng)由底層硬件創(chuàng)新驅(qū)動(dòng)、產(chǎn)業(yè)協(xié)同賦能的生態(tài)系統(tǒng)性突圍。
其中核心技術(shù)路線包括曦智科技聯(lián)合壁仞科技、中興推出全球首款分布式光交換(dOCS)超節(jié)點(diǎn),通過(guò)采用硅光芯片實(shí)現(xiàn)GPU間光互連,以及華為昇騰384超節(jié)點(diǎn)打破英偉達(dá)NVLink的私有協(xié)議壟斷,為國(guó)產(chǎn)萬(wàn)卡集群提供可擴(kuò)展架構(gòu)新范式,同時(shí)更多國(guó)內(nèi)AI芯片企業(yè)展示的系統(tǒng)級(jí)創(chuàng)新、軟硬協(xié)同,打通了從技術(shù)攻堅(jiān)到商業(yè)落地的正循環(huán)“最后一公里”。
這體現(xiàn)出國(guó)產(chǎn)算力逐漸從“替代備份”走向“技術(shù)引領(lǐng)”,其中關(guān)鍵勝負(fù)手在于超節(jié)點(diǎn)集群打破算力密度天花板,光互連/液冷等技術(shù)破解物理限制,以及開(kāi)放異構(gòu)生態(tài)化解碎片化困局。而以智能計(jì)算超節(jié)點(diǎn)應(yīng)運(yùn)而生并成為解決算力瓶頸的關(guān)鍵方案為代表,這場(chǎng)國(guó)產(chǎn)算力破局之戰(zhàn)不僅是技術(shù)維度的創(chuàng)新突破,更是中國(guó)AI產(chǎn)業(yè)從“硬件依賴”到“系統(tǒng)定義”的范式躍升。
AI超節(jié)點(diǎn)成解決算力瓶頸關(guān)鍵路徑
在大模型參數(shù)指數(shù)級(jí)增長(zhǎng)推動(dòng)下,業(yè)界對(duì)GPU集群的規(guī)模需求也在快速擴(kuò)大,從千卡級(jí)、萬(wàn)卡級(jí)再到十萬(wàn)卡級(jí)等,這體現(xiàn)出對(duì)算力的需求增長(zhǎng)速度逐步遠(yuǎn)超芯片性能提升曲線。
對(duì)于未來(lái)如何構(gòu)建越來(lái)越大規(guī)模的GPU算力集群?解決路徑是ScaleUp和ScaleOut。其中,ScaleUp(縱向擴(kuò)展)增加單節(jié)點(diǎn)資源數(shù)量,ScaleOut(橫向擴(kuò)展)增加節(jié)點(diǎn)的數(shù)量。簡(jiǎn)單理解,每臺(tái)服務(wù)器里面多塞幾塊GPU,這時(shí)一臺(tái)服務(wù)器就是一個(gè)節(jié)點(diǎn),即ScaleUp。而通過(guò)網(wǎng)絡(luò)將多臺(tái)電腦(節(jié)點(diǎn))連接起來(lái)就是ScaleOut。
據(jù)了解,ScaleOut考驗(yàn)的是節(jié)點(diǎn)之間通信能力,而ScaleUp在性能、成本、組網(wǎng)和運(yùn)維等方面具有重要優(yōu)勢(shì)。在AI訓(xùn)練過(guò)程中,通常包括多種并行計(jì)算方式,其中PP(流水線并行)和DP(數(shù)據(jù)并行)的通信量較小,一般交由ScaleOut處理。而TP(張量并行)、EP(專家并行)的通信量大,這就需要交由ScaleUp(超節(jié)點(diǎn)內(nèi)部)處理。
當(dāng)前,超節(jié)點(diǎn)作為ScaleUp的最優(yōu)解,通過(guò)內(nèi)部高速總線互連,能夠有效支撐并行計(jì)算任務(wù),加速GPU之間的參數(shù)交換和數(shù)據(jù)同步,縮短大模型的訓(xùn)練周期。其核心技術(shù)優(yōu)勢(shì)在于突破單服務(wù)器限制,數(shù)十塊甚至數(shù)百塊GPU集成在一個(gè)機(jī)架內(nèi);超帶寬域(HBD)技術(shù)可將GPU間通信時(shí)延壓縮至百納秒級(jí),實(shí)現(xiàn)GPU間數(shù)據(jù)交換的無(wú)縫銜接,并大幅降低組網(wǎng)復(fù)雜度;以及支持ScaleUp與ScaleOut融合,實(shí)現(xiàn)“樂(lè)高式”靈活搭建。
超節(jié)點(diǎn)最初是英偉達(dá)提出的概念,并將以超大帶寬互聯(lián)16卡以上GPU-GPU的ScaleUp系統(tǒng)稱為超節(jié)點(diǎn)。歷經(jīng)多年發(fā)展和數(shù)次迭代,2024年3月,英偉達(dá)發(fā)布NVL72超節(jié)點(diǎn),可以將36個(gè)GraceCPU和72個(gè)BlackwellGPU集成到一個(gè)液冷機(jī)柜中,實(shí)現(xiàn)總計(jì)720PFLOPs的AI訓(xùn)練性能,或1440PFLOPs的推理性能。
從NVL72開(kāi)始,超節(jié)點(diǎn)概念在算力行業(yè)內(nèi)被頻繁提及,并逐漸從藍(lán)圖走向現(xiàn)實(shí)。在2025WAIC現(xiàn)場(chǎng),中國(guó)企業(yè)也帶來(lái)了超節(jié)點(diǎn)技術(shù)方案,而且成為大會(huì)最大看點(diǎn)之一。
國(guó)內(nèi)首個(gè)光互連光交換GPU超節(jié)點(diǎn)亮相
在2025WAIC“智算云啟,共繪生態(tài)”論壇上,上海儀電聯(lián)合曦智科技、壁仞科技、中興通訊正式發(fā)布國(guó)內(nèi)首個(gè)光互連光交換GPU超節(jié)點(diǎn)解決方案——光躍LightSphereX。
據(jù)悉,該超節(jié)點(diǎn)以曦智科技全球首創(chuàng)的分布式光交換(dOCS)芯片為核心,通過(guò)基于壁仞科技自主原創(chuàng)架構(gòu)的大算力通用GPU液冷模組壁勵(lì)166L與全新載板互連,并搭載中興通訊高性能AI國(guó)產(chǎn)服務(wù)器及儀電開(kāi)放智算云平臺(tái)軟件,構(gòu)建起高帶寬、低延遲、靈活可擴(kuò)展的自主可控智算集群生態(tài),即將于上海儀電智算中心落地。
鑒于算力集群邁入“萬(wàn)卡協(xié)同”時(shí)代,當(dāng)前業(yè)界一種常見(jiàn)方案是通過(guò)提升單機(jī)柜功耗來(lái)部署更多GPU,但受限于數(shù)據(jù)中心單機(jī)柜的功耗天花板,單機(jī)柜GPU密度提升存在瓶頸。
對(duì)此,光躍LightSphereX采用光互連技術(shù),通過(guò)增加機(jī)柜數(shù)量構(gòu)建超節(jié)點(diǎn),突破傳統(tǒng)互連方式下超節(jié)點(diǎn)的物理限制。相比銅纜,光纜的遠(yuǎn)距離傳輸優(yōu)勢(shì)可實(shí)現(xiàn)交付與機(jī)柜解耦,其核心價(jià)值在于:突破單機(jī)柜功耗束縛,支持萬(wàn)卡級(jí)彈性擴(kuò)展,兼容現(xiàn)有機(jī)房設(shè)施降低部署成本,并可按算力需求動(dòng)態(tài)調(diào)整超節(jié)點(diǎn)規(guī)模,實(shí)現(xiàn)分階段建設(shè)。
同時(shí),光躍LightSphereX的曦智科技分布式光交換(dOCS)技術(shù)進(jìn)一步提升了超節(jié)點(diǎn)的靈活度和系統(tǒng)可擴(kuò)展性,從而達(dá)到提升系統(tǒng)性價(jià)比的目的。得益于多計(jì)算Chiplet與CoWoS2.5D封裝協(xié)同設(shè)計(jì)的GPU模組,光躍LightSphereX擁有強(qiáng)大算力。該模組基于壁仞科技的大算力(單卡1P級(jí))通用GPU液冷模組,極大增強(qiáng)了集群訓(xùn)推性能。
未來(lái),光躍LightSphereX將成為儀電首個(gè)采用該方案的超節(jié)點(diǎn)國(guó)產(chǎn)算力集群,其靈活的拓?fù)浣Y(jié)構(gòu)和規(guī)模適應(yīng)不同模型的通信需求,開(kāi)放的協(xié)議架構(gòu)打破廠商壁壘,構(gòu)建了從光芯片、GPU模組、到液冷服務(wù)器及高速域算力集群的全棧自主可控生態(tài),可全面賦能千億級(jí)參數(shù)大模型訓(xùn)練與推理需求,為我國(guó)人工智能跨越式發(fā)展提供澎湃動(dòng)力。
各大AI芯片企業(yè)向“系統(tǒng)化”奮進(jìn)
在算力基礎(chǔ)設(shè)施的務(wù)實(shí)轉(zhuǎn)型浪潮中,系統(tǒng)化創(chuàng)新、全鏈路國(guó)產(chǎn)化的推進(jìn)節(jié)奏成為新焦點(diǎn)。因?yàn)榇竽P偷目焖侔l(fā)展和迭代,不僅改變了以往模型碎片化的產(chǎn)業(yè)生態(tài),更驅(qū)動(dòng)算力基礎(chǔ)設(shè)施朝著系統(tǒng)化和集群化發(fā)展。對(duì)此,國(guó)產(chǎn)AI芯片企業(yè)均在不同維度的系統(tǒng)化攻堅(jiān)奮進(jìn)。
其中,摩爾線程以全功能GPU為核心底座構(gòu)建的“云邊端”全棧AI產(chǎn)品和解決方案亮相2025WAIC展覽區(qū),包括KUAE2智算集群解決方案面向大規(guī)模智算中心,集成計(jì)算、存儲(chǔ)、網(wǎng)絡(luò)硬件及分布式計(jì)算軟件,最高支持10240個(gè)全功能GPU部署。
摩爾線程還提出,公司將通過(guò)系統(tǒng)級(jí)工程創(chuàng)新,打造生產(chǎn)先進(jìn)模型的“AI工廠”,實(shí)現(xiàn)先進(jìn)架構(gòu)、芯片算力、單節(jié)點(diǎn)效率、集群效率優(yōu)化與可靠性等協(xié)同躍升的深度技術(shù)創(chuàng)新。
目前,芯片、超節(jié)點(diǎn)、網(wǎng)絡(luò)、并行計(jì)算以及云架構(gòu)下的大模型適配環(huán)環(huán)相扣,為算力與大模型的協(xié)同創(chuàng)新與發(fā)展提供了巨大空間。鑒于此,燧原科技打出“組合拳”,在大會(huì)期間首次展出燧原S60高性能人工智能推理加速卡和DeepSeek一體機(jī)系列產(chǎn)品,同時(shí)還發(fā)布第四代訓(xùn)推一體產(chǎn)品燧原L600,以及推出全新計(jì)算系統(tǒng)——云燧OGX系列產(chǎn)品。
沐曦集成在大會(huì)上首次展示了旗艦訓(xùn)推一體GPU曦云C600以及從芯片到集群的立體化呈現(xiàn)。據(jù)悉,曦云C600性能全面對(duì)標(biāo)國(guó)際旗艦GPU產(chǎn)品,包括搭載當(dāng)前業(yè)界前沿的HBM3e顯存等。而基于上代產(chǎn)品曦云C500系列芯片,沐曦在現(xiàn)場(chǎng)展示了PCIe服務(wù)器、OAM服務(wù)器和光互連服務(wù)器解決方案,這些服務(wù)器基本都實(shí)現(xiàn)了“全鏈路國(guó)產(chǎn)化”。
此外,無(wú)問(wèn)芯穹首次發(fā)布展示了三大“操作系統(tǒng)級(jí)”產(chǎn)品——“無(wú)穹AI云”“無(wú)界智算平臺(tái)”與“無(wú)垠終端智能解決方案”,分別面向跨地域智算網(wǎng)絡(luò)、智算集群與多形態(tài)智能終端等全規(guī)模場(chǎng)景,統(tǒng)一適配多元算力,提供從模型調(diào)度、性能優(yōu)化到AI應(yīng)用部署的全鏈路支持。
據(jù)了解,無(wú)問(wèn)芯穹展示的全球首創(chuàng)單任務(wù)千卡異構(gòu)混訓(xùn)系統(tǒng)及Infini-AI異構(gòu)云平臺(tái),突破異構(gòu)芯片、異地集群、異屬算力統(tǒng)一管理的技術(shù)瓶頸,算力利用率高達(dá)97.6%。
中國(guó)智算超節(jié)點(diǎn)首度上演“集體秀”
伴隨著國(guó)內(nèi)智算集群建設(shè)從單點(diǎn)突破邁向系統(tǒng)攻堅(jiān)階段,國(guó)產(chǎn)AI超節(jié)點(diǎn)無(wú)疑是系統(tǒng)級(jí)創(chuàng)新的重要體現(xiàn),不僅要設(shè)計(jì)好底層芯片以及將大量芯片連接起來(lái)的“神經(jīng)網(wǎng)絡(luò)”,還需通過(guò)優(yōu)化節(jié)點(diǎn)內(nèi)的高速互聯(lián)、存儲(chǔ)架構(gòu)和軟件棧,最大化發(fā)揮國(guó)產(chǎn)芯片集群的整體效能。
在2025WAIC上,尤為受關(guān)注的是耗費(fèi)數(shù)十億元的華為昇騰384超節(jié)點(diǎn)真機(jī)。作為展區(qū)“鎮(zhèn)館之寶”,其通過(guò)總線技術(shù)達(dá)成384個(gè)NPU之間的大帶寬低時(shí)延互聯(lián),有效解決集群內(nèi)計(jì)算、存儲(chǔ)等各資源之間通信瓶頸。同時(shí),昇騰384超節(jié)點(diǎn)單卡推理性能提升4倍,Decoding吞吐達(dá)到2300+Tokens,通訊時(shí)延降低至50ms以下,MFU算力使用率達(dá)50%,在業(yè)界位居領(lǐng)先水平。
據(jù)官方公告,華為AI算力集群解決方案CloudMatrix384,通過(guò)全互連拓?fù)浼軜?gòu)實(shí)現(xiàn)芯片間的高效協(xié)同,可提供達(dá)300PFLOPs密集BF16算力,性能接近英偉達(dá)NVL72系統(tǒng)兩倍。按照國(guó)外投行觀點(diǎn),華為的規(guī)模化解決方案“領(lǐng)先于英偉達(dá)和AMD目前市場(chǎng)上的產(chǎn)品一代”,并且認(rèn)為中國(guó)在AI基礎(chǔ)設(shè)施上取得的突破,將對(duì)全球AI產(chǎn)業(yè)格局產(chǎn)生深遠(yuǎn)影響。
同時(shí),中興展示了架構(gòu)代際領(lǐng)先的智算超節(jié)點(diǎn)服務(wù)器,算力高密集成、高效互聯(lián),為超大參數(shù)規(guī)模的模型訓(xùn)練和推理打造高算效的硬件底座。其單機(jī)柜可搭載64個(gè)GPU,內(nèi)置16個(gè)計(jì)算節(jié)點(diǎn),8個(gè)交換節(jié)點(diǎn),機(jī)內(nèi)Scaleup可擴(kuò)展至2048張算力卡,機(jī)間支持Scaleout拓展至萬(wàn)卡規(guī)模。據(jù)了解,相比起華為單機(jī)搭載32卡,中興可以做到單機(jī)搭載64卡。
此外,新華三展出的是超節(jié)點(diǎn)產(chǎn)品H3CUniPodS80000全球首秀。這是專為萬(wàn)億級(jí)大模型的訓(xùn)練與推理需求量身打造的核心設(shè)備,支持單機(jī)柜、多機(jī)柜等多種形態(tài),Scale-up互聯(lián)規(guī)模提升300%;依托以太互聯(lián)協(xié)議,可實(shí)現(xiàn)Scale-up南向互聯(lián);以及能夠?qū)崿F(xiàn)單機(jī)柜64卡(與中興一樣)高密部署及互聯(lián)互通,并同時(shí)具備向1024卡互聯(lián)演進(jìn)的能力。
超聚變則帶來(lái)了全球首個(gè)多元智算即插即用超級(jí)集群系統(tǒng),實(shí)現(xiàn)全面軟硬件基礎(chǔ)設(shè)施技術(shù)和算力生態(tài),能夠兼容10+加速卡,提供雙生態(tài)南北向安全異構(gòu)算力。同時(shí),其做到單柜128個(gè)AI加速卡,112G/224G的高速互連;使用第5代100%原生液冷,可實(shí)現(xiàn)節(jié)能超20%。
結(jié)語(yǔ)
在大模型時(shí)代,面對(duì)算力的需求增長(zhǎng)速度逐步遠(yuǎn)超芯片性能提升曲線,單芯片性能差異的重要性逐漸讓位于整個(gè)集群的總體效能。鑒于芯片性能、開(kāi)發(fā)成本和國(guó)際限制等因素,國(guó)內(nèi)要達(dá)到與國(guó)際主流方案相當(dāng)?shù)目偹懔π琛耙粤垦a(bǔ)質(zhì)”。這使得AI超節(jié)點(diǎn)成為勢(shì)必被催生的高效、可擴(kuò)展、標(biāo)準(zhǔn)化的算力集群架構(gòu),并且是我國(guó)構(gòu)建大規(guī)模算力基礎(chǔ)設(shè)施的現(xiàn)實(shí)可行方向。
可喜的是,2025WAIC顯示出以壁仞科技、華為為代表的中國(guó)AI智算企業(yè)正在不斷努力,攻堅(jiān)從人工智能產(chǎn)業(yè)的核心底座——以芯片、板卡、服務(wù)器、計(jì)算集群等為核心構(gòu)成的算力基礎(chǔ)設(shè)施,再到與本土行業(yè)應(yīng)用的深度創(chuàng)新協(xié)同,促使一條貫穿大模型生態(tài)的國(guó)產(chǎn)化鏈條加速成型。而這場(chǎng)中國(guó)智算超節(jié)點(diǎn)的“集體秀”,不僅是技術(shù)路線選擇,更關(guān)乎整個(gè)產(chǎn)業(yè)發(fā)展命脈。
小說(shuō):實(shí)習(xí)醫(yī)生獲最強(qiáng)系統(tǒng),回鄉(xiāng)種地行醫(yī),竟成隱世富豪
事實(shí)上,唐逸飛又哪里會(huì)知道,這套【超級(jí)醫(yī)生系統(tǒng)】,已經(jīng)徹底改造了他的性格,他再也不是之前那個(gè)懦弱不堪的唐逸飛了。而平靜下來(lái)的唐逸飛,內(nèi)心則難以掩飾陣陣激動(dòng)。他本是一名苦逼的實(shí)習(xí)醫(yī)生,接連遭遇上司刁難,女友劈腿,可謂是倒霉到極點(diǎn)——|?,F(xiàn)在,老天爺眷顧他,竟然給他一個(gè)翻身的機(jī)會(huì)|。不僅讓自己融合了那位仙醫(yī)大能的一身醫(yī)術(shù),而且 事實(shí)上,唐逸飛又哪里會(huì)知道,這套【超級(jí)醫(yī)生系統(tǒng)】,已經(jīng)徹底改造了他的性格,他再也不是之前那個(gè)懦弱不堪的唐逸飛了——-。而平靜下來(lái)的唐逸飛,內(nèi)心則難以掩飾陣陣激動(dòng)。他本是一名苦逼的實(shí)習(xí)醫(yī)生,接連遭遇上司刁難,女友劈腿,可謂是倒霉到極點(diǎn)。現(xiàn)在,老天爺眷顧他,竟然給他一個(gè)翻身的機(jī)會(huì)-_。不僅讓自己融合了那位仙醫(yī)是什么。小說(shuō):末世遭背叛重生得系統(tǒng),卻陷十神選之爭(zhēng),她誓要獨(dú)活稱霸!