陳涵純
本文來源:時代財經(jīng)作者:郭美婷
當單點算力不足,集合在一起可以解決問題嗎?近日,在WAIC2025上,多家國產(chǎn)算力企業(yè)紛紛交出了“超節(jié)點”方案。
“超節(jié)點”是英偉達最先提出的概念,用于描述一種縱向擴展(Scale-Up)的GPU集群形態(tài)。據(jù)中科院物理所介紹,超節(jié)點的英文名叫SuperPod,它是ScaleUp的當前最優(yōu)解,通過內(nèi)部高速總線互連,能夠有效支撐并行計算任務,加速GPU之間的參數(shù)交換和數(shù)據(jù)同步,縮短大模型的訓練周期。
壁仞科技OCS超節(jié)點項目相關負責人董朝鋒向時代財經(jīng)解釋,簡單來說,傳統(tǒng)AI服務器節(jié)點一般為單機8卡,這是一個標準節(jié)點,而超節(jié)點的規(guī)模沒有固定限制。但如果只是簡單將機器疊加組合在一起,并非真正意義上的超節(jié)點。超節(jié)點是在傳統(tǒng)節(jié)點基礎上,在保證節(jié)點內(nèi)通信帶寬和延遲性能一致的前提下進行擴展。因此,超節(jié)點是一種應對大算力集群芯片協(xié)同問題的方案。通過整合算力芯片資源,在一個超節(jié)點內(nèi)構建低延遲、高帶寬的算力實體,讓單個超節(jié)點盡可能大地釋放算力。
早在4月10日,華為云于蕪湖生態(tài)大會上發(fā)布CloudMatrix384超節(jié)點。5月,華為又于鯤鵬昇騰開發(fā)者大會上推出了昇騰超節(jié)點,成功實現(xiàn)業(yè)界最大規(guī)模的384卡高速總線互聯(lián)。在此次WAIC的華為展區(qū)內(nèi),昇騰384超節(jié)點首次在線下展出。時代財經(jīng)觀察到,該超節(jié)點由多列服務器機柜組成,左右兩邊各分為兩個部分的計算柜,中間為總機柜。
圖源:時代財經(jīng)攝
據(jù)華為方面介紹,昇騰384超節(jié)點即Atlas900A3SuperPoD,該產(chǎn)品基于超節(jié)點架構,通過總線技術實現(xiàn)384個NPU之間的大帶寬低時延互聯(lián),解決集群內(nèi)計算、存儲等各資源之間的通信瓶頸。通過系統(tǒng)工程的優(yōu)化,實現(xiàn)資源的高效調(diào)度,讓超節(jié)點像一臺計算機一樣工作。
從今年4月10日至7月31日,東方財富華為昇騰指數(shù)漲超30%。7月31日當天,華為昇騰指數(shù)成分股直真科技(003007.SZ)、彩訊科技(300634.SZ)、云天勵飛-U(688343.SH)漲超3%,高德紅外(002414.SZ)漲超2%。
據(jù)中國銀河證券研報,華為昇騰384超節(jié)點基于總線技術實現(xiàn)384個NPU之間的低時延互聯(lián),解決了集群內(nèi)部計算、存儲等各資源之前通信的瓶頸問題,具備三大優(yōu)勢:超大帶寬、超低時延、超強性能。在性能上,華為昇騰384超節(jié)點已可以對標英偉達GB200NVL72。根據(jù)SemiAnalysis數(shù)據(jù),在系統(tǒng)能效方面,華為單個超節(jié)點的性能是英偉達GB200NVL72的4倍,算力能效比是英偉達的2.3倍,帶寬能效比為1.8倍。
目前,全球首個商用智算昇騰超節(jié)點由中國電信上線,現(xiàn)已在廣東韶關落地。
無獨有偶,上海儀電聯(lián)合曦智科技、壁仞科技、中興通訊,也正式發(fā)布國內(nèi)首個光互連光交換GPU超節(jié)點——光躍LightSphereX。
據(jù)了解,光躍LightSphereX基于曦智科技分布式光交換技術,采用硅光技術的光互連光交換(OCS)芯片和壁仞科技的大算力通用GPU液冷模組與全新載板互連,并搭載中興通訊的AI國產(chǎn)服務器及儀電智算云平臺軟件,并即將于上海儀電智算中心落地。
董朝鋒表示,光躍LightSphereX具有靈活動態(tài)可配置的特點:它最小可支持8卡,還能擴展至16卡、32卡、甚至數(shù)千卡。通過曦智科技全光交換ocs模塊,該方案可以按照不同類型大模型的特征動態(tài)配置最優(yōu)的拓撲。例如,若要運行70B規(guī)模的dense模型,通過軟件將拓撲配置為HCM模式,就能充分發(fā)揮其算力性能優(yōu)勢;若運行類似于deepseekR1滿血版的MOE模型只需通過軟件將拓撲配置為EP32/EP64,即可獲得最優(yōu)的訓練/推理性能。
“當前各家都在布局超節(jié)點領域,呈現(xiàn)百花齊放的態(tài)勢。”董朝鋒介紹,在成本與價格方面,LightSphereX與普通單機方案額外增加的光模塊成本較低。因此,與未配備OCS的超節(jié)點相比,我們的集群方案性價比有顯著提升,且能從8卡、32卡靈活擴展至數(shù)千卡,沒有限制。
董朝鋒談到,目前行業(yè)關于超節(jié)點的需求較多,這一趨勢的形成主要基于單卡算力存在限制,同時也受到外部地緣因素的影響,此外行業(yè)發(fā)展確實需要開箱即用的一體機/超節(jié)點方案提供給終端用戶。
不過,多位受訪對象告訴時代財經(jīng),目前關于超節(jié)點尚未形成公認的行業(yè)標準。在華為展位上,相關負責人表示華為正在聯(lián)合相關部門制定這一標準。董朝鋒也表示,未來幾年超節(jié)點可能會逐步確立標準,包括底層協(xié)議(如類似UCIE協(xié)議)及上層硬件連接協(xié)議等,壁仞科技也在與相關組織推進這一標準的制定。
盡管仍處于發(fā)展初期,超節(jié)點仍有望加速國產(chǎn)算力的滲透。申萬宏源認為,超節(jié)點產(chǎn)業(yè)化將重塑算力產(chǎn)業(yè)鏈分工、催生服務器整合,光通信增量及液冷滲透提升等投資機會。一方面,芯片廠商縱向整合趨勢明顯,英偉達、AMD通過并購強化通信與軟件能力,海光信息擬吸收合并中科曙光強化軟件、液冷等能力。另一方面,在代工環(huán)節(jié)、光通信領域,華為CloudMatrix推動光模塊需求,光模塊與GPU需求比可達1:18。同時,在IDC產(chǎn)業(yè)鏈中,單機柜功率超120kW推動液冷滲透率提升,模塊化布局加速智算中心交付。
來源:紅網(wǎng)
作者:江莉婷
編輯:李志文
本文為紅辣椒評論 原創(chuàng)文章,僅系作者個人觀點,不代表紅網(wǎng)立場。轉載請附原文出處鏈接和本聲明。