7月26日-28日,全球頂級(jí)的AI大會(huì)世界人工智能大會(huì)(WAIC2025)在上海召開,為全球產(chǎn)業(yè)變革提供關(guān)鍵技術(shù)支點(diǎn)與戰(zhàn)略前瞻洞察。作為人工智能產(chǎn)業(yè)鏈重要一環(huán),本屆WAIC也聚集了本土一眾算力芯片廠商,其中,華為384超節(jié)點(diǎn)真機(jī)首次線下亮相引發(fā)了廣泛的關(guān)注。此外,摩爾線程、沐曦、燧原、曦智科技等都展出了自己最新的產(chǎn)品和解決方案。
澎湃新聞?dòng)浾哂^察到,在算力芯片制程受限的情況下,產(chǎn)業(yè)界轉(zhuǎn)向超節(jié)點(diǎn)集群以及產(chǎn)業(yè)鏈多個(gè)環(huán)節(jié)協(xié)同創(chuàng)新方式來(lái)解決當(dāng)下算力需求。特別值得一提的是,算力前沿領(lǐng)域的光互聯(lián)光交換技術(shù)也取得了一系列突破性進(jìn)展。
2025年7月26日,上海世博展覽館,華為昇騰超節(jié)點(diǎn)技術(shù)突破384卡高速互聯(lián),通信帶寬提升15倍,使千億級(jí)模型性能提升2.5倍以上。澎湃新聞?dòng)浾咧靷ポx圖
廠商齊推超節(jié)點(diǎn)推動(dòng)算力進(jìn)入“萬(wàn)卡協(xié)同”時(shí)代
本次大會(huì),華為首次把384超節(jié)點(diǎn)真機(jī)搬到展臺(tái),從而引發(fā)了觀眾廣泛關(guān)注。
華為超節(jié)點(diǎn)首創(chuàng)將384顆昇騰NPU和192顆鯤鵬CPU通過(guò)全新高速網(wǎng)絡(luò)MatrixLink全對(duì)等互聯(lián),形成一臺(tái)超級(jí)“AI服務(wù)器”,算力規(guī)模300PFlops,成功打破跨機(jī)通信帶寬性能瓶頸,實(shí)現(xiàn)從服務(wù)器級(jí)到矩陣級(jí)的資源供給模式轉(zhuǎn)變。
此外,華為云的昇騰AI云服務(wù),讓超節(jié)點(diǎn)能夠以云服務(wù)的形態(tài)實(shí)現(xiàn)按需用、隨心用,降低企業(yè)應(yīng)用先進(jìn)智算基礎(chǔ)設(shè)施的門檻,目前基于CloudMatrix384超節(jié)點(diǎn)的華為云新一代昇騰AI云服務(wù)目前已在蕪湖、貴安、烏蘭察布、和林格爾數(shù)據(jù)中心全面上線。
萬(wàn)億參數(shù)大模型與多模態(tài)訓(xùn)練的崛起,正推動(dòng)算力集群邁入“萬(wàn)卡協(xié)同”時(shí)代。超節(jié)點(diǎn)架構(gòu)通過(guò)深度整合GPU資源,在超節(jié)點(diǎn)內(nèi)構(gòu)建起低延遲、高帶寬的統(tǒng)一算力實(shí)體,已成為支撐這一演進(jìn)的關(guān)鍵技術(shù)路徑。
一位芯片行業(yè)人士接受澎湃新聞?dòng)浾卟稍L時(shí)表示,之前英偉達(dá)推出了NVL72方案,專注為萬(wàn)億參數(shù)大模型提供訓(xùn)練算力,這也是行業(yè)的共識(shí),大家都會(huì)走超節(jié)點(diǎn)集群路線。此外,本土芯片制程受限,單芯片突破比較難,超節(jié)點(diǎn)把更多卡放在一起,從而滿足高參數(shù)大模型訓(xùn)練需求。
同樣的,摩爾線程在WAIC上首次提出“AI工廠”理念,從單芯片轉(zhuǎn)向系統(tǒng)級(jí)創(chuàng)新來(lái)突破大模型訓(xùn)練效率瓶頸。
摩爾線程提出的“AI工廠”,如同芯片晶圓廠的制程升級(jí),是一個(gè)系統(tǒng)性、全方位的變革,需要實(shí)現(xiàn)從底層芯片架構(gòu)創(chuàng)新、到集群整體架構(gòu)的優(yōu)化,再到軟件算法調(diào)優(yōu)和資源調(diào)度系統(tǒng)的全面升級(jí)。這種全方位的基礎(chǔ)設(shè)施變革,將推動(dòng)AI訓(xùn)練從千卡級(jí)向萬(wàn)卡級(jí)乃至十萬(wàn)卡級(jí)規(guī)模演進(jìn),以系統(tǒng)級(jí)工程實(shí)現(xiàn)生產(chǎn)力和創(chuàng)新效率的飛躍。
“光”迎來(lái)了高光時(shí)刻
本屆WAIC,曦智科技聯(lián)合壁仞科技、中興通訊共同推出的光躍LightSphereX——全球首個(gè)分布式光互連光交換GPU超節(jié)點(diǎn)解決方案,憑借其突破性原始創(chuàng)新獲得了大會(huì)2025SAIL獎(jiǎng)(卓越人工智能引領(lǐng)者獎(jiǎng))。
需要指出的是這是一個(gè)真實(shí)落地的算力方案,即將落地在上海儀電的國(guó)產(chǎn)算力集群。
曦智科技的“全光”方案為廠商部署超節(jié)點(diǎn)方案提供了新思路。大型計(jì)算集群成千上萬(wàn)顆GPU一起協(xié)同工作,連接他們的“神經(jīng)”——傳統(tǒng)的電纜在長(zhǎng)距離傳輸高帶寬信號(hào)時(shí),會(huì)產(chǎn)生巨大的延遲和功耗,這限制了集群的規(guī)模和效率。
這時(shí),人們目光鎖定了“光”,光帶寬更高、延遲更低、能耗也更小。英偉達(dá)在交換機(jī)上率先引入了CPO(光電共封裝)技術(shù),把光模塊和交換芯片封裝在一起,縮短了電信號(hào)的傳輸距離,從而降低了衰減和功耗。曦智科技也是一家追“光”者,專注于“光子計(jì)算+光子網(wǎng)絡(luò)”兩大領(lǐng)域。
該超節(jié)點(diǎn)的核心技術(shù)就是曦智科技全球首創(chuàng)的分布式光交換技術(shù)。傳統(tǒng)的方式無(wú)論電交換還是光交換都是中央集中式交換,而LightSphereX分布式交換可以理解為把集中式打成碎片,讓每個(gè)GPU上集成光交換功能。這讓超節(jié)點(diǎn)在調(diào)度GPU時(shí)變得非常靈活,而且可以實(shí)現(xiàn)故障場(chǎng)景下替換替補(bǔ),降低GPU冗余成本。
更關(guān)鍵的是,這種交換方式發(fā)生在物理層,與上層的數(shù)據(jù)傳輸協(xié)議無(wú)關(guān)。這也使得國(guó)內(nèi)各大GPU廠商都愿意跟曦智科技合作一起來(lái)構(gòu)建解決方案。
除了分布式超節(jié)點(diǎn)方案,曦智科技還聯(lián)合燧原科技推出國(guó)內(nèi)首款xPU-CPO光電共封裝原型系統(tǒng),通過(guò)將光學(xué)引擎與計(jì)算芯片(xPU)在基板上實(shí)現(xiàn)光電共封裝,大幅提升信號(hào)完整性并降低損耗和延遲,同時(shí)顯著降低系統(tǒng)功耗,有效提高光電轉(zhuǎn)換的穩(wěn)定性。
國(guó)內(nèi)首款xPU-CPO光電共封裝原型系統(tǒng)
作為國(guó)內(nèi)首次采用CPO技術(shù)實(shí)現(xiàn)GPU直接出光的成功案例,該項(xiàng)目驗(yàn)證了xPU-CPO光電共封裝技術(shù)的可行性與技術(shù)方向,同時(shí)為中國(guó)人工智能基礎(chǔ)設(shè)施建設(shè)與先進(jìn)光學(xué)封裝產(chǎn)業(yè)突破奠定了關(guān)鍵技術(shù)錨點(diǎn)。
曦智科技還與沐曦合作的光互連電交換超節(jié)點(diǎn)方案也首次公開亮相。該方案采用線性直驅(qū)光互連技術(shù),具有低延時(shí)、高帶寬、低功耗的特點(diǎn),并支持長(zhǎng)距離傳輸,突破跨機(jī)柜連接的限制,支持8臺(tái)標(biāo)準(zhǔn)服務(wù)器共64張xPU卡的高速互連,為大模型訓(xùn)練及推理提供更靈活、更高效的并行策略支持,從而提升集群性能。
曦智科技創(chuàng)始人、CEO沈亦晨表示:“我們的芯片制程上不一樣,我們沒(méi)有辦法繼續(xù)去復(fù)制美國(guó)的技術(shù)路線,但我們?cè)诨ヂ?lián)上會(huì)催生革命性的’交通工具’。光互聯(lián)是軌道交通,電互聯(lián)是公路交通?!?/p>
“我們?cè)诠韫饧夹g(shù)上不落后,甚至我們商業(yè)落地比美國(guó)企業(yè)還要領(lǐng)先些?!鄙蛞喑勘硎荆磥?lái)可能每個(gè)交換芯片、GPU芯片都會(huì)配數(shù)個(gè)硅光芯片,類似現(xiàn)在GPU邊上配了一圈HBM,整個(gè)硅光的生態(tài)產(chǎn)業(yè)鏈都會(huì)受益,包括晶圓廠、光的封裝廠,激光的光源,激光芯片公司等。
四本無(wú)限世界快穿小說(shuō),主角在副本快意恩仇,爽到?jīng)]邊際
「快穿無(wú)限流」《輪回列車「無(wú)限」》作者:弓青瀚,強(qiáng)強(qiáng)|無(wú)限流
無(wú)限生存快穿文推薦:《今天也沒(méi)變成玩偶呢》
免責(zé)聲明:本文內(nèi)容由開放的智能模型自動(dòng)生成,僅供參考。