(文/觀察者網(wǎng)呂棟)
7月26日,觀察者網(wǎng)在世界人工智能大會(huì)(WAIC2025)現(xiàn)場(chǎng)了解到,華為首次展出了昇騰384超節(jié)點(diǎn)真機(jī),并且獲評(píng)“WAIC鎮(zhèn)館之寶”。在展臺(tái)上,華為還全方位展現(xiàn)了昇騰算力底座的創(chuàng)新能力、訓(xùn)練及推理解決方案、開(kāi)源開(kāi)放的軟硬件生態(tài),以及在互聯(lián)網(wǎng)、運(yùn)營(yíng)商、金融、能源、教育科研等千行萬(wàn)業(yè)的豐富實(shí)踐。
圖源:觀察者網(wǎng)
在當(dāng)下,大模型訓(xùn)練和推理對(duì)算力需求的爆炸式增長(zhǎng),但傳統(tǒng)計(jì)算架構(gòu)面臨資源利用率低,故障頻發(fā)等挑戰(zhàn),難以支撐AI技術(shù)的代際躍遷,這就算力集群的系統(tǒng)工程能力提出更高要求。
今年5月,在鯤鵬昇騰開(kāi)發(fā)者大會(huì)上,華為推出了昇騰384超節(jié)點(diǎn),由12個(gè)計(jì)算柜和4個(gè)總線柜構(gòu)成。這個(gè)體積龐大的“算力核彈”,成功實(shí)現(xiàn)業(yè)界最大規(guī)模的384個(gè)NPU卡高速總線互聯(lián)。根據(jù)現(xiàn)場(chǎng)介紹,昇騰超節(jié)點(diǎn)具備超大帶寬、超低時(shí)延、超強(qiáng)性能的三大優(yōu)勢(shì),包括多款訓(xùn)練和推理產(chǎn)品。
相比英偉達(dá)NVL72等行業(yè)超節(jié)點(diǎn)方案,昇騰超節(jié)點(diǎn)最關(guān)鍵的創(chuàng)新,在于徹底打破了傳統(tǒng)以CPU為中心的馮諾依曼架構(gòu),既“主從架構(gòu)”,創(chuàng)新提出了“全對(duì)等架構(gòu)”,憑借高速互聯(lián)總線的關(guān)鍵突破,把總線從服務(wù)器內(nèi)部擴(kuò)展到整機(jī)柜、甚至跨機(jī)柜,最終將CPU、NPU、DPU、存儲(chǔ)和內(nèi)存等資源全部互聯(lián)和池化,這樣就能去除掉繁多的中轉(zhuǎn)環(huán)節(jié),從而實(shí)現(xiàn)真正的點(diǎn)對(duì)點(diǎn)互聯(lián),進(jìn)而實(shí)現(xiàn)更大的算力密度和互聯(lián)帶寬。
縱觀國(guó)內(nèi),目前使用全國(guó)產(chǎn)芯片構(gòu)建超節(jié)點(diǎn),還能全面超越英偉達(dá)NVL72的,只有華為。昇騰384超節(jié)點(diǎn)通過(guò)全新高速網(wǎng)絡(luò)MatrixLink全對(duì)等互聯(lián),形成一臺(tái)超級(jí)“AI服務(wù)器”,它的算力總規(guī)模達(dá)300Pflops,是英偉達(dá)NVL72的1.7倍;網(wǎng)絡(luò)互聯(lián)總帶寬達(dá)269TB/s,比英偉達(dá)NVL72提升107%;內(nèi)存總帶寬達(dá)1229TB/s,比英偉達(dá)NVL72提升113%;單卡推理吞吐量躍升到2300Tokens/s。
更重要的是,通過(guò)最佳負(fù)載均衡組網(wǎng)等方案,昇騰超節(jié)點(diǎn)還能進(jìn)一步擴(kuò)展為包含數(shù)萬(wàn)卡的Atlas900SuperCluster超節(jié)點(diǎn)集群,未來(lái)可以支撐更大規(guī)模的模型演進(jìn)。
觀察者網(wǎng)獲得的性能測(cè)試數(shù)據(jù)顯示,在昇騰超節(jié)點(diǎn)集群上,LLaMA3等千億稠密模型性能相比傳統(tǒng)集群提升2.5倍以上;在通信需求更高的Qwen、DeepSeek等多模態(tài)、MoE模型上,性能提升可達(dá)3倍以上,較業(yè)界其他集群高出1.2倍,在行業(yè)中處于領(lǐng)先地位。
“單芯片制程從7納米到5納米、3納米、2納米,每代性能提升不超過(guò)20%,總體能提升50%左右。華為通過(guò)高效的超節(jié)點(diǎn)系統(tǒng),提升了芯片算力利用率。在硬件什么也沒(méi)有改變的情況下,通過(guò)系統(tǒng)工程的優(yōu)化,資源的高效調(diào)度,一定程度彌補(bǔ)了芯片工藝的不足。”華為專(zhuān)家曾對(duì)觀察者網(wǎng)表示。
昇騰384超節(jié)點(diǎn)架構(gòu)
自2019年以來(lái),昇騰不僅在芯片等根技術(shù)領(lǐng)域深耕,還持續(xù)擴(kuò)展產(chǎn)業(yè)生態(tài),提供好用易用的軟件、工具和平臺(tái),實(shí)現(xiàn)AI技術(shù)和行業(yè)場(chǎng)景深度融合。目前業(yè)界已基于昇騰適配和開(kāi)發(fā)超過(guò)80個(gè)大模型,在基礎(chǔ)大模型方面多個(gè)技術(shù)方向均有積累,如訊飛星火認(rèn)知、DeepSeek、Qwen、鵬城、LLaMA等。同時(shí),昇騰聯(lián)合2700+行業(yè)合作伙伴,共同孵化了超過(guò)6000+個(gè)行業(yè)解決方案,使能百模千態(tài),加速行業(yè)智能化。
觀察者網(wǎng)了解到,本次參展WAIC,華為展臺(tái)面積超過(guò)800平方米,除了展示昇騰軟硬件能力,訓(xùn)練、推理解決方案和開(kāi)源開(kāi)放的軟硬件生態(tài),還攜手伙伴共同展示互聯(lián)網(wǎng)、運(yùn)營(yíng)商、金融、政務(wù)、醫(yī)療、油氣、交通等11大行業(yè)解決方案實(shí)踐,供與會(huì)者現(xiàn)場(chǎng)參觀交流。
本文系觀察者網(wǎng)獨(dú)家稿件,未經(jīng)授權(quán),不得轉(zhuǎn)載。
2019暑期閱讀書(shū)單新鮮出爐!讓孩子愛(ài)上閱讀!??澎湃在線
嘔心瀝血乾坤鑒
講座|郁喆雋:雅典學(xué)園中哪些哲學(xué)家不會(huì)去“搶菜”
免責(zé)聲明:本文內(nèi)容由開(kāi)放的智能模型自動(dòng)生成,僅供參考。