在《紅樓夢》中,當(dāng)詩社舉辦第二次詩會時(shí),李紈在評選菊花詩時(shí)為啥不再力推薛寶釵了?
(文/觀察者網(wǎng)呂棟)
7月26日,觀察者網(wǎng)在世界人工智能大會(WAIC2025)現(xiàn)場了解到,華為首次展出了昇騰384超節(jié)點(diǎn)真機(jī),并且獲評“WAIC鎮(zhèn)館之寶”。在展臺上,華為還全方位展現(xiàn)了昇騰算力底座的創(chuàng)新能力、訓(xùn)練及推理解決方案、開源開放的軟硬件生態(tài),以及在互聯(lián)網(wǎng)、運(yùn)營商、金融、能源、教育科研等千行萬業(yè)的豐富實(shí)踐。
圖源:觀察者網(wǎng)
在當(dāng)下,大模型訓(xùn)練和推理對算力需求的爆炸式增長,但傳統(tǒng)計(jì)算架構(gòu)面臨資源利用率低,故障頻發(fā)等挑戰(zhàn),難以支撐AI技術(shù)的代際躍遷,這就算力集群的系統(tǒng)工程能力提出更高要求。
今年5月,在鯤鵬昇騰開發(fā)者大會上,華為推出了昇騰384超節(jié)點(diǎn),由12個(gè)計(jì)算柜和4個(gè)總線柜構(gòu)成。這個(gè)體積龐大的“算力核彈”,成功實(shí)現(xiàn)業(yè)界最大規(guī)模的384個(gè)NPU卡高速總線互聯(lián)。根據(jù)現(xiàn)場介紹,昇騰超節(jié)點(diǎn)具備超大帶寬、超低時(shí)延、超強(qiáng)性能的三大優(yōu)勢,包括多款訓(xùn)練和推理產(chǎn)品。
相比英偉達(dá)NVL72等行業(yè)超節(jié)點(diǎn)方案,昇騰超節(jié)點(diǎn)最關(guān)鍵的創(chuàng)新,在于徹底打破了傳統(tǒng)以CPU為中心的馮諾依曼架構(gòu),既“主從架構(gòu)”,創(chuàng)新提出了“全對等架構(gòu)”,憑借高速互聯(lián)總線的關(guān)鍵突破,把總線從服務(wù)器內(nèi)部擴(kuò)展到整機(jī)柜、甚至跨機(jī)柜,最終將CPU、NPU、DPU、存儲和內(nèi)存等資源全部互聯(lián)和池化,這樣就能去除掉繁多的中轉(zhuǎn)環(huán)節(jié),從而實(shí)現(xiàn)真正的點(diǎn)對點(diǎn)互聯(lián),進(jìn)而實(shí)現(xiàn)更大的算力密度和互聯(lián)帶寬。
縱觀國內(nèi),目前使用全國產(chǎn)芯片構(gòu)建超節(jié)點(diǎn),還能全面超越英偉達(dá)NVL72的,只有華為。昇騰384超節(jié)點(diǎn)通過全新高速網(wǎng)絡(luò)MatrixLink全對等互聯(lián),形成一臺超級“AI服務(wù)器”,它的算力總規(guī)模達(dá)300Pflops,是英偉達(dá)NVL72的1.7倍;網(wǎng)絡(luò)互聯(lián)總帶寬達(dá)269TB/s,比英偉達(dá)NVL72提升107%;內(nèi)存總帶寬達(dá)1229TB/s,比英偉達(dá)NVL72提升113%;單卡推理吞吐量躍升到2300Tokens/s。
更重要的是,通過最佳負(fù)載均衡組網(wǎng)等方案,昇騰超節(jié)點(diǎn)還能進(jìn)一步擴(kuò)展為包含數(shù)萬卡的Atlas900SuperCluster超節(jié)點(diǎn)集群,未來可以支撐更大規(guī)模的模型演進(jìn)。
觀察者網(wǎng)獲得的性能測試數(shù)據(jù)顯示,在昇騰超節(jié)點(diǎn)集群上,LLaMA3等千億稠密模型性能相比傳統(tǒng)集群提升2.5倍以上;在通信需求更高的Qwen、DeepSeek等多模態(tài)、MoE模型上,性能提升可達(dá)3倍以上,較業(yè)界其他集群高出1.2倍,在行業(yè)中處于領(lǐng)先地位。
“單芯片制程從7納米到5納米、3納米、2納米,每代性能提升不超過20%,總體能提升50%左右。華為通過高效的超節(jié)點(diǎn)系統(tǒng),提升了芯片算力利用率。在硬件什么也沒有改變的情況下,通過系統(tǒng)工程的優(yōu)化,資源的高效調(diào)度,一定程度彌補(bǔ)了芯片工藝的不足?!比A為專家曾對觀察者網(wǎng)表示。
昇騰384超節(jié)點(diǎn)架構(gòu)
自2019年以來,昇騰不僅在芯片等根技術(shù)領(lǐng)域深耕,還持續(xù)擴(kuò)展產(chǎn)業(yè)生態(tài),提供好用易用的軟件、工具和平臺,實(shí)現(xiàn)AI技術(shù)和行業(yè)場景深度融合。目前業(yè)界已基于昇騰適配和開發(fā)超過80個(gè)大模型,在基礎(chǔ)大模型方面多個(gè)技術(shù)方向均有積累,如訊飛星火認(rèn)知、DeepSeek、Qwen、鵬城、LLaMA等。同時(shí),昇騰聯(lián)合2700+行業(yè)合作伙伴,共同孵化了超過6000+個(gè)行業(yè)解決方案,使能百模千態(tài),加速行業(yè)智能化。
觀察者網(wǎng)了解到,本次參展WAIC,華為展臺面積超過800平方米,除了展示昇騰軟硬件能力,訓(xùn)練、推理解決方案和開源開放的軟硬件生態(tài),還攜手伙伴共同展示互聯(lián)網(wǎng)、運(yùn)營商、金融、政務(wù)、醫(yī)療、油氣、交通等11大行業(yè)解決方案實(shí)踐,供與會者現(xiàn)場參觀交流。
本文系觀察者網(wǎng)獨(dú)家稿件,未經(jīng)授權(quán),不得轉(zhuǎn)載。