IT之家7月28日消息,2025世界人工智能大會(WAIC)于7月26日在上海世博中心啟幕。本次WAIC,華為首次線下展出昇騰384超節(jié)點Atlas900A3SuperPoD,該產(chǎn)品基于超節(jié)點架構(gòu),通過總線技術(shù)實現(xiàn)384個NPU之間的大帶寬低時延互聯(lián),解決集群內(nèi)計算、存儲等各資源之間的通信瓶頸。
據(jù)華為中國官方消息,昇騰384超節(jié)點Atlas900SuperPoD被評選為本次WAIC2025鎮(zhèn)館之寶,其主要有以下3大優(yōu)勢:
①超大帶寬超節(jié)點內(nèi)任意兩個AI處理器之間通信帶寬,相較于傳統(tǒng)架構(gòu)提升15倍,超節(jié)點內(nèi)單跳時延降低10倍。②超低時延昇騰超節(jié)點支持全局內(nèi)存統(tǒng)一編址,具備更高效的內(nèi)存語義通信能力。通過更低時延指令級內(nèi)存語義通信,可滿足大模型訓(xùn)練/推理中的小包通信需求,提升專家網(wǎng)絡(luò)小包數(shù)據(jù)傳輸及離散隨機訪存通信效率。昇騰384超節(jié)點Atlas900SuperPoD是業(yè)界唯一突破Decode時延15ms的方案,滿足實時深度思考下的用戶體驗需求。③超強性能經(jīng)過實際測試,在昇騰超節(jié)點集群上,LLaMA3等千億稠密模型訓(xùn)練性能可達傳統(tǒng)集群的2.5倍以上。在通信占比更高的Qwen、DeepSeek等多模態(tài)、MoE模型上,可以達到3倍以上的提升。
據(jù)IT之家此前報道,在今年5月的鯤鵬昇騰開發(fā)者大會上,華為推出了昇騰超節(jié)點,成功實現(xiàn)業(yè)界最大規(guī)模的384卡高速總線互聯(lián)。昇騰超節(jié)點具備超大帶寬、超低時延、超強性能的三大優(yōu)勢,包括多款訓(xùn)練和推理產(chǎn)品,基于超節(jié)點創(chuàng)新架構(gòu),更好地滿足模型訓(xùn)練和推理對低時延,大帶寬,長穩(wěn)可靠的要求。
華為官方透露,目前業(yè)界已基于昇騰適配和開發(fā)超過80個大模型,在基礎(chǔ)大模型方面多個技術(shù)方向均有積累,如訊飛星火認知、DeepSeek、Qwen、鵬城、LLaMA等。同時,昇騰聯(lián)合2700+行業(yè)合作伙伴,共同孵化了超過6000+個行業(yè)解決方案。
華為本次展區(qū)面積超過800平方米,IT之家注意到,除了展示昇騰軟硬件能力,訓(xùn)練、推理解決方案和開源開放的軟硬件生態(tài),華為還攜手伙伴共同展示互聯(lián)網(wǎng)、運營商、金融、政務(wù)、醫(yī)療、油氣、交通等11大行業(yè)解決方案實踐。
延伸閱讀:與 再次聯(lián)手哈登不可思議 下賽季未:{必是最|后}一季 的相關(guān)文章