智東西作者陳駿達(dá)編輯漠影
隨著大模型的快速演進(jìn)和模型參數(shù)規(guī)模的快速增長(zhǎng),AI算力需求正呈現(xiàn)爆發(fā)式態(tài)勢(shì)。然而,支撐芯片發(fā)展的摩爾定律已逼近物理極限,晶體管微縮帶來(lái)的成本呈指數(shù)級(jí)上升,性能提升幅度卻逐年收窄。
這一根本性矛盾促使業(yè)界亟需探索一種能繼續(xù)擴(kuò)展AI基礎(chǔ)設(shè)施的解決方案。超節(jié)點(diǎn)技術(shù)應(yīng)運(yùn)而生,通過數(shù)十張乃至數(shù)百?gòu)埣铀倏ǖ母邘捇ミB,將相對(duì)獨(dú)立的計(jì)算資源整合為統(tǒng)一的超級(jí)計(jì)算單元,突破了傳統(tǒng)架構(gòu)在規(guī)模擴(kuò)展上的瓶頸。
不過,在國(guó)內(nèi)環(huán)境中,由于高端算力的缺乏,國(guó)產(chǎn)超節(jié)點(diǎn)方案往往需要整合更大規(guī)模的集群,這對(duì)互連技術(shù)提出了更高的要求。在帶寬、能耗、傳輸距離上較傳統(tǒng)電互連方案更具優(yōu)勢(shì)的光學(xué)方案的應(yīng)用,有望逐步成為推動(dòng)超節(jié)點(diǎn)性能提升的關(guān)鍵驅(qū)動(dòng)力。
就在昨天,國(guó)內(nèi)光電混合算力獨(dú)角獸曦智科技在世界人工智能大會(huì)(WAIC)上發(fā)布了國(guó)內(nèi)首個(gè)光互連光交換GPU超節(jié)點(diǎn)光躍LightSphereX,并聯(lián)合壁仞科技、中興通訊首次進(jìn)行示范應(yīng)用,即將于上海儀電國(guó)產(chǎn)超節(jié)點(diǎn)算力集群落地。
憑借全球首創(chuàng)的分布式光交換技術(shù),光躍LightSphereX獲得世界人工智能大會(huì)的最高獎(jiǎng)項(xiàng),2025SAIL獎(jiǎng),并成為SAIL四大評(píng)價(jià)維度(Superior,Application,Innovation,Leading)中“Innovation”(創(chuàng)新)維度的標(biāo)桿案例。
近日,智東西與曦智科技創(chuàng)始人兼CEO沈亦晨博士、曦智科技聯(lián)合創(chuàng)始人兼CTO孟懷宇博士以及曦智科技互連產(chǎn)品線副總裁朱劍進(jìn)行了近2個(gè)小時(shí)的深入溝通,他們向智東西等媒體剖析了光躍LightSphereX背后的技術(shù)創(chuàng)新與曦智科技對(duì)光電混合算力行業(yè)的長(zhǎng)期展望。
一、超節(jié)點(diǎn)互連技術(shù)路徑分野,國(guó)產(chǎn)方案如何突圍
當(dāng)下,海外的超節(jié)點(diǎn)方案基本由英偉達(dá)主導(dǎo),使用電交換構(gòu)建單柜達(dá)72卡的大規(guī)模超節(jié)點(diǎn),也就是所謂的GB200NVL72。
該解決方案依賴于一個(gè)在國(guó)內(nèi)看來(lái)幾乎有些“奢侈”的前提——每張GB200的算力數(shù)倍于國(guó)產(chǎn)卡。若要實(shí)現(xiàn)同等效果,國(guó)產(chǎn)超節(jié)點(diǎn)可能需要進(jìn)行成百上千卡的互連,在現(xiàn)有條件下,基本難以在單機(jī)柜內(nèi)實(shí)現(xiàn)。
即便從理論上可行,單機(jī)柜內(nèi)構(gòu)建如此密集的電互連方案本身也面臨極高的技術(shù)挑戰(zhàn)和投入成本,對(duì)于目前國(guó)內(nèi)的產(chǎn)業(yè)基礎(chǔ)來(lái)說(shuō),依然是一項(xiàng)極具挑戰(zhàn)性的任務(wù)。
因此,國(guó)產(chǎn)解決方案更可行的路徑或許是通過增加機(jī)柜數(shù)量,先確保計(jì)算卡的總量,再通過高效互連技術(shù)組成超節(jié)點(diǎn)。
沈亦晨博士稱,在多機(jī)柜場(chǎng)景下,傳統(tǒng)的銅導(dǎo)線連接距離一旦超過1-1.5米,就無(wú)法滿足超節(jié)點(diǎn)對(duì)帶寬和延時(shí)的嚴(yán)苛要求,光互連幾乎成為必選項(xiàng)。
谷歌曾在其TPU光互連超節(jié)點(diǎn)方案采用集中式光交換,實(shí)現(xiàn)GPU集群間的跨機(jī)柜通信。不過,該方案專為TPU定制,硬件成本高昂,對(duì)全棧軟件能力要求較高,目前除了谷歌外尚未有其他廠商采用。
前段時(shí)間帶火超節(jié)點(diǎn)概念的華為昇騰CloudMatrix384超節(jié)點(diǎn),也使用了光互連網(wǎng)絡(luò),配備近7000個(gè)光模塊,讓數(shù)百塊GPU能實(shí)現(xiàn)高效協(xié)同。
此外,要打造高效的超節(jié)點(diǎn)方案,交換也是極為關(guān)鍵的一環(huán)。
沈亦晨博士介紹,在模型訓(xùn)練過程中,不同階段GPU間的通信拓?fù)浯嬖趧?dòng)態(tài)變化。英偉達(dá)采用NVSwitch電交換芯片集中調(diào)度NVLink信號(hào),類似交通信號(hào)燈統(tǒng)一分配各GPU間的通信路徑。
然而,國(guó)內(nèi)GPU廠商普遍缺乏同類高性能電交換芯片,現(xiàn)有解決方案在性能上仍與英偉達(dá)存在顯著差距。此外,國(guó)內(nèi)GPU廠商的互連接口協(xié)議也各不相同,傳統(tǒng)交換機(jī)無(wú)法做到統(tǒng)一調(diào)度。
面臨種種挑戰(zhàn),國(guó)產(chǎn)超節(jié)點(diǎn)方案究竟應(yīng)該如何破局?作為國(guó)內(nèi)乃至全球領(lǐng)先的光電混合算力提供商,曦智科技依托其在光子計(jì)算和光子網(wǎng)絡(luò)的技術(shù)積累,交出國(guó)內(nèi)首個(gè)光互連光交換GPU超節(jié)點(diǎn)解決方案光躍LightSphereX。
二、首創(chuàng)分布式光交換芯片,相關(guān)成果獲頂會(huì)認(rèn)證
光躍LightSphereX的核心技術(shù),是曦智科技全球首創(chuàng)的基于硅光子技術(shù)的分布式光交換dOCS(distributedOpticalCircuitSwitch)芯片。
若把傳統(tǒng)集中式的交換芯片比為中央物流中心,將每張計(jì)算卡比為一個(gè)車間,分布式光交換技術(shù)所進(jìn)行的調(diào)整,就是取消了中央物流中心,轉(zhuǎn)而在每個(gè)車間旁邊設(shè)置小型物料中轉(zhuǎn)站,使物料傳輸路徑更短、更直接。
得益于這一架構(gòu),光躍LightSphereX可靈活配置超節(jié)點(diǎn)的規(guī)模,并可靈活切換GPU間互連拓?fù)浣Y(jié)構(gòu),以適應(yīng)不同模型負(fù)載對(duì)通信模式的差異化需求。
在大規(guī)模訓(xùn)練、推理場(chǎng)景中,上述解決方案在GPU冗余率上展現(xiàn)出明顯優(yōu)勢(shì)。傳統(tǒng)超節(jié)點(diǎn)必須整體運(yùn)作,單卡故障會(huì)導(dǎo)致整個(gè)節(jié)點(diǎn)下線,冗余成本高;而分布式光交換讓超節(jié)點(diǎn)支持動(dòng)態(tài)重組——當(dāng)檢測(cè)到異常時(shí),系統(tǒng)可自動(dòng)移除故障節(jié)點(diǎn),接入備份服務(wù)器重新組網(wǎng)。
這種“卡級(jí)冗余”相比傳統(tǒng)“節(jié)點(diǎn)級(jí)冗余”大幅降低備用資源需求,將冗余比例從整節(jié)點(diǎn)壓縮到單卡級(jí)別,冗余率僅為英偉達(dá)、谷歌等方案的1/10。
光躍LightSphereX解決方案在商用光電轉(zhuǎn)換模組的基礎(chǔ)上,增加了用于光交換功能的芯片,以較低的成本實(shí)現(xiàn)了分布式的光交換。分布式設(shè)計(jì)方案幾乎可以無(wú)限擴(kuò)展,突破了傳統(tǒng)交換芯片對(duì)連接數(shù)量的限制。
在本屆WAIC期間發(fā)布的光躍LightSphereX獲得了SAIL獎(jiǎng)(WAIC最高獎(jiǎng)項(xiàng)),也成為該獎(jiǎng)項(xiàng)創(chuàng)新維度的標(biāo)桿案例。而dOCS相關(guān)方案則收錄于國(guó)際通信網(wǎng)絡(luò)旗艦會(huì)議SIGCOMM2025。
除了技術(shù)方面的突破之外,光躍LightSphereX還對(duì)國(guó)產(chǎn)算力生態(tài)起到了一定的推動(dòng)作用。
當(dāng)下,國(guó)產(chǎn)GPU類型、架構(gòu)龐雜,協(xié)議各有區(qū)別,難以形成協(xié)同效應(yīng)。而光交換本身不依賴于特定的數(shù)據(jù)傳輸協(xié)議,這意味著它能無(wú)縫兼容不同廠商使用的互連協(xié)議。這有效緩解了開放生態(tài)中缺乏高效Scale-Up交換芯片的現(xiàn)狀,推動(dòng)了基于光交換的Scale-Up技術(shù)路徑。
此外,dOCS芯片基于硅光技術(shù),其設(shè)計(jì)與制造不依賴于先進(jìn)半導(dǎo)體工藝節(jié)點(diǎn),這對(duì)提升算力基礎(chǔ)設(shè)施供應(yīng)鏈的安全性與韌性也有較大意義。
三、硅光技術(shù)迎來(lái)歷史機(jī)遇期,5年內(nèi)硅光芯片占比或?qū)⑦_(dá)30%
光躍LightSphereX是曦智科技在AI算力需求大爆發(fā)的當(dāng)下,對(duì)光電混合算力的最新探索,這離不開曦智成立8年多來(lái)在硅光技術(shù)上的長(zhǎng)期投入。該公司擁有光子矩陣計(jì)算(oMAC)、片上光網(wǎng)絡(luò)(oNOC)和片間光網(wǎng)絡(luò)(oNET)三大領(lǐng)域的核心技術(shù),并打造了光子計(jì)算和光子網(wǎng)絡(luò)兩大產(chǎn)品線。
沈亦晨認(rèn)為,近兩年,硅光技術(shù)在國(guó)際上的熱度和重視度不斷攀升,可能已經(jīng)走到歷史上最好的階段。面臨這一歷史機(jī)遇期,曦智從兩年前便開始聚焦產(chǎn)品化、商業(yè)化,業(yè)務(wù)收入在過去3年內(nèi)快速增長(zhǎng),今年芯片出貨量已經(jīng)達(dá)到數(shù)萬(wàn)顆。
放眼未來(lái),曦智科技的高管們一致認(rèn)為,隨著算力集群和算力需求越來(lái)越大,硅光是必然的解決方案。雖然國(guó)際上純電互連仍占主導(dǎo),但華為這一主流廠商已將光互連引入超節(jié)點(diǎn)解決方案,英偉達(dá)的下一步也可能是如此。
此外,光互連和光交換技術(shù)當(dāng)前仍屬于系統(tǒng)級(jí)方案,通過外接光模組實(shí)現(xiàn),通過不斷迭代,未來(lái)光互連和光交換器件有望與主芯片實(shí)現(xiàn)共封裝,從而進(jìn)一步提高帶寬和能效。
沈亦晨預(yù)測(cè),未來(lái)五年,硅光芯片在智算中心的占比有望提升至30%以上。隨著規(guī)?;慨a(chǎn),硅光芯片成本將成倍下降,推動(dòng)成本降低到應(yīng)用普及的正向循環(huán)。
具體來(lái)看,他認(rèn)為光互連有望率先在未來(lái)幾年出現(xiàn)指數(shù)級(jí)增長(zhǎng);光計(jì)算則從大模型推理、AIforScience等追求極致性能的場(chǎng)景切入,逐步擴(kuò)展通用性。
曦智科技目前擁有一支近250人的團(tuán)隊(duì),核心成員由來(lái)自麻省理工學(xué)院的頂尖科學(xué)家和擁有豐富半導(dǎo)體行業(yè)經(jīng)驗(yàn)的業(yè)界知名人士組成,在上海、杭州、南京、北京、新加坡等地均設(shè)有辦公室及實(shí)驗(yàn)室。
自成立以來(lái),曦智科技在產(chǎn)品進(jìn)展、技術(shù)研發(fā)、融資規(guī)模等方面均位居全球光電混合賽道前列。孟懷宇博士透露,曦智在光學(xué)芯片、模擬芯片、先進(jìn)封裝技術(shù)等方面都擁有前瞻性的技術(shù)儲(chǔ)備。
負(fù)責(zé)互連產(chǎn)品線的朱劍則稱,曦智有很多先進(jìn)的技術(shù)儲(chǔ)備,但該公司會(huì)采取較為務(wù)實(shí)的態(tài)度,根據(jù)市場(chǎng)的發(fā)展階段提供適合的解決方案。
結(jié)語(yǔ):實(shí)現(xiàn)從0到千卡突破,光電融合已成行業(yè)大勢(shì)
光電混合算力作為一項(xiàng)前沿技術(shù),在落地的時(shí)候必然面臨客戶原有技術(shù)路徑的慣性問題。沈亦晨透露,直到如今,曦智仍需要花精力“教育市場(chǎng)”,逐步說(shuō)服廠商采用這一技術(shù)。
令人慶幸的是,曦智已在光躍LightSphereX方案上實(shí)現(xiàn)了從0到千卡突破,將對(duì)光互連超節(jié)點(diǎn)方案的魯棒性和成本效益驗(yàn)證起到極大的推動(dòng)作用。
在智東西與曦智的溝通中,我們清楚地感受到其發(fā)展路徑:以光電混合算力技術(shù)為支點(diǎn),逐步撬動(dòng)算力基礎(chǔ)設(shè)施的升級(jí),同時(shí)保持對(duì)“光替代電”的長(zhǎng)期信仰。
做半飛秒激光近視眼手術(shù)需要多長(zhǎng)時(shí)間?
近視去做ICL晶體植入術(shù)后,我真的后悔了……
上班族:做近視手術(shù)到底要請(qǐng)幾天假?
免責(zé)聲明:本文內(nèi)容由開放的智能模型自動(dòng)生成,僅供參考。