本文由半導體產(chǎn)業(yè)縱橫(ID:ICVIEWS)綜合
ODM們準備好了。
2025年3月的英偉達GTC大會上,英偉達首次公開了GB300的架構(gòu)和產(chǎn)品,宣布計劃于2025年第二季度開始工程樣品出貨和小量測試訂單,并計劃于2025年第三季度實現(xiàn)量產(chǎn)和首批出貨。
英偉達GB300NVL72采用全液冷機架式設(shè)計,將72個BlackwellUltraGPU和36個基于Arm架構(gòu)的GraceCPU整合到一個平臺上,并針對測試時間擴展推理進行了優(yōu)化。采用GB300NVL72的AI工廠使用Quantum-X800InfiniBand或Spectrum-X以太網(wǎng),搭配ConnectX-8SuperNICS,相比NVIDIAHopper?平臺可將推理模型推理的輸出提升50倍。
GB300NVL72平臺帶來的全新AI推理性能。與Hopper相比,GB300NVL72的用戶響應(yīng)速度提升了10倍,吞吐量(每兆瓦TPS)提升了5倍。
由于發(fā)布會當時GB200系列尚未實現(xiàn)量產(chǎn),有人擔心此舉會不會造成市場蠶食或推遲GB300的出貨。同時,由于制造工藝技術(shù)、液冷系統(tǒng)和熱管理等關(guān)鍵挑戰(zhàn),GB200產(chǎn)品的量產(chǎn)時間從2024年9月推遲到2025年第二季度。許多供應(yīng)商隨后預(yù)計,GB300也可能因此面臨延遲。
2025年4月,有報道稱,GB300最初計劃采用的Cordelia架構(gòu)將被GB200現(xiàn)有的Bianca架構(gòu)取代。這一變化增強了業(yè)內(nèi)人士對GB300計劃在2025年第四季度批量出貨的信心。
近日,據(jù)供應(yīng)鏈消息人士透露,英偉達已開始限量生產(chǎn)其下一代人工智能服務(wù)器平臺GB300,預(yù)計將于2025年9月開始批量出貨。業(yè)內(nèi)人士預(yù)計,得益于減輕制造商負擔的戰(zhàn)略轉(zhuǎn)變,英偉達下半年的生產(chǎn)軌跡將平穩(wěn)。
英偉達的一項重要舉措是,選擇在GB300上沿用其當前GB200平臺(即Bianca主板)的主板設(shè)計。這種重復使用大大縮短了供應(yīng)商的學習曲線,過去許多供應(yīng)商都難以跟上英偉達迅猛的產(chǎn)品更新周期。
一位ODM代表表示:“目前GB300沒有出現(xiàn)什么大問題。下半年的出貨應(yīng)該會很順利?!?/p>
目前,GB200的需求依然強勁,盡管其對液體冷卻的依賴導致了大量冷卻劑泄漏的報道。盡管問題尚未解決,但企業(yè)客戶仍然渴望部署該系統(tǒng),并選擇了泄漏測試和局部停機等臨時解決方案。在人工智能開發(fā)中保持競爭力的緊迫性促使數(shù)據(jù)中心運營商優(yōu)先考慮速度而非技術(shù)完善。
一位業(yè)內(nèi)高管表示:“英偉達在AI服務(wù)器領(lǐng)域的升級步伐就像軍事閃電戰(zhàn)。競爭對手甚至連尾燈都看不到,但供應(yīng)鏈卻感受到了壓力。”
英偉達的快速迭代——從Hopper到當前的Blackwell架構(gòu)——持續(xù)帶來翻天覆地的變化。例如,GB200大幅壓縮了服務(wù)器布局,導致量產(chǎn)屢屢延期。然而,由于GB300可重復利用現(xiàn)有基礎(chǔ)設(shè)施,供應(yīng)商不再面臨同樣嚴峻的產(chǎn)能提升挑戰(zhàn)。
ODM廠商目前正在積極測試GB300,早期生產(chǎn)結(jié)果令人鼓舞。預(yù)計過渡將順利進行,預(yù)計第三季度出貨量將保持穩(wěn)定,第四季度出貨量預(yù)計將進一步回升。計算板供應(yīng)商緯創(chuàng)資通已確認,由于代際重疊,本季度收入將不會環(huán)比增長——這間接證實了GB300的生產(chǎn)正在進行中。
展望未來:Rubin系列將帶來新的挑戰(zhàn)
雖然供應(yīng)鏈暫時得到緩解,但下一個架構(gòu)飛躍的準備工作已在進行中:英偉達的Rubin平臺。
2025年6月,德國萊布尼茨超算中心確認全新超級計算機BlueLion,將在NVIDIAVeraRubin架構(gòu)上運行。在推理性能方面,Rubin實現(xiàn)了驚人的50petaflops,是當前Blackwell芯片的2.5倍。據(jù)報道,SK海力士在尚未進入量產(chǎn)階段的情況下就向英偉達少量供應(yīng)了用于下代RubinGPU樣品的HBM412Hi內(nèi)存堆棧。
Rubin將引入與臺積電合作設(shè)計的基于chiplet的GPU,并采用全新設(shè)計的Kyber機架(VR300NVL576),取代目前的Oberon機架。新的設(shè)計將提升GPU密度,從而需要更強大的散熱解決方案。液冷技術(shù)在GB200中已得到更顯著的應(yīng)用,而Rubin也將因此成為核心。
目前,GB200液冷系統(tǒng)中最脆弱的部件是快速連接配件,即使在工廠進行壓力測試后,也容易發(fā)生泄漏。ODM指出,實際部署場景的水壓和管道設(shè)計差異很大,因此很難完全消除泄漏。發(fā)貨后的維護工作耗費了大量人力。
盡管面臨這些挑戰(zhàn),ODM廠商仍然對GB300的推出充滿信心。
客戶端對AI服務(wù)器的需求依然強勁,廠商加班加點地支持客戶交付。富士康、緯創(chuàng)、廣達等GB200出貨量主要龍頭企業(yè)及其相關(guān)供應(yīng)鏈預(yù)計將繼續(xù)受益于市場對AI算力日益增長的需求,預(yù)計2025年下半年營收將實現(xiàn)增長。
*聲明:本文系原作者創(chuàng)作。文章內(nèi)容系其個人觀點,我方轉(zhuǎn)載僅為分享與討論,不代表我方贊成或認同,如有異議,請聯(lián)系后臺。
想要獲取半導體產(chǎn)業(yè)的前沿洞見、技術(shù)速遞、趨勢解析,關(guān)注我們!
免責聲明:本文內(nèi)容由開放的智能模型自動生成,僅供參考。