7月28日,在2025世界人工智能大會(huì)(WAIC)期間,商湯大裝置發(fā)布基于DeepLink的異構(gòu)混合調(diào)度方案,將DeepLink深度融入商湯大裝置核心能力體系。該方案針對(duì)當(dāng)前國(guó)產(chǎn)算力資源碎片化、異構(gòu)芯片調(diào)度復(fù)雜、跨域訓(xùn)練穩(wěn)定性不足等行業(yè)挑戰(zhàn),全面提升異構(gòu)集群的協(xié)同效率與運(yùn)行可靠性,加速國(guó)產(chǎn)AI算力從“可用”邁向“好用”,為大模型訓(xùn)練提供強(qiáng)大而高效的支撐能力。
活動(dòng)現(xiàn)場(chǎng),商湯大裝置事業(yè)群產(chǎn)品總經(jīng)理盧國(guó)強(qiáng)和上海人工智能實(shí)驗(yàn)室DeepLink高級(jí)解決方案專(zhuān)家王峰在WAICUP魔盒直播間進(jìn)行解讀,詳細(xì)介紹了相關(guān)的技術(shù)原理與產(chǎn)業(yè)價(jià)值。
【W(wǎng)AIC2025直播間主題分享】
打通軟硬壁壘,構(gòu)建AI算力協(xié)同新路徑
DeepLink是由上海人工智能實(shí)驗(yàn)室(上海AI實(shí)驗(yàn)室)推出的人工智能開(kāi)放計(jì)算體系,其目標(biāo)是搭建在硬件芯片與深度學(xué)習(xí)軟件框架之間進(jìn)行適配的橋梁,共建開(kāi)放的軟硬件適配生態(tài)。DeepLink把AI芯片與基礎(chǔ)框架連接起來(lái),上下游廠商基于DeepLink一次適配即可接入廣泛的算法生態(tài),實(shí)現(xiàn)軟硬件解耦,破除生態(tài)壁壘。
當(dāng)下,大規(guī)模集群建設(shè)的同時(shí),仍然存在軟硬件優(yōu)化適配不足、資源利用率低、供需失衡等問(wèn)題。為更好的推進(jìn)問(wèn)題解決,上海AI實(shí)驗(yàn)室率先探索并研發(fā)了DeepLink超大規(guī)??缬蚧煊?xùn)技術(shù)方案,通過(guò)訓(xùn)練加速、異構(gòu)通信、并行策略等核心技術(shù),打破芯片架構(gòu)差異帶來(lái)的協(xié)同壁壘,重構(gòu)計(jì)算資源調(diào)度體系。
今年2月,上海AI實(shí)驗(yàn)室聯(lián)合包括商湯在內(nèi)的十余家合作伙伴,于上海建成了超大規(guī)??缬蚧煊?xùn)集群原型,并已在千億量級(jí)參數(shù)的自研模型上,完成20天不間斷長(zhǎng)穩(wěn)訓(xùn)練,效率達(dá)單一芯片集群的90%。此突破成果為快速實(shí)現(xiàn)智算中心互聯(lián)、支撐超大模型混訓(xùn)提供可行技術(shù)保障。其中,商湯大裝置為超大規(guī)模的混訓(xùn)集群提供了算力調(diào)度和管理平臺(tái),從而支持了多芯集群的穩(wěn)定運(yùn)行。
共建異構(gòu)算力生態(tài),釋放超大規(guī)模異構(gòu)算力集群價(jià)值
基于DeepLink的異構(gòu)混合調(diào)度方案的發(fā)布,是商湯大裝置與上海AI實(shí)驗(yàn)室長(zhǎng)期協(xié)作的重要成果。商湯大裝置與DeepLink的深度融合,具備以下特點(diǎn):
多芯片協(xié)同調(diào)度:可實(shí)現(xiàn)多種國(guó)產(chǎn)芯片之間的協(xié)同通信與統(tǒng)一調(diào)度,并自動(dòng)進(jìn)行并行策略優(yōu)化和負(fù)載均衡,真正做到“不同芯片,同一平臺(tái)”的協(xié)同工作,釋放異構(gòu)集群的計(jì)算潛力。高效混訓(xùn),穩(wěn)定可控:顯著提升了異構(gòu)調(diào)度與彈性算力能力,以秒級(jí)彈性伸縮、分鐘級(jí)故障恢復(fù)等,保障大模型訓(xùn)練過(guò)程穩(wěn)定、高效、可控。支持主流模型全流程運(yùn)行:方案兼容DeepSeek、InternLM、LLaMA、Qwen等主流大模型,適配稠密模型與MoE架構(gòu),支持訓(xùn)練與推理的高效執(zhí)行。
商湯大裝置事業(yè)群產(chǎn)品總經(jīng)理盧國(guó)強(qiáng)表示:“通過(guò)基于DeepLink的異構(gòu)混合調(diào)度方案,商湯大裝置將為更多GPU適配、訓(xùn)練和推理場(chǎng)景擴(kuò)展、商業(yè)化落地提供更強(qiáng)助力。未來(lái),商湯大裝置將與上海人工智能實(shí)驗(yàn)室持續(xù)深化合作,加快國(guó)產(chǎn)AI算力芯片的適配與優(yōu)化,共筑國(guó)產(chǎn)AI生態(tài)底座,為智能時(shí)代的產(chǎn)業(yè)升級(jí)注入源源不斷的技術(shù)動(dòng)能?!?/p>
戰(zhàn)“疫”日記|病毒無(wú)情,“蘭州好人”的溫度??蘭州新聞網(wǎng)
扛鼎之作《好人日記》,實(shí)力碾壓對(duì)手,你跪了嗎?
日記:老板的工作就是用好人,分好錢(qián),連續(xù)日記216篇