上篇文章中,我們了解了“神威·太湖之光”曾是世界上最快的超級(jí)計(jì)算機(jī),代表著中國在算力領(lǐng)域的一次重大突破。但很多人不知道,它的真正核心,不是龐大的機(jī)房設(shè)備,而是一顆中國“芯”——申威處理器。
一臺(tái)超級(jí)計(jì)算機(jī)跑得快,并不稀奇;能靠自己造跑得快的芯片,才是真本事。這背后的故事,是中國從“能用超算”到“能造超算”的關(guān)鍵一步。本篇文章,我們就聚焦于這顆中國自主設(shè)計(jì)的芯片——SW26010。
SW26010芯片
(圖片來源:國家超級(jí)計(jì)算無錫中心)
“超算的大腦”:我國自主研發(fā)的申威處理器
申威不是一臺(tái)機(jī)器,而是一種國產(chǎn)高性能處理器的統(tǒng)稱。尤其是在“神威·太湖之光”這臺(tái)超級(jí)計(jì)算機(jī)中,所采用的正是名為SW26010的申威處理器。換句話說,“申威”是“神威”的大腦,是驅(qū)動(dòng)這臺(tái)超級(jí)計(jì)算機(jī)完成千萬億次運(yùn)算的計(jì)算核心。
這顆芯片是中國自主研發(fā)、完全不依賴國外架構(gòu)授權(quán)的處理器,具有以下幾個(gè)關(guān)鍵特點(diǎn):每顆SW26010芯片包含260個(gè)計(jì)算核心,包括256個(gè)運(yùn)算核心和4個(gè)管理核心,整個(gè)神威系統(tǒng)共搭載了40960顆芯片,總計(jì)超過1065萬個(gè)計(jì)算核心。
芯片采用“低頻高并行”策略,適合高效執(zhí)行大規(guī)模科學(xué)計(jì)算任務(wù)?!暗皖l高并行”指的是不追求單個(gè)處理器核心的高主頻,而是通過集成大量低頻核心來實(shí)現(xiàn)整體計(jì)算能力的提升。相比傳統(tǒng)的“高頻少核”方案,這種方式能顯著降低能耗和發(fā)熱,提升系統(tǒng)的能效比。
SW26010架構(gòu)以及從核陣列結(jié)構(gòu)邏輯示意圖
(圖片來源:國家超級(jí)計(jì)算無錫中心)
SW26010-Pro:升級(jí)版“中國芯”
在SW26010的基礎(chǔ)上,我國還研發(fā)出了SW26010-Pro處理器,它是“神威·太湖之光”后續(xù)型號(hào)超級(jí)計(jì)算機(jī)所使用的核心芯片。
與SW26010相比,SW26010-Pro在計(jì)算性能、存儲(chǔ)帶寬、能效比、指令集兼容性和編程友好性等方面都有明顯提升。W20610-Pro由6個(gè)核心組和1個(gè)協(xié)議處理單元組成,每個(gè)核心組包含64個(gè)計(jì)算處理元素,總計(jì)384個(gè)內(nèi)核,而SW26010只有4個(gè)核心組,并且每個(gè)核心組都有自己的內(nèi)存控制器,理論帶寬達(dá)到了307.2GB/s,解決了上一代中某些核心互聯(lián)與內(nèi)存訪問瓶頸,提升了多核之間的數(shù)據(jù)傳輸效率。
此外,它還增強(qiáng)了對異構(gòu)計(jì)算架構(gòu)的支持,更適配未來大規(guī)模并行任務(wù)的需求。
我們?yōu)槭裁匆匝刑幚砥鳎?/p>
在“神威”使用“申威”的那一刻起,中國邁出了超算領(lǐng)域關(guān)鍵的一步:不再依賴國外芯片,而是走上了自主可控的道路。那么,為什么自研處理器這么重要?原因可以歸結(jié)為四個(gè)層面:
1.避免“卡脖子”風(fēng)險(xiǎn)
曾幾何時(shí),中國的超級(jí)計(jì)算機(jī)系統(tǒng)使用的芯片常從國外進(jìn)口。但在2015年,美國政府限制向中國出口高性能計(jì)算芯片,使得“天河二號(hào)”升級(jí)計(jì)劃被迫中止。正是這一事件,直接促使“神威·太湖之光”全面轉(zhuǎn)向國產(chǎn)處理器“申威”。自研芯片,不僅是技術(shù)能力,更是“算力主權(quán)”的保障。
2.滿足國家戰(zhàn)略需求
超級(jí)計(jì)算機(jī)不只是科研工具,它是涉及國防安全、氣候預(yù)測、能源開發(fā)等多個(gè)關(guān)鍵領(lǐng)域的“科技基石”。如果關(guān)鍵芯片依賴進(jìn)口,一旦被封鎖,整個(gè)系統(tǒng)將面臨癱瘓風(fēng)險(xiǎn)。唯有自主研發(fā)處理器,才能確保國家最核心的科研和安全任務(wù)順利進(jìn)行。
3.節(jié)能高效、針對性強(qiáng)
國外通用芯片是為“泛用途”設(shè)計(jì)的,即采用通用計(jì)算架構(gòu),旨在適應(yīng)廣泛的、多樣化的計(jì)算需求,而非專門針對某一特定領(lǐng)域優(yōu)化。而申威處理器從一開始就專為高性能并行計(jì)算優(yōu)化。它采用大量核心、低頻協(xié)同的架構(gòu),適合大規(guī)??茖W(xué)模擬、復(fù)雜工程仿真等任務(wù),在能耗控制和并行效率上具有明顯優(yōu)勢。申威并不追求“單核最快”,而是追求“整體最適合超算”。
總之,自研“申威”,不僅僅是為了實(shí)現(xiàn)自主可用,更是為了擺脫受制于人的困境,掌握技術(shù)發(fā)展的主導(dǎo)權(quán)?!吧裢钡某瑥?qiáng)算力令人驚嘆,但更令人自豪的,是“申威”這顆完全自主的“中國芯”。從芯片到整機(jī),從被動(dòng)使用到自主設(shè)計(jì),我們不只是造出了一臺(tái)超級(jí)計(jì)算機(jī),更邁出了自主可控、掌握核心技術(shù)的堅(jiān)實(shí)一步。真正的算力強(qiáng)國,不僅要跑得快,更要掌握方向盤。
不過,硬件的強(qiáng)大僅僅是起點(diǎn),真正的價(jià)值在于它如何將算力轉(zhuǎn)化為解決實(shí)際問題的“超級(jí)力量”。這樣一臺(tái)配備自主研發(fā)的芯片、具有強(qiáng)大算力的超級(jí)計(jì)算機(jī),到底有什么具體的用途呢?我們將在下一篇文章揭曉。
參考文獻(xiàn):
[1]胡怡,陳道琨,楊超,等.國產(chǎn)SW26010-Pro處理器上3級(jí)BLAS函數(shù)眾核并行優(yōu)化[J].軟件學(xué)報(bào),2023,35(3):1569-1584.
出品:科普中國
作者:楊超(中國科普作家協(xié)會(huì))
監(jiān)制:中國科普博覽
盤點(diǎn)三十位網(wǎng)絡(luò)小說中知名的小說主角,你都知道其中的哪幾位呢!
結(jié)識(shí)了齊先生、寧姚、阮秀、小寶瓶、阿良、魏檗、文圣、魏晉等人|。在劍氣長城與寧姑娘互表心意,定下十年之約,收裴錢和曹晴朗為徒,經(jīng)歷了書簡湖的練心之旅|。成為新一任"隱官",并幫助劍氣長城|。第十一位、《求魔》,蘇銘他號(hào)稱最悲情的男主,蘇銘的一生都在與命運(yùn)斗爭,他從蠻荒開始,一生所求的不過是追求真相——。隨著修為的提升, NO2.求魔魔前一扣三千年,回首凡塵不做仙,只為她……掌緣生滅|——。該書主要講述了主角蘇銘不甘命運(yùn)被掌控,與命運(yùn)斗爭的故事-。蘇銘:本書主人公,第五真界塑冥族族人,蘇戰(zhàn)之子——。生來夭折,第五真界被破時(shí)被蘇軒衣利用,身魂分離。用一滴血和暗晨禁術(shù)十億尸魂禁偽造成肉身,被陰靈族偶然發(fā)現(xiàn),帶到陰死之地到此結(jié)束了?。極品玄幻小說曾是釋放精神壓力佳作,讓你越看越上頭!真過癮