拆解數(shù)據(jù)中心機柜中的服務器,通常會看到里面有十來張固態(tài)硬盤(SSD)。這些固態(tài)硬盤承擔著數(shù)據(jù)存儲的重任,其中的主控芯片又是固態(tài)硬盤的大腦,高效精準調度數(shù)據(jù)進出存儲單元。
存儲是大模型時代的關鍵基礎設施之一。只要有數(shù)據(jù),就需要存儲。當數(shù)據(jù)成為AI領域的核心資源,存儲技術就決定了大模型數(shù)據(jù)處理效率,并影響訓練和推理速度。伴隨訓練數(shù)據(jù)集規(guī)模的指數(shù)級增長,數(shù)據(jù)儲存成本與性能的平衡也至關重要。
“存儲是一個確定的大市場?!贝鎯π酒O計公司英韌科技CFO鐘曉蕙日前對澎湃科技表示,算力、存力、傳輸能力,三者往往協(xié)同促進、共生發(fā)展,大模型熱潮正推動存儲技術演進,對存儲芯片企業(yè)及SSD廠商的差異化競爭和技術迭代能力提出了更高要求。
算力很重要,存力也很重要
固態(tài)硬盤(SSD)的主要硬件組件包括NAND閃存顆粒、DRAM緩存和主控芯片等。如果把需要存儲的數(shù)據(jù)比作汽車,那么固態(tài)硬盤就是一個巨型停車場,閃存芯片上的存儲單元是一個停車位,主控芯片是這個巨型停車場的“管理員”,負責指揮每一輛車準確、快速、合理地進出自己的停車位。
可以說,主控芯片就是固態(tài)硬盤的大腦,通過相應的固件代碼,負責對閃存顆粒等部件執(zhí)行數(shù)據(jù)讀取、寫入、加密等復雜操作。英韌科技就是固態(tài)硬盤這類核心存儲部件的開發(fā)商,其核心產(chǎn)品包括固態(tài)硬盤的整盤解決方案及其內部存儲主控芯片。
全球范圍企業(yè)級SSD市場主要由韓國的三星電子、SK海力士長期占據(jù)壟斷地位,合計市場份額超過70%。國內企業(yè)級SSD產(chǎn)業(yè)鏈仍處于快速追趕階段。2017年英韌科技成立時,主流存儲技術正從機械硬盤轉向固態(tài)硬盤,數(shù)據(jù)傳輸接口也從SATA(用于連接主板和大量存儲設備的端口)接口向更高速的PCIe(高速串行計算機擴展總線標準)轉換,這為國內初創(chuàng)企業(yè)的發(fā)展提供了機遇。
英韌科技固態(tài)硬盤主控芯片及應用于PC和服務器的SSD模組參考圖。
“從2017年到2021年,國產(chǎn)廠商都在解決技術能不能轉化成產(chǎn)品的問題。從2021年到2024年,解決產(chǎn)品問題后,大家要解決的是有沒有客戶的問題?!庇㈨g科技CFO鐘曉蕙表示,國產(chǎn)替代客觀上推進了中國存儲芯片行業(yè)的發(fā)展,而AI熱潮是眼下更大的助力。
在江蘇連云港海州區(qū)的“悟空智算”6876P算力中心,一字排開的機柜里,服務器進行著每秒687億億次的浮點運算?!拔蚩罩撬恪睂eepSeek全參數(shù)版進行軟硬件協(xié)同深度優(yōu)化后,實現(xiàn)了每秒超6900Token的超高吞吐率,支持企業(yè)3分鐘快速啟動AI應用。
算力很重要,存力也很重要。當前,大模型熱潮下,數(shù)據(jù)量越來越大。冷數(shù)據(jù)越來越少,更多的數(shù)據(jù)變成溫數(shù)據(jù)甚至是熱數(shù)據(jù)。過去,金融系統(tǒng)或傳統(tǒng)數(shù)據(jù)中心里的數(shù)據(jù)經(jīng)過5年時間就存起來不再使用,但現(xiàn)在情況已經(jīng)改變,模型跑起來后需要實時吞吐數(shù)據(jù),原先的冷數(shù)據(jù)和溫數(shù)據(jù)都變成了熱數(shù)據(jù)。
江蘇中環(huán)云控物聯(lián)科技有限公司正依托“悟空智算”開發(fā)海州環(huán)衛(wèi)大模型,探索智能體落地應用。環(huán)衛(wèi)工人佩戴智能手環(huán)即可實時回傳體征、位置與任務進度,系統(tǒng)自動調整作業(yè)路線;無人清掃車與無人機實時共享路況與垃圾分布數(shù)據(jù),按秒級頻率刷新作業(yè)策略。通過虛實映射、統(tǒng)籌調度、自主協(xié)同的作業(yè)方式,傳統(tǒng)環(huán)衛(wèi)作業(yè)模式變成新型智能體模式?!斑^去我們把智慧環(huán)衛(wèi)叫信息化管理,現(xiàn)在叫具身智能體,區(qū)別就在于系統(tǒng)不再只是看數(shù)據(jù)的大腦,而是讓每一臺設備、每一位工人、每一條作業(yè)鏈路都變成會思考、能對話、自進化的數(shù)字生命體?!敝协h(huán)云控執(zhí)行董事徐磊表示。
與此同時,DeepSeek等應用打開了推理和邊緣計算的大門。輕量化模型設計、硬件適配優(yōu)化,以及模型部署成本降低,推動了算力需求從“訓練側”向“推理側”傾斜,訓練任務集中在云端,推理任務則下沉到邊緣設備。海量數(shù)據(jù)“升溫”,算力需求不斷演進,人們對于推理體驗的追求不斷升級,渴望實現(xiàn)極致的低延遲,這些都對存力也提出了更高的要求。
大模型驅動存儲技術升級
在表面打磨行業(yè),優(yōu)良的工藝是不可逾越的技術壁壘,而AI的價值就在于持續(xù)積累工藝數(shù)據(jù),開發(fā)更智能的機器人大腦,進一步優(yōu)化工藝。
2018年成立的索菲絲智能科技(上海)有限公司從機器人代理走向產(chǎn)品自研,旗下工業(yè)機器人聚焦解決制造業(yè)中打磨、切割、鉆孔、去毛刺等應用場景。創(chuàng)始人杜玲表示,只有AI化才能讓機器人更智能,團隊開發(fā)了可在手機和電腦等智能終端顯示的智能磨機,端側操作保證員工遠離粉塵和噪音等惡劣工作環(huán)境,也能記錄老師傅打磨過程中留下來的壓力、溫度、轉速、材料等工藝數(shù)據(jù)和關鍵參數(shù),未來開發(fā)打磨大模型,應對不同產(chǎn)品的打磨需求,提升工藝。
這也凸顯了對算力與存力的迫切需求。據(jù)英韌科技介紹,原始數(shù)據(jù)的收集和推理日志,帶來的數(shù)據(jù)量非常大,對于存儲的要求是海量寫入、高速讀取。數(shù)據(jù)清洗和模型訓練對于存儲的要求是高并發(fā)混合讀寫,對隨機性能要求更高。不同的數(shù)據(jù)應用場景對存儲芯片的要求已經(jīng)出現(xiàn)差異化。
傳統(tǒng)數(shù)據(jù)中心的固態(tài)硬盤需求是4T到8T,DeepSeek出現(xiàn)后,閃存容量需求提升到32T、64T甚至128T,閃存顆粒容量越大,開發(fā)難度也越大。這就好比房子建得越高,對于結構的要求也越高。就像英韌科技同一代次的產(chǎn)品已經(jīng)衍生出各種細分應用,這恰恰對存儲芯片企業(yè)及SSD廠商的差異化競爭和技術迭代能力提出了更高要求。
事實上,AI正在推進存儲技術的演進方向。“過去,國內大量數(shù)據(jù)中心還在使用機械硬盤。前兩年開始,出于對速度的要求更換成固態(tài)硬盤,從SATA變成PCIe4.0,現(xiàn)在進入PCIe5.0時代?!辩姇赞ソ榻B,2022年ChatGPT落地后,以AIGC為代表的應用市場開始對存儲提出更高的性能和容量需求。DeepSeek的出現(xiàn)促進了大模型推理的應用落地,新一代的PCIe6.0固態(tài)硬盤和基于CXL接口的存儲級內存方案也開始受到關注,這些技術將以新的方式支持大模型數(shù)據(jù)中心云服務以及本地部署的一體機,使DeepSeek等開源大模型加速落地?!癆I的出現(xiàn)加速了SSD的市場導入,我們大概用了一年左右的時間導入標準服務器廠商,2024年半年時間出貨量就攀升了10倍以上?!?/p>
算力、存力、傳輸能力,三者往往協(xié)同促進、共生發(fā)展。國內AI芯片公司正在使用更開放的架構RISC-V,探索從邊緣服務器到云端服務器的布局。芯片設計公司知合計算CEO孟建熠表示,RISC-V在高性能計算領域實現(xiàn)突破不僅要在通用計算層面進入高性能領域,更需要在架構層面融合AI增強計算,實現(xiàn)AI原生。
“存儲一直跟隨算力和傳輸能力跑。這兩端,但凡有一端起來了,你必須跟上?!辩姇赞フJ為,要針對不同應用場景匹配差異化存儲方案,支撐算力需求。今年團隊的重點工作就是開發(fā)符合未來AI需求的存儲主控芯片及解決方案,“全球存儲控制器還是有不少廠商,要撕開這個市場缺口,站住腳并且能夠站得穩(wěn),必須在迭代升級過程中,做到人無我有。”未來國產(chǎn)廠商除了要關注產(chǎn)品滿足國產(chǎn)替代需求和可持續(xù)的產(chǎn)品迭代能力,還要重視產(chǎn)品“出海”能力,國產(chǎn)存儲產(chǎn)品要走向海外,這是未來3-5年甚至5-10年國產(chǎn)存儲企業(yè)必經(jīng)的階段。
穿越重生,籃球運動員曹陽竟綁定教練系統(tǒng)!籃壇冠軍主教之路開啟!
免責聲明:本文內容由開放的智能模型自動生成,僅供參考。