最還原志愿軍戰(zhàn)斗的電影是哪一部?【軍事榨菜32】
【環(huán)球網科技報道記者張陽】在數字化浪潮以排山倒海之勢席卷全球的當下,數據已成為驅動社會進步和產業(yè)變革的核心要素,其規(guī)模正以指數級的速度瘋狂增長。特別是隨著人工智能(AI)技術的逐步成熟,大模型技術成為科技領域發(fā)展的核心熱點,決定大模型發(fā)展快慢的“算力”,成為街頭巷尾的熱議話題,而對于“存力”話題卻讓很多人感到茫然。
所謂“存力”也即數據存儲能力,隨著全球數據量以36%的年增長率持續(xù)擴張,預計到2030年將達到YB級規(guī)模,如何高效、安全地存儲這些海量數據,成為了讓算力將人工智能大模型發(fā)揮其應有效力的前提。因為也有評論認為“算力決定人工智能的底線,數據決定人工智能的上限”。而根據工業(yè)和信息化部等六部門印發(fā)的《算力基礎設施高質量發(fā)展行動計劃》認為,算力是集信息計算力、網絡運載力、數據存儲力于一體的新型生產力。在這一背景下,算力與存力作為數據價值釋放的“雙引擎”,正成為新基建競爭的戰(zhàn)略制高點。
近日,為了更好探究我國存力發(fā)展現狀、挑戰(zhàn)及未來趨勢,中國信息通信研究院組織的“存力中國行”活動正式啟動,首站走進廣東,為行業(yè)搭建了深度交流的平臺。
“存力中國行”走進廣東,透視存力發(fā)展現狀
廣州華銀康醫(yī)療集團股份有限公司(簡稱華銀康集團)是以病理為核心的獨立醫(yī)學檢驗與診斷服務企業(yè)。作為國內病理服務的先行者,華銀康集團于2010年開始,與國內外多所重點院校共同建設“華銀康病理診斷中心”。目前已建立覆蓋31個省區(qū)的醫(yī)學實驗室網絡,全國服務客戶超過12800家,其中與近700家醫(yī)療機構共建高水平病理科。
華銀康集團圍繞智慧病理的發(fā)展持續(xù)布局,依托“數據-算法-場景”全鏈路技術閉環(huán),在行業(yè)內首創(chuàng)“AI+系統(tǒng)+設備+資源”四位一體服務模式,提供模塊化智慧病理解決方案。在233位病理專家團隊及100位標注專家的支持下,深度融合DeepSeek等大模型技術,在遠程病理的基礎上為各級醫(yī)療機構提供數字病理數據庫打造、病理AI輔助診斷、病理結構化報告以及病理全流程管理監(jiān)控等服務。
以胃活檢為例,胃活檢診斷具有極高的復雜性,對于處在病情發(fā)展中或少量異型細胞存在的情況,模型可通過提示性文字和對應區(qū)域展示,針對非明確的散落的可疑異型細胞進行建議性提示。系統(tǒng)針對于胃癌的敏感性超過99%,特異性達90%,有效防止漏診與誤診。通過AI分析后,會輸出整體診斷建議、熱力圖及色階圖,幫助醫(yī)生快速定位可疑病變區(qū)域,最終由病理醫(yī)生完成診斷。
華銀康在發(fā)展過程中遇到的一大難題就是數據存儲,全集團年檢測標本量約4000萬例,每一張完整病理圖像都需要近1GB存儲空間,同時還要保障能夠快速調用這些圖片供AI與病理醫(yī)生進行分析診斷,如果全部完整使用、歸檔所需要的存儲空間以及設備成本將是一個天文數字。所以華銀康采用了切片方式對病理圖像數據進行處理,僅保留病灶部位的圖像切片,并且采用了華為分布式存儲系統(tǒng),構建安全、高效、可擴展的先進存力,并通過高效的壓縮技術降低存儲空間壓力,盡管如此,集團的機房內每年需要擴展的存儲容量仍然在PB級別。
數據要素化催生存力新基建
華銀康集團面臨的難題可以說是AI時代發(fā)展的縮影,隨著人工智能的爆發(fā)式增長和數據總量的指數級躍升,存儲已從傳統(tǒng)的“數據容器”躍遷為支撐數字經濟高質量發(fā)展的戰(zhàn)略基座,是激活數據要素價值、培育新質生產力的核心引擎。
中國信通院副院長王志勤介紹,我國存力建設取得顯著成效,截至2024年底,全國存力總規(guī)模已達1580EB,先進存儲占比提升至28%。然而,仍面臨“存而不用、用而不深”、核心芯片、軟件、介質短板以及存算運協(xié)同效率待提升等挑戰(zhàn)。為此,她提出三大建議:探索最優(yōu)路徑,共享最佳實踐;聚焦存力服務普惠與效能提升;強化技術攻關與產業(yè)協(xié)同生態(tài)構建。
華為數據存儲產品線戰(zhàn)略與業(yè)務發(fā)展部總裁王旭東對此也深表認同。王旭東在接受記者專訪時開門見山地指出:“AI時代是數據的黃金時代,更是算力與存力協(xié)同進化的時代。”當DeepSeek等大模型引發(fā)產業(yè)變革后,數據已從“沉睡資產”蛻變?yōu)轵寗赢a業(yè)發(fā)展的核心生產要素。然而當前我國數據發(fā)展面臨雙重矛盾,記者采訪王旭東了解到:一方面2024年全國數據生產總量達41.06ZB,同比增長25%,但存儲總量僅2.09ZB,數據留存率不足5.1%;另一方面存儲數據中一年內未使用的“冷數據”逐年增多,傳統(tǒng)架構下數據孤島問題嚴重,導致數據治理效率低下。
這種矛盾在技術層面表現得尤為突出。隨著AI進入多模態(tài)時代,文本、視頻、圖像等異構數據融合需求激增,傳統(tǒng)網絡架構已難以支撐。王旭東以醫(yī)療行業(yè)為例:“醫(yī)院在構建AI大模型時,非結構化醫(yī)學影像數據的標注成本極高,傳統(tǒng)方式下數據準備周期長達數月?!边@正是存力中心建設如火如荼的核心原因——它通過規(guī)模聚數、高效治數、安全供數、產業(yè)用數四個維度,構建起數據從資源到資產的閉環(huán)體系,與算力基礎設施形成互補,共同破解“數據豐富但價值貧瘠”的產業(yè)困境。
政策層面的驅動同樣顯著。國家數據局、工信部等部委密集出臺政策,將存力列為重點發(fā)展方向,明確提出推動行業(yè)和區(qū)域數據歸集平臺建設。在“東數西算”工程中,廣東韶關、貴州、京津冀廊坊等樞紐節(jié)點同步規(guī)劃存力中心,使其不僅成為數據存儲載體,更升級為省級備份災備中心、行業(yè)語料庫開發(fā)基地和產業(yè)聚集中心?!罢吲c技術的雙重驅動,讓存力中心從概念走向落地,成為激活數據要素價值的關鍵基礎設施?!蓖跣駯|強調。
從數據匯聚到產業(yè)賦能的全鏈條創(chuàng)新
王旭東告訴記者,在華為的實踐中,存力中心的價值釋放依托四大核心能力體系,形成了一套可復制的“華為方案”。
規(guī)模聚數:打破數據孤島的全局掌控力。面對跨區(qū)域、跨行業(yè)的數據匯聚挑戰(zhàn),華為Omni-Dataverse通過三大創(chuàng)新實現數據全局可視、可管、可用:一是建立統(tǒng)一數據視圖,解決“數據在哪里”的認知難題,實現資產注冊0遺漏、更新0等待;二是依托智能數據目錄,對百億級數據進行自動標簽,支持秒級查找;三是構建自定義數據流通機制,用戶可根據需求設定跨區(qū)域、跨設備的共享策略。
高效治數:AI時代的數據質量鍛造廠?!癆I大模型的競爭力高度依賴高質量數據集。”王旭東以華為AI全流程工具鏈ModelEngine為例,闡述華為如何通過數據使能、模型使能、應用使能三方面提升數據治理效率。在瑞金醫(yī)院病理大模型項目中,基于此工具將病理數據標注周期縮短80%,大幅降低了AI模型上線成本。更重要的是,ModelEngine覆蓋了“數據預處理-模型訓練-應用部署”全流程,使單癌種業(yè)務AI應用上線周期縮短80%,為醫(yī)療、制造等行業(yè)的模型落地提供了加速器。
安全供數:數據流通的可信防護網。數據要素流通的前提是安全可信。華為構建的軟硬一體可信數據空間,從技術與管理雙維度保障數據流動:技術上采用可信流通策略、芯片級安全保障和端到端傳輸加密;管理上建立30+數據控制策略,實現全流程日志審計。“就像給數據敷上‘保護膜’,讓提供方和使用方都能放心。”王旭東提到,這種安全體系不僅滿足合規(guī)要求,更解決了龍頭企業(yè)數據共享的核心顧慮——在醫(yī)療領域,通過所有權與使用權隔離技術,已推動多家三甲醫(yī)院實現數據安全共享。
產業(yè)用數:海量數據規(guī)模集聚融合之后,要推動“數據+行業(yè)+場景”的深度融合,形成數據從采集到治理到應用的正循環(huán)。王旭東透露,在某汽車廠商場景中,該企業(yè)不僅依托存力中心匯聚了企業(yè)內部數據,還整合了城市、金融、充電樁等外部數據,為后續(xù)該企業(yè)的數據應用服務奠定基礎,并為政府部門提供體系化監(jiān)管服務支撐。
從介質突破到生態(tài)協(xié)同的破局之路
盡管存力中心發(fā)展前景廣闊,王旭東也坦誠指出當前產業(yè)面臨的三大核心挑戰(zhàn):“國內80%以上的數據仍存儲在機械硬盤,而該領域核心技術長期不在國內。”王旭東呼吁加速全閃存介質的應用與創(chuàng)新,他強調:“發(fā)展存力產業(yè)必須構建自主可控的產業(yè)鏈,從芯片到整機再到應用,形成完整的技術生態(tài),這既是安全需求,也是產業(yè)升級的必然路徑?!?/p>
AI應用對存儲提出了全新要求:千億級參數模型訓練需要極致性能支撐,邊緣推理場景需要長記憶存儲能力。華為通過存算協(xié)同架構,在訓練場景中使AI集群利用率提升30%,在推理場景中實現數據吞吐量提升60%。王旭東建議:“應將AI存儲納入國家關鍵技術規(guī)劃,推動行業(yè)標準制定,通過技術創(chuàng)新提升我國在全球高端存儲領域的競爭力。”
當前我國數據災備覆蓋率僅為34%,遠低于發(fā)達國家水平,且開源軟件依賴度高,存在安全隱患。華為推出的“兩地三中心”災備方案,業(yè)務故障時可實現分鐘級切換,同時通過自研存儲操作系統(tǒng)降低對開源組件的依賴。“數據安全是存力中心的生命線,需要政策引導、技術創(chuàng)新和生態(tài)協(xié)同多管齊下,構建自主可控的安全底座?!蓖跣駯|總結道。
“就像電力改變工業(yè)時代一樣,存力將定義AI時代的產業(yè)新秩序?!蓖跣駯|認為,存力中心將從三個維度重塑產業(yè)格局:在技術層面,存儲設備不僅是數據容器,更將進化為數據處理中心;在產業(yè)層面,以存力中心為樞紐,將形成數據采集、治理、交易、應用的完整產業(yè)鏈,催生數據服務商、AI訓練師等新興職業(yè);在社會層面,數據將像水電一樣成為公共資源,通過存力中心的高效配置,推動智慧城市、精準醫(yī)療等場景的大規(guī)模落地。從算力到存力,從數據資源到數據資產,一場深刻的產業(yè)變革正在上演。
十本征服無數讀者的高品質爽文,情節(jié)設計巧妙,值得連刷多遍!
盤點2005年國內公測的經典網游,《QQ堂》上榜
88本經典網絡小說推薦,每一本都曾紅極一時,看看你讀過幾本?