【文/觀察者網(wǎng)專欄作者陳經(jīng)】
中美芯片斗爭,出現(xiàn)了一個(gè)有些意外的轉(zhuǎn)折。
2025年7月15日,英偉達(dá)CEO黃仁勛接受央視記者采訪時(shí)表示:“美國政府已經(jīng)批準(zhǔn)了我們的出口許可,我們可以開始發(fā)貨了,所以我們將開始向中國市場(chǎng)銷售H20。我非常期待能很快發(fā)貨,對(duì)此我非常高興,這真是個(gè)非常好的消息?!?/p>
AMD發(fā)言人同日稱,美國商務(wù)部告知公司,MI308產(chǎn)品的許可申請(qǐng)將進(jìn)入審查程序。與H20類似,MI308是AMD專為中國市場(chǎng)設(shè)計(jì)的AI芯片。
早前4月初,特朗普政府突然叫停了H20的銷售,讓英偉達(dá)碰上麻煩。黃仁勛罕見地主動(dòng)介入政治,頻繁奔走于世界各地積極協(xié)商,2025年已三次來華穩(wěn)定與中國政府、客戶的關(guān)系。
另一頭,黃仁勛改變作風(fēng)極積參與美國政治活動(dòng),努力說服特朗普政府改變政策,跟隨特朗普出訪中東,赴美國國會(huì)作證,和白宮積極建立良好關(guān)系。
7月23日,黃仁勛在華盛頓舉行的AI峰會(huì)上回答主持人提問時(shí)表示:“美國擁有任何國家都無法比擬的獨(dú)特優(yōu)勢(shì),那就是特朗普總統(tǒng)?!彼S后解釋,特朗普上任第一天就認(rèn)識(shí)到AI與能源的重要性,并推出減稅、放松監(jiān)管、AI行動(dòng)計(jì)劃等一系列政策,為美國企業(yè)在全球競(jìng)爭中創(chuàng)造了“不可復(fù)制的制度紅利”。特朗普本人也在現(xiàn)場(chǎng)回應(yīng):“你做得真棒!”一個(gè)科技工作者的政治工作做到這個(gè)水平,讓人感嘆。
另一個(gè)關(guān)鍵因素,是中國自身的技術(shù)能力。7月15日,美國財(cái)政部長貝森特在彭博電視臺(tái)節(jié)目中說,中國已經(jīng)研發(fā)出性能與H20相當(dāng)?shù)男酒?,因此英偉達(dá)銷售H20芯片不存在問題。這是美國政府首次公開承認(rèn),中國在同類AI芯片上已具備可替代能力。
更為直接的解釋,是白宮“AI沙皇”大衛(wèi)·薩克斯點(diǎn)出的。2024年12月5日,特朗普宣布薩克斯將任新設(shè)的“白宮人工智能與加密貨幣事務(wù)專員”。今年7月16日,薩克斯對(duì)彭博社表示,恢復(fù)向中國大陸銷售英偉達(dá)H20芯片并非“讓步”,而是一種精準(zhǔn)遏制華為的手段。薩克斯說:
“有充分理由這么做:你不希望把整個(gè)中國市場(chǎng)拱手讓給華為。即使是一顆性能被削弱的芯片,英偉達(dá)也能在中國拿下很大一塊份額,從而擠壓華為的空間?!?/p>
美國對(duì)H20解禁,政治相關(guān)的活動(dòng)不難看到,但并非關(guān)鍵。貝森特與薩克斯所指的GPU技術(shù)與市場(chǎng)背景,是說服特朗普的關(guān)鍵,需要仔細(xì)解釋。
國產(chǎn)GPU市場(chǎng)與技術(shù)進(jìn)展
對(duì)芯片業(yè)數(shù)據(jù)不太熟悉的,很難想到國產(chǎn)GPU市場(chǎng)有多大。
上圖為國外機(jī)構(gòu)對(duì)華為昇騰GPU營收的估計(jì),根據(jù)國內(nèi)先進(jìn)芯片產(chǎn)能估算,圖中910B、910C和910X是性能逐步提升的昇騰GPU型號(hào)。產(chǎn)能單位“kwpm”意為“千片晶圓每月”,而“Dieperwafer”是指每片晶圓上的“裸芯片”數(shù)量,單個(gè)芯片面積越大數(shù)值越小,可以看出910C和910X面積約是910B兩倍,而910B一片12寸晶圓(直徑300毫米,面積約700平方厘米)也只有78顆,說明GPU芯片面積是比較大的。
“yieldrate”是指良率,由于7nm先進(jìn)芯片用DUV光刻機(jī)需要復(fù)雜的多重曝光工藝,外媒估計(jì)良率起步只有15%,逐步提升至50%,最高70%。910B、910C、910X的初始價(jià)格根據(jù)市場(chǎng)信息估為5萬、11萬、14萬,供應(yīng)上來后會(huì)有降價(jià)。
這個(gè)估算很粗略,但結(jié)果極為驚人。2024年華為GPU芯片營收為429.47億人民幣,2025年預(yù)計(jì)大增240%至1461.07億,2026年再增45%至2120.23億,2027年2865.67億。2024年華為營收為8621億,凈利潤626億。如果利潤率極高的GPU能再有2000多億營收,這將極大支撐華為的研發(fā)能力擴(kuò)增。這個(gè)估算肯定不準(zhǔn)確,但能夠說明中國算力GPU市場(chǎng)的規(guī)模與利潤。
在5月21日的臺(tái)北國際電腦展新聞發(fā)布會(huì)上,黃仁勛說“英偉達(dá)在中國的市場(chǎng)份額從95%跌到了50%”。其實(shí)2024年,中國市場(chǎng)只占英偉達(dá)全球營收12.5%,對(duì)應(yīng)金額約170億美元,并不算特別多,因?yàn)楸菻20更先進(jìn)的GPU不能賣。雖然中國市場(chǎng)銷售受限,但并未影響英偉達(dá)全球營收飛速擴(kuò)增。不過黃仁勛擔(dān)心的是,2025年之后中國算力GPU市場(chǎng)會(huì)有較大增長,英偉達(dá)讓出的市場(chǎng)份額會(huì)成為中國競(jìng)爭對(duì)手的“成長加速器”。
英偉達(dá)算力GPU在國際上幾乎沒有競(jìng)爭對(duì)手,2024年數(shù)據(jù)中心GPU營收約1150億美元,市場(chǎng)份額高達(dá)93%-94%。唯一值得一提的對(duì)手AMD份額僅約4%,英特爾等其它對(duì)手合計(jì)不到3%。
這種極為罕見的格局,其技術(shù)原因筆者曾于2024年初在《沒人能“殺死”1.5萬億美元的英偉達(dá)》文中解釋了。原本打輔助的GPU依靠通用計(jì)算功能與CPU地位倒轉(zhuǎn),成為芯片計(jì)算能力的絕對(duì)主力。英偉達(dá)服務(wù)客戶的精神非常極致,在神經(jīng)網(wǎng)絡(luò)、科學(xué)計(jì)算、游戲開發(fā)、云計(jì)算、AIGC、大語言模型等眾多領(lǐng)域主動(dòng)優(yōu)化,將CUDA打造成為事實(shí)上的“GPU操作系統(tǒng)”,而且沒有值得一提的競(jìng)爭對(duì)手。
算力GPU相關(guān)程序開發(fā)極為復(fù)雜,“萬卡互聯(lián)”涉及到的軟硬件開發(fā)難度讓人望而生畏,需要優(yōu)化的環(huán)節(jié)極多。各環(huán)節(jié)稍有缺陷就會(huì)導(dǎo)致客戶研發(fā)流程卡頓、崩潰,一旦問題難以解決,結(jié)果就會(huì)是“送給人用都不要”,這就是AMD面對(duì)的尷尬情形。
只有英偉達(dá)在GPU芯片設(shè)計(jì)、GPU系統(tǒng)架構(gòu)、HBM內(nèi)存管理、NVlink/NVSwitch高速數(shù)據(jù)傳輸、InfiniBand連接GPU服務(wù)器、CUDA軟件配合硬件性能優(yōu)化等諸多環(huán)節(jié)都做到了極為優(yōu)秀,讓客戶可以方便地使用英偉達(dá)GPU進(jìn)行大模型等前AI前沿研發(fā)與應(yīng)用。
英偉達(dá)數(shù)據(jù)中心GPU產(chǎn)品高達(dá)73%的毛利潤率、90%以上的市場(chǎng)份額,都與這些極為困難的技術(shù)有關(guān)。競(jìng)爭對(duì)手也許在某個(gè)專門的應(yīng)用上指標(biāo)超過英偉達(dá),就如AMD不時(shí)宣傳的,但“實(shí)戰(zhàn)”應(yīng)用就毛病一堆。領(lǐng)域還在以“超摩爾定律”快速發(fā)展,英偉達(dá)不斷推出Blackwell、Rubin等新GPU架構(gòu),有超過萬名員工在針對(duì)機(jī)器人、光刻等多類專業(yè)應(yīng)用優(yōu)化CUDA系統(tǒng),軟硬件優(yōu)勢(shì)相當(dāng)牢固。即使AMD等芯片業(yè)競(jìng)爭對(duì)手在芯片設(shè)計(jì)領(lǐng)域很有實(shí)力,但如黃仁勛所言,英偉達(dá)已經(jīng)從芯片設(shè)計(jì)公司轉(zhuǎn)型成為“軟件公司”,不在同一個(gè)層面了。
讓外界震驚的是,在技術(shù)如此復(fù)雜的算力GPU領(lǐng)域,中國遭美國最高程度限制打壓,卻初步發(fā)展出了能與英偉達(dá)競(jìng)爭的軟硬件系統(tǒng)能力。近期出來的標(biāo)志性成果,是華為基于昇騰910C打造的CloudMatrix384超節(jié)點(diǎn),性能直接對(duì)標(biāo)英偉達(dá)GB200NVL72系統(tǒng)。
2025年4月16日,半導(dǎo)體與人工智能分析機(jī)構(gòu)SemiAnalysis出報(bào)告詳細(xì)分析了華為CloudMatrix和910C。從中可以看出,雖然中國先進(jìn)芯片制造技術(shù)受限,但用綜合解決方案追平了GPU芯片的性能差距。讓眾多西方公司難以追上英偉達(dá)的復(fù)雜技術(shù)問題,卻是中國公司的機(jī)會(huì),復(fù)雜反而提供了多條路線優(yōu)化的可能性。
圖為GB200NVL72機(jī)柜,比一個(gè)成人高一些,體積不算太大。論單個(gè)芯片性能,910C與GB200有一定差距。算力用BF16稠密算力衡量(稀疏算力更高,但不穩(wěn)定),GB200高達(dá)2500TFLOPS(TFLOPS是指“每秒1萬億次浮點(diǎn)運(yùn)算”),而910C是780TFLOPS,可簡略理解為三分之一算力。
GB200中的B100芯片是臺(tái)積電3nm工藝。B100有1040億個(gè)晶體管,B200是兩顆B100die先進(jìn)封裝,共2080億個(gè)晶體管。再加上HBM相關(guān)差異,910C單卡性能與GB200相比,有不小的差距。除了算力與傳輸速率差距,還有7nm與3nm工藝導(dǎo)致的芯片功耗差距。
但是,華為用384顆910C組成的CloudMatrix384超節(jié)點(diǎn)(以下簡稱CM384),BF16算力高達(dá)300PFLOPS(PFLOPS等于1000TFLOPS),約為GB200NVL72的180PFLOPS的1.7倍。明顯的代價(jià)是,系統(tǒng)功耗約為NVL72的4.1倍,每TFLOPS功耗是2.5倍。也需要3.6倍的總內(nèi)存容量,以及2.1倍的ScaleUpBandwidth總帶寬。
在物理尺寸上,CM384就明顯比GB200NVL72機(jī)柜要大得多。它有16個(gè)機(jī)架,12個(gè)做計(jì)算,4個(gè)用于數(shù)據(jù)交換,簡單目測(cè)就是NVL72機(jī)柜約16倍大小與占地面積。需要用五倍的芯片數(shù)量,10倍以上的體積與占地面積,來彌補(bǔ)單個(gè)芯片性能的差距。
但總算力趕超就是很大的成就,為此CM384架構(gòu)上需要一些“大招”。有趣的是,只要想出了辦法,7nm與3nm芯片性能的差距,在整個(gè)GPU算力系統(tǒng)中就不算很關(guān)鍵了。例如華為擅長的數(shù)據(jù)通信領(lǐng)域技術(shù),“光互聯(lián)”就起到了重要作用。
SemiAnalysis認(rèn)為華為的工程優(yōu)勢(shì)在于系統(tǒng)層面,而不僅僅是芯片層面,還有拓?fù)渚W(wǎng)絡(luò)、光互聯(lián)技術(shù)和軟件堆棧的創(chuàng)新??傮w來說,華為的技術(shù)方案的缺陷是成本高,能耗還高4倍,雖然總算力高,但綜合指標(biāo)性能明顯不如英偉達(dá)NVL72。正常情況下,市場(chǎng)不會(huì)接受這樣的方案。
但現(xiàn)在情況就是極不正常。最大的不正常是英偉達(dá)AI算力產(chǎn)品不賣給中國,國產(chǎn)系統(tǒng)做出來能用就有價(jià)值。另一個(gè)不正常是,英偉達(dá)GPU產(chǎn)品利潤率極高,以至于華為對(duì)標(biāo)產(chǎn)品的高成本、高能耗根本不是問題。
H20解禁的意義
筆者曾參觀過H20服務(wù)器生產(chǎn)線,主要成本是一個(gè)8×H20的盒子(英偉達(dá)銷售的時(shí)候就是8卡一起),還有主板、CPU、NVLink互聯(lián)及4×400GbE網(wǎng)卡等等,組裝成一個(gè)完整的服務(wù)器。它的總算力是BF161184TFLOPS,不比一個(gè)910C的理論算力高多少,不適合用于基座大模型訓(xùn)練。
H20在中國需求不錯(cuò),一個(gè)重要原因是DeepSeek帶動(dòng)了推理服務(wù)器部署需求,以及垂類模型訓(xùn)練需求。H20單卡價(jià)格在10萬元左右,八卡服務(wù)器的價(jià)格在110萬元至130萬元之間,利潤很高。中國大模型研發(fā)應(yīng)用還是更習(xí)慣CUDA生態(tài),H20組的推理應(yīng)用較為成熟。
H20的特性是,算力不到H100的十分之一,但是HBM容量有96GB、141GB,HBM帶寬4.0TB/s,這都和H100接近。大模型推理應(yīng)用時(shí),矩陣計(jì)算遠(yuǎn)不如訓(xùn)練時(shí)密集,數(shù)據(jù)在GPU之間的傳輸多,H20的數(shù)據(jù)傳輸表現(xiàn)不錯(cuò)。幾家頭部互聯(lián)網(wǎng)公司下了不少訂單,2024年就預(yù)訂了160億美元的H20。
H20的性能指標(biāo)不算太強(qiáng),國產(chǎn)GPU完全有能力接近它。除華為昇騰,還有摩爾線程、壁仞科技、沐曦、天數(shù)智芯等多家在做算力GPU。這幾家GPU頭部企業(yè)已全部啟動(dòng)IPO或借殼程序,在科創(chuàng)板、港交所同步推進(jìn),上市節(jié)奏明顯加快。拿出了性能不錯(cuò)的GPU產(chǎn)品的其它公司還有多家。
由于美國制裁的影響,中國企業(yè)即使覺得英偉達(dá)CUDA生態(tài)好用,也還是在努力探索其它平臺(tái)。
科大訊飛星飛大模型與華為聯(lián)手,堅(jiān)持軟硬件全棧自主的技術(shù)路線。星火大模型訓(xùn)練與推理全部跑在華為910B/910C全國產(chǎn)萬卡集群“飛星一號(hào)”上;二期“飛星二號(hào)”預(yù)計(jì)2025年內(nèi)交付,可支撐萬億參數(shù)模型持續(xù)訓(xùn)練。
星火大模型研發(fā)團(tuán)隊(duì)由于技術(shù)路線特殊,適配需要花費(fèi)極大精力,華為也要派很多人一起維護(hù)開發(fā)GPU運(yùn)行,非常艱苦。經(jīng)過幾年努力,目前星火大模型性能已經(jīng)追趕上來了,多種垂類模型與中石油、中海油等大國企應(yīng)用合作,有特殊的戰(zhàn)略價(jià)值,生態(tài)會(huì)不斷壯大。
上市公司寒武紀(jì)的MLU(MachineLearningUnit)云端智能芯片,其實(shí)就是GPU,目前取得了僅次于昇騰系列的應(yīng)用成績。寒武紀(jì)思元590能支撐DeepSeek-R1671B、Llama-3、Qwen-3等主流開源大模型的千卡級(jí)訓(xùn)練,實(shí)測(cè)算力密度達(dá)到A100的80%。思元690傳有中芯國際預(yù)留先進(jìn)芯片產(chǎn)能。寒武紀(jì)的“硬件-軟件-生態(tài)”體系已經(jīng)初步成型,與國內(nèi)主流大模型開發(fā)商合作,目標(biāo)是2025-2026年形成訓(xùn)練推理全覆蓋的國產(chǎn)算力矩陣。技術(shù)前景支撐了寒武紀(jì)2800億的市值,維持了超過半年,并非一般快速見頂?shù)念}材炒作,2025年一季度轉(zhuǎn)為盈利。
近期,國產(chǎn)大模型開發(fā)勢(shì)頭很好。DeepSeek在2025年初突破以后,開源了幾項(xiàng)關(guān)鍵技術(shù),推動(dòng)了行業(yè)大發(fā)展。目前阿里Qwen系列、KimiK2等國產(chǎn)大模型在開源榜單上成績很好,引發(fā)了全球關(guān)注。字節(jié)、騰訊等大企業(yè)對(duì)大模型也有很高投入,應(yīng)用場(chǎng)景豐富,實(shí)力迅速增長。
國產(chǎn)AI軟硬件生態(tài)與半年前相比,都可以說完全兩樣了,實(shí)力暴漲,各類突破層出不窮。生態(tài)有了,技術(shù)信心也起來了,對(duì)于美國AI封禁并沒有那么在乎了。
這一切,是以前完全不敢想的,大發(fā)展的動(dòng)力絕對(duì)是美國芯片制裁。芯片業(yè)國產(chǎn)替代、生態(tài)建設(shè)已經(jīng)進(jìn)入繁榮期。而GPU由于技術(shù)復(fù)雜,應(yīng)用場(chǎng)景多,能想的系統(tǒng)級(jí)辦法也多,對(duì)于EUV光刻機(jī)的依賴并不嚴(yán)重,因此CM384可以追上NVL72的總算力。多家國產(chǎn)GPU各有絕活,又是IT互聯(lián)網(wǎng)公司資本投入的重點(diǎn)有真金白銀,屬于較為活躍的芯片創(chuàng)新領(lǐng)域。
美國的制裁現(xiàn)在很微妙,全球業(yè)界其實(shí)也已有了判斷,愿意與中國搞好關(guān)系。連美國政府自己都明白,中國已經(jīng)熬過了芯片制裁,國產(chǎn)GPU芯片的巨大市場(chǎng)需求都出現(xiàn)了。而國產(chǎn)大模型與美國差距顯著縮小,幾家公司都至少有技術(shù)跟隨能力。從限制中國芯片與人工智能技術(shù)發(fā)展的角度來看,美國制裁已經(jīng)失敗了,中國取得了長足的進(jìn)步,沒法限制了。
2018年美國對(duì)中國發(fā)動(dòng)貿(mào)易戰(zhàn)以來,已經(jīng)可以得出結(jié)論:美國科技制裁,對(duì)我國科技發(fā)展正面作用極大;芯片產(chǎn)業(yè)出現(xiàn)了發(fā)展奇跡,連最尖端的GPU芯片都有了中國生態(tài)。
而H20的解禁,說明美國內(nèi)部承認(rèn)中國AI領(lǐng)域的軟硬件自主發(fā)展成果,認(rèn)識(shí)到了制裁的負(fù)面作用。美國方面已經(jīng)調(diào)整目標(biāo),不再堅(jiān)持徹底封殺中國的目標(biāo),而是改為“占領(lǐng)全球AI市場(chǎng)”。
這其實(shí)就是意識(shí)到,中國是競(jìng)爭對(duì)手,市場(chǎng)需要去競(jìng)爭。黃仁勛在中國、中東等地的商業(yè)活動(dòng),對(duì)美國政府的全球AI戰(zhàn)略很有幫助,因此話語權(quán)上升,H20解禁也在情理之中。
美國政府的態(tài)度變化,說明了中美芯片斗爭已經(jīng)進(jìn)入了新的階段。美國政府愿意用稍微正常一點(diǎn)的市場(chǎng)邏輯來看問題了,不再一味封殺、愚蠢地讓出寶貴市場(chǎng),而是希望用H20來搶中國企業(yè)的市場(chǎng)份額。
至于H20解禁是否會(huì)損害國產(chǎn)芯片的市場(chǎng)前景,看了前面的技術(shù)分析就能明白,華為CloudMatrix384這種能與英偉達(dá)最先進(jìn)服務(wù)器對(duì)標(biāo)的產(chǎn)品,遠(yuǎn)超H20的技術(shù)指標(biāo),不在一個(gè)層面競(jìng)爭。H20能夠補(bǔ)充中國的大模型推理算力、垂直模型訓(xùn)練算力,有利于大模型應(yīng)用推廣,解禁也不是壞事。
在更為廣闊的AI訓(xùn)練與推理應(yīng)用市場(chǎng),國產(chǎn)GPU市場(chǎng)需求隨著自主生態(tài)的逐漸完善,必然有高速增長。如果美國為了破壞中國市場(chǎng)生態(tài),又解禁性能更強(qiáng)的GPU,那么中美科技斗爭的勝負(fù)趨勢(shì)就更為明顯了。
本文系觀察者網(wǎng)獨(dú)家稿件,文章內(nèi)容純屬作者個(gè)人觀點(diǎn),不代表平臺(tái)觀點(diǎn),未經(jīng)授權(quán),不得轉(zhuǎn)載,否則將追究法律責(zé)任。關(guān)注觀察者網(wǎng)微信guanchacn,每日閱讀趣味文章。
5本網(wǎng)游建設(shè)類小說,主角建設(shè)經(jīng)營領(lǐng)地,招募猛將名士,爭霸天下
第四本:《網(wǎng)游之全球在線》 作者:笙簫劍客書評(píng):史上第一款集個(gè)人冒險(xiǎn)+領(lǐng)地建設(shè)+位面戰(zhàn)爭于一體的跨時(shí)代網(wǎng)游《地球Online》,全球玩家在線,群雄爭霸。且看重生后的主角如何建設(shè)領(lǐng)地,招募?xì)v史猛將名士,攪動(dòng)風(fēng)云,成就帝王霸業(yè)!重生文,世界末日地球人民被宇宙飛船遷往希望之星,做了一個(gè)游戲打發(fā)時(shí)間,也是為了爭奪以后到了希望之星的資源,主角 總結(jié):這是一部憑借題材與風(fēng)格脫穎而出的東方領(lǐng)主爭霸類網(wǎng)游小說。雖然存在一些缺點(diǎn),但整體質(zhì)量仍然值得一看。對(duì)于喜歡領(lǐng)主爭霸題材的讀者來說,這部小說無疑是一個(gè)不錯(cuò)的選擇_。第四本《領(lǐng)主之兵伐天下》作者:神天衣字?jǐn)?shù):698.6萬主角出身于一個(gè)都市豪門,卻是一個(gè)被家族拋棄的棄子。然而,他身負(fù)贏秦和李唐等會(huì)說。五本網(wǎng)絡(luò)游戲小說,文筆極佳,故事新穎,伏筆絕妙,值得書荒一看