照理說,新產(chǎn)品發(fā)布一類的文章托尼都是在工作日給大家寫的,因為廠商們通常選擇在工作日開發(fā)布會。
但是這家名叫“礪算科技”的廠商很神奇,他們周末加了個班(被迫著我也加了個班),但是發(fā)布的東西卻堪稱非常重磅了——
首款國產(chǎn)自研6nm工藝顯卡!
沒錯,是能插在電腦上打游戲的那種顯卡,而且按照礪算在發(fā)布會上的說法,這款顯卡的光柵性能趕超了英偉達(dá)的RTX4060,甚至還能穩(wěn)玩1080P的黑猴?看完昨天咱們國內(nèi)企業(yè)“礪算科技”的新品發(fā)布會,說實話托尼到現(xiàn)在人還是懵的。
因為根據(jù)相關(guān)報道,礪算科技截至2024年僅僅募資6.28億,但是作為對比,我們每天都在罵貴的英偉達(dá)、罵不爭氣的英特爾和AMD,他們哥仨的研發(fā)投入動輒就是幾百億。國內(nèi)芯片創(chuàng)業(yè)公司用著十幾分之一的資源“手搓”出了4060級別的顯卡???
假如事情是真的,那這真的妥妥是一個“顯卡圈子”的DeepSeek故事了。
不過著急看這兩款產(chǎn)品詳細(xì)測試的小伙伴估計要再等一等了,昨天發(fā)布的消費級顯卡7G106,及專業(yè)級顯卡7G105,不出意外應(yīng)該是8月份產(chǎn)品送樣,9月份才開始量產(chǎn)。
所以真正的上手實測大家還得再等等,但是如果你還好奇昨天的發(fā)布會還公布了哪些細(xì)節(jié),托尼這里可以帶著大家再盤一下這兩款國產(chǎn)自研顯卡昨天公開的信息。
首先是這兩款顯卡核心的GPU部分,基于臺積電N6工藝,并且采用了“礪算科技”自研的TrueGPU圖形架構(gòu)。這也意味著從計算核心到指令集完全由自主設(shè)計,而不是市場上常見的“公版IP授權(quán)+自主優(yōu)化”的形式。
這樣做有啥好處呢?舉幾個發(fā)布會錄播提到的例子吧——
我們都知道,GPU的3D渲染,也就是我們看到的圖形,是根據(jù)無數(shù)的三角形像積木一樣拼湊出來的。GPU的渲染過程,就是三角形的拆分、拼湊和后續(xù)計算的過程。
根據(jù)礪算科技官方的說法,礪算7G106的三角形渲染,重構(gòu)了圖形管線的執(zhí)行邏輯,智能亂序渲染,而且能根據(jù)負(fù)載情況動態(tài)分配計算單元。不用像傳統(tǒng)的GPU圖形一樣,按照既定的步驟,低效地一步步執(zhí)行,所以礪算7G106能夠在適配場景下直接提升50%的渲染效率。
此外,礪算7G106還支持FP32或INT32的指令雙發(fā)射,以方塊形式存儲矩陣數(shù)據(jù)等特性,可以優(yōu)化40%的顯存使用效率。
從這些支持特性上來看,礪算顯卡的設(shè)計思路還是比較先進(jìn)的——
就拿FP32/INT32雙發(fā)射這點來說,我查了一下,NVIDIA也是從20系顯卡才開始支持,AMD則是從前兩年的RX7000系顯卡才開始支持,英特爾則是從A700系列的獨顯才開始支持。
說完GPU,接下來再來看下兩款顯卡的硬件規(guī)格:
根據(jù)發(fā)布會錄播,消費級顯卡礪算7G106搭載12GBGDDR6顯存,但是功耗頻率這樣的基礎(chǔ)硬件信息并未公布;參考同行爆料的信息,礪算7G106位寬192bit,擁有192個紋理單元(TMU)和96個光柵單元(ROP)。
假設(shè)這個爆料屬實,那么礪算7G106就是擁有4060兩倍規(guī)模的紋理單元和光柵單元,那么它在跑分上超過4060,好像就說得過去了。除此之外,礪算7G106支持DirectX12、Vulkan1.3、OpenGL4.6和OpenCL3.0等主流API,大概是個夠用但并不算進(jìn)階的水平。
因為目前DX12API最新的版本是DX12Ultimate,Vulkan最新版本是1.4。缺乏這兩個API最新版本的支持,就意味著礪算7G106有可能不支持光追和可變速率著色(VRS),影響游戲時畫面效果和幀率,并且在渲染能力上存在一定的劣勢。
可變速率著色(VRS)示意,從左到右著色率變低
反觀礪算想要挑戰(zhàn)的行業(yè)霸主英偉達(dá)這邊,先是在2014年發(fā)布的GTX900系列顯卡上支持了瓦片式渲染和改進(jìn)的調(diào)度器,這兩樣技術(shù)其實也屬于礪算這次宣傳的“智能亂序渲染”的類似物。
但是英偉達(dá)直到4年后的RTX20系列才支持可變速率著色(VRS),然后才支持了完整的DX12UltimateAPI,礪算7G106的后續(xù)產(chǎn)品,明顯還有一些需要提升的地方。
其他方面,礪算7G106采用PCIe4.0x16標(biāo)準(zhǔn),提供4個DisplayPort1.4接口,公版卡沒有HDMI接口。
順帶說一下專業(yè)卡7G105的規(guī)格,整體來看處于中高端的水平——
配備24GBGDDR6ECC顯存、最大紋理填充率384GT/s,最大像素填充率192GP/s,支持FP32和INT8計算,F(xiàn)P32最大吞吐量為24TFLOPS,也適合高像素渲染以及大模型訓(xùn)練。
前面架構(gòu)和規(guī)格的部分,目前能公開找到的資料其實不多,但我相信參數(shù)啥的大家也就隨便看看,游戲黨們更關(guān)心的還是具體的實測——
之前也提到了,礪算7G106的部分光柵性能是強(qiáng)于RTX4060的。。。
比如在Geekbench測試?yán)?,衡量GPU通用計算能力的OpenCL跑分,礪算7G106得分為111290分,比RTX4060的101028分,整整高出10%,甚至直逼RTX5060!如果上市的時候再搭配不錯的價格,感覺花更少的錢就能買到光柵性能這塊,就不止是AMD一家的優(yōu)勢了。
更貼近游戲性能的3DMarkFireStrike(1080p)測試,礪算7G106的跑分成績?yōu)?6800分,作為對比4060大約是2w7到2w8的成績,也幾乎快追上4060了。
在更考驗顯卡性能的4K分辨率測試項目SteelNomad里,礪算7G106的跑分也能有2256分,參考公開的測試數(shù)據(jù),RTX4060這項測試的數(shù)據(jù)在2302左右。
總結(jié)下來,礪算7G106顯卡的整體表現(xiàn),雖然說不至于完全對標(biāo)英偉達(dá)RTX4060,但光柵化性能是妥妥的趕上了,然后在一些小項目上體現(xiàn)出了自己的優(yōu)勢。
但是我們都知道,老黃除了硬件還有軟件,就拿游戲來說,DLSS是老黃的招牌。
根據(jù)發(fā)布會錄播的來看,礪算也做了個名叫NRSS的DLSS類似物,但是沒有實機(jī)演示;我在錄播里看到,最后發(fā)布會現(xiàn)場是拿黑神話內(nèi)置的游戲科學(xué)NXSR做了個超分的演示,也就是通過原生低畫質(zhì)+超采樣實現(xiàn)4K分辨率運(yùn)行黑神話悟空,但是對一款甜品卡來說,咱們直接看1080P的表現(xiàn)就好了。
《黑神話:悟空》在1080P分辨率、高畫質(zhì)設(shè)置下,礪算7G106平均幀數(shù)能過70幀,而且在打斗過程中,遇到野怪、釋放技能和特效,也沒有明顯的掉幀情況。這個表現(xiàn),其實跟4060關(guān)掉DLSS“裸玩”黑猴的幀數(shù)也差不多了(雖然沒這個必要)。。。
更讓托尼感覺到意外的是,明末:淵虛之羽在1080P分辨率、高畫質(zhì)設(shè)置下,依舊能跑到70幀以上。參考同行針對這個游戲做的實測,RTX5060顯卡在DLSS4多幀生成的條件下,可以達(dá)到149幀,但會感覺到明顯卡頓。
考慮到這是個上線還沒有兩天的游戲,這么短的時間,礪算7G106肯定來不及針對游戲做適配,就能達(dá)到這種可玩的水平,那只能理解為礪算7G106核心規(guī)模更大,以及大顯存、高位寬,帶來的力大磚飛的提升了。
至于老牌的3A游戲古墓麗影:暗影,礪算7G106在游戲時只有平均80幀以上,表現(xiàn)就要差一些了。在同樣的畫質(zhì)設(shè)置下,4060對這款游戲有適配優(yōu)化,可以跑到147幀。這其實也是擺在國產(chǎn)GPU面前的最大的問題,硬件追趕只是第一步,后續(xù)的驅(qū)動適配和游戲優(yōu)化,路還長著呢。。。
如果托尼后續(xù)能夠拿到這款顯卡,到時候也會給大家來個全面測試。
感覺礪算7G106未來隨著驅(qū)動的優(yōu)化,整體達(dá)到4060的水平應(yīng)該沒有什么問題,而且游戲玩家們其實很包容國產(chǎn)顯卡的,哪怕最后的實際表現(xiàn)不如4060,或者說用著真有bug,只要價格別割韭菜,愿意和國內(nèi)玩家們交朋友,那我相信,大家都是陪著你一起成長的。
我們不妨對比另外一個國產(chǎn)顯卡摩爾線程S80——
一開始大家也吐槽摩爾線程的S80顯卡很多游戲都玩不了,缺乏優(yōu)化,但是后來它就降價了,有一陣的優(yōu)惠價格甚至掉到了1000塊錢左右,之后各路評論區(qū)對摩爾線程的評價一下子就反轉(zhuǎn)了,變成了“只有中國人真心對中國人好”。。。
所以問題來了,大家覺得這次礪算的顯卡會賣多少錢呢?
撰文:Levi
米羅&洛洛
美編:陽光
圖片、資料來源:
礪算科技發(fā)布會
b站@憨色的手腳
游民星空@MadaoKing
知乎@Wallcae