照理說(shuō),新產(chǎn)品發(fā)布一類的文章托尼都是在工作日給大家寫的,因?yàn)閺S商們通常選擇在工作日開發(fā)布會(huì)。
但是這家名叫“礪算科技”的廠商很神奇,他們周末加了個(gè)班(被迫著我也加了個(gè)班),但是發(fā)布的東西卻堪稱非常重磅了——
首款國(guó)產(chǎn)自研6nm工藝顯卡!
沒(méi)錯(cuò),是能插在電腦上打游戲的那種顯卡,而且按照礪算在發(fā)布會(huì)上的說(shuō)法,這款顯卡的光柵性能趕超了英偉達(dá)的RTX4060,甚至還能穩(wěn)玩1080P的黑猴?看完昨天咱們國(guó)內(nèi)企業(yè)“礪算科技”的新品發(fā)布會(huì),說(shuō)實(shí)話托尼到現(xiàn)在人還是懵的。
因?yàn)楦鶕?jù)相關(guān)報(bào)道,礪算科技截至2024年僅僅募資6.28億,但是作為對(duì)比,我們每天都在罵貴的英偉達(dá)、罵不爭(zhēng)氣的英特爾和AMD,他們哥仨的研發(fā)投入動(dòng)輒就是幾百億。國(guó)內(nèi)芯片創(chuàng)業(yè)公司用著十幾分之一的資源“手搓”出了4060級(jí)別的顯卡???
假如事情是真的,那這真的妥妥是一個(gè)“顯卡圈子”的DeepSeek故事了。
不過(guò)著急看這兩款產(chǎn)品詳細(xì)測(cè)試的小伙伴估計(jì)要再等一等了,昨天發(fā)布的消費(fèi)級(jí)顯卡7G106,及專業(yè)級(jí)顯卡7G105,不出意外應(yīng)該是8月份產(chǎn)品送樣,9月份才開始量產(chǎn)。
所以真正的上手實(shí)測(cè)大家還得再等等,但是如果你還好奇昨天的發(fā)布會(huì)還公布了哪些細(xì)節(jié),托尼這里可以帶著大家再盤一下這兩款國(guó)產(chǎn)自研顯卡昨天公開的信息。
首先是這兩款顯卡核心的GPU部分,基于臺(tái)積電N6工藝,并且采用了“礪算科技”自研的TrueGPU圖形架構(gòu)。這也意味著從計(jì)算核心到指令集完全由自主設(shè)計(jì),而不是市場(chǎng)上常見的“公版IP授權(quán)+自主優(yōu)化”的形式。
這樣做有啥好處呢?舉幾個(gè)發(fā)布會(huì)錄播提到的例子吧——
我們都知道,GPU的3D渲染,也就是我們看到的圖形,是根據(jù)無(wú)數(shù)的三角形像積木一樣拼湊出來(lái)的。GPU的渲染過(guò)程,就是三角形的拆分、拼湊和后續(xù)計(jì)算的過(guò)程。
根據(jù)礪算科技官方的說(shuō)法,礪算7G106的三角形渲染,重構(gòu)了圖形管線的執(zhí)行邏輯,智能亂序渲染,而且能根據(jù)負(fù)載情況動(dòng)態(tài)分配計(jì)算單元。不用像傳統(tǒng)的GPU圖形一樣,按照既定的步驟,低效地一步步執(zhí)行,所以礪算7G106能夠在適配場(chǎng)景下直接提升50%的渲染效率。
此外,礪算7G106還支持FP32或INT32的指令雙發(fā)射,以方塊形式存儲(chǔ)矩陣數(shù)據(jù)等特性,可以優(yōu)化40%的顯存使用效率。
從這些支持特性上來(lái)看,礪算顯卡的設(shè)計(jì)思路還是比較先進(jìn)的——
就拿FP32/INT32雙發(fā)射這點(diǎn)來(lái)說(shuō),我查了一下,NVIDIA也是從20系顯卡才開始支持,AMD則是從前兩年的RX7000系顯卡才開始支持,英特爾則是從A700系列的獨(dú)顯才開始支持。
說(shuō)完GPU,接下來(lái)再來(lái)看下兩款顯卡的硬件規(guī)格:
根據(jù)發(fā)布會(huì)錄播,消費(fèi)級(jí)顯卡礪算7G106搭載12GBGDDR6顯存,但是功耗頻率這樣的基礎(chǔ)硬件信息并未公布;參考同行爆料的信息,礪算7G106位寬192bit,擁有192個(gè)紋理單元(TMU)和96個(gè)光柵單元(ROP)。
假設(shè)這個(gè)爆料屬實(shí),那么礪算7G106就是擁有4060兩倍規(guī)模的紋理單元和光柵單元,那么它在跑分上超過(guò)4060,好像就說(shuō)得過(guò)去了。除此之外,礪算7G106支持DirectX12、Vulkan1.3、OpenGL4.6和OpenCL3.0等主流API,大概是個(gè)夠用但并不算進(jìn)階的水平。
因?yàn)槟壳癉X12API最新的版本是DX12Ultimate,Vulkan最新版本是1.4。缺乏這兩個(gè)API最新版本的支持,就意味著礪算7G106有可能不支持光追和可變速率著色(VRS),影響游戲時(shí)畫面效果和幀率,并且在渲染能力上存在一定的劣勢(shì)。
可變速率著色(VRS)示意,從左到右著色率變低
反觀礪算想要挑戰(zhàn)的行業(yè)霸主英偉達(dá)這邊,先是在2014年發(fā)布的GTX900系列顯卡上支持了瓦片式渲染和改進(jìn)的調(diào)度器,這兩樣技術(shù)其實(shí)也屬于礪算這次宣傳的“智能亂序渲染”的類似物。
但是英偉達(dá)直到4年后的RTX20系列才支持可變速率著色(VRS),然后才支持了完整的DX12UltimateAPI,礪算7G106的后續(xù)產(chǎn)品,明顯還有一些需要提升的地方。
其他方面,礪算7G106采用PCIe4.0x16標(biāo)準(zhǔn),提供4個(gè)DisplayPort1.4接口,公版卡沒(méi)有HDMI接口。
順帶說(shuō)一下專業(yè)卡7G105的規(guī)格,整體來(lái)看處于中高端的水平——
配備24GBGDDR6ECC顯存、最大紋理填充率384GT/s,最大像素填充率192GP/s,支持FP32和INT8計(jì)算,F(xiàn)P32最大吞吐量為24TFLOPS,也適合高像素渲染以及大模型訓(xùn)練。
前面架構(gòu)和規(guī)格的部分,目前能公開找到的資料其實(shí)不多,但我相信參數(shù)啥的大家也就隨便看看,游戲黨們更關(guān)心的還是具體的實(shí)測(cè)——
之前也提到了,礪算7G106的部分光柵性能是強(qiáng)于RTX4060的。。。
比如在Geekbench測(cè)試?yán)?,衡量GPU通用計(jì)算能力的OpenCL跑分,礪算7G106得分為111290分,比RTX4060的101028分,整整高出10%,甚至直逼RTX5060!如果上市的時(shí)候再搭配不錯(cuò)的價(jià)格,感覺(jué)花更少的錢就能買到光柵性能這塊,就不止是AMD一家的優(yōu)勢(shì)了。
更貼近游戲性能的3DMarkFireStrike(1080p)測(cè)試,礪算7G106的跑分成績(jī)?yōu)?6800分,作為對(duì)比4060大約是2w7到2w8的成績(jī),也幾乎快追上4060了。
在更考驗(yàn)顯卡性能的4K分辨率測(cè)試項(xiàng)目SteelNomad里,礪算7G106的跑分也能有2256分,參考公開的測(cè)試數(shù)據(jù),RTX4060這項(xiàng)測(cè)試的數(shù)據(jù)在2302左右。
總結(jié)下來(lái),礪算7G106顯卡的整體表現(xiàn),雖然說(shuō)不至于完全對(duì)標(biāo)英偉達(dá)RTX4060,但光柵化性能是妥妥的趕上了,然后在一些小項(xiàng)目上體現(xiàn)出了自己的優(yōu)勢(shì)。
但是我們都知道,老黃除了硬件還有軟件,就拿游戲來(lái)說(shuō),DLSS是老黃的招牌。
根據(jù)發(fā)布會(huì)錄播的來(lái)看,礪算也做了個(gè)名叫NRSS的DLSS類似物,但是沒(méi)有實(shí)機(jī)演示;我在錄播里看到,最后發(fā)布會(huì)現(xiàn)場(chǎng)是拿黑神話內(nèi)置的游戲科學(xué)NXSR做了個(gè)超分的演示,也就是通過(guò)原生低畫質(zhì)+超采樣實(shí)現(xiàn)4K分辨率運(yùn)行黑神話悟空,但是對(duì)一款甜品卡來(lái)說(shuō),咱們直接看1080P的表現(xiàn)就好了。
《黑神話:悟空》在1080P分辨率、高畫質(zhì)設(shè)置下,礪算7G106平均幀數(shù)能過(guò)70幀,而且在打斗過(guò)程中,遇到野怪、釋放技能和特效,也沒(méi)有明顯的掉幀情況。這個(gè)表現(xiàn),其實(shí)跟4060關(guān)掉DLSS“裸玩”黑猴的幀數(shù)也差不多了(雖然沒(méi)這個(gè)必要)。。。
更讓托尼感覺(jué)到意外的是,明末:淵虛之羽在1080P分辨率、高畫質(zhì)設(shè)置下,依舊能跑到70幀以上。參考同行針對(duì)這個(gè)游戲做的實(shí)測(cè),RTX5060顯卡在DLSS4多幀生成的條件下,可以達(dá)到149幀,但會(huì)感覺(jué)到明顯卡頓。
考慮到這是個(gè)上線還沒(méi)有兩天的游戲,這么短的時(shí)間,礪算7G106肯定來(lái)不及針對(duì)游戲做適配,就能達(dá)到這種可玩的水平,那只能理解為礪算7G106核心規(guī)模更大,以及大顯存、高位寬,帶來(lái)的力大磚飛的提升了。
至于老牌的3A游戲古墓麗影:暗影,礪算7G106在游戲時(shí)只有平均80幀以上,表現(xiàn)就要差一些了。在同樣的畫質(zhì)設(shè)置下,4060對(duì)這款游戲有適配優(yōu)化,可以跑到147幀。這其實(shí)也是擺在國(guó)產(chǎn)GPU面前的最大的問(wèn)題,硬件追趕只是第一步,后續(xù)的驅(qū)動(dòng)適配和游戲優(yōu)化,路還長(zhǎng)著呢。。。
如果托尼后續(xù)能夠拿到這款顯卡,到時(shí)候也會(huì)給大家來(lái)個(gè)全面測(cè)試。
感覺(jué)礪算7G106未來(lái)隨著驅(qū)動(dòng)的優(yōu)化,整體達(dá)到4060的水平應(yīng)該沒(méi)有什么問(wèn)題,而且游戲玩家們其實(shí)很包容國(guó)產(chǎn)顯卡的,哪怕最后的實(shí)際表現(xiàn)不如4060,或者說(shuō)用著真有bug,只要價(jià)格別割韭菜,愿意和國(guó)內(nèi)玩家們交朋友,那我相信,大家都是陪著你一起成長(zhǎng)的。
我們不妨對(duì)比另外一個(gè)國(guó)產(chǎn)顯卡摩爾線程S80——
一開始大家也吐槽摩爾線程的S80顯卡很多游戲都玩不了,缺乏優(yōu)化,但是后來(lái)它就降價(jià)了,有一陣的優(yōu)惠價(jià)格甚至掉到了1000塊錢左右,之后各路評(píng)論區(qū)對(duì)摩爾線程的評(píng)價(jià)一下子就反轉(zhuǎn)了,變成了“只有中國(guó)人真心對(duì)中國(guó)人好”。。。
所以問(wèn)題來(lái)了,大家覺(jué)得這次礪算的顯卡會(huì)賣多少錢呢?
撰文:Levi
米羅&洛洛
美編:陽(yáng)光
圖片、資料來(lái)源:
礪算科技發(fā)布會(huì)
b站@憨色的手腳
游民星空@MadaoKing
知乎@Wallcae
小說(shuō):我偷仙丹閣主反贈(zèng),仙門大比未戰(zhàn)而勝,師父寵我無(wú)人能敵
整座山峰就像是漂浮的一朵白云,在仙霧繚繞之間若隱若現(xiàn),因此這座山叫作浮云山。浮云山上,有座宮殿,叫作浮云殿_|。這里是無(wú)數(shù)神君上仙,甚至各類妖魔鬼怪都想來(lái)的地方,因?yàn)榭∶罒o(wú)儔、法力無(wú)邊的軒轅帝君就住在這里。別處的仙山神宮無(wú)不種植著各種神草靈藥,瑞草鋪地、靈花盛開-|。第3章:吃果子但是,浮云山上卻種滿了各種果樹,桃樹、梨樹 今日推薦:《家有仙師天上來(lái)》作者:十片葉子。點(diǎn)擊文末超鏈接開始觀看吧~第375章:還我花襲月!云洛洛縱身一跳,飛出祖師殿,祖師殿在她身后砰然倒塌,夷為平地!只是,一道微弱的看不到的細(xì)芒,從祖師殿的廢墟中飛了出來(lái),以最快的速度鉆進(jìn)了云洛洛的體內(nèi),這一幕包括軒轅帝君在內(nèi),都沒(méi)有看到!云洛洛也說(shuō)完了——_。出道緣分干貨整理(仙道貴生,無(wú)量度人)