今年年初英偉達在發(fā)售RTX50系顯卡的時候,相信不少玩家都注意到老黃重點強調(diào)了“DLSS”技術的革新。NVIDIA的深度學習超級采樣技術(DLSS)一直處于行業(yè)前沿,這次與RTX50系顯卡一同發(fā)布的就是最新的DLSS4技術。從最初的DLSS到如今的DLSS4,每一次迭代都意味著游戲體驗的巨大飛躍。那么它到底是什么呢,下面小編就為大家講解一下~
DLSS技術自誕生以來,便致力于利用AI技術提升游戲性能。DLSS1首次引入深度學習神經(jīng)網(wǎng)絡,通過對低分辨率圖像的分析和重建,生成接近原生高分辨率的圖像,從而在不損失過多畫質(zhì)的前提下提升幀率。這一開創(chuàng)性的技術為后來的發(fā)展奠定了基礎。
隨著時間的推移,DLSS2帶來了更強大的性能提升。它改進了神經(jīng)網(wǎng)絡架構,提高了圖像重建的質(zhì)量和效率,讓游戲畫面更加清晰、流暢。不僅如此,DLSS2在更多游戲中得到了支持,逐漸成為玩家提升游戲體驗重要手段。
DLSS3的出現(xiàn)則帶來了幀生成技術。它利用AI模型和光流加速器,根據(jù)已有的渲染幀生成額外的幀,進一步提升幀率。同時,DLSS3還優(yōu)化了延遲,使得游戲操作更加流暢、響應迅速。這一技術的突破讓玩家在享受高幀率的同時,也能感受到更加順滑的游戲體驗。
DLSS4多幀生成技術原理剖析
進入DLSS4時代,多幀生成技術成為了最大的亮點。該技術能夠為每個傳統(tǒng)渲染幀生成多達三幀額外的幀。其實現(xiàn)過程涉及多個復雜而精妙的環(huán)節(jié)。首先,全新的幀生成AI模型發(fā)揮了關鍵作用。與以往相比,這個模型速度提高了40%,顯存占用降低了30%。這意味著它能夠在更短的時間內(nèi),以更低的資源消耗完成多幀生成的任務。
為了實現(xiàn)多幀生成,DLSS4還采用了效率極高的AI模型代替硬件光流加速器來加速光流場的生成。結合使用這些AI模型,可以顯著降低生成額外幀的計算開銷。同時,GeForceRTX50系列GPU的第五代TensorCore提供了強大的算力支持,其具備高達2.5倍的AI處理性能提升,確保GPU能夠在幾毫秒內(nèi)為每個渲染幀運行涉及超分辨率、光線重建和多幀生成技術的5個AI模型。
在生成多幀之后,DLSS4還面臨著如何讓這些幀平穩(wěn)顯示的問題。DLSS3幀生成技術使用CPUPacing技術來控制幀顯示,在這種情況下,節(jié)奏差異會隨著附加幀數(shù)增加而越發(fā)嚴重,導致每幀之間幀節(jié)奏不一致,進而影響畫面的流暢程度。為了解決這個問題,Blackwell使用基于硬件的FlipMetering來代替CPUPacing,將幀節(jié)奏邏輯轉(zhuǎn)移到顯示引擎,讓GPU能夠更精確地管理顯示時間。并且,Blackwell顯示引擎的像素處理能力提升了兩倍,以支持更高分辨率和刷新率下的硬件FlipMetering,確保生成的多幀能夠以穩(wěn)定、流暢的方式呈現(xiàn)給玩家。
在我們的游戲測試中,以《賽博朋克2077》為例,在所有測試中,為保證縮放比例固定,我們均選擇在DLSS質(zhì)量模式下進行。
傳統(tǒng)DLSS2的測試中,使用CNN模型DLSS,可以看到即便是RTX5070Ti16GB在4K分辨率下,光追超級畫質(zhì)也僅有55幀,而在光追超速模式下為33幀,尚無法達到流暢運行的成績。
DLSS3的測試依然為CNN模型,增加幀生成??梢钥吹紻LSS3已經(jīng)可以大幅提升幀數(shù),相較DLSS2,在4K超級畫質(zhì)/光追超級/光追加速的提升分別為64%/71%/79%,綜合提升71%。
DLSS4的測試為Transformer模型4X幀生成模式,在4K超級畫質(zhì)/光追超級/光追加速中,相較DLSS3的幀生成提升分別為64%/68%/83%。足以見得DLSS4技術對于游戲幀數(shù)的提升有多大的幫助。
延伸閱讀:與 {為啥開了}DLSS 4幀數(shù)就能突破:天;際 的相關文章