朱怡婷
Ultra3D團(tuán)隊投稿量子位|公眾號QbitAI
在高質(zhì)量3D生成需求日益增長的背景下,如何高效生成結(jié)構(gòu)精良、幾何精細(xì)的三維資產(chǎn),已成為AIGC和數(shù)字內(nèi)容創(chuàng)作領(lǐng)域的關(guān)鍵挑戰(zhàn)。
盡管近年來的3D生成方法發(fā)展迅速,精度越來越高,但現(xiàn)有框架在兼顧效率和質(zhì)量上依然面臨瓶頸,尤其是在高分辨率建模中,計算的高復(fù)雜度嚴(yán)重制約了生成速度和應(yīng)用落地。
為解決上述困境,南洋理工大學(xué)聯(lián)合數(shù)美萬物、西湖大學(xué)提出了Ultra3D:一種全新的3D生成框架。
Ultra3D提出了一種coarse-to-fine的兩階段生成流程,高效實現(xiàn)高分辨率三維資產(chǎn)建模,刷新了3D生成質(zhì)量的上限。在第一階段,Ultra3D利用高效的VecSet表示快速生成coarsemesh,并導(dǎo)出稀疏體素;在第二階段,引入新提出局部化的PartAttention,對每個體素進(jìn)行細(xì)粒度特征建模。
該機(jī)制僅在語義一致的局部區(qū)域內(nèi)進(jìn)行注意力計算,大幅降低全局注意力的冗余計算,有效提升生成效率。該方法支持1024分辨率輸出,實現(xiàn)在保持高保真度的同時,實現(xiàn)高達(dá)6.7×的加速比,為三維資產(chǎn)的快速生成和下游應(yīng)用提供了切實可行的解決方案。
研究背景
3D生成領(lǐng)域近年來進(jìn)展迅猛,稀疏體素憑借其對表面細(xì)節(jié)強(qiáng)大的建模能力成為了近來的各個SoTA方法普遍采用的3D表征。
這一表征將3D物體編碼成稀疏體素以及與各個體素對應(yīng)的latenttoken。其雖然表達(dá)能力非常強(qiáng),但由于其token數(shù)目巨大,在高分辨率下往往過萬,所以導(dǎo)致其計算效率很低。
鑒于此,之前的工作往往局限于一個較低的分辨率,從而難以沖擊更高的質(zhì)量。為解決這一問題,Ultra3D旨在提出一個全新的兼顧效率和質(zhì)量的二階段生成pipeline,在不降低質(zhì)量的情況下大幅加速了訓(xùn)練和推理,從而將其擴(kuò)展到了更高的分辨率和更高的質(zhì)量。
方法概述
Ultra3D由一個二階段的Pipeline構(gòu)成:第一階段通過緊湊高效的VecSet表征快速生成coarsemesh,并據(jù)此體素化得到稀疏體素的結(jié)構(gòu)布局;第二階段則基于該布局引入結(jié)構(gòu)感知的PartAttention,對每個體素進(jìn)行l(wèi)atentfeature精細(xì)建模。
PartAttention通過幾何對齊的語義分組,僅在局部區(qū)域內(nèi)計算注意力,大幅減少計算冗余,同時保持幾何連續(xù)性和細(xì)節(jié)質(zhì)量。實驗顯示,Ultra3D可在不犧牲生成質(zhì)量的前提下,實現(xiàn)3.3×的整體加速,并在多個指標(biāo)上超越現(xiàn)有SoTA方法,兼具速度與保真。
Ultra3D的核心在于其新提出的partattention機(jī)制,sparsevoxel這一表征雖然表達(dá)力很強(qiáng),但苦于其token數(shù)太大,導(dǎo)致attention的計算開銷巨大。
為解決這一問題,Ultra3D提出了一種專為3D設(shè)計的partattention,其將attention計算限制在同一個partgroup內(nèi),避免了冗余的全局attention,從而在不降低質(zhì)量的情況下大幅度地降低了計算壓力。
一個簡單的替代方案是使用在大語言模型領(lǐng)域常用到的windowattention,但如下圖所示,實驗表明這種attention直接運(yùn)用到3D中會導(dǎo)致質(zhì)量的下降。這是因為其固定的分割模式與3D物體的語義并不吻合。
與其他方法的對比實驗和userstudy表明,Ultra3D在生成質(zhì)量上遠(yuǎn)超了之前的SoTA方法,能生產(chǎn)具有高精度細(xì)節(jié)的高分辨mesh。attention的ablation實驗也表明partattention是更加適用與3D生成的localattention機(jī)制。
結(jié)語
Ultra3D提出了一個兼顧效率與保真度的創(chuàng)新性3D生成框架,成功突破了當(dāng)前主流方法在分辨率和計算成本之間的權(quán)衡瓶頸。
通過coarse-to-fine的雙階段設(shè)計,以及結(jié)構(gòu)感知的PartAttention機(jī)制,Ultra3D顯著提高了稀疏體素建模的效率,在保持高質(zhì)量輸出的同時實現(xiàn)了多倍加速,支持高達(dá)1024分辨率的三維資產(chǎn)生成。
這一方法不僅在多個定量指標(biāo)上大幅超越現(xiàn)有SoTA方法,在用戶主觀評價中也表現(xiàn)優(yōu)異,能夠真實還原復(fù)雜幾何結(jié)構(gòu)和微小紋理細(xì)節(jié),如毛發(fā)、衣褶等,展現(xiàn)出卓越的細(xì)節(jié)還原能力。
更重要的是,Ultra3D具備良好的擴(kuò)展性和通用性,為數(shù)字內(nèi)容創(chuàng)作、游戲建模、AR/VR、影視制作等多種下游應(yīng)用提供了更快速、更高質(zhì)的3D建模方案。
隨著生成式AI向多模態(tài)和高保真內(nèi)容生成不斷邁進(jìn),Ultra3D所展現(xiàn)出的性能和潛力,標(biāo)志著高分辨率3D生成進(jìn)入了一個新階段。
未來,Ultra3D有望進(jìn)一步拓展到動畫、可編輯3D內(nèi)容生成以及3D-4D一體化建模等更多復(fù)雜任務(wù),成為推動AIGC向更高維空間發(fā)展的關(guān)鍵技術(shù)基石。
論文鏈接:https://arxiv.org/abs/2507.17745項目地址:https://buaacyw.github.io/ultra3d/
推文!現(xiàn)言偏執(zhí)病嬌男主文合集⑥,男主他有病,女主是他的藥!
大家好,我是南一。本期推薦5本男主是瘋批偏執(zhí)病嬌型的古言小說_-。歡迎大家來圍觀咸魚與美強(qiáng)慘男主的救贖日常!書蟲的內(nèi)心獨白:【小說里】他好瘋,我好愛!【現(xiàn)實中】警察叔叔,就是他!1.《他從夜色深處來》作者:夜雨秋燈書評:陰陽分兩極時,九天上同時誕生了兩座分別掌管光明和黑暗的神秘城池,一座善見,..
薦書《偏執(zhí)寵愛》破鏡重圓言情,沈亦歡是陸舟的癮也是他唯一的藥
簡介:偏執(zhí)病嬌文,原本是千金大小姐的她,一夜之間失去了所有,是那個站在金字塔頂尖的男人收留她照顧她,原以為他是她一生的溫暖,誰知原來是無盡的深淵|。【收藏后點擊下方閱讀全文】精彩片段:陶曉曦緊緊地咬著自己的唇角,眼眶微紅,泫然欲泣。這副模樣,是男人看了都會憐惜,但顧一柏卻只是微微瞇起了眸子,沒有說話有幫助請點贊-——。
推文!完結(jié)!現(xiàn)言偏執(zhí)病嬌男主文合集③,他蓄謀已久,你不看不懂
《總裁他是偏執(zhí)狂》作者:貓千草短評:男主自閉癥!偏執(zhí)狂!對女主是絕對的寵!!女主說什么他就做什么!男主的眼里只有女主啊啊??!因為女主說了一句讓他住手,他就真的住手讓別人打得頭破血流也不還手,我的媽呀,真的太感動了——。好忠犬萌死我了,兩人從小一起長大,男主因為自閉癥的關(guān)系,只黏女主一個人后面會介紹。
來源:紅網(wǎng)
作者:元明煦
編輯:劉上榮
本文為紅辣椒評論 原創(chuàng)文章,僅系作者個人觀點,不代表紅網(wǎng)立場。轉(zhuǎn)載請附原文出處鏈接和本聲明。