隗千亦
論文第一作者唐靈,張拳石老師課題組的博二學生。
今天要聊的是個硬核技術——如何給神經(jīng)網(wǎng)絡刻上抹不掉的"身份證"?,F(xiàn)在大模型抄襲糾紛不斷,這事兒特別應景。
所謂神經(jīng)網(wǎng)絡指紋技術,是指使用神經(jīng)網(wǎng)絡內(nèi)部如同人類指紋一樣的特異性信息作為身份標識,用于判斷模型的所有權和來源。傳統(tǒng)方法都在玩"貼標簽":往模型里塞各種人造指紋。但問題是,模型微調(diào)(fine-tuning)就像給整容——參數(shù)一動,"整張臉"就變了,指紋自然就糊了。
面對神經(jīng)網(wǎng)絡微調(diào)訓練的威脅,現(xiàn)有方案都在修修補補,而我們上升到理論層面重新思考:神經(jīng)網(wǎng)絡是否先天存在某種對微調(diào)魯棒的特征?如果存在,并將該固有特征作為網(wǎng)絡指紋,那么無論對模型參數(shù)如何微調(diào),該指紋就能始終保持不變。在這一視角下,前人的探索較為有限,沒有從理論上證明出神經(jīng)網(wǎng)絡內(nèi)部對微調(diào)天然魯棒的特征。
論文地址:https://arxiv.org/pdf/2505.01007論文標題:TowardstheResistanceofNeuralNetworkWatermarkingtoFine-tuning
方法介紹
這里我們發(fā)現(xiàn)了一個顛覆性事實:卷積核的某些頻率成分根本不怕微調(diào)。就像給聲波做DNA檢測,我們把模型參數(shù)轉(zhuǎn)換到頻率域,找到了那些"焊死"在頻譜上的特征點——我們拓展了離散傅里葉變換,從而定義了神經(jīng)網(wǎng)絡一個卷積核所對應的頻譜,并進一步證明:當輸入特征僅包含低頻成分時,卷積核的某些特定頻率成分在微調(diào)過程中能夠保持穩(wěn)定。
實驗
最后,我們開展了一系列實驗,以評估所提出神經(jīng)網(wǎng)絡指紋方法對微調(diào)操作的魯棒性。實驗結(jié)果表明,相較于現(xiàn)有主流的模型指紋與模型溯源方法,在所有數(shù)據(jù)集和微調(diào)使用的學習率設置下,我們的方法在模型溯源任務中均取得了最優(yōu)表現(xiàn),尤其在高學習率條件下展現(xiàn)出顯著優(yōu)勢。
小說:殺手王者做?;ūgS,陷是非群芳環(huán)繞,花都任他逍遙行
《美女的超級保鏢》作者:日月星辰第一章只會一招三層獨棟別墅的大門緩緩打開。奧迪A8長驅(qū)直入,忠叔停下了車,扭頭看了一眼坐在后排的瞇著眼睛的少年_-。這少年個子不高不低,瘦的跟電線桿似的的他穿著一身明顯是從地攤上買來的服裝,頭發(fā)更是亂的跟雞窩似的。忠叔眉頭皺了皺淡淡說道:“林楓先生,到了-。..
看膩《最強花少》,這些優(yōu)質(zhì)小說任你讀,不忍完結(jié)
《美女的超級保鏢》——作者:日月星辰精彩片段:初開始蘇小蠻還對林楓各種鄙視,各種不屑,各種嘲諷,可是當林楓以迅雷不及掩耳之勢連續(xù)過了好幾關之后,蘇小蠻的臉色微微的變了--。很快,十幾關過去了,蘇小蠻的臉色越來越不對勁了,唐妃與秦婉蓉倆人一開始只顧著說話,可是很快,三個小妞緊緊地擠在了林楓的旁邊希望你能滿意。
YY文,雙手緊握無上權力掌控他人生死,更有美女相伴,攀人生巔峰
今日推薦:高品質(zhì)的TOP3都市超能小說《美女的超級保鏢》 作者:日月星辰內(nèi)容簡介:殺手界的王者降臨花都,成為了超級美女?;ǖ谋gS,不曾想卷入了無數(shù)的是非當中,伴隨著這些是非又有無數(shù)的美女蜂擁而來,且看一個不太善良的小保鏢如何縱橫花都抱得美人歸。(點擊下方免費閱讀)《美女總裁的貼身兵王》 作者:..
來源:紅網(wǎng)
作者:青新之
編輯:斯梓
本文為紅辣椒評論 原創(chuàng)文章,僅系作者個人觀點,不代表紅網(wǎng)立場。轉(zhuǎn)載請附原文出處鏈接和本聲明。