論文第一作者唐靈,張拳石老師課題組的博二學生。
今天要聊的是個硬核技術——如何給神經網(wǎng)絡刻上抹不掉的"身份證"?,F(xiàn)在大模型抄襲糾紛不斷,這事兒特別應景。
所謂神經網(wǎng)絡指紋技術,是指使用神經網(wǎng)絡內部如同人類指紋一樣的特異性信息作為身份標識,用于判斷模型的所有權和來源。傳統(tǒng)方法都在玩"貼標簽":往模型里塞各種人造指紋。但問題是,模型微調(fine-tuning)就像給整容——參數(shù)一動,"整張臉"就變了,指紋自然就糊了。
面對神經網(wǎng)絡微調訓練的威脅,現(xiàn)有方案都在修修補補,而我們上升到理論層面重新思考:神經網(wǎng)絡是否先天存在某種對微調魯棒的特征?如果存在,并將該固有特征作為網(wǎng)絡指紋,那么無論對模型參數(shù)如何微調,該指紋就能始終保持不變。在這一視角下,前人的探索較為有限,沒有從理論上證明出神經網(wǎng)絡內部對微調天然魯棒的特征。
論文地址:https://arxiv.org/pdf/2505.01007論文標題:TowardstheResistanceofNeuralNetworkWatermarkingtoFine-tuning
方法介紹
這里我們發(fā)現(xiàn)了一個顛覆性事實:卷積核的某些頻率成分根本不怕微調。就像給聲波做DNA檢測,我們把模型參數(shù)轉換到頻率域,找到了那些"焊死"在頻譜上的特征點——我們拓展了離散傅里葉變換,從而定義了神經網(wǎng)絡一個卷積核所對應的頻譜,并進一步證明:當輸入特征僅包含低頻成分時,卷積核的某些特定頻率成分在微調過程中能夠保持穩(wěn)定。
實驗
最后,我們開展了一系列實驗,以評估所提出神經網(wǎng)絡指紋方法對微調操作的魯棒性。實驗結果表明,相較于現(xiàn)有主流的模型指紋與模型溯源方法,在所有數(shù)據(jù)集和微調使用的學習率設置下,我們的方法在模型溯源任務中均取得了最優(yōu)表現(xiàn),尤其在高學習率條件下展現(xiàn)出顯著優(yōu)勢。
《權寵醫(yī)妃》狡黠世子VS貌美醫(yī)女,寵溺無下限,腹黑無極限
今天來給大家利安的是:《權寵醫(yī)妃》狡黠世子VS貌美醫(yī)女,寵溺無下限,腹黑無極限第一本:《權寵醫(yī)妃》作者:凝望的滄桑眼眸入坑指南:師心鸞忙著收服丫鬟為自己在侯府站穩(wěn)腳跟奠定基礎,那邊楚央坐著馬車在朱雀大街繞了一圈,算計著時間,終于進了宮。今年開春后明州離河一帶春汛嚴重,楚央進宮的時候,宣武帝正在御書房聽工部 第一本:《權寵醫(yī)妃》內容主線:為娶青梅,他狠心將孕妃關在地牢,結果一尸三命!精彩片段:如今眼前的人不但不癡,甚至還多了許多一般閨閣小姐都不曾有的身手-|。孤夜白唇角微微彎起,這個鳳柒,有點意思-?!盃敚沁呌腥送卵?!”追風匆匆趕來,臉色有些灰白,看了鳳柒一眼,才低聲開口——。獨孤億早就豎著耳朵好了吧!霸榜之作《權寵醫(yī)妃》,少女心又一次被治愈了??女生小說研究所