用于數(shù)據(jù)保護(hù)的預(yù)訓(xùn)練模型微調(diào)方法、應(yīng)用方法及裝置

文檔序號(hào)：40405486發(fā)布日期：2024-12-20 12:29閱讀：5來(lái)源：國(guó)知局

導(dǎo)航： X技術(shù)> 最新專(zhuān)利>計(jì)算;推算;計(jì)數(shù)設(shè)備的制造及其應(yīng)用技術(shù)

本技術(shù)涉及機(jī)器學(xué)習(xí)，特別涉及一種用于數(shù)據(jù)保護(hù)的預(yù)訓(xùn)練模型微調(diào)方法、應(yīng)用方法及裝置。

背景技術(shù)：

1、在數(shù)字化時(shí)代，pcs（personalized?content?synthesis，個(gè)性化內(nèi)容合成）技術(shù)在文本到圖像生成領(lǐng)域中扮演著日益重要的角色。用戶(hù)通過(guò)提供簡(jiǎn)短的描述文本，利用pcs技術(shù)生成與特定主題或?qū)ο笙嚓P(guān)的高質(zhì)量圖像。

2、dm（diffusion?model，擴(kuò)散模型）是實(shí)現(xiàn)pcs技術(shù)的一種主流方法。用戶(hù)通過(guò)提供與soi（subject?of?interest，感興趣主題）相關(guān)的圖像，利用如dreambooth算法對(duì)預(yù)訓(xùn)練的擴(kuò)散模型進(jìn)行微調(diào)，從而可生成包含soi的新圖像。惡意用戶(hù)可利用該技術(shù)生成逼真的合成圖像，并通過(guò)社交媒體平臺(tái)傳播虛假信息，會(huì)對(duì)個(gè)人的安全和隱私構(gòu)成威脅。

3、相關(guān)技術(shù)中，為了解決pcs中惡意使用面部圖像引起的隱私和安全問(wèn)題，現(xiàn)有技術(shù)中提出了anti-dreambooth，以引導(dǎo)模型生成無(wú)關(guān)聯(lián)的結(jié)果，該方式通過(guò)學(xué)習(xí)一個(gè)可替代的模型來(lái)干擾dreambooth，從而增強(qiáng)了個(gè)人圖像的保護(hù)效果。但是目前的anti-dreambooth訓(xùn)練時(shí)需要構(gòu)建先驗(yàn)類(lèi)樣本且訓(xùn)練時(shí)需要訓(xùn)練模型的所有參數(shù)，同時(shí)目前需要較多次數(shù)的干擾才能學(xué)習(xí)完成，導(dǎo)致實(shí)際訓(xùn)練場(chǎng)景中計(jì)算需求大，計(jì)算成本較高。

技術(shù)實(shí)現(xiàn)思路

1、本技術(shù)實(shí)施例提供了一種用于數(shù)據(jù)保護(hù)的預(yù)訓(xùn)練模型微調(diào)方法、應(yīng)用方法及裝置。為了對(duì)披露的實(shí)施例的一些方面有一個(gè)基本的理解，下面給出了簡(jiǎn)單的概括。該概括部分不是泛泛評(píng)述，也不是要確定關(guān)鍵／重要組成元素或描繪這些實(shí)施例的保護(hù)范圍。其唯一目的是用簡(jiǎn)單的形式呈現(xiàn)一些概念，以此作為后面的詳細(xì)說(shuō)明的序言。

2、第一方面，本技術(shù)實(shí)施例提供了一種用于數(shù)據(jù)保護(hù)的預(yù)訓(xùn)練模型微調(diào)方法，方法包括：

3、創(chuàng)建用于數(shù)據(jù)保護(hù)的代理模型，代理模型是將預(yù)訓(xùn)練的擴(kuò)散模型中除文本編碼器和u-net結(jié)構(gòu)的交叉注意層的參數(shù)之外的其他參數(shù)禁用之后得到的；

4、根據(jù)預(yù)設(shè)人臉圖像集及其描述文本，對(duì)代理模型進(jìn)行預(yù)設(shè)時(shí)間步的迭代微調(diào)，得到代理個(gè)性化生成模型；

5、使用預(yù)設(shè)對(duì)抗樣本集與描述文本，對(duì)代理個(gè)性化生成模型進(jìn)行攻擊，得到擾動(dòng)值，其中，預(yù)設(shè)對(duì)抗樣本集是將預(yù)設(shè)人臉圖像集進(jìn)行預(yù)處理得到的，計(jì)算擾動(dòng)值時(shí)的擾動(dòng)步長(zhǎng)是根據(jù)時(shí)間步數(shù)計(jì)算得到的；

6、將擾動(dòng)值添加至預(yù)設(shè)對(duì)抗樣本集中，并繼續(xù)執(zhí)行對(duì)代理個(gè)性化生成模型進(jìn)行攻擊的步驟，直到攻擊次數(shù)到達(dá)預(yù)設(shè)次數(shù)閾值的情況下，得到目標(biāo)對(duì)抗樣本；

7、使用目標(biāo)對(duì)抗樣本，再次對(duì)代理模型進(jìn)行預(yù)設(shè)時(shí)間步的迭代微調(diào)，在當(dāng)前微調(diào)次數(shù)到達(dá)預(yù)設(shè)擾動(dòng)閾值的情況下，得到最終的代理個(gè)性化生成模型。

8、可選的，使用預(yù)設(shè)對(duì)抗樣本集與描述文本，對(duì)代理個(gè)性化生成模型進(jìn)行攻擊，得到擾動(dòng)值，包括：

9、將預(yù)設(shè)對(duì)抗樣本集與描述文本輸入代理個(gè)性化生成模型，以計(jì)算擾動(dòng)值；

10、輸出預(yù)設(shè)對(duì)抗樣本集對(duì)應(yīng)的處理結(jié)果；

11、獲取處理結(jié)果中包括的擾動(dòng)值。

12、可選的，將預(yù)設(shè)對(duì)抗樣本集與描述文本輸入代理個(gè)性化生成模型，以計(jì)算擾動(dòng)值，包括：

13、代理個(gè)性化生成模型使用分?jǐn)?shù)蒸餾采樣算法，對(duì)預(yù)設(shè)對(duì)抗樣本集與描述文本進(jìn)行計(jì)算處理，得到當(dāng)前梯度；

14、代理個(gè)性化生成模型獲取時(shí)間步數(shù)；

15、代理個(gè)性化生成模型根據(jù)時(shí)間步數(shù)，計(jì)算擾動(dòng)步長(zhǎng)；

16、代理個(gè)性化生成模型根據(jù)當(dāng)前梯度與擾動(dòng)步長(zhǎng)，計(jì)算擾動(dòng)值。

17、可選的，擾動(dòng)步長(zhǎng)計(jì)算公式為：

18、

19、其中，為擾動(dòng)步長(zhǎng)，為超參數(shù)，用于調(diào)整步長(zhǎng)的大小，可以根據(jù)模型的需要和訓(xùn)練過(guò)程中的表現(xiàn)進(jìn)行調(diào)整，在時(shí)間步數(shù)時(shí)的加噪強(qiáng)度，加噪強(qiáng)度與擴(kuò)散模型的噪聲方差相關(guān)，為時(shí)間步數(shù)，用于動(dòng)態(tài)調(diào)整步長(zhǎng)，使得隨著時(shí)間步的增加，更新幅度逐漸減小；

20、擾動(dòng)值的計(jì)算公式為：

21、

22、其中，為擾動(dòng)值，是一個(gè)縮放因子，為0.1，用于控制對(duì)抗性擾動(dòng)的強(qiáng)度，為擾動(dòng)步長(zhǎng)，為損失函數(shù)梯度的符號(hào)函數(shù)，它返回梯度向量的符號(hào)（正或負(fù)），在對(duì)抗性攻擊中，使用梯度的符號(hào)來(lái)確定擾動(dòng)的方向，為使用分?jǐn)?shù)蒸餾采樣算法得到的當(dāng)前梯度。

23、可選的，當(dāng)前梯度計(jì)算公式為：

24、

25、其中，表示對(duì)的梯度運(yùn)算符，用于計(jì)算損失函數(shù)l相對(duì)于輸入預(yù)設(shè)對(duì)抗樣本集中圖像的梯度；表示在模型函數(shù)下，圖像經(jīng)過(guò)擾動(dòng)后的損失函數(shù)；表示在迭代過(guò)程中的第次迭代的圖像，表示使用分?jǐn)?shù)蒸餾采樣算法計(jì)算的損失函數(shù)，表示期望值運(yùn)算符，用于計(jì)算在所有可能的組合下梯度的平均值，表示原始輸入圖像，在迭代和擾動(dòng)之前的狀態(tài)，為時(shí)間步數(shù)，為模型參數(shù)的集合，為時(shí)間步數(shù)時(shí)添加到圖像中的實(shí)際噪聲，表示模型根據(jù)當(dāng)前的模型參數(shù)集合、時(shí)間步數(shù)和描述文本預(yù)測(cè)的噪聲，表示時(shí)間步數(shù)時(shí)，模型輸出相對(duì)于的梯度，為時(shí)間步數(shù)時(shí)模型的輸出，為時(shí)間步數(shù)時(shí)模型的輸入。

26、可選的，代理模型的損失函數(shù)為：

27、

28、其中，為損失函數(shù)，用于度量在給定模型參數(shù)和預(yù)設(shè)人臉圖像集的情況下計(jì)算的損失值，是期望值運(yùn)算符，用于計(jì)算所有可能的組合下?lián)p失函數(shù)的平均值，為時(shí)間步數(shù)，為模型參數(shù)的集合，為時(shí)間步數(shù)時(shí)添加到圖像中的實(shí)際噪聲，表示模型根據(jù)當(dāng)前的模型參數(shù)集合、時(shí)間步數(shù)和描述文本預(yù)測(cè)的噪聲。

29、可選的，預(yù)設(shè)時(shí)間步為3步，預(yù)設(shè)次數(shù)閾值大于6，預(yù)設(shè)擾動(dòng)閾值為50次，代理模型的微調(diào)方式采用dreambooth算法的訓(xùn)練方式。

30、第二方面，本技術(shù)實(shí)施例提供了一種模型應(yīng)用方法，方法包括：

31、接收?qǐng)D像處理請(qǐng)求，圖像處理請(qǐng)求攜帶用戶(hù)的人臉圖像；

32、將人臉圖像輸入最終的代理個(gè)性化生成模型中，輸出添加隱私保護(hù)信息的目標(biāo)圖像，隱私保護(hù)信息用于防止擴(kuò)散模型生成與感興趣主題相關(guān)的圖像；最終的代理個(gè)性化生成模型是通過(guò)用于數(shù)據(jù)保護(hù)的預(yù)訓(xùn)練模型微調(diào)方法微調(diào)得到的；

33、展示目標(biāo)圖像。

34、第三方面，本技術(shù)實(shí)施例提供一種用于數(shù)據(jù)保護(hù)的預(yù)訓(xùn)練模型微調(diào)裝置，裝置包括：

35、創(chuàng)建模塊，用于創(chuàng)建用于數(shù)據(jù)保護(hù)的代理模型，代理模型是將預(yù)訓(xùn)練的擴(kuò)散模型中除文本編碼器和u-net結(jié)構(gòu)的交叉注意層的參數(shù)之外的其他參數(shù)禁用之后得到的；

36、第一微調(diào)模塊，用于根據(jù)預(yù)設(shè)人臉圖像集及其描述文本，對(duì)代理模型進(jìn)行預(yù)設(shè)時(shí)間步的迭代微調(diào)，得到代理個(gè)性化生成模型；

37、第一攻擊模塊，用于使用預(yù)設(shè)對(duì)抗樣本集與描述文本，對(duì)代理個(gè)性化生成模型進(jìn)行攻擊，得到擾動(dòng)值，其中，預(yù)設(shè)對(duì)抗樣本集是將預(yù)設(shè)人臉圖像集進(jìn)行預(yù)處理得到的，計(jì)算擾動(dòng)值時(shí)的擾動(dòng)步長(zhǎng)是根據(jù)時(shí)間步數(shù)計(jì)算得到的；

38、第二攻擊模塊，用于將擾動(dòng)值添加至預(yù)設(shè)對(duì)抗樣本集中，并繼續(xù)執(zhí)行對(duì)代理個(gè)性化生成模型進(jìn)行攻擊的步驟，直到攻擊次數(shù)到達(dá)預(yù)設(shè)次數(shù)閾值的情況下，得到目標(biāo)對(duì)抗樣本；

39、第二微調(diào)模塊，用于使用目標(biāo)對(duì)抗樣本，再次對(duì)代理模型進(jìn)行預(yù)設(shè)時(shí)間步的迭代微調(diào)，在當(dāng)前微調(diào)次數(shù)到達(dá)預(yù)設(shè)擾動(dòng)閾值的情況下，得到最終的代理個(gè)性化生成模型。

40、第四方面，本技術(shù)實(shí)施例提供一種模型應(yīng)用裝置，裝置包括：

41、接收模塊，用于接收?qǐng)D像處理請(qǐng)求，圖像處理請(qǐng)求攜帶用戶(hù)的人臉圖像；

42、輸入模塊，用于將人臉圖像輸入最終的代理個(gè)性化生成模型中，輸出添加隱私保護(hù)信息的目標(biāo)圖像，隱私保護(hù)信息用于防止擴(kuò)散模型生成與感興趣主題相關(guān)的圖像；最終的代理個(gè)性化生成模型是通過(guò)用于數(shù)據(jù)保護(hù)的預(yù)訓(xùn)練模型微調(diào)方法微調(diào)得到的；

43、展示模塊，用于展示目標(biāo)圖像。

44、本技術(shù)實(shí)施例提供的技術(shù)方案可以包括以下有益效果：

45、在本技術(shù)實(shí)施例中，通過(guò)將預(yù)訓(xùn)練的擴(kuò)散模型中除文本編碼器和u-net結(jié)構(gòu)的交叉注意層的參數(shù)之外的其他參數(shù)禁用，使得模型參數(shù)大大減少，同時(shí)根據(jù)時(shí)間步數(shù)動(dòng)態(tài)調(diào)整擾動(dòng)更新步長(zhǎng)，不僅破壞了惡意用戶(hù)可能利用的文本與圖像之間的耦合，而且減少了對(duì)抗樣本訓(xùn)練所需的時(shí)間和計(jì)算資源，使得實(shí)際訓(xùn)練場(chǎng)景中計(jì)算需求少，減少了計(jì)算資源的浪費(fèi)。

46、應(yīng)當(dāng)理解的是，以上的一般描述和后文的細(xì)節(jié)描述僅是示例性和解釋性的，并不能限制本技術(shù)。

完整全部詳細(xì)技術(shù)資料下載

當(dāng)前第1頁(yè)1 2

該技術(shù)已申請(qǐng)專(zhuān)利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請(qǐng)聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：高雅,趙晨旭,楊靜,吳明輝,蘇安煬,余梓彤
技術(shù)所有人：北京大學(xué)
我是此專(zhuān)利的發(fā)明人

該領(lǐng)域下的技術(shù)專(zhuān)家
如您需求助技術(shù)專(zhuān)家，請(qǐng)點(diǎn)此查看客服電話(huà)進(jìn)行咨詢(xún)。
1、李老師：1.計(jì)算力學(xué) 2.無(wú)損檢測(cè)
2、畢老師：機(jī)構(gòu)動(dòng)力學(xué)與控制
3、袁老師：1.計(jì)算機(jī)視覺(jué) 2.無(wú)線網(wǎng)絡(luò)及物聯(lián)網(wǎng)
4、王老師：1.計(jì)算機(jī)網(wǎng)絡(luò)安全 2.計(jì)算機(jī)仿真技術(shù)
5、王老師：1.網(wǎng)絡(luò)安全；物聯(lián)網(wǎng)安全、大數(shù)據(jù)安全 2.安全態(tài)勢(shì)感知、輿情分析和控制 3.區(qū)塊鏈及應(yīng)用
如您是高校老師，可以點(diǎn)此聯(lián)系我們加入專(zhuān)家?guī)臁?/a>

相關(guān)技術(shù)

網(wǎng)友詢(xún)問(wèn)留言已有0條留言

還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊！

精彩留言，會(huì)給你點(diǎn)贊！

国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

用于數(shù)據(jù)保護(hù)的預(yù)訓(xùn)練模型微調(diào)方法、應(yīng)用方法及裝置

用于數(shù)據(jù)保護(hù)的預(yù)訓(xùn)練模型微調(diào)方法、應(yīng)用方法及裝置