本發(fā)明涉及,尤其涉及一種基于dpwgan的恒定時間離散高斯采樣方法及裝置。
背景技術(shù):
1、gan的實現(xiàn)目標(biāo)是由均勻分布的數(shù)據(jù),生成高斯正態(tài)分布的數(shù)據(jù),即:對服從均勻分布的數(shù)據(jù)樣本進行采樣,對采樣得到的數(shù)據(jù)經(jīng)gan處理后,生成高斯正態(tài)分布數(shù)據(jù)。gan系列模型主要由生成器和判別器兩部分組成,生成器負責(zé)生成數(shù)據(jù),判別器負責(zé)判別生成的數(shù)據(jù)與真實數(shù)據(jù)之間的差距,目的是使生成數(shù)據(jù)與真實數(shù)據(jù)的差距越來越小,從而使得生成數(shù)據(jù)具有與真實數(shù)據(jù)相近的數(shù)據(jù)特征。
2、首先,gan技術(shù)方案首先以一維均勻分布樣本輸入到生成器中,以真實目標(biāo)數(shù)據(jù)的數(shù)據(jù)特征,即離散高斯分布數(shù)據(jù)的數(shù)據(jù)特征,輸入到判別器中。然后,判別器會以目標(biāo)數(shù)據(jù)的數(shù)據(jù)特征為判別依據(jù),判斷生成器不斷生成數(shù)據(jù)的真實性。若真實性得分過低,會要求生成器繼續(xù)迭代生成數(shù)據(jù),直到真實數(shù)據(jù)與生成數(shù)據(jù)之間的差距足夠小,我們稱之為損失函數(shù)。所以gan技術(shù)方案的核心目的,就是使模型的損失函數(shù)越來越小,即目標(biāo)數(shù)據(jù)與生成數(shù)據(jù)之間的差異越來越小。在本技術(shù)方案中,目標(biāo)數(shù)據(jù)的數(shù)據(jù)特征選取了四個參照,分別是均值、標(biāo)準(zhǔn)差、偏度、峰度,結(jié)合以作為判別器評判數(shù)據(jù)是否足夠真實的標(biāo)準(zhǔn)。
3、在得到足夠真實的生成數(shù)據(jù)后,判別器會將數(shù)據(jù)打印出來,至此整個gan模型訓(xùn)練和生成過程結(jié)束。打印出來的數(shù)據(jù)會交由采樣器進行采樣,從中隨機選出任意一數(shù),該數(shù)即為服從離散高斯分布的隨機采樣數(shù)。
4、目前區(qū)塊鏈簽名的生成過程中,對于其中的離散高斯分布采樣環(huán)節(jié),一直存在以下三個缺點。第一,現(xiàn)有生成區(qū)塊鏈簽名的方案中,對于離散高斯分布采樣所采用的方法均不具備較強的時間一致性,這會導(dǎo)致易受到側(cè)信道攻擊。能夠抵御側(cè)信道攻擊在當(dāng)前前沿的區(qū)塊鏈簽名技術(shù),如抗量子區(qū)塊鏈簽名領(lǐng)域尤為重要。第二,當(dāng)前主流離散高斯分布采樣,采用的是離散二叉樹的形式。盡管離散二叉樹具備計算時間快的優(yōu)點,但需要預(yù)先存儲大量的概率統(tǒng)計分布表,所占存儲空間為代碼部分的十倍甚至二十倍,使其磁盤占用量較高,不利于部署在資源環(huán)境受限的節(jié)點,例如邊緣節(jié)點上。第三,當(dāng)前雖然也有使用生成模型,如gan來完成離散高斯分布采樣,但gan模型所使用的損失函數(shù),由于函數(shù)設(shè)計使然,不利于處理當(dāng)輸入數(shù)據(jù)與目標(biāo)數(shù)據(jù)的數(shù)據(jù)分布相差過大的情況。
技術(shù)實現(xiàn)思路
1、本發(fā)明要解決的技術(shù)問題是,如何針對上述缺點,提升時間一致性、節(jié)約資源、減小分布差異;有鑒于此,本發(fā)明提供一種基于dpwgan的恒定時間離散高斯采樣方法及裝置。
2、本發(fā)明采用的技術(shù)方案是,一種基于dpwgan的恒定時間離散高斯采樣方法,包括:
3、步驟s1,獲取均勻分布的訓(xùn)練數(shù)據(jù)以及真實數(shù)據(jù);
4、步驟s2,基于配置的生成網(wǎng)絡(luò),利用所述訓(xùn)練數(shù)據(jù),得到對應(yīng)的生成數(shù)據(jù)并輸入至損失函數(shù),基于配置的辨別網(wǎng)絡(luò),確定所述真實數(shù)據(jù)對應(yīng)的真實值并輸入至所述損失函數(shù),用于確定所述真實值與所述生成數(shù)據(jù)的差異;
5、步驟s3,所述生成網(wǎng)絡(luò)基于所述損失函數(shù)的差異,對當(dāng)前生成數(shù)據(jù)進行迭代,以使得生成數(shù)據(jù)與所述真實值的差異減小;
6、步驟s4,對迭代后并達到預(yù)定要求的生成數(shù)據(jù)進行采樣處理。
7、在一個實施方式中,所述方法還包括:
8、獲取所述真實數(shù)據(jù)后,在所述真實數(shù)據(jù)中添加隨機噪聲。
9、在一個實施方式中,獲取所述真實數(shù)據(jù)后,在所述真實數(shù)據(jù)中添加隨機噪聲,通過下式實現(xiàn):
10、
11、其中,為定義域,為隨機噪聲且滿足α∈(1,∞),真實數(shù)據(jù)
12、在一個實施方式中,所述損失函數(shù)具體包括:
13、
14、其中,w(pr,pg)表征最優(yōu)規(guī)劃下的最小消耗,ⅱ(pr,pg)是將pr、pg結(jié)合在一起的所有可能聯(lián)合分布的集合,γ(x,y)表示將x轉(zhuǎn)換為y所需的工作消耗,以將分布pr轉(zhuǎn)換為分布pg。
15、本發(fā)明的另一方面還提供了一種基于dpwgan的恒定時間離散高斯采樣裝置,包括:
16、獲取單元,配置為獲取均勻分布的訓(xùn)練數(shù)據(jù)以及真實數(shù)據(jù);
17、比較單元,配置為基于配置的生成網(wǎng)絡(luò),利用所述訓(xùn)練數(shù)據(jù),得到對應(yīng)的生成數(shù)據(jù)并輸入至損失函數(shù),基于配置的辨別網(wǎng)絡(luò),確定所述真實數(shù)據(jù)對應(yīng)的真實值并輸入至所述損失函數(shù),用于確定所述真實值與所述生成數(shù)據(jù)的差異;
18、迭代單元,配置為所述生成網(wǎng)絡(luò)基于所述損失函數(shù)的差異,對當(dāng)前生成數(shù)據(jù)進行迭代,以使得生成數(shù)據(jù)與所述真實值的差異減??;
19、采樣單元,配置為對迭代后并達到預(yù)定要求的生成數(shù)據(jù)進行采樣處理。
20、本發(fā)明的另一方面還提供了一種電子設(shè)備,所述電子設(shè)備包括:存儲器、處理器及存儲在所述存儲器上并可在所述處理器上運行的計算機程序,所述計算機程序被所述處理器執(zhí)行時實現(xiàn)如上任一項所述的基于dpwgan的恒定時間離散高斯采樣方法的步驟。
21、本發(fā)明的另一方面還提供了一種計算機存儲介質(zhì),所述計算機存儲介質(zhì)上存儲有計算機程序,所述計算機程序被處理器執(zhí)行時實現(xiàn)如上任一項所述的基于dpwgan的恒定時間離散高斯采樣方法的步驟。
22、相較于現(xiàn)有技術(shù),本發(fā)明至少具備以下優(yōu)點:
23、本發(fā)明提供的方法,以生成模型的方式完成離散高斯分布采樣,增強了采樣的時間一致性,從而提高了抵御側(cè)信道攻擊的能力;dpwgan相較于離散二叉樹,不需要預(yù)先存儲概率統(tǒng)計分布表,節(jié)約了存儲空間的開銷;相較于經(jīng)典gan模型,dpwgan使用wasserstein距離替代gan所使用的js距離,對于輸入數(shù)據(jù)與目標(biāo)數(shù)據(jù)的數(shù)據(jù)分布相差過大的情況能夠提供較好的損失函數(shù)最小值求解方案。
1.一種基于dpwgan的恒定時間離散高斯采樣方法,其特征在于,包括:
2.根據(jù)權(quán)利要求1所述基于dpwgan的恒定時間離散高斯采樣方法,其特征在于,所述方法還包括:
3.根據(jù)權(quán)利要求2所述基于三維數(shù)字孿生模型的數(shù)據(jù)維護管理方法,其特征在于,獲取所述真實數(shù)據(jù)后,在所述真實數(shù)據(jù)中添加隨機噪聲,通過下式實現(xiàn):
4.根據(jù)權(quán)利要求3所述基于dpwgan的恒定時間離散高斯采樣方法,其特征在于,所述損失函數(shù)具體包括:
5.一種基于dpwgan的恒定時間離散高斯采樣裝置,其特征在于,包括:
6.一種電子設(shè)備,其特征在于,所述電子設(shè)備包括:存儲器、處理器及存儲在所述存儲器上并可在所述處理器上運行的計算機程序,所述計算機程序被所述處理器執(zhí)行時實現(xiàn)如權(quán)利要求1至4中任一項所述基于dpwgan的恒定時間離散高斯采樣方法的步驟。
7.一種計算機存儲介質(zhì),所述計算機存儲介質(zhì)上存儲有計算機程序,所述計算機程序被處理器執(zhí)行時實現(xiàn)如權(quán)利要求1至4中任一項所述基于dpwgan的恒定時間離散高斯采樣方法的步驟。