理效率的比較圖;
[0036] 圖6為驗(yàn)證性試驗(yàn)中本發(fā)明的算法魯棒性分析示意圖。
【具體實(shí)施方式】
[0037] 下面結(jié)合附圖對(duì)本發(fā)明做進(jìn)一步詳細(xì)描述:
[0038] 本發(fā)明所述的基于數(shù)據(jù)染色的隱私保護(hù)方法包括以下步驟:
[0039] 1)獲取數(shù)據(jù)版權(quán)標(biāo)識(shí)信息,采用數(shù)據(jù)版權(quán)標(biāo)識(shí)信息經(jīng)Hash算法加密得到信息摘 要S,再根據(jù)所述信息摘要S得云模型的期望Ex、熵En及超熵He,然后將云模型的期望Ex、 熵En及超熵He作為輸入?yún)?shù)輸入到前向顏色生成器算法CG中,得N組第一顏色定量值;
[0040] 2)通過步驟1)得到的N組第一顏色定量值對(duì)用戶的數(shù)據(jù)集進(jìn)行染色,然后將染色 的數(shù)據(jù)上傳至云服務(wù)器中;
[0041] 3)采用數(shù)據(jù)染色算法的逆過程從染色的數(shù)據(jù)集中提取出所述N組第二顏色定量 值U1, X2,…,xN},再將所述N組第二顏色定量值U1, X2,…,xN}輸入到逆向顏色生成器算法 中,得提取過程中的期望Ex'、熵En'及超熵He';
[0042] 4)將步驟3)得到的提取過程中的期望Ex'、熵En'及超熵He'、步驟1)得到的 云模型的期望Ex、熵En及超熵He、以及用戶預(yù)設(shè)的相似度閥值σ。作為輸入?yún)?shù)輸入到前 向顏色生成器算法中,產(chǎn)生N組第三顏色定量值,并將得到的N組第三顏色定量值按大小進(jìn) 行排序,再篩選出有效范圍[Ex u-3Enu,Exu+3Enu]和[Εχν-3Εη ν,Εχν+3Εην]內(nèi)的第三顏色定量 值,然后在有效范圍[Ex u-3Enu,Exu+3Enu]和[Εχν-3Εη ν,Εχν+3Εην]內(nèi),計(jì)算云模型的期望Εχ、 熵En及超熵He與提取過程中的期望E?、熵EY及超熵的相似度,當(dāng)所述相似度大 于等于用戶預(yù)設(shè)的相似度閥值σ。時(shí),服務(wù)器則將染色的數(shù)據(jù)集授權(quán)給用戶。
[0043] 信息摘要S的表達(dá)式為:
[0044] S = M1M2 …M32 (1)
[0045] 其中,信息摘要的第i位,1彡i彡32。
[0046] 步驟1)中再根據(jù)所述信息摘要S得云模型的期望Ex、熵En及超熵He的具體操作 為:將信息摘要S分為子序列Sp &及S 3,再分別計(jì)算出子序列Sp &及S 3的浮點(diǎn)型數(shù)據(jù), 然后將子序列&及S 3的浮點(diǎn)型數(shù)據(jù)依次作為云模型的望Ex、熵En和超熵He,其中,
[0047]
[0048] V. ^ M及超熵He作為輸入?yún)?shù)輸入到前向顏色生成 器算法CG中,得N組第一顏色定量值的具體操作為:
[0049] 將云模型的期望Ex、熵En和超熵He、以及參數(shù)N作為輸入?yún)?shù)輸入到前向 顏色生成器算法中,得以云模型的熵En為期望、超熵He為方差的正態(tài)隨機(jī)數(shù)En 1'= NORM (En,He2),并計(jì)算以期望Ex為期望、En/為方差的正態(tài)隨機(jī)數(shù)X1= NORM (En,En/ 2), 再根據(jù)En /得隸屬度A ,然后再根據(jù)隸屬度#; 輸出N組第一顏色定量 值。
[0050] 步驟2)的具體操作為:
[0051] 對(duì)染色密鑰k和數(shù)據(jù)記錄的關(guān)鍵字1進(jìn)行歸一化處理,再以歸一化得到的結(jié)果作 為Chebyshev混純序列的初值輸入到Chebyshev混純序列發(fā)生器中進(jìn)行混純計(jì)算,然后根 據(jù)混沌計(jì)算的結(jié)果Cl 1及染色間隔值參數(shù)p判斷數(shù)據(jù)集中的數(shù)據(jù)元組是否能夠進(jìn)行染色,當(dāng) 該數(shù)據(jù)元組能夠進(jìn)行染色時(shí),則在數(shù)據(jù)集中選擇屬性A,,當(dāng)所選擇的屬性A,存在冗余空間 時(shí),則根據(jù)數(shù)據(jù)元組的規(guī)模大小和精度確定選擇的屬性A,能夠染色的LSB位數(shù),再通過步 驟1)得到的N組第一顏色定量值替換選擇的屬性A,的后ε ,位數(shù)據(jù),完成數(shù)據(jù)的染色,然 后再將染色的數(shù)據(jù)上傳至服務(wù)器中。
[0052] 判斷所選擇的屬性Aj是否存在冗余空間的具體操作為:
[0053] 預(yù)設(shè)待判斷選擇的屬性Aj的充許誤差c%,則該選擇的屬性A ^的冗余度e為
[0054]
[0055] 當(dāng)e彡0,則選擇的屬性、存在冗余空間。
[0056] 步驟3)中將所述N組第二顏色定量值{Xl,X2,…,x N}輸入到逆向顏色生成器算法 中,得提取過程中的期望Ex^、熵EY及超熵的具體操作為:
[0057] 將N組第二顏色定量值{Xl,X2,…,xN}輸入到逆向顏色生成器算法中,得均值
,然后計(jì)算提取過程中的期望Ex'、熵En'及超 /V ' i y - I 熵He,,其中,銳' ,
[0058] 根據(jù)混沌計(jì)算的結(jié)果Cl1及染色間隔值參數(shù)p判斷數(shù)據(jù)集中的數(shù)據(jù)元組是否能夠 進(jìn)行染色的具體操作為:
[0059] a)將混沌計(jì)算的結(jié)果Cl1與染色間隔值參數(shù)p連成一個(gè)字符串,所述字符串通過單 向Hash算法轉(zhuǎn)化為32位十六進(jìn)制序列;
[0060] b)將步驟a)中產(chǎn)生的32位十六進(jìn)制序列轉(zhuǎn)化為十進(jìn)制數(shù);
[0061] c)通過步驟b)得到的十進(jìn)制數(shù)除以λ,當(dāng)步驟b)得到的十進(jìn)制數(shù)除以λ的余 數(shù)為零時(shí),則當(dāng)前數(shù)據(jù)元組能夠進(jìn)行染色,其中,λ為數(shù)據(jù)集中數(shù)據(jù)元組的總數(shù)與N的商。 [0062] 本發(fā)明在使用過程中,當(dāng)數(shù)據(jù)泄露時(shí),可以有效地進(jìn)行數(shù)據(jù)歸屬權(quán)認(rèn)證,抵制非法 用戶的攻擊,本發(fā)明允許用戶將加密后的數(shù)據(jù)上傳至服務(wù)器中,不僅可以保護(hù)用戶隱私數(shù) 據(jù)不受外部攻擊,支持靈活的數(shù)據(jù)訪問方式,同時(shí)防止存儲(chǔ)服務(wù)提供商非法傳播篡改用戶 的隱私數(shù)據(jù)。
[0063] 在使用過程中,如果未授權(quán)用戶UDU(Unauthorized Data Users)非法獲取用戶 隱私數(shù)據(jù),由于數(shù)據(jù)是經(jīng)過染色處理后的,未授權(quán)用戶UDU無法確定數(shù)據(jù)可用性程度的高 低,進(jìn)而無法確定獲取的信息價(jià)值量的大小,在一定程度上也可以保護(hù)用戶數(shù)據(jù)的安全。此 外,如果未授權(quán)用戶篡改或傳播用戶的數(shù)據(jù),數(shù)據(jù)擁有者可采集部分疑似泄漏的數(shù)據(jù),通過 染色提取方法和逆向顏色生成器計(jì)算出實(shí)際數(shù)據(jù)的云模型參數(shù)Ex'、En'和He',并結(jié)合原 有的參數(shù)Ex、En和He,通過顏色相似度匹配方法確定數(shù)據(jù)的所有者,進(jìn)而可以追究泄漏數(shù) 據(jù)的服務(wù)提供商和未授權(quán)用戶UDU的責(zé)任,達(dá)到保護(hù)數(shù)據(jù)的目的。對(duì)于授權(quán)數(shù)據(jù)使用者 ADU (Authorized Data Users),在得到云模型參數(shù)Ex、En和He和染色后的數(shù)據(jù),需要顏色 相似度匹配方法來確定數(shù)據(jù)的可用性程度的高低,進(jìn)而判斷數(shù)據(jù)的有效性。
[0064] 驗(yàn)證性試驗(yàn)
[0065] 為了說明本發(fā)明的性能,利用本發(fā)明的方法和基于k_匿名算法的隱私保護(hù)方法 進(jìn)行比較實(shí)驗(yàn),實(shí)驗(yàn)主要是在選定的數(shù)據(jù)集上進(jìn)行算法測試,數(shù)據(jù)集來源于UCI人工智能 與數(shù)據(jù)挖掘?qū)嶒?yàn)室提供的公開Forest CoverType Database數(shù)據(jù)集,該數(shù)據(jù)集以二維表的 形式描述了美國的森林覆蓋情況,數(shù)據(jù)集共有581012個(gè)數(shù)據(jù)元組,通過對(duì)該數(shù)據(jù)集進(jìn)行預(yù) 處理,從所有的54個(gè)屬性中選取10個(gè)有意義的數(shù)值型屬性進(jìn)行實(shí)驗(yàn),并將該數(shù)據(jù)集作為實(shí) 驗(yàn)的染色載體,本次實(shí)驗(yàn)驗(yàn)證從運(yùn)行效率、魯棒性及參數(shù)誤差的方面進(jìn)行測試分析,實(shí)驗(yàn)測 試分析具體如下:
[0066] 算法性能測試分析:數(shù)據(jù)染色方法包括染色密鑰歸一化操作、數(shù)據(jù)元組的選取、屬 性的判斷、執(zhí)行染色等操作,實(shí)驗(yàn)中分別采用本文的基于數(shù)據(jù)染色的隱私保護(hù)方法本發(fā)明 和基于k_匿名算法對(duì)數(shù)據(jù)處理,分析各自的執(zhí)行時(shí)間,依次取不同比例的數(shù)據(jù)集進(jìn)行數(shù)據(jù) 染色處理,得到的實(shí)驗(yàn)結(jié)果如圖5所示,由于基于數(shù)據(jù)染色的隱私保護(hù)方法本發(fā)明的計(jì)算 復(fù)雜性低于傳統(tǒng)的加密算法,隨著測試數(shù)據(jù)集數(shù)據(jù)量的增大,本發(fā)明的基于數(shù)據(jù)染色的隱 私保護(hù)方法可有效追蹤隱私泄露情況,降低用戶隱私泄露的風(fēng)險(xiǎn),同時(shí)與k-匿名方法相比 在效率方面提升了 18. 5%,顯示出明顯的優(yōu)勢(shì)。
[0067] 算法魯棒性測試分析:對(duì)染色后的數(shù)據(jù)進(jìn)行攻擊測試,其中,包括數(shù)據(jù)子集增加攻 擊、數(shù)據(jù)子集選擇攻擊及數(shù)據(jù)子集更改攻擊。在分析兩種方法的魯棒性時(shí),需