社會(huì)網(wǎng)絡(luò)動(dòng)態(tài)發(fā)布中防止標(biāo)簽鄰居攻擊的匿名方法與流程

文檔序號(hào)：11524198閱讀：271來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>電子通信裝置的制造及其應(yīng)用技術(shù)

社會(huì)網(wǎng)絡(luò)動(dòng)態(tài)發(fā)布中防止標(biāo)簽鄰居攻擊的匿名方法與流程

本發(fā)明涉及數(shù)據(jù)隱私保護(hù)技術(shù)領(lǐng)域，具體涉及一種社會(huì)網(wǎng)絡(luò)動(dòng)態(tài)發(fā)布中防止標(biāo)簽鄰居攻擊的匿名方法。

背景技術(shù)：

近年來，隨著互聯(lián)網(wǎng)技術(shù)的蓬勃發(fā)展，社交網(wǎng)絡(luò)軟件也越來越流行，如微博微信和facebook等，這些社交網(wǎng)絡(luò)應(yīng)用為人們提供了方便的溝通平臺(tái)，同時(shí)也產(chǎn)生了大量的有關(guān)用戶的信息。這些信息具有廣泛的用途，如進(jìn)行廣告投放、商品推薦和社會(huì)行為預(yù)測等。社會(huì)網(wǎng)絡(luò)數(shù)據(jù)中包含大量的敏感信息，包括個(gè)人的屬性信息(比如職業(yè)，薪酬等)，個(gè)人的行為信息(比如個(gè)人的社交關(guān)系等)，這些信息如果不進(jìn)行處理就發(fā)布共享，有可能會(huì)侵犯用戶的隱私。因此，社會(huì)網(wǎng)絡(luò)數(shù)據(jù)發(fā)布的隱私保護(hù)問題成為眾多研究者關(guān)注的熱點(diǎn)。

在社會(huì)網(wǎng)絡(luò)數(shù)據(jù)中，通常用標(biāo)簽來表示用戶的個(gè)人信息，例如姓名，性別，年齡，地址，職業(yè)等，用戶可以自己選擇想要隱藏的屬性，被隱藏的屬性是敏感的，而公開的屬性是不敏感的，所以標(biāo)簽分為敏感和非敏感。最常用且直觀的一種匿名方法為簡單匿名，即移除能唯一標(biāo)識(shí)用戶的顯式標(biāo)識(shí)符屬性，只保留用標(biāo)簽表示的屬性。這樣做雖然能夠降低一部分隱私泄露，但是保護(hù)的強(qiáng)度不夠，攻擊者還是能夠通過背景知識(shí)比如度、鄰居結(jié)構(gòu)信息來唯一識(shí)別個(gè)體。因此，在進(jìn)行社會(huì)網(wǎng)絡(luò)分析時(shí)，需要更進(jìn)一步的考慮來保證隱私不被泄露，這些工作主要關(guān)注個(gè)體和關(guān)系泄露。

現(xiàn)有工作主要關(guān)注靜態(tài)網(wǎng)絡(luò)分析，但是很多應(yīng)用涉及到網(wǎng)絡(luò)的動(dòng)態(tài)發(fā)展變化，與靜態(tài)網(wǎng)絡(luò)不同，面向動(dòng)態(tài)網(wǎng)絡(luò)數(shù)據(jù)的隱私保護(hù)提出了更高要求，它不僅是要保證某一時(shí)刻的數(shù)據(jù)滿足匿名要求，由于不同時(shí)刻之間的數(shù)據(jù)還存在內(nèi)在的關(guān)聯(lián)關(guān)系，攻擊者可通過先后時(shí)刻發(fā)布的數(shù)據(jù)進(jìn)行比對而獲得更多的隱私信息，還要保證多次發(fā)布隱私信息的安全，因此，現(xiàn)有的面向靜態(tài)社會(huì)網(wǎng)絡(luò)分析的隱私保護(hù)方法已不適用于動(dòng)態(tài)發(fā)布的隱私保護(hù)的需求。本文針對以上問題，提出了在社會(huì)網(wǎng)絡(luò)動(dòng)態(tài)發(fā)布中防止標(biāo)簽鄰居攻擊的隱私保護(hù)模型。

技術(shù)實(shí)現(xiàn)要素：

本發(fā)明所要解決的是現(xiàn)有隱私保護(hù)方僅基于社會(huì)網(wǎng)絡(luò)靜態(tài)發(fā)布而設(shè)計(jì)，而無法適用于社會(huì)網(wǎng)絡(luò)動(dòng)態(tài)發(fā)布的問題，提供一種社會(huì)網(wǎng)絡(luò)動(dòng)態(tài)發(fā)布中防止標(biāo)簽鄰居攻擊的匿名方法，其能夠在發(fā)布數(shù)據(jù)時(shí)，可以滿足動(dòng)態(tài)網(wǎng)絡(luò)的隱私要求。

為解決上述問題，本發(fā)明是通過以下技術(shù)方案實(shí)現(xiàn)的：

社會(huì)網(wǎng)絡(luò)動(dòng)態(tài)發(fā)布中防止標(biāo)簽鄰居攻擊的匿名方法，包括如下步驟：

步驟1、初始化當(dāng)前時(shí)刻原始的社會(huì)網(wǎng)絡(luò)圖；

步驟2、對社會(huì)網(wǎng)絡(luò)圖中帶敏感標(biāo)簽的節(jié)點(diǎn)根據(jù)結(jié)構(gòu)相似度進(jìn)行分組；

步驟3、對分過組后的帶敏感標(biāo)簽的節(jié)點(diǎn)的鄰居節(jié)點(diǎn)進(jìn)行匹配，使得組內(nèi)節(jié)點(diǎn)的鄰居標(biāo)簽信息相同；

步驟4、對已經(jīng)完成節(jié)點(diǎn)標(biāo)簽匹配操作的標(biāo)簽-鄰居圖進(jìn)行隨機(jī)化，得到隨機(jī)化后的社會(huì)網(wǎng)絡(luò)圖；

步驟5、將隨機(jī)化后的社會(huì)網(wǎng)絡(luò)圖發(fā)布。

上述步驟2的具體過程如下：

步驟3.1、將社會(huì)網(wǎng)絡(luò)數(shù)據(jù)中帶敏感標(biāo)簽節(jié)點(diǎn)集合按度數(shù)降序排列，得到新的節(jié)點(diǎn)集合；

步驟3.2、選擇新的節(jié)點(diǎn)集合中度數(shù)最大的帶敏感標(biāo)簽的節(jié)點(diǎn)，并將該選中的節(jié)點(diǎn)從新的節(jié)點(diǎn)集合中去除；

步驟3.3、計(jì)算選中的帶敏感標(biāo)簽的節(jié)點(diǎn)和新的節(jié)點(diǎn)集合中的每個(gè)節(jié)點(diǎn)的結(jié)構(gòu)相似度，并將該選中的帶敏感標(biāo)簽的節(jié)點(diǎn)及其結(jié)構(gòu)相似度最相似的節(jié)點(diǎn)歸為一組，直到該分組中所包含的節(jié)點(diǎn)個(gè)數(shù)達(dá)到隱私水平l；

步驟3.4、重復(fù)步驟3.2-3.3，直至新的節(jié)點(diǎn)集合中不再含有帶敏感標(biāo)簽的節(jié)點(diǎn)，即完成分組工作。

上述步驟3.1中，將節(jié)點(diǎn)集合按度數(shù)降序排列，得到新的節(jié)點(diǎn)序列。

上述步驟4的具體過程如下：

步驟4.1、對已經(jīng)完成節(jié)點(diǎn)標(biāo)簽匹配操作的標(biāo)簽-鄰居圖隨機(jī)添加和/或刪除邊；即隨機(jī)選取標(biāo)簽-鄰居圖中的任意2個(gè)節(jié)點(diǎn)，如果這2個(gè)節(jié)點(diǎn)之間的邊存在于原始的社會(huì)網(wǎng)絡(luò)圖中，則從標(biāo)簽-鄰居圖中刪除這條邊；否則，將這條邊添加到標(biāo)簽-鄰居圖中；

步驟4.2、為已隨機(jī)添加和/或刪除邊后的標(biāo)簽-鄰居圖中的每一條邊隨機(jī)產(chǎn)生一個(gè)[0，1]的概率，并將該概率作為該條邊存在于標(biāo)簽-鄰居圖的概率。

與現(xiàn)有技術(shù)相比，本發(fā)明具有如下特點(diǎn)：

1、采用基于鄰居標(biāo)簽相似度設(shè)計(jì)的算法gsga(globalsimilarity-basedgroupanonymization)來為節(jié)點(diǎn)分配合適的分組，同時(shí)又考慮了原始社會(huì)網(wǎng)絡(luò)中相同組中節(jié)點(diǎn)的鄰居結(jié)構(gòu)和度信息，用到的strusim方法在此算法的基礎(chǔ)上有所改進(jìn)，來達(dá)到隱私要求；提高組內(nèi)節(jié)點(diǎn)的結(jié)構(gòu)相似度，為下一步的操作做準(zhǔn)備，由此方法得到t時(shí)刻分組后的社會(huì)網(wǎng)絡(luò)圖。

2、采用隨機(jī)擾亂的方法來改變圖結(jié)構(gòu)，隨機(jī)添加刪除邊，然后采用模糊化的方法，每條邊都有相應(yīng)的概率存在于社會(huì)網(wǎng)絡(luò)，使攻擊者不能高于1/l的概率唯一確定帶敏感標(biāo)簽的個(gè)體。

3、僅對帶敏感標(biāo)簽的個(gè)體的標(biāo)簽鄰居信息進(jìn)行擾亂，減少了不確定圖的數(shù)量，提高了數(shù)據(jù)的可用性。

附圖說明

圖1為社會(huì)網(wǎng)絡(luò)動(dòng)態(tài)發(fā)布中防止標(biāo)簽鄰居攻擊的匿名方法的原理圖。

圖2為數(shù)據(jù)匿名分組處理過程。

圖3為數(shù)據(jù)匿名隨機(jī)處理過程。

圖4為不同時(shí)刻輸入的原始社會(huì)網(wǎng)絡(luò)圖，其中(a)t＝1時(shí)刻輸入的原始社會(huì)網(wǎng)絡(luò)圖，(b)t＝2時(shí)刻輸入的原始社會(huì)網(wǎng)絡(luò)圖。

圖5為分組過程圖。

圖6為重構(gòu)過程圖及發(fā)布圖。

具體實(shí)施方式

本發(fā)明用到的社會(huì)網(wǎng)絡(luò)數(shù)據(jù)是帶標(biāo)簽的簡單無向圖，攻擊者的背景知識(shí)可以是任意節(jié)點(diǎn)所在的特定的子圖信息，即鄰居標(biāo)簽信息。社會(huì)網(wǎng)絡(luò)數(shù)據(jù)在發(fā)布前需要進(jìn)行初步的匿名處理，即去掉唯一標(biāo)識(shí)節(jié)點(diǎn)的顯示標(biāo)識(shí)屬性，如姓名等，改用標(biāo)簽表示屬性信息。發(fā)布的圖用gt(v^t；e^t；l^t)表示動(dòng)態(tài)網(wǎng)絡(luò)t時(shí)刻的圖，其中v^t為節(jié)點(diǎn)的集合，表示社會(huì)網(wǎng)絡(luò)中的個(gè)人或其他實(shí)體；e^t表示個(gè)體之間的關(guān)聯(lián)，即圖中邊的集合，表示個(gè)人或?qū)嶓w間的關(guān)系，如朋友、合作關(guān)系。l^t表示個(gè)體的標(biāo)簽的集合。

本發(fā)明提出了一個(gè)動(dòng)態(tài)網(wǎng)絡(luò)多次發(fā)布隱私模型，即dynamic-l-diversity，在這個(gè)模型中，給定一個(gè)在時(shí)刻t帶標(biāo)簽的動(dòng)態(tài)網(wǎng)絡(luò)gt(v^t；vs^t；e^t；l^t)，和一個(gè)隱私閾值l。v^t表示節(jié)點(diǎn)的集合，e^t表示邊的集合，表示帶敏感標(biāo)簽的節(jié)點(diǎn)的集合，l^t表示個(gè)體的標(biāo)簽的集合，γ表示節(jié)點(diǎn)到標(biāo)簽的映射關(guān)系，γ:v^t→l^t。我們提出一個(gè)動(dòng)態(tài)社會(huì)網(wǎng)絡(luò)的隱私模型，節(jié)點(diǎn)的標(biāo)簽鄰居信息作為攻擊者的背景知識(shí)，帶敏感標(biāo)簽的節(jié)點(diǎn)是需要保護(hù)的，就是將原始網(wǎng)絡(luò)gt轉(zhuǎn)化為隨機(jī)化的匿名社會(huì)網(wǎng)絡(luò)gt’，使匿名后的網(wǎng)絡(luò)在動(dòng)態(tài)發(fā)布中滿足l-多樣性要求。即對于任意的帶敏感標(biāo)簽的節(jié)點(diǎn)u∈v^t，至少存在l-1個(gè)帶有不同敏感標(biāo)簽的節(jié)點(diǎn)，但帶有相同的標(biāo)簽-鄰居圖，在t時(shí)刻社會(huì)網(wǎng)絡(luò)g1,g2,g3,...,gt匿名后的社會(huì)網(wǎng)絡(luò)圖g’1,g’2,g’3,...,g’t在動(dòng)態(tài)發(fā)布中滿足l-多樣性要求。能夠有效防止攻擊者使用背景知識(shí)對用戶所在的發(fā)布的數(shù)據(jù)中重新定位。其中標(biāo)簽-鄰居圖表示對于任意的節(jié)點(diǎn)u，節(jié)點(diǎn)u的相關(guān)標(biāo)簽鄰居圖gl(u)＝(gu,nlsu)，其中g(shù)u表示節(jié)點(diǎn)u的one-hop鄰居圖，nlsu節(jié)點(diǎn)u的one-hop鄰居標(biāo)簽。

參見圖1，本發(fā)明中設(shè)計(jì)的數(shù)據(jù)處理方式主要為：首先是初始化數(shù)據(jù)，即去掉顯示的標(biāo)識(shí)屬性，改用標(biāo)簽表示。除此之外，再將帶敏感標(biāo)簽節(jié)點(diǎn)集合按度數(shù)降序排列，得到新的節(jié)點(diǎn)序列。接下來是對帶敏感標(biāo)簽的節(jié)點(diǎn)根據(jù)結(jié)構(gòu)相似度進(jìn)行分組，在此過程中：選擇第一個(gè)帶敏感標(biāo)簽節(jié)點(diǎn)，這里選擇度數(shù)最大的節(jié)點(diǎn)，此時(shí)帶敏感標(biāo)簽的節(jié)點(diǎn)集合除去已選中的節(jié)點(diǎn)，后計(jì)算這個(gè)節(jié)點(diǎn)與中每個(gè)節(jié)點(diǎn)的結(jié)構(gòu)相似度。選擇最相似的帶敏感標(biāo)簽的節(jié)點(diǎn)分到一組，直到組中包含的帶敏感標(biāo)簽節(jié)點(diǎn)個(gè)數(shù)達(dá)到隱私水平l。再選擇下一個(gè)帶敏感標(biāo)簽的節(jié)點(diǎn)，直到帶敏感標(biāo)簽節(jié)點(diǎn)集合為空。如果存在敏感標(biāo)簽個(gè)體的分組中的個(gè)體個(gè)數(shù)小于l，則從組集中移除組g，并將組中節(jié)點(diǎn)根據(jù)結(jié)構(gòu)相似度分到其他組中。然后對分過組的帶敏感標(biāo)簽的節(jié)點(diǎn)的鄰居節(jié)點(diǎn)進(jìn)行匹配，使得最終得到的組內(nèi)節(jié)點(diǎn)的鄰居標(biāo)簽信息相同，最后對完成匹配的標(biāo)簽-鄰居圖進(jìn)行隨機(jī)化，隨機(jī)添加刪除邊，使邊的個(gè)數(shù)不超過某個(gè)閾值。然后把節(jié)點(diǎn)的標(biāo)簽-鄰居圖的邊變成不確定的邊，邊的概率選擇均勻分布[0，1]的概率。最后得到滿足動(dòng)態(tài)社會(huì)網(wǎng)絡(luò)的圖數(shù)據(jù)。

(1)分組處理

當(dāng)一個(gè)新的快照gt，添加或刪除邊的時(shí)候，對帶敏感標(biāo)簽的節(jié)點(diǎn)的子圖結(jié)構(gòu)如果發(fā)生變化，則對發(fā)生變化的節(jié)點(diǎn)進(jìn)行分組，即調(diào)用l-grouping(gt)；然后對分組后的節(jié)點(diǎn)的標(biāo)簽-鄰居圖進(jìn)行隨機(jī)化；如果有新的帶敏感標(biāo)簽的節(jié)點(diǎn)添加到社會(huì)網(wǎng)絡(luò)圖中，則對新添加的所有帶敏感標(biāo)簽節(jié)點(diǎn)進(jìn)行分組，然后對分組后的節(jié)點(diǎn)的標(biāo)簽-鄰居圖進(jìn)行隨機(jī)化。如果帶敏感標(biāo)簽的節(jié)點(diǎn)的標(biāo)簽在t+1時(shí)刻發(fā)生變化，如由b變?yōu)閠，則在t+2時(shí)刻進(jìn)行發(fā)布，即延遲發(fā)布，保證不被攻擊者識(shí)別。針對動(dòng)態(tài)社會(huì)網(wǎng)絡(luò)多次發(fā)布防止標(biāo)簽鄰居攻擊用途中這一具體應(yīng)用，本發(fā)明提出了一種滿足動(dòng)態(tài)社會(huì)網(wǎng)絡(luò)數(shù)據(jù)隱私匿名方法。分組主要的實(shí)現(xiàn)過程如圖2所示。

為了給節(jié)點(diǎn)分配合適的分組，在解決這一問題時(shí)用的是根據(jù)鄰居標(biāo)簽相似度設(shè)計(jì)的算法gsga(globalsimilarity-basedgroupanonymization)來達(dá)到隱私要求，即對于兩個(gè)節(jié)點(diǎn)v1,v2，v1的鄰居標(biāo)簽信息v2的鄰居標(biāo)簽信息鄰居標(biāo)簽相似度越大，表示兩節(jié)點(diǎn)的鄰居標(biāo)簽信息越相似。它們的鄰居標(biāo)簽信息相似度可以計(jì)算如下：

但是此方法中在分組過程中并未考慮原始社會(huì)網(wǎng)絡(luò)中節(jié)點(diǎn)的鄰居結(jié)構(gòu)信息，而本文中提出的strusim方法在此算法的基礎(chǔ)上有所改進(jìn)，(strusim)結(jié)構(gòu)相似度定義如下：

定義(strusim)對于兩個(gè)節(jié)點(diǎn)v1,v2，value1i表示帶標(biāo)簽的節(jié)點(diǎn)v1的第i個(gè)鄰居節(jié)點(diǎn)度信息，v2的第i個(gè)鄰居節(jié)點(diǎn)度信息(value2i)，鄰居標(biāo)簽相似度越大，表示兩節(jié)點(diǎn)的鄰居標(biāo)簽信息越相似。它們的鄰居標(biāo)簽信息相似度可以計(jì)算如下：

步驟1：初始化數(shù)據(jù)集，輸入社會(huì)網(wǎng)絡(luò)g^t，參數(shù)隱私閾值l。

步驟2：將c置為空，將帶敏感標(biāo)簽的節(jié)點(diǎn)集vs^t按度數(shù)進(jìn)行降序排列，以方便后續(xù)程序中節(jié)點(diǎn)的選擇。

步驟3：判斷當(dāng)前的帶敏感標(biāo)簽的節(jié)點(diǎn)集vs^t是否大于l。若是，則根據(jù)標(biāo)簽相似度降序排列。新建組g，將第一個(gè)帶敏感標(biāo)簽節(jié)點(diǎn)us，并到組中然后轉(zhuǎn)到步驟4。否則轉(zhuǎn)到步驟7。

步驟4：判斷當(dāng)前的分組中的節(jié)點(diǎn)個(gè)數(shù)是否小于l。如果小于l，則轉(zhuǎn)到步驟5。否則轉(zhuǎn)到步驟6。

步驟5：保證鄰居標(biāo)簽相似度較大的情況下，找到與us結(jié)構(gòu)相似度strusim最大的節(jié)點(diǎn)umax，并到組中，同時(shí)從剩下的候選敏感標(biāo)簽節(jié)點(diǎn)集中移除umax。直到組中節(jié)點(diǎn)個(gè)數(shù)大于等于l，循環(huán)結(jié)束，轉(zhuǎn)到步驟6。

在步驟5中，從以下方面防止動(dòng)態(tài)發(fā)布鄰居標(biāo)簽信息攻擊，同時(shí)保證數(shù)據(jù)的效用性：在選擇帶敏感標(biāo)簽節(jié)點(diǎn)分組時(shí)，找到鄰居標(biāo)簽相似度較大的情況下，找到結(jié)構(gòu)相似度最大的節(jié)點(diǎn)，方便在隨機(jī)化方法中盡可能小的信息損失量。

步驟6：將現(xiàn)有分組g合并到組集c中，判斷剩余的帶敏感節(jié)點(diǎn)集中的節(jié)點(diǎn)是否大于l，是轉(zhuǎn)到步驟4。否則轉(zhuǎn)到步驟7。

步驟7：判斷當(dāng)前未分組的帶敏感標(biāo)簽節(jié)點(diǎn)個(gè)數(shù)是否為空集。如果是，則轉(zhuǎn)到步驟9。否則轉(zhuǎn)到步驟8。

步驟8：根據(jù)結(jié)構(gòu)相似度，將g中節(jié)點(diǎn)按照結(jié)構(gòu)相似度分到其他組。

步驟9：得到所有的組集中的組。

步驟10：判斷當(dāng)前組集是否為空，如果是，則轉(zhuǎn)到步驟11。否則轉(zhuǎn)到步驟12。

步驟11：取組集中的第一個(gè)組的一個(gè)帶敏感標(biāo)簽的節(jié)點(diǎn)uf，對于任意的ui，計(jì)算出組內(nèi)所有的鄰居標(biāo)簽信息。然后再對組內(nèi)所有的節(jié)點(diǎn)在社會(huì)網(wǎng)絡(luò)中找到所有未匹配的節(jié)點(diǎn)，合并到當(dāng)前的帶敏感標(biāo)簽節(jié)點(diǎn)的標(biāo)簽-鄰居圖cl(v)中。

在步驟11中，首先完成的功能是對于每個(gè)組，合并當(dāng)前組中所有節(jié)點(diǎn)的鄰居標(biāo)簽信息，我們用nlsg表示組中所有節(jié)點(diǎn)的鄰居標(biāo)簽信息。將每個(gè)分組中的帶敏感標(biāo)簽的節(jié)點(diǎn)的標(biāo)簽-鄰居圖的標(biāo)簽鄰居信息與當(dāng)前組的鄰居標(biāo)簽信息nlsg比較，為當(dāng)前簇cl(v)找到未匹配的節(jié)點(diǎn)合并，節(jié)點(diǎn)匹配首先要滿足標(biāo)簽相同，度相似，直到對于組內(nèi)任意節(jié)點(diǎn)v，簇cl(v)內(nèi)的節(jié)點(diǎn)的鄰居標(biāo)簽信息與當(dāng)前組的鄰居標(biāo)簽信息nlsg相同，節(jié)點(diǎn)匹配完成。這里已經(jīng)完成節(jié)點(diǎn)標(biāo)簽匹配的節(jié)點(diǎn)的標(biāo)簽-鄰居圖我們簡稱為簇cl(v).

步驟12：輸出已經(jīng)完成節(jié)點(diǎn)標(biāo)簽匹配后的社會(huì)網(wǎng)絡(luò)圖和組集c。

步驟13：結(jié)束。

(2)隨機(jī)化處理

輸入已經(jīng)完成節(jié)點(diǎn)標(biāo)簽匹配后的社會(huì)網(wǎng)絡(luò)圖和組集c，將簇cl(v)的邊全部放到邊集es中，并隨機(jī)選擇簇cl(v)中的節(jié)點(diǎn)u,v∈vcl(v)，如果邊(u，v)原本就存在ecl(v)中，從es中刪除(u，v)；如果邊(u，v)不存在ecl(v)中，就添加邊(u，v)，直到|es|＝β|ecl(v)|。β取值大于0，β的取值除了子圖原本就是完全圖的狀態(tài)，取值范圍為(0，1)，因?yàn)檫叢荒茉偬砑恿?，除此之外，取值大?即可。得到邊為es的子圖后，對于產(chǎn)生0-1之間均勻分布的概率，用來混淆邊存在的概率。圖3為隨機(jī)化的實(shí)現(xiàn)流程圖。

步驟1：輸入已經(jīng)完成節(jié)點(diǎn)標(biāo)簽匹配后的社會(huì)網(wǎng)絡(luò)圖，組集c和參數(shù)β。

步驟2：判斷gs是否不為空集。若是，則轉(zhuǎn)到步驟3。否則轉(zhuǎn)到步驟9。

步驟3：判斷當(dāng)前的帶敏感標(biāo)簽的節(jié)點(diǎn)的鄰居-標(biāo)簽圖的集合是否不為空。若為空，則轉(zhuǎn)到步驟2，否則轉(zhuǎn)到步驟9。

步驟4：將已經(jīng)匹配好的節(jié)點(diǎn)標(biāo)簽-鄰居圖的邊全部放到es中。轉(zhuǎn)到步驟5。

步驟5：判斷|es|是否等于β|ecl(v)|。如果是，則轉(zhuǎn)到步驟6。否則轉(zhuǎn)到步驟7。

步驟6：得到邊為es的子圖后，對子圖的邊產(chǎn)生0-1之間均勻分布的概率。

步驟7：并隨機(jī)選擇已經(jīng)匹配好節(jié)點(diǎn)的標(biāo)簽-鄰居圖cl(v)中的節(jié)點(diǎn)u,v∈vcl(v)，轉(zhuǎn)到步驟8。

步驟8：判斷邊(u，v)是否屬于邊集ecl(v)，如果邊(u，v)原本就已經(jīng)存在邊集ecl(v)中，從es中刪除(u，v)；如果邊(u，v)不存在ecl(v)中，就添加邊(u，v)。直到|es|等于β|ecl(v)|。

步驟9：輸出t時(shí)刻的匿名后的社會(huì)網(wǎng)絡(luò)圖gt’。

步驟10：結(jié)束。

下面通過一個(gè)具體實(shí)例，對本發(fā)明效果進(jìn)行進(jìn)一步說明：

原始圖：gt，l＝2，t＝1，2。圖4為t＝1時(shí)刻和t＝2時(shí)刻輸入的原始社會(huì)網(wǎng)絡(luò)圖，其中節(jié)點(diǎn)a,c是帶敏感標(biāo)簽的節(jié)點(diǎn)。

為了使得每個(gè)組內(nèi)的節(jié)點(diǎn)有相同的鄰居標(biāo)簽信息，我們對節(jié)點(diǎn)進(jìn)行適當(dāng)?shù)姆纸M，所以在相同組內(nèi)的1-鄰居圖和標(biāo)簽信息是同構(gòu)的。帶有非敏感標(biāo)簽的節(jié)點(diǎn)需要插入圖中，使得節(jié)點(diǎn)的標(biāo)簽-鄰居圖在每個(gè)組內(nèi)是同構(gòu)的，并且組內(nèi)節(jié)點(diǎn)不少于l個(gè)。我們用以下指標(biāo)對節(jié)點(diǎn)進(jìn)行分組：鄰居標(biāo)簽相似度(nlss)。對于兩個(gè)節(jié)點(diǎn)，v1的鄰居標(biāo)簽信息(nlsv1)和v2的鄰居標(biāo)簽信息(nlsv2)，他們的鄰居標(biāo)簽信息相似度可以計(jì)算為：

初始化數(shù)據(jù)：將t＝1時(shí)刻帶敏感標(biāo)簽的節(jié)點(diǎn)按度數(shù)排序v：{4，3，3}。

敏感標(biāo)簽節(jié)點(diǎn)分組l-grouping(gt)：

假設(shè)l＝2。首先節(jié)點(diǎn)度降序排列后，節(jié)點(diǎn)a的鄰居標(biāo)簽信息為{b，b，d，t}，節(jié)點(diǎn)c的鄰居標(biāo)簽信息為{b，b，d}，節(jié)點(diǎn)f鄰居標(biāo)簽信息為{b，b，d}，我們首先考慮帶敏感標(biāo)簽的節(jié)點(diǎn)a，根據(jù)鄰居標(biāo)簽相似度降序排列帶敏感標(biāo)簽的節(jié)點(diǎn)序列為{a，c，f}，并且為節(jié)點(diǎn)a創(chuàng)建一個(gè)組g，根據(jù)這個(gè)例子，我們建立一個(gè)鄰接矩陣如表1所示，通過strusim得到：

表1：節(jié)點(diǎn)的one-hop鄰域的鄰接矩陣w

節(jié)點(diǎn)a和c結(jié)構(gòu)相似度，節(jié)點(diǎn)a和c結(jié)構(gòu)相似度s(a，c)為0.8，節(jié)點(diǎn)a與節(jié)點(diǎn)c的結(jié)構(gòu)相似度最大，所以當(dāng)前的帶不同敏感標(biāo)簽的節(jié)點(diǎn)的分組為g＝{a，c}，很顯然，對于節(jié)點(diǎn)f，如果不存在沒有分組其他帶敏感標(biāo)簽的節(jié)點(diǎn)，就將節(jié)點(diǎn)f分到現(xiàn)有的分組g中。然后對組集c的組內(nèi)節(jié)點(diǎn)的標(biāo)簽-鄰居圖進(jìn)行合并節(jié)點(diǎn)操作，通過遍歷組內(nèi)節(jié)點(diǎn)的nlsg＝{b，b，d，t}，對組內(nèi)節(jié)點(diǎn)a和節(jié)點(diǎn)c的標(biāo)簽-鄰居圖進(jìn)行節(jié)點(diǎn)標(biāo)簽匹配操作，節(jié)點(diǎn)r1,r2,r3和節(jié)點(diǎn)x1,x2,x3匹配，然而節(jié)點(diǎn)r4在節(jié)點(diǎn)c的標(biāo)簽-鄰居圖中找不到與其相匹配的節(jié)點(diǎn)，所以我們找到社會(huì)網(wǎng)絡(luò)中未匿名的節(jié)點(diǎn)x4與r4匹配，并且標(biāo)簽都為t。直到所有帶敏感標(biāo)簽節(jié)點(diǎn)的鄰居圖匹配結(jié)束，循環(huán)結(jié)束。參見圖5。

隨機(jī)化處理：對于隨機(jī)化處理，對同組內(nèi)的已經(jīng)完成節(jié)點(diǎn)標(biāo)簽匹配的節(jié)點(diǎn)的標(biāo)簽-鄰居圖進(jìn)行隨機(jī)化處理。節(jié)點(diǎn)f先不做考慮。例如，在圖6的g1是t＝1時(shí)刻的2-分組社會(huì)網(wǎng)絡(luò)圖，β＝0.9，對組內(nèi)帶敏感標(biāo)簽的節(jié)點(diǎn){a，c}的匹配過的標(biāo)簽-鄰居圖進(jìn)行隨機(jī)化，即對簇cl(a)和cl(c)進(jìn)行隨機(jī)化，對子圖cl(a)，隨機(jī)選擇兩個(gè)節(jié)點(diǎn)的邊(u，v)，并判斷邊是否存在簇cl(a)中，不存在則添加邊，否則刪除邊。直到cl(a)中的邊數(shù)為β|ecl(v)|＝5(向下取整)；對簇cl(c)，隨機(jī)選擇兩個(gè)節(jié)點(diǎn)(u，v)，并判斷是否存在簇cl(c)中，不存在則添加邊，否則刪除邊。直到簇cl(c)中的邊數(shù)為4；圖6中的g1’即為圖g1中第一個(gè)分組隨機(jī)化后的結(jié)果。由于t＝2時(shí)刻，邊發(fā)生變化，對發(fā)生變化的帶敏感標(biāo)簽的子圖進(jìn)行重新分組，然后對節(jié)點(diǎn)進(jìn)行隨機(jī)化處理，同樣的方法來重構(gòu)圖t＝2時(shí)刻的g2，圖6中的g2’即為最后要發(fā)布的匿名圖。

隨機(jī)化的過程中，只是隨機(jī)添加刪除少量的邊，通過隨機(jī)化的方法來混淆圖，除此之外，每個(gè)分組都是大于等于l的，因此，對于社會(huì)網(wǎng)絡(luò)圖中的任意一個(gè)節(jié)點(diǎn)v來說，在發(fā)布的匿名圖中至少有l(wèi)-1個(gè)節(jié)點(diǎn)與之不可區(qū)分，所以，在發(fā)布的社會(huì)網(wǎng)絡(luò)圖中，攻擊者能成功重識(shí)別目標(biāo)節(jié)點(diǎn)的概率不會(huì)超過1/l，即達(dá)到了l匿名的隱私要求。同時(shí)對子圖引入不確定邊的方法，即使在動(dòng)態(tài)發(fā)布的情況下，攻擊者也不能唯一確定個(gè)體。同時(shí)，本發(fā)明提出的防止動(dòng)態(tài)網(wǎng)絡(luò)多次發(fā)布社會(huì)網(wǎng)絡(luò)標(biāo)簽鄰居攻擊的方法可以方便用戶直接對發(fā)布的數(shù)據(jù)進(jìn)行分析，除此之后，此方法對原始社會(huì)網(wǎng)絡(luò)中原始圖結(jié)構(gòu)保護(hù)效果明顯。

匿名化處理：當(dāng)一個(gè)新的快照gt出現(xiàn)，分情況對社會(huì)網(wǎng)絡(luò)圖進(jìn)行處理。情況1，帶敏感標(biāo)簽節(jié)點(diǎn)子圖添加或刪除邊的時(shí)候，對帶敏感標(biāo)簽的節(jié)點(diǎn)的子圖結(jié)構(gòu)如果發(fā)生變化，則對發(fā)生變化的節(jié)點(diǎn)進(jìn)行分組，即調(diào)用敏感節(jié)點(diǎn)分組算法l-grouping(gt)；然后對分組后的節(jié)點(diǎn)的1-鄰居子圖進(jìn)行隨機(jī)化；情況2，如果有新的帶敏感標(biāo)簽的節(jié)點(diǎn)添加到社會(huì)網(wǎng)絡(luò)圖中，則對新添加的所有帶敏感標(biāo)簽節(jié)點(diǎn)進(jìn)行分組，然后對分組后的節(jié)點(diǎn)的標(biāo)簽-鄰居圖進(jìn)行隨機(jī)化。情況3，如果帶敏感標(biāo)簽的節(jié)點(diǎn)的標(biāo)簽在t+1時(shí)刻發(fā)生變化，如由b變?yōu)閠，則在t+2時(shí)刻進(jìn)行發(fā)布，即延遲發(fā)布，保證不被攻擊者識(shí)別。

匿名方法程度檢驗(yàn)：以下為本發(fā)明設(shè)計(jì)的算法在本例中的社會(huì)網(wǎng)絡(luò)圖數(shù)據(jù)匿名前后保護(hù)帶敏感標(biāo)簽個(gè)體的情況。

t＝1，t＝2時(shí)刻如果攻擊者知道個(gè)體a的標(biāo)簽-鄰居圖，通過隨機(jī)化處理，個(gè)體a的匿名發(fā)布的標(biāo)簽-鄰居圖不再是原始圖中標(biāo)簽-鄰居圖。并且個(gè)體c也有相似的標(biāo)簽-鄰居圖，t＝2時(shí)刻也有標(biāo)簽-鄰居圖的變化。攻擊者不能以高于1/2的概率識(shí)別個(gè)體a，通過比對兩次發(fā)布的社會(huì)網(wǎng)絡(luò)圖，攻擊者不能唯一確定個(gè)體a及她的屬性l，因?yàn)閍不是是唯一的節(jié)點(diǎn)度發(fā)生變化，并且匹配不到正確的標(biāo)簽-鄰居圖，也就找不到a個(gè)體，所以a及她的職業(yè)不會(huì)被泄露。

完整全部詳細(xì)技術(shù)資料下載

當(dāng)前第1頁1 2

該技術(shù)已申請專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：李先賢;胡曉依;雷聰;許元馨;王利娥
技術(shù)所有人：廣西師范大學(xué)
我是此專利的發(fā)明人

該領(lǐng)域下的技術(shù)專家
如您需求助技術(shù)專家，請點(diǎn)此查看客服電話進(jìn)行咨詢。
1、王老師：1.數(shù)字信號(hào)處理 2.傳感器技術(shù)及應(yīng)用 3.機(jī)電一體化產(chǎn)品開發(fā) 4.機(jī)械工程測試技術(shù) 5.逆向工程技術(shù)研究
2、王老師：1.機(jī)器人 2.嵌入式控制系統(tǒng)開發(fā)
3、孫老師：1.振動(dòng)信號(hào)時(shí)頻分析理論與測試系統(tǒng)設(shè)計(jì) 2.汽車檢測系統(tǒng)設(shè)計(jì) 3.汽車電子控制系統(tǒng)設(shè)計(jì)
4、畢老師：機(jī)構(gòu)動(dòng)力學(xué)與控制
5、袁老師：1.計(jì)算機(jī)視覺 2.無線網(wǎng)絡(luò)及物聯(lián)網(wǎng)
如您是高校老師，可以點(diǎn)此聯(lián)系我們加入專家?guī)臁?/a>

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評論。精彩留言會(huì)獲得點(diǎn)贊！

精彩留言，會(huì)給你點(diǎn)贊！

国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

社會(huì)網(wǎng)絡(luò)動(dòng)態(tài)發(fā)布中防止標(biāo)簽鄰居攻擊的匿名方法與流程