一種垂直分布式關(guān)聯(lián)規(guī)則挖掘隱私信息保護方法與流程

文檔序號：11276747閱讀：307來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>計算;推算;計數(shù)設(shè)備的制造及其應(yīng)用技術(shù)

一種垂直分布式關(guān)聯(lián)規(guī)則挖掘隱私信息保護方法與流程

本發(fā)明涉及數(shù)據(jù)挖掘技術(shù)領(lǐng)域，特別涉及一種垂直分布式關(guān)聯(lián)規(guī)則挖掘隱私信息保護方法。

背景技術(shù)：

伴隨著數(shù)據(jù)挖掘技術(shù)在各個領(lǐng)域的廣泛應(yīng)用，數(shù)據(jù)挖掘?qū)τ脩舻碾[私和數(shù)據(jù)安全所造成的威脅越來越引起人們的關(guān)注。在涉及企業(yè)敏感數(shù)據(jù)(如電子病歷中包含的醫(yī)院醫(yī)療業(yè)務(wù)或財務(wù)狀況)或個人隱私信息(如電子病歷中包含的患者隱私病癥)的各種數(shù)據(jù)挖掘日常應(yīng)用中，對于如何提高數(shù)據(jù)的安全性引起了學(xué)者的廣泛關(guān)注。

目前國內(nèi)外的隱私保護數(shù)據(jù)挖掘算法主要有基于數(shù)據(jù)擾亂的、基于查詢限制等方法，在分布式環(huán)境下主要有基于查詢限制或數(shù)據(jù)擾亂和查詢限制混合使用等方法。數(shù)據(jù)擾亂首先通過數(shù)據(jù)離散化、數(shù)據(jù)隨機變換和增加噪聲等操作對原始數(shù)據(jù)進行干擾，對干擾后的數(shù)據(jù)進行挖掘，減少挖掘中隱私的泄漏；查詢限制則是通過數(shù)據(jù)隱藏、抽樣、劃分或加密等方式，再利用概率統(tǒng)計或分布式計算的方法得到挖掘結(jié)果，以達到保護數(shù)據(jù)的目的。目前分布式環(huán)境下關(guān)聯(lián)規(guī)則挖掘隱私保護算法較多的使用同態(tài)加密技術(shù)，該技術(shù)最主要的特點是對經(jīng)過同態(tài)加密的數(shù)據(jù)進行處理得到一個輸出，將這一輸出進行解密，其結(jié)果與用同一方法處理未加密的原始數(shù)據(jù)得到的輸出結(jié)果是一樣的。在將該技術(shù)運用在分布式關(guān)聯(lián)規(guī)則挖掘中時，私鑰擁有者容易通過兩兩計算站點的信息，獲得足夠多的方程組后，解出各站點數(shù)據(jù)集中項集的支持度信息造成隱私泄漏。

技術(shù)實現(xiàn)要素：

針對現(xiàn)有技術(shù)存在的不足，本發(fā)明提出一種垂直分布式關(guān)聯(lián)規(guī)則挖掘隱私信息保護方法，增強在垂直分布式環(huán)境下關(guān)聯(lián)規(guī)則挖掘中各站點支持度和個體信息的安全性，圖2是分布式數(shù)據(jù)挖掘框架。

主要思想如下:

(1)在對站點的數(shù)據(jù)進行挖掘之前，首先使用部分隨機化回答方法對原始數(shù)據(jù)集進行隱藏與干擾，對隱藏與干擾后的數(shù)據(jù)進行挖掘，再通過重構(gòu)方法重構(gòu)出數(shù)據(jù)中包含的項的支持度，保護站點原始數(shù)據(jù)的安全性的同時，通過重構(gòu)項集支持度來保證數(shù)據(jù)的準確性。

(2)在計算分布在各站點中的數(shù)據(jù)的項的支持度時，各站點先對數(shù)據(jù)進行paillier算法加密，paillier算法具有加法同態(tài)加密性質(zhì)，站點之間通過對已加密的項的數(shù)據(jù)進行相加操作，高效安全地求出項集的全局支持度。

附圖說明

圖1是方法流程圖；

圖2是分布式數(shù)據(jù)挖掘框架。

具體實施方式

一種垂直分布式關(guān)聯(lián)規(guī)則挖掘隱私信息保護方法，如圖1所示，包含以下步驟：

若k＝1，即判斷1-項集是否為頻繁項集，通過統(tǒng)計該1-項集存在的事務(wù)個數(shù)，即來計算出該1-項集的支持數(shù)，并根據(jù)給定的最小支持度來判斷該1-項集是否為頻繁項集。

若k≥2，則采用以下方法：

(1)各站點si(1≤i≤n)產(chǎn)生paillier加密算法密鑰對(ei,di)，并把公鑰ei發(fā)送給dsc，在dsc向站點發(fā)送數(shù)據(jù)時，先使用與該站點相應(yīng)的公鑰ei對數(shù)據(jù)進行加密，保證數(shù)據(jù)在傳輸中的安全性；

(2)dsc產(chǎn)生paillier加密算法密鑰對(pk,sk)和隨機干擾參數(shù)p1，p2，使用ei對公鑰pk、和參數(shù)p1，p2進行加密并發(fā)送到各站點，在站點向其他站點或者dsc發(fā)送數(shù)據(jù)時，先使用公鑰pk對數(shù)據(jù)進行加密，保證數(shù)據(jù)在傳輸中的安全性；

(3)站點si根據(jù)從dsc接收到的隨機干擾參數(shù)p1和p2并行使用部分隨機化回答方法對原始數(shù)據(jù)進行隱藏與擾亂；

(4)當si擁有多個頻繁項集時，對每個事務(wù)向量(事務(wù)向量表示該項在事務(wù)中的存在情況)進行相加運算，得出新的事務(wù)向量

(5)si使用公鑰pk對進行paillier同態(tài)加密，并發(fā)送到下一個站點si+1，si+1站點對其自身的數(shù)據(jù)同樣使用pk進行加密，將得到的結(jié)果與接收到的數(shù)據(jù)進行相加運算，把最后的結(jié)果發(fā)送到下一個站點，最后一個站點運算后把最后的結(jié)果發(fā)送給dsc。

(6)dsc將接收到的結(jié)果進行解密，即得到該項集隱藏與擾亂后的全局事務(wù)向量，通過重構(gòu)方法重構(gòu)出原始數(shù)據(jù)中的k-項集的全局事務(wù)向量，最后統(tǒng)計出k-項集的事務(wù)向量中“k”出現(xiàn)的次數(shù)，即為k-項集的全局支持數(shù)。

以上對本發(fā)明的具體實施例進行了描述。需要理解的是，本發(fā)明并不局限于上述特定實施方式，本領(lǐng)域技術(shù)人員可以在權(quán)利要求的范圍內(nèi)做出各種變形或修改，這并不影響本發(fā)明的實質(zhì)內(nèi)容。

技術(shù)特征：

技術(shù)總結(jié)
目前國內(nèi)外的隱私保護數(shù)據(jù)挖掘算法存在不足，例如，目前分布式環(huán)境下關(guān)聯(lián)規(guī)則挖掘隱私保護算法較多的使用同態(tài)加密技術(shù)，在將該技術(shù)運用在分布式關(guān)聯(lián)規(guī)則挖掘中時，私鑰擁有者容易通過兩兩計算站點的信息，獲得足夠多的方程組后，解出各站點數(shù)據(jù)集中項集的支持度信息造成隱私泄漏。針對現(xiàn)有技術(shù)的不足，本發(fā)明提出了一種垂直分布式關(guān)聯(lián)規(guī)則挖掘隱私信息保護方法。該方法使用了部分隱藏的隨機化回答方法對各站點原始數(shù)據(jù)進行擾亂與隱藏，引入半可信第三方，各站點計算得到本地持有的項集事務(wù)向量，利用Paillier加密算法統(tǒng)計出項集全局事務(wù)向量，由第三方進行解密并得到項集全局支持度。本發(fā)明方法提高了支持數(shù)的計算效率和安全性。

技術(shù)研發(fā)人員：凌捷;張燕平;謝銳;柳毅;楊育斌
受保護的技術(shù)使用者：廣東工業(yè)大學(xué)
技術(shù)研發(fā)日：2017.05.23
技術(shù)公布日：2017.09.26

完整全部詳細技術(shù)資料下載

該技術(shù)已申請專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：凌捷;張燕平;謝銳;柳毅;楊育斌
技術(shù)所有人：廣東工業(yè)大學(xué)
我是此專利的發(fā)明人

上一篇：阿比特龍衍生物的制備方法及其新固態(tài)形式和用途與流程
上一篇：一種Z型稀有人參皂苷的儲存方法與流程

該領(lǐng)域下的技術(shù)專家
如您需求助技術(shù)專家，請點此查看客服電話進行咨詢。
1、李老師：1.計算力學(xué) 2.無損檢測
2、畢老師：機構(gòu)動力學(xué)與控制
3、袁老師：1.計算機視覺 2.無線網(wǎng)絡(luò)及物聯(lián)網(wǎng)
4、王老師：1.計算機網(wǎng)絡(luò)安全 2.計算機仿真技術(shù)
5、王老師：1.網(wǎng)絡(luò)安全；物聯(lián)網(wǎng)安全、大數(shù)據(jù)安全 2.安全態(tài)勢感知、輿情分析和控制 3.區(qū)塊鏈及應(yīng)用
如您是高校老師，可以點此聯(lián)系我們加入專家?guī)臁?/a>

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評論。精彩留言會獲得點贊！

精彩留言，會給你點贊！

關(guān)聯(lián)規(guī)則挖掘算法相關(guān)技術(shù)

關(guān)聯(lián)規(guī)則挖掘相關(guān)技術(shù)

關(guān)聯(lián)規(guī)則數(shù)據(jù)挖掘算法相關(guān)技術(shù)

關(guān)聯(lián)規(guī)則挖掘方法相關(guān)技術(shù)

多維關(guān)聯(lián)規(guī)則挖掘?qū)嵗嚓P(guān)技術(shù)

国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

一種垂直分布式關(guān)聯(lián)規(guī)則挖掘隱私信息保護方法與流程