基于空間聚合的軌跡數(shù)據(jù)隱私保護方法及系統(tǒng)的制作方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明數(shù)據(jù)安全技術(shù)領(lǐng)域,具體涉及一種基于空間聚合的軌跡數(shù)據(jù)隱私保護方法 及系統(tǒng)。
【背景技術(shù)】
[0002] 大數(shù)據(jù)背景下,通過對手機用戶活動的空間數(shù)據(jù)進行挖掘,從通話位置數(shù)據(jù)(CDR) 中識別出個體本身已經(jīng)成為可能。手機定位數(shù)據(jù)以其詳細的記錄清單和蘊含的強大信息 已經(jīng)成為目前各運營商和科研機構(gòu)研究的一個主要方向。目前,通過手機數(shù)據(jù)識別個體職 住地,以及通過手機數(shù)據(jù)研究城市居民活動模式和城市空間結(jié)構(gòu)都已經(jīng)成為現(xiàn)實,并得到 了科學(xué)的驗證。而從發(fā)布的手機定位數(shù)據(jù)中,運用相關(guān)挖掘算法,識別數(shù)據(jù)集中具有明顯 特征的個體已經(jīng)被證明具有現(xiàn)實的可操作性。而目前隨著網(wǎng)絡(luò)技術(shù)的發(fā)展,基于位置的服 務(wù)(LBS)已經(jīng)成為目前互聯(lián)網(wǎng)服務(wù)行業(yè)的一個前沿,面對越來越精確的位置服務(wù)和空間定 位技術(shù),用戶的位置隱私和軌跡隱私成為目前數(shù)據(jù)發(fā)布和服務(wù)過程中急需要解決的關(guān)鍵問 題。
[0003] 不同的攻擊方式下,數(shù)據(jù)暴露出來的隱私風(fēng)險是不同的,這里提到的隱私主要指 移動對象的身份。在評估隱私風(fēng)險之前必須要設(shè)定不同的攻擊模型,即模仿惡意攻擊者的 不同攻擊方式,并根據(jù)攻擊模型設(shè)定不同的風(fēng)險量化指標計算相應(yīng)的隱私風(fēng)險。為了評估 包含大量移動對象的軌跡數(shù)據(jù)集的隱私風(fēng)險,定義隱私風(fēng)險的值為完全重識別的人口百分 比,完全重識別即某個移動對象的活動特征具有唯一性,能夠與其他所有人完全區(qū)分開,其 身份可以被完全識別出來。而現(xiàn)實生活中,攻擊者也主要是挖掘數(shù)據(jù)發(fā)布過程中,通過移動 對象的時空位置信息信息對個體進行重識別。
[0004] 現(xiàn)有技術(shù)中大多是對整個數(shù)據(jù)軌跡片段進行保護,技術(shù)手段復(fù)雜而且難以保證保 護后數(shù)據(jù)的整體失真情況。對保護后的數(shù)據(jù)本身無法估量整個數(shù)據(jù)集合可利用程度。與此 同時,在現(xiàn)實生活當中,并非所有用戶的活動地點都是攻擊者考慮的范圍,而真正起到重要 作用的是用戶活動的頻繁位置?;谡麄€軌跡數(shù)據(jù)的方法耗費了大量的資源和時間,而且 難以保證數(shù)據(jù)的整體失真情況。同時,基于軌跡片段的這種保護方法操作流程復(fù)雜,計算復(fù) 雜度高,難以應(yīng)對大數(shù)據(jù)量的空間數(shù)據(jù)。
【發(fā)明內(nèi)容】
[0005] 有鑒如此,有必要提供一種基于空間聚合的軌跡數(shù)據(jù)隱私保護方法,該基于空間 聚合的軌跡數(shù)據(jù)隱私保護方法計算復(fù)雜度低,可適應(yīng)于大數(shù)據(jù)量的空間數(shù)據(jù)。
[0006] 為實現(xiàn)上述目的,本發(fā)明采用下述技術(shù)方案:
[0007] -種基于空間聚合的軌跡數(shù)據(jù)隱私保護方法,包括下述步驟:
[0008] 步驟S110 :構(gòu)建隱私模型以獲取個體隱私風(fēng)險度量值;
[0009] 步驟S120 :對比所述個體隱私風(fēng)險度量值及城市人群風(fēng)險空間分布的實際情況, 構(gòu)建隱私風(fēng)險保護;及
[0010] 步驟S130 :評價經(jīng)隱私保護后的效果。
[0011] 在一些實施例中,其中,步驟S110,構(gòu)建隱私模型包括下述步驟:
[0012] 構(gòu)建每個個體活動的序列,根據(jù)個體活動時間分布得到個體頻繁活動點集合;
[0013] 基于K-匿名的度量方式得到頻繁活動點集,獲取所述頻繁活動點集中每個個體 隱私風(fēng)險的度量值;
[0014] 基于不同的時空點和攻擊者所可能得到的個體活動點的個數(shù),得到不同活動點已 被知曉的前提下個體隱私風(fēng)險的不同值。
[0015] 在一些實施例中,步驟S120中,對比所述個體隱私風(fēng)險度量值及城市人群風(fēng)險空 間分布的實際情況,構(gòu)建隱私風(fēng)險保護,包括下述步驟:
[0016] 基于個體不同時空點個數(shù)被知曉的情況下,分別對城市人群的移動終端定位基站 進行不同層次空間上的合并;
[0017] 其中,所述移動終端的位置基站的空間合并是按著從小到大的距離進行合并的。
[0018] 在一些實施例中,其中,步驟S130中,評價經(jīng)隱私保護后的效果,包括下述步驟:
[0019] 步驟S131 :將個體所有的通話記錄按照時間先后排序;
[0020] 步驟S132 :尋找連續(xù)通話記錄的個體,并將連續(xù)兩個時間點位置發(fā)生了變化視作 一次移動,且將時間點在前的位置作為出發(fā)點記為0,將時間點在后的位置視作目的地記為 D;
[0021] 步驟S133 :分別計算隱私保護前后0D的總和;
[0022] 步驟S134 :分別比較數(shù)據(jù)保護前后個體隱私風(fēng)險度量值變化和0D的變化,進而得 到保護前后數(shù)據(jù)的保護效果。
[0023] 在一些實施例中,其中,步驟S133 :分別計算隱私保護前后0D的總和,是通過采用 下述計算公式計算得到的:
[0024]
[0025] 其中,N表示TAZ的總個數(shù),i和j表示對TAZ從1到N的編號,ODi」表示根據(jù)原始 數(shù)據(jù)統(tǒng)計得到的從TAZjljTAZ,的0D流量,0D' 表示根據(jù)做了隱私保護處理后的數(shù)據(jù)統(tǒng)計 得到的相應(yīng)的值,所述TAZ由城市內(nèi)交通規(guī)劃單位劃分的交通小區(qū)。
[0026] 另一方面,本發(fā)明還提供了一種基于高風(fēng)險頻繁活動點替換策略的隱私保護系 統(tǒng),包括:
[0027] 模型構(gòu)建模塊,用于構(gòu)建隱私模型以獲取個體隱私風(fēng)險度量值;
[0028] 風(fēng)險分類模塊,對比所述個體隱私風(fēng)險度量值及城市人群風(fēng)險空間分布的實際情 況,構(gòu)建隱私風(fēng)險保護;及
[0029] 效果評價模塊,用于評價經(jīng)隱私保護后的效果。
[0030] 本發(fā)明采用上述技術(shù)方案帶來的技術(shù)效果在于:
[0031] -方面,本發(fā)明提供的基于空間聚合的軌跡數(shù)據(jù)隱私保護方法及系統(tǒng),通過構(gòu)建 隱私模型以獲取個體隱私風(fēng)險度量值,對比所述個體隱私風(fēng)險度量值及城市人群風(fēng)險空間 分布的實際情況,構(gòu)建隱私風(fēng)險保護,評價經(jīng)隱私保護后的效果,上述方法簡單計算復(fù)雜度 低,可適應(yīng)于大數(shù)據(jù)量的空間數(shù)據(jù)。
[0032] 另一方面,本發(fā)明提供的基于空間聚合的軌跡數(shù)據(jù)隱私保護方法及系統(tǒng),基于頻 繁活動點集的角度構(gòu)建個體對象的隱私模型,彌補了現(xiàn)有技術(shù)缺乏頻繁活動點集合研究手 機位置數(shù)據(jù)發(fā)布過程中的隱私保護問題,在手機定位數(shù)據(jù)(CDR)發(fā)布依隱私保護方法中增 加了對數(shù)據(jù)發(fā)布之后新的數(shù)據(jù)集合的數(shù)據(jù)使用效益的研究,突出了方法與實際使用相結(jié) 合;同時在在構(gòu)建隱私模型和保護方法上進一步的衡量方法的可操作性和實際的應(yīng)用性特 征,具有很強的迀移性和可移植性。
【附圖說明】
[0033]圖1是本發(fā)明實施例一提供的基于空間聚合的軌跡數(shù)據(jù)隱私保護方法的步驟流 程圖。
[0034]圖2是本發(fā)明實施例一一較佳方式提供的構(gòu)建隱私模型的步驟流程圖。
[0035] 圖3是本發(fā)明實施例提供的展示了基站服務(wù)范圍聚合的過程示意圖。
[0036] 圖4是本發(fā)明另一實施例提供的評價經(jīng)隱私保護后的效果的步驟流程圖。
[0037] 圖5是本發(fā)明提供的基于高風(fēng)險頻繁活動點替換策略的隱私保護系統(tǒng)結(jié)構(gòu)示意 圖。
[0038] 圖6是包含的基站位置及根據(jù)基站位置生成的泰森多變形示意圖。
[0039] 圖7是隱私風(fēng)險下降曲線圖。
[0040] 圖8是數(shù)據(jù)保護前后數(shù)據(jù)可用性損失的情況示意圖。
【具體實施方式】
[0041] 為了便于理解本發(fā)明,下面將參照相關(guān)附圖對本發(fā)