本發(fā)明涉及共享充電樁領(lǐng)域,具體為一種共享充電站用戶隱私保護(hù)方法及系統(tǒng)。
背景技術(shù):
1、隨著電動(dòng)汽車(chē)的普及和充電需求的增加,充電樁作為電動(dòng)汽車(chē)充電的重要基礎(chǔ)設(shè)施,其數(shù)量和布局也在不斷擴(kuò)大。隨著共享充電樁的普及和數(shù)據(jù)收集的增加,用戶的隱私保護(hù)問(wèn)題日益受到關(guān)注,用戶在使用共享充電樁時(shí),往往需要提供個(gè)人信息和位置信息,并且充電行為也會(huì)被記錄。這些數(shù)據(jù)在為平臺(tái)提供服務(wù)優(yōu)化和用戶行為分析的同時(shí),也帶來(lái)了潛在的隱私風(fēng)險(xiǎn)。如果不加以有效保護(hù),用戶的身份、行為模式和位置信息可能會(huì)被惡意利用,導(dǎo)致隱私泄露和安全威脅。
2、在對(duì)共享充電站進(jìn)行數(shù)據(jù)分析以及充電預(yù)測(cè)中,通常是在共享充電樁的數(shù)據(jù)基礎(chǔ)上進(jìn)行分析的。然而,當(dāng)涉及到不完全信任的第三方時(shí),數(shù)據(jù)隱私和安全性成為一個(gè)關(guān)鍵問(wèn)題。在這種情況下,將原始數(shù)據(jù)直接暴露給第三方可能會(huì)導(dǎo)致用戶隱私的泄露或數(shù)據(jù)被濫用。通過(guò)本地差分隱私(local?differential?privacy,?ldp),用戶的數(shù)據(jù)在上傳前已被隨機(jī)化處理,即使第三方獲取了這些數(shù)據(jù),也難以恢復(fù)出用戶的真實(shí)信息,從而有效地保護(hù)了用戶隱私。ldp中的隱私保護(hù)強(qiáng)度通常通過(guò)隱私預(yù)算來(lái)控制。然而,充電數(shù)據(jù)有些字段具有比較強(qiáng)的相關(guān)性,采用固定隱私預(yù)算的方式忽略了字段的相關(guān)性,如果兩個(gè)字段高度相關(guān),通過(guò)其中一個(gè)字段的隱私泄露信息可以推測(cè)出另一個(gè)字段的信息,這就帶來(lái)了潛在的隱私泄露風(fēng)險(xiǎn)。
技術(shù)實(shí)現(xiàn)思路
1、為了解決上述問(wèn)題,本發(fā)明提供了一種共享充電站用戶隱私保護(hù)方法,所述方法包括以下步驟:
2、獲取共享充電站用戶的充電記錄,獲取每個(gè)字段的預(yù)設(shè)隱私預(yù)算,計(jì)算充電記錄中不同字段的相關(guān)性,根據(jù)字段的相關(guān)性和所述預(yù)設(shè)隱私預(yù)算得到每個(gè)字段的隱私預(yù)算;
3、將充電記錄中數(shù)據(jù)項(xiàng)進(jìn)行編碼,基于字段的隱私預(yù)算確定字段的每個(gè)編碼后數(shù)據(jù)項(xiàng)的概率分布,并根據(jù)數(shù)據(jù)項(xiàng)的概率分布確定多個(gè)隨機(jī)數(shù),利用所述多個(gè)隨機(jī)數(shù)構(gòu)建數(shù)據(jù)項(xiàng)對(duì)應(yīng)的隨機(jī)數(shù)池;
4、從數(shù)據(jù)項(xiàng)對(duì)應(yīng)的隨機(jī)數(shù)池中取出一個(gè)隨機(jī)數(shù),根據(jù)概率分布和取出的隨機(jī)數(shù)生成數(shù)據(jù)項(xiàng)的報(bào)告值。
5、優(yōu)選地,所述計(jì)算充電記錄中不同字段的相關(guān)性,根據(jù)字段的相關(guān)性和所述預(yù)設(shè)隱私預(yù)算得到每個(gè)字段的隱私預(yù)算,具體為:
6、計(jì)算每個(gè)字段和其他字段的相關(guān)性矩陣,通過(guò)所述相關(guān)性矩陣計(jì)算字段和其他字段的相關(guān)性總和,計(jì)算每個(gè)字段的相關(guān)性總和的倒數(shù),并將字段的倒數(shù)標(biāo)準(zhǔn)化得到每個(gè)字段的相關(guān)性權(quán)重;
7、計(jì)算所有字段的相關(guān)性權(quán)重的平均值,計(jì)算字段的相關(guān)性權(quán)重和所述平均值的比值,將所述比值和字段的預(yù)設(shè)隱私預(yù)算的乘積作為字段的隱私預(yù)算。
8、優(yōu)選地,所述根據(jù)數(shù)據(jù)項(xiàng)的概率分布確定多個(gè)隨機(jī)數(shù),利用所述多個(gè)隨機(jī)數(shù)構(gòu)建數(shù)據(jù)項(xiàng)對(duì)應(yīng)的隨機(jī)數(shù)池,具體為:
9、根據(jù)數(shù)據(jù)項(xiàng)編碼后的位數(shù)確定區(qū)間個(gè)數(shù),所述區(qū)間個(gè)數(shù)和編碼后的位數(shù)相同;
10、計(jì)算在每個(gè)區(qū)間的累計(jì)概率范圍,在每個(gè)累計(jì)概率范圍生成至少一個(gè)隨機(jī)數(shù),隨機(jī)數(shù)大小位于所述累計(jì)概率范圍內(nèi),使得最后生成的隨機(jī)數(shù)的個(gè)數(shù)和每個(gè)累計(jì)概率范圍的范圍大小成正相關(guān),將生成的隨機(jī)數(shù)放入到數(shù)據(jù)項(xiàng)對(duì)應(yīng)的隨機(jī)數(shù)池中。
11、優(yōu)選地,所述數(shù)據(jù)項(xiàng)編碼采用one-hot編碼,編碼的位數(shù)為one-hot編碼后編碼長(zhǎng)度,每個(gè)編碼位對(duì)應(yīng)一個(gè)區(qū)間。
12、優(yōu)選地,所述計(jì)算在每個(gè)區(qū)間的累計(jì)概率范圍,具體為:
13、計(jì)算編碼后數(shù)據(jù)項(xiàng)的概率分布,每個(gè)編碼位有一個(gè)概率,第i個(gè)區(qū)間的累計(jì)概率范圍的下限為前i-1個(gè)編碼位的概率總和,上限為前i個(gè)編碼位的概率總和,i為正整數(shù),且1≤i≤n,n為編碼的位數(shù)。
14、另外一方面,本發(fā)明提供一種共享充電站用戶隱私保護(hù)系統(tǒng),所述系統(tǒng)包括以下模塊:
15、隱私預(yù)算確定模塊,用于獲取共享充電站用戶的充電記錄,獲取每個(gè)字段的預(yù)設(shè)隱私預(yù)算,計(jì)算充電記錄中不同字段的相關(guān)性,根據(jù)字段的相關(guān)性和所述預(yù)設(shè)隱私預(yù)算得到每個(gè)字段的隱私預(yù)算;
16、隨機(jī)數(shù)確定模塊,用于將充電記錄中數(shù)據(jù)項(xiàng)進(jìn)行編碼,基于字段的隱私預(yù)算確定字段的每個(gè)編碼后數(shù)據(jù)項(xiàng)的概率分布,并根據(jù)數(shù)據(jù)項(xiàng)的概率分布確定多個(gè)隨機(jī)數(shù),利用所述多個(gè)隨機(jī)數(shù)構(gòu)建數(shù)據(jù)項(xiàng)對(duì)應(yīng)的隨機(jī)數(shù)池;
17、隱私處理模塊,用于從數(shù)據(jù)項(xiàng)對(duì)應(yīng)的隨機(jī)數(shù)池中取出一個(gè)隨機(jī)數(shù),根據(jù)概率分布和取出的隨機(jī)數(shù)生成數(shù)據(jù)項(xiàng)的報(bào)告值。
18、優(yōu)選地,所述計(jì)算充電記錄中不同字段的相關(guān)性,根據(jù)字段的相關(guān)性和所述預(yù)設(shè)隱私預(yù)算得到每個(gè)字段的隱私預(yù)算,具體為:
19、計(jì)算每個(gè)字段和其他字段的相關(guān)性矩陣,通過(guò)所述相關(guān)性矩陣計(jì)算字段和其他字段的相關(guān)性總和,計(jì)算每個(gè)字段的相關(guān)性總和的倒數(shù),并將字段的倒數(shù)標(biāo)準(zhǔn)化得到每個(gè)字段的相關(guān)性權(quán)重;
20、計(jì)算所有字段的相關(guān)性權(quán)重的平均值,計(jì)算字段的相關(guān)性權(quán)重和所述平均值的比值,將所述比值和字段的預(yù)設(shè)隱私預(yù)算的乘積作為字段的隱私預(yù)算。
21、優(yōu)選地,所述根據(jù)數(shù)據(jù)項(xiàng)的概率分布確定多個(gè)隨機(jī)數(shù),利用所述多個(gè)隨機(jī)數(shù)構(gòu)建數(shù)據(jù)項(xiàng)對(duì)應(yīng)的隨機(jī)數(shù)池,具體為:
22、根據(jù)數(shù)據(jù)項(xiàng)編碼后的位數(shù)確定區(qū)間個(gè)數(shù),所述區(qū)間個(gè)數(shù)和編碼后的位數(shù)相同;
23、計(jì)算在每個(gè)區(qū)間的累計(jì)概率范圍,在每個(gè)累計(jì)概率范圍生成至少一個(gè)隨機(jī)數(shù),隨機(jī)數(shù)大小位于所述累計(jì)概率范圍內(nèi),使得最后生成的隨機(jī)數(shù)的個(gè)數(shù)和每個(gè)累計(jì)概率范圍的范圍大小成正相關(guān),將生成的隨機(jī)數(shù)放入到數(shù)據(jù)項(xiàng)對(duì)應(yīng)的隨機(jī)數(shù)池中。
24、優(yōu)選地,所述數(shù)據(jù)項(xiàng)編碼采用one-hot編碼,編碼的位數(shù)為one-hot編碼后編碼長(zhǎng)度,每個(gè)編碼位對(duì)應(yīng)一個(gè)區(qū)間。
25、優(yōu)選地,所述計(jì)算在每個(gè)區(qū)間的累計(jì)概率范圍,具體為:
26、計(jì)算編碼后數(shù)據(jù)項(xiàng)的概率分布,每個(gè)編碼位有一個(gè)概率,第i個(gè)區(qū)間的累計(jì)概率范圍的下限為前i-1個(gè)編碼位的概率總和,上限為前i個(gè)編碼位的概率總和,i為正整數(shù),且1≤i≤n,n為編碼的位數(shù)。
27、另外,本發(fā)明提供了一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),所述可讀存儲(chǔ)介質(zhì)上存儲(chǔ)有計(jì)算機(jī)程序,所述計(jì)算機(jī)程序在被處理器執(zhí)行時(shí)實(shí)現(xiàn)如上所述的方法。
28、進(jìn)一步地,本發(fā)明還提供了一種計(jì)算機(jī)設(shè)備,所述計(jì)算機(jī)設(shè)備至少包括可讀存儲(chǔ)介質(zhì)和處理器,所述可讀存儲(chǔ)介質(zhì)上存儲(chǔ)有計(jì)算機(jī)程序,所述計(jì)算機(jī)程序在被處理器執(zhí)行時(shí)實(shí)現(xiàn)如上所述的方法。
29、為了降低對(duì)于相關(guān)度高的字段,通過(guò)一個(gè)字段的隱私泄露信息推測(cè)出另一個(gè)字段的信息的可能性,本發(fā)明根據(jù)字段的相關(guān)性和所述預(yù)設(shè)隱私預(yù)算得到每個(gè)字段的隱私預(yù)算,降低相關(guān)性高的字段信息泄露;此外,在差分隱私機(jī)制中,隨機(jī)數(shù)的選取完全是隨機(jī)的,但是每個(gè)數(shù)據(jù)項(xiàng)的累加概率區(qū)間并不是相等大小,這就導(dǎo)致有些累加概率區(qū)間被選擇的可能性大,基于此,本發(fā)明還根據(jù)每個(gè)累加概率區(qū)間的上下限調(diào)整隨機(jī)數(shù),讓每個(gè)累加概率區(qū)間被選擇的概率盡可能相同。
1.一種共享充電站用戶隱私保護(hù)方法,其特征在于,所述方法包括以下步驟:
2.如權(quán)利要求1所述的方法,其特征在于,所述計(jì)算充電記錄中不同字段的相關(guān)性,根據(jù)字段的相關(guān)性和所述預(yù)設(shè)隱私預(yù)算得到每個(gè)字段的隱私預(yù)算,具體為:
3.如權(quán)利要求1所述的方法,其特征在于,所述根據(jù)數(shù)據(jù)項(xiàng)的概率分布確定多個(gè)隨機(jī)數(shù),利用所述多個(gè)隨機(jī)數(shù)構(gòu)建數(shù)據(jù)項(xiàng)對(duì)應(yīng)的隨機(jī)數(shù)池,具體為:
4.如權(quán)利要求3所述的方法,其特征在于,所述數(shù)據(jù)項(xiàng)編碼采用one-hot編碼,編碼的位數(shù)為one-hot編碼后編碼長(zhǎng)度,每個(gè)編碼位對(duì)應(yīng)一個(gè)區(qū)間。
5.如權(quán)利要求3所述的方法,其特征在于,所述計(jì)算在每個(gè)區(qū)間的累計(jì)概率范圍,具體為:
6.一種共享充電站用戶隱私保護(hù)系統(tǒng),其特征在于,所述系統(tǒng)包括以下模塊:
7.如權(quán)利要求6所述的系統(tǒng),其特征在于,所述計(jì)算充電記錄中不同字段的相關(guān)性,根據(jù)字段的相關(guān)性和所述預(yù)設(shè)隱私預(yù)算得到每個(gè)字段的隱私預(yù)算,具體為:
8.如權(quán)利要求6所述的系統(tǒng),其特征在于,所述根據(jù)數(shù)據(jù)項(xiàng)的概率分布確定多個(gè)隨機(jī)數(shù),利用所述多個(gè)隨機(jī)數(shù)構(gòu)建數(shù)據(jù)項(xiàng)對(duì)應(yīng)的隨機(jī)數(shù)池,具體為:
9.一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),所述可讀存儲(chǔ)介質(zhì)上存儲(chǔ)有計(jì)算機(jī)程序,其特征在于,所述計(jì)算機(jī)程序在被處理器執(zhí)行時(shí)實(shí)現(xiàn)如權(quán)利要求1-5任一項(xiàng)所述的方法。
10.一種計(jì)算機(jī)設(shè)備,所述計(jì)算機(jī)設(shè)備至少包括可讀存儲(chǔ)介質(zhì)和處理器,所述可讀存儲(chǔ)介質(zhì)上存儲(chǔ)有計(jì)算機(jī)程序,其特征在于,所述計(jì)算機(jī)程序在被處理器執(zhí)行時(shí)實(shí)現(xiàn)如權(quán)利要求1-5任一項(xiàng)所述的方法。