一種數(shù)據(jù)脫敏的方法與流程

文檔序號：40271526發(fā)布日期：2024-12-11 13:05閱讀：12來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>計(jì)算;推算;計(jì)數(shù)設(shè)備的制造及其應(yīng)用技術(shù)

本發(fā)明涉及數(shù)據(jù)處理，尤其涉及一種數(shù)據(jù)脫敏的方法。

背景技術(shù)：

1、數(shù)據(jù)脫敏技術(shù)是采用數(shù)據(jù)變形的方式對敏感數(shù)據(jù)進(jìn)行處理，防止隱私數(shù)據(jù)泄漏的數(shù)據(jù)處理技術(shù)。

2、傳統(tǒng)的數(shù)據(jù)脫敏技術(shù)通常采用統(tǒng)一的脫敏規(guī)則，如數(shù)據(jù)替換、哈?；蚣用?，存在一些局限性，例如：(1)缺乏個(gè)性化，統(tǒng)一的脫敏規(guī)則無法適應(yīng)不同用戶的需求；(2)信息損失，過于嚴(yán)格的脫敏規(guī)則可能導(dǎo)致有價(jià)值的信息丟失，影響數(shù)據(jù)分析和建模的質(zhì)量；(3)靈活性不足，難以根據(jù)不同的分析目的調(diào)整脫敏策略；這些局限性都會(huì)導(dǎo)致無法滿足不同用戶對數(shù)據(jù)的不同需求，實(shí)用性較差。

3、為此，本發(fā)明提供了一種數(shù)據(jù)脫敏的方法。

技術(shù)實(shí)現(xiàn)思路

1、基于此，有必要針對上述技術(shù)問題，提供一種數(shù)據(jù)脫敏的方法。

2、根據(jù)本發(fā)明的一方面，提供了一種數(shù)據(jù)脫敏的方法，應(yīng)用于數(shù)據(jù)倉庫，該數(shù)據(jù)倉庫采用hadoop和hive技術(shù)搭建，以及采用spark?sql作為數(shù)據(jù)倉庫的數(shù)據(jù)查詢引擎，該方法包括：基于不同用戶和不同場景的需求，在配置文件中定義各個(gè)字段的默認(rèn)脫敏算法；根據(jù)用戶的角色、權(quán)限和數(shù)據(jù)脫敏需求，在配置文件中對相應(yīng)默認(rèn)脫敏算法的脫敏規(guī)則進(jìn)行自定義配置，得到個(gè)性化脫敏算法；基于默認(rèn)脫敏算法和個(gè)性化脫敏算法，生成脫敏算法文件；獲取用戶的sql查詢請求，基于邏輯執(zhí)行計(jì)劃改造策略，對目標(biāo)待脫敏數(shù)據(jù)表進(jìn)行解析處理，捕獲表格內(nèi)容信息，根據(jù)表格內(nèi)容信息，調(diào)用脫敏算法文件的restapi，獲取相應(yīng)的默認(rèn)脫敏算法或個(gè)性化脫敏算法，根據(jù)默認(rèn)脫敏算法或個(gè)性化脫敏算法對表格內(nèi)容信息進(jìn)行脫敏處理，得到脫敏后的數(shù)據(jù)。

3、在一些實(shí)施例的一些可選的實(shí)現(xiàn)方式中，所述基于默認(rèn)脫敏算法和個(gè)性化脫敏算法，生成脫敏算法文件，具體包括：將每個(gè)默認(rèn)脫敏算法和每個(gè)個(gè)性化脫敏算法的實(shí)現(xiàn)邏輯過程均編寫成獨(dú)立的java類文件或scala類文件，并將所有的java類文件或scala類文件編譯成jar文件，將所述jar文件加載到spark計(jì)算引擎的lib目錄下，用于在spark?sql查詢引擎運(yùn)行時(shí)使用。

4、在一些實(shí)施例的一些可選的實(shí)現(xiàn)方式中，所述默認(rèn)脫敏算法和個(gè)性化脫敏算法均包括規(guī)則脫敏算法或時(shí)間加權(quán)脫敏算法。

5、在一些實(shí)施例的一些可選的實(shí)現(xiàn)方式中，所述邏輯執(zhí)行計(jì)劃改造策略，具體包括：通過編譯spark?catalyst代碼，將編譯后的spark?catalyst代碼進(jìn)行打包，并生成一個(gè)新的spark?catalyst運(yùn)行包，所述新的spark?catalyst運(yùn)行包包含運(yùn)行新增的個(gè)性化脫敏算法所需依賴的jar文件，將新的spark?catalyst運(yùn)行包部署到spark?sql源碼環(huán)境中。

6、在一些實(shí)施例的一些可選的實(shí)現(xiàn)方式中，所述編譯spark?catalyst代碼，具體包括：設(shè)置一個(gè)處理邏輯計(jì)劃的規(guī)則類，用于在其apply方法中遍歷邏輯計(jì)劃樹。

7、在一些實(shí)施例的一些可選的實(shí)現(xiàn)方式中，所述遍歷邏輯計(jì)劃樹，具體包括：在遍歷過程中，對待脫敏數(shù)據(jù)表中包含的所有表節(jié)點(diǎn)及其字段信息進(jìn)行識(shí)別處理。

8、在一些實(shí)施例的一些可選的實(shí)現(xiàn)方式中，所述獲取用戶的sql查詢請求，基于邏輯執(zhí)行計(jì)劃改造策略，對目標(biāo)待脫敏數(shù)據(jù)表進(jìn)行解析處理，捕獲表格內(nèi)容信息，根據(jù)表格內(nèi)容信息，調(diào)用脫敏算法文件的restapi，獲取相應(yīng)的默認(rèn)脫敏算法或個(gè)性化脫敏算法，根據(jù)默認(rèn)脫敏算法或個(gè)性化脫敏算法對表格內(nèi)容信息進(jìn)行脫敏處理，得到脫敏后的數(shù)據(jù)，具體包括：獲取用戶的sql查詢請求，采用spark?sql解析器對目標(biāo)待脫敏數(shù)據(jù)表進(jìn)行解析處理，捕獲表格內(nèi)容信息，生成邏輯計(jì)劃樹對象，遍歷計(jì)劃樹對象中的所有表節(jié)點(diǎn)，篩查需要脫敏處理的字段信息，針對每個(gè)需要脫敏處理的字段信息，調(diào)用脫敏算法文件的restapi，獲取相應(yīng)的默認(rèn)脫敏算法或個(gè)性化脫敏算法，采用默認(rèn)脫敏算法或個(gè)性化脫敏算法對需要脫敏處理的字段信息進(jìn)行脫敏處理，直至所有需要脫敏處理的字段信息完成脫敏處理為止，得到脫敏后的數(shù)據(jù)。

9、在一些實(shí)施例的一些可選的實(shí)現(xiàn)方式中，在得到所述脫敏后的數(shù)據(jù)后，還包括：基于脫敏后的數(shù)據(jù)，響應(yīng)所述用戶的sql查詢請求。

10、根據(jù)本發(fā)明的第二方面，提供了一種電子設(shè)備，包括存儲(chǔ)器、處理器以及存儲(chǔ)在存儲(chǔ)器中并且可以在處理器上運(yùn)行的計(jì)算機(jī)程序，該處理器執(zhí)行計(jì)算機(jī)程序時(shí)實(shí)現(xiàn)上述方法的步驟。

11、根據(jù)本發(fā)明的第三方面，提供一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)，該計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)存儲(chǔ)有計(jì)算機(jī)程序，該計(jì)算機(jī)程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)上述方法的步驟。

12、本發(fā)明的優(yōu)點(diǎn)及有益效果在于：

13、1、個(gè)性化脫敏，本發(fā)明通過編譯spark?catalyst代碼來實(shí)現(xiàn)對spark?sql查詢引擎的改造，能夠針對不同場景、不同用戶、不同數(shù)據(jù)脫敏需求，動(dòng)態(tài)匹配對應(yīng)的脫敏算法，以便根據(jù)不同用戶的需求提供定制化的脫敏效果。

14、2、最小化信息損失，本發(fā)明采用規(guī)則脫敏算法或時(shí)間加權(quán)脫敏算法，能夠在保護(hù)隱私的前提下，盡可能保留數(shù)據(jù)的分析價(jià)值，從而提高數(shù)據(jù)分析和建模的質(zhì)量。

15、3、高靈活性，本發(fā)明能夠根據(jù)不同的分析目的和數(shù)據(jù)使用場景調(diào)整脫敏策略，實(shí)現(xiàn)動(dòng)態(tài)脫敏，以支持多種場景和用戶需求。

技術(shù)特征：

1.一種數(shù)據(jù)脫敏的方法，其特征在于，應(yīng)用于數(shù)據(jù)倉庫，該數(shù)據(jù)倉庫采用hadoop和hive技術(shù)搭建，以及采用spark?sql作為數(shù)據(jù)倉庫的數(shù)據(jù)查詢引擎，該方法包括：

2.根據(jù)權(quán)利要求1所述的一種數(shù)據(jù)脫敏的方法，其特征在于，所述基于默認(rèn)脫敏算法和個(gè)性化脫敏算法，生成脫敏算法文件，具體包括：將每個(gè)默認(rèn)脫敏算法和每個(gè)個(gè)性化脫敏算法的實(shí)現(xiàn)邏輯過程均編寫成獨(dú)立的java類文件或scala類文件，并將所有的java類文件或scala類文件編譯成jar文件，將所述jar文件加載到spark計(jì)算引擎的lib目錄下，用于在spark?sql查詢引擎運(yùn)行時(shí)使用。

3.根據(jù)權(quán)利要求2所述的一種數(shù)據(jù)脫敏的方法，其特征在于，所述默認(rèn)脫敏算法和個(gè)性化脫敏算法均包括規(guī)則脫敏算法或時(shí)間加權(quán)脫敏算法。

4.根據(jù)權(quán)利要求1所述的一種數(shù)據(jù)脫敏的方法，其特征在于，所述邏輯執(zhí)行計(jì)劃改造策略，具體包括：通過編譯spark?catalyst代碼，將編譯后的spark?catalyst代碼進(jìn)行打包，并生成一個(gè)新的spark?catalyst運(yùn)行包，所述新的spark?catalyst運(yùn)行包包含運(yùn)行新增的個(gè)性化脫敏算法所需依賴的jar文件，將新的spark?catalyst運(yùn)行包部署到spark?sql源碼環(huán)境中。

5.根據(jù)權(quán)利要求4所述的一種數(shù)據(jù)脫敏的方法，其特征在于，所述編譯spark?catalyst代碼，具體包括：設(shè)置一個(gè)處理邏輯計(jì)劃的規(guī)則類，用于在其apply方法中遍歷邏輯計(jì)劃樹。

6.根據(jù)權(quán)利要求5所述的一種數(shù)據(jù)脫敏的方法，其特征在于，所述遍歷邏輯計(jì)劃樹，具體包括：在遍歷過程中，對待脫敏數(shù)據(jù)表中包含的所有表節(jié)點(diǎn)及其字段信息進(jìn)行識(shí)別處理。

7.根據(jù)權(quán)利要求6所述的一種數(shù)據(jù)脫敏的方法，其特征在于，所述獲取用戶的sql查詢請求，基于邏輯執(zhí)行計(jì)劃改造策略，對目標(biāo)待脫敏數(shù)據(jù)表進(jìn)行解析處理，捕獲表格內(nèi)容信息，根據(jù)表格內(nèi)容信息，調(diào)用脫敏算法文件的restapi，獲取相應(yīng)的默認(rèn)脫敏算法或個(gè)性化脫敏算法，根據(jù)默認(rèn)脫敏算法或個(gè)性化脫敏算法對表格內(nèi)容信息進(jìn)行脫敏處理，得到脫敏后的數(shù)據(jù)，具體包括：獲取用戶的sql查詢請求，采用spark?sql解析器對目標(biāo)待脫敏數(shù)據(jù)表進(jìn)行解析處理，捕獲表格內(nèi)容信息，生成邏輯計(jì)劃樹對象，遍歷計(jì)劃樹對象中的所有表節(jié)點(diǎn)，篩查需要脫敏處理的字段信息，針對每個(gè)需要脫敏處理的字段信息，調(diào)用脫敏算法文件的restapi，獲取相應(yīng)的默認(rèn)脫敏算法或個(gè)性化脫敏算法，采用默認(rèn)脫敏算法或個(gè)性化脫敏算法對需要脫敏處理的字段信息進(jìn)行脫敏處理，直至所有需要脫敏處理的字段信息完成脫敏處理為止，得到脫敏后的數(shù)據(jù)。

8.根據(jù)權(quán)利要求7所述的一種數(shù)據(jù)脫敏的方法，其特征在于，在得到所述脫敏后的數(shù)據(jù)后，還包括：基于脫敏后的數(shù)據(jù)，響應(yīng)所述用戶的sql查詢請求。

9.一種電子設(shè)備，包括存儲(chǔ)器、處理器以及存儲(chǔ)在所述存儲(chǔ)器中并且可以在所述處理器上運(yùn)行的計(jì)算機(jī)程序，其特征在于，所述處理器執(zhí)行所述計(jì)算機(jī)程序時(shí)實(shí)現(xiàn)如權(quán)利要求1至8中任一項(xiàng)所述方法的步驟。

10.一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)，所述計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)存儲(chǔ)有計(jì)算機(jī)程序，其特征在于，所述計(jì)算機(jī)程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)如權(quán)利要求1至8中任一項(xiàng)所述方法的步驟。

技術(shù)總結(jié)
本發(fā)明涉及數(shù)據(jù)處理技術(shù)領(lǐng)域，尤其涉及一種數(shù)據(jù)脫敏的方法，包括：基于不同用戶和不同場景的需求，定義各個(gè)字段的默認(rèn)脫敏算法；根據(jù)用戶的角色、權(quán)限和數(shù)據(jù)脫敏需求，對相應(yīng)默認(rèn)脫敏算法的脫敏規(guī)則進(jìn)行自定義配置，得到個(gè)性化脫敏算法；基于默認(rèn)脫敏算法和個(gè)性化脫敏算法，生成脫敏算法文件；獲取用戶的SQL查詢請求，基于邏輯執(zhí)行計(jì)劃改造策略，對目標(biāo)待脫敏數(shù)據(jù)表進(jìn)行解析處理，捕獲表格內(nèi)容信息，根據(jù)表格內(nèi)容信息，調(diào)用脫敏算法文件的RestAPI，獲取相應(yīng)的默認(rèn)脫敏算法或個(gè)性化脫敏算法，根據(jù)默認(rèn)脫敏算法或個(gè)性化脫敏算法對表格內(nèi)容信息進(jìn)行脫敏處理，得到脫敏后的數(shù)據(jù)。本發(fā)明的技術(shù)方案具有個(gè)性化脫敏、最小化信息損失和高靈活性的特點(diǎn)。

技術(shù)研發(fā)人員：楊晨,周鋒,孫喜鋒,馮彥明,李響,王志敏
受保護(hù)的技術(shù)使用者：河南中原消費(fèi)金融股份有限公司
技術(shù)研發(fā)日：
技術(shù)公布日：2024/12/10

完整全部詳細(xì)技術(shù)資料下載

該技術(shù)已申請專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：楊晨,周鋒,孫喜鋒,馮彥明,李響,王志敏
技術(shù)所有人：河南中原消費(fèi)金融股份有限公司
我是此專利的發(fā)明人

上一篇：一種精密限速端子沖壓成型裝置的制作方法
上一篇：轉(zhuǎn)子組件和電子水泵的制作方法

該領(lǐng)域下的技術(shù)專家
如您需求助技術(shù)專家，請點(diǎn)此查看客服電話進(jìn)行咨詢。
1、李老師：1.計(jì)算力學(xué) 2.無損檢測
2、畢老師：機(jī)構(gòu)動(dòng)力學(xué)與控制
3、袁老師：1.計(jì)算機(jī)視覺 2.無線網(wǎng)絡(luò)及物聯(lián)網(wǎng)
4、王老師：1.計(jì)算機(jī)網(wǎng)絡(luò)安全 2.計(jì)算機(jī)仿真技術(shù)
5、王老師：1.網(wǎng)絡(luò)安全；物聯(lián)網(wǎng)安全、大數(shù)據(jù)安全 2.安全態(tài)勢感知、輿情分析和控制 3.區(qū)塊鏈及應(yīng)用
如您是高校老師，可以點(diǎn)此聯(lián)系我們加入專家?guī)臁?/a>

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評論。精彩留言會(huì)獲得點(diǎn)贊！

精彩留言，會(huì)給你點(diǎn)贊！

国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

一種數(shù)據(jù)脫敏的方法與流程