本申請(qǐng)涉及信息安全,具體涉及一種跨網(wǎng)信息數(shù)據(jù)安全脫敏和訪問(wèn)控制方法及系統(tǒng)。
背景技術(shù):
1、隨著信息技術(shù)的飛速發(fā)展,網(wǎng)絡(luò)環(huán)境越來(lái)越復(fù)雜,企業(yè)和組織日漸依賴(lài)于跨網(wǎng)絡(luò)系統(tǒng)來(lái)處理和存儲(chǔ)數(shù)據(jù)。數(shù)據(jù)的安全性成為一個(gè)不可忽視的問(wèn)題。傳統(tǒng)的網(wǎng)絡(luò)安全措施包括以下幾部分:
2、數(shù)據(jù)加密:將數(shù)據(jù)通過(guò)數(shù)學(xué)算法轉(zhuǎn)換為密文,使除了授權(quán)用戶外,其他人即使獲取了數(shù)據(jù)也無(wú)法解讀內(nèi)容。
3、防火墻與入侵檢測(cè)系統(tǒng):通過(guò)一定的規(guī)則或模式來(lái)阻止未授權(quán)訪問(wèn),并監(jiān)控潛在的惡意活動(dòng)。
4、訪問(wèn)控制:通過(guò)建立訪問(wèn)權(quán)限和規(guī)則來(lái)限定用戶對(duì)系統(tǒng)資源的訪問(wèn)。
5、在大數(shù)據(jù)時(shí)代,企業(yè)和組織掌握了大量的個(gè)人敏感信息和關(guān)鍵運(yùn)營(yíng)數(shù)據(jù)。此時(shí),數(shù)據(jù)的脫敏處理顯得尤為關(guān)鍵。數(shù)據(jù)脫敏是指采取技術(shù)手段將敏感信息轉(zhuǎn)化為不含敏感內(nèi)容的數(shù)據(jù)副本,以便在防止泄露敏感信息的前提下,保留數(shù)據(jù)的使用價(jià)值。
6、然而,盡管已有的數(shù)據(jù)脫敏技術(shù)可以在一定程度上保護(hù)個(gè)人隱私和企業(yè)信息,但在實(shí)際情況中,由于網(wǎng)絡(luò)入侵手段不斷更新,傳統(tǒng)的入侵檢測(cè)系統(tǒng)難以適應(yīng)新型威脅,無(wú)法實(shí)現(xiàn)對(duì)復(fù)雜多變的安全攻擊的有效防御。
技術(shù)實(shí)現(xiàn)思路
1、鑒于此,本申請(qǐng)?zhí)峁┮环N跨網(wǎng)信息數(shù)據(jù)安全脫敏和訪問(wèn)控制方法及系統(tǒng),能夠使用smotetomek技術(shù)結(jié)合機(jī)器學(xué)習(xí)算法,用于改善數(shù)據(jù)集的類(lèi)不平衡問(wèn)題,增強(qiáng)入侵檢測(cè)模型的泛化能力,并通過(guò)脫敏機(jī)制和細(xì)粒度的訪問(wèn)控制確保信息數(shù)據(jù)的安全,從而實(shí)現(xiàn)對(duì)復(fù)雜多變的安全攻擊的有效防御。
2、本申請(qǐng)?zhí)峁┮环N跨網(wǎng)信息數(shù)據(jù)安全脫敏和訪問(wèn)控制方法,包括:
3、獲取跨網(wǎng)信息數(shù)據(jù),對(duì)所述跨網(wǎng)信息數(shù)據(jù)進(jìn)行脫敏處理;
4、設(shè)置用戶權(quán)限,并基于不同的用戶權(quán)限,對(duì)用戶請(qǐng)求進(jìn)行權(quán)限驗(yàn)證;
5、在權(quán)限驗(yàn)證成功后,基于過(guò)采樣和預(yù)處理smotetomek技術(shù)及機(jī)器學(xué)習(xí)模型對(duì)用戶訪問(wèn)所述脫敏后的跨網(wǎng)信息數(shù)據(jù)過(guò)程進(jìn)行入侵檢測(cè)。
6、可選地,基于過(guò)采樣和預(yù)處理smotetomek技術(shù)及機(jī)器學(xué)習(xí)模型對(duì)用戶訪問(wèn)所述脫敏后的跨網(wǎng)信息數(shù)據(jù)過(guò)程進(jìn)行入侵檢測(cè),包括:
7、對(duì)脫敏后的所述跨網(wǎng)信息數(shù)據(jù)清洗;
8、使用smotetomek對(duì)清洗后的所述跨網(wǎng)信息數(shù)據(jù)進(jìn)行過(guò)采樣;
9、獲取過(guò)采樣后的所述跨網(wǎng)信息數(shù)據(jù)的特征,基于所述跨網(wǎng)信息數(shù)據(jù)的特征,通過(guò)機(jī)器學(xué)習(xí)模型對(duì)用戶訪問(wèn)所述脫敏后的跨網(wǎng)信息數(shù)據(jù)過(guò)程進(jìn)行入侵檢測(cè)。
10、可選地,使用smotetomek對(duì)清洗后的所述跨網(wǎng)信息數(shù)據(jù)進(jìn)行過(guò)采樣,包括:
11、對(duì)脫敏后的所述跨網(wǎng)信息數(shù)據(jù)進(jìn)行分析,識(shí)別脫敏后的所述跨網(wǎng)信息數(shù)據(jù)中正常和異常樣本的分布情況,其中,正常樣本的數(shù)據(jù)集大于異常樣本的數(shù)據(jù)集;
12、使用smote對(duì)所述異常樣本的數(shù)據(jù)集進(jìn)行過(guò)采樣,合成第二異常樣本,所述第二異常樣本為過(guò)采樣后生成的新異常樣本;
13、通過(guò)tomek?links識(shí)別并移除樣本對(duì),以增強(qiáng)分類(lèi)器的決策邊界。
14、可選地,使用smote對(duì)所述異常樣本的數(shù)據(jù)集進(jìn)行過(guò)采樣,包括:
15、尋找所述異常樣本在特征空間中的k近鄰,其中,k為預(yù)先設(shè)定的近鄰數(shù)目;
16、對(duì)于每一異常樣本及其近鄰,采用線性插值法在二者之間生成新樣本點(diǎn),其中,所述新樣本點(diǎn)的集合為所述第二異常樣本;
17、將所述第二異常樣本添加至脫敏后的所述跨網(wǎng)信息數(shù)據(jù)中。
18、可選地,通過(guò)tomek?links識(shí)別并移除樣本對(duì),包括:
19、獲取過(guò)采樣后的異常樣本,在所述異常樣本中識(shí)別出所有的最近鄰樣本對(duì)tomeklinks;
20、移除被確定為tomek?links中的多數(shù)類(lèi)樣本對(duì)。
21、可選地,獲取過(guò)采樣后的所述跨網(wǎng)信息數(shù)據(jù)的特征,基于所述跨網(wǎng)信息數(shù)據(jù)的特征,通過(guò)機(jī)器學(xué)習(xí)模型對(duì)用戶訪問(wèn)所述脫敏后的跨網(wǎng)信息數(shù)據(jù)過(guò)程進(jìn)行入侵檢測(cè),包括:
22、采用信息增益方法選擇過(guò)采樣后的所述跨網(wǎng)信息數(shù)據(jù)的特征;
23、使用選擇后的所述跨網(wǎng)信息數(shù)據(jù)的特征構(gòu)建訓(xùn)練數(shù)據(jù)集;
24、構(gòu)建決策樹(shù)模型,利用所述訓(xùn)練數(shù)據(jù)集對(duì)所述決策樹(shù)模型進(jìn)行訓(xùn)練;
25、利用訓(xùn)練后的所述決策樹(shù)模型對(duì)用戶訪問(wèn)所述脫敏后的跨網(wǎng)信息數(shù)據(jù)過(guò)程進(jìn)行入侵檢測(cè)。
26、可選地,獲取過(guò)采樣后的所述跨網(wǎng)信息數(shù)據(jù)的特征,基于所述跨網(wǎng)信息數(shù)據(jù)的特征,通過(guò)機(jī)器學(xué)習(xí)模型對(duì)用戶訪問(wèn)所述脫敏后的跨網(wǎng)信息數(shù)據(jù)過(guò)程進(jìn)行入侵檢測(cè),包括:
27、采用卡方檢測(cè)方法選擇過(guò)采樣后的所述跨網(wǎng)信息數(shù)據(jù)的特征;
28、使用選擇后的所述跨網(wǎng)信息數(shù)據(jù)的特征構(gòu)建訓(xùn)練數(shù)據(jù)集;
29、構(gòu)建隨機(jī)森林模型,利用所述訓(xùn)練數(shù)據(jù)集對(duì)所述隨機(jī)森林模型進(jìn)行訓(xùn)練;
30、使用正則化技術(shù)對(duì)所述隨機(jī)森林模型進(jìn)行過(guò)擬合預(yù)防,并評(píng)估模型的性能;
31、利用訓(xùn)練后的所述隨機(jī)森林模型對(duì)用戶訪問(wèn)所述脫敏后的跨網(wǎng)信息數(shù)據(jù)過(guò)程進(jìn)行入侵檢測(cè)。
32、可選地,獲取跨網(wǎng)信息數(shù)據(jù),對(duì)所述跨網(wǎng)信息數(shù)據(jù)進(jìn)行脫敏處理,包括:
33、對(duì)所述跨網(wǎng)信息數(shù)據(jù)進(jìn)行分類(lèi)處理,識(shí)別出需要脫敏的敏感信息;
34、根據(jù)不同跨網(wǎng)信息數(shù)據(jù)的敏感級(jí)別,確定對(duì)應(yīng)的脫敏策略;
35、依照對(duì)應(yīng)的脫敏策略對(duì)所述敏感信息進(jìn)行脫敏處理。
36、可選地,基于不同的用戶權(quán)限,對(duì)用戶請(qǐng)求進(jìn)行權(quán)限驗(yàn)證,包括:
37、使用訪問(wèn)控制列表acl機(jī)制對(duì)用戶訪問(wèn)請(qǐng)求進(jìn)行校驗(yàn)。
38、本公開(kāi)實(shí)施例還提供一種跨網(wǎng)信息數(shù)據(jù)安全脫敏和訪問(wèn)控制系統(tǒng),包括:
39、脫敏模塊,用于獲取跨網(wǎng)信息數(shù)據(jù),對(duì)所述跨網(wǎng)信息數(shù)據(jù)進(jìn)行脫敏處理;
40、驗(yàn)證模塊,用于設(shè)置用戶權(quán)限,并基于不同的用戶權(quán)限,對(duì)用戶請(qǐng)求進(jìn)行權(quán)限驗(yàn)證;
41、檢測(cè)模塊,用于在權(quán)限驗(yàn)證成功后,基于過(guò)采樣和預(yù)處理smotetomek技術(shù)及機(jī)器學(xué)習(xí)模型對(duì)用戶訪問(wèn)所述脫敏后的跨網(wǎng)信息數(shù)據(jù)過(guò)程進(jìn)行入侵檢測(cè)。
42、本申請(qǐng)?zhí)峁┮环N跨網(wǎng)信息數(shù)據(jù)安全脫敏和訪問(wèn)控制方法及系統(tǒng),使用smotetomek技術(shù)結(jié)合機(jī)器學(xué)習(xí)算法,用于改善數(shù)據(jù)集的類(lèi)不平衡問(wèn)題,增強(qiáng)入侵檢測(cè)模型的泛化能力,并通過(guò)脫敏機(jī)制和細(xì)粒度的訪問(wèn)控制確保信息數(shù)據(jù)的安全。其借助機(jī)器學(xué)習(xí)的能力來(lái)實(shí)時(shí)識(shí)別和應(yīng)對(duì)未知威脅,以及通過(guò)更為科學(xué)的數(shù)據(jù)脫敏技術(shù)來(lái)保障數(shù)據(jù)在全生命周期中的安全,成為提升網(wǎng)絡(luò)數(shù)據(jù)安全性的關(guān)鍵措施。
1.一種跨網(wǎng)信息數(shù)據(jù)安全脫敏和訪問(wèn)控制方法,其特征在于,所述方法包括:
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,基于過(guò)采樣和預(yù)處理smotetomek技術(shù)及機(jī)器學(xué)習(xí)模型對(duì)用戶訪問(wèn)所述脫敏后的跨網(wǎng)信息數(shù)據(jù)過(guò)程進(jìn)行入侵檢測(cè),包括:
3.根據(jù)權(quán)利要求2所述的方法,其特征在于,使用smotetomek對(duì)清洗后的所述跨網(wǎng)信息數(shù)據(jù)進(jìn)行過(guò)采樣,包括:
4.根據(jù)權(quán)利要求3所述的方法,其特征在于,使用smote對(duì)所述異常樣本的數(shù)據(jù)集進(jìn)行過(guò)采樣,包括:
5.根據(jù)權(quán)利要求3所述的方法,其特征在于,通過(guò)tomek?links識(shí)別并移除樣本對(duì),包括:
6.根據(jù)權(quán)利要求2-5任一項(xiàng)所述的方法,其特征在于,獲取過(guò)采樣后的所述跨網(wǎng)信息數(shù)據(jù)的特征,基于所述跨網(wǎng)信息數(shù)據(jù)的特征,通過(guò)機(jī)器學(xué)習(xí)模型對(duì)用戶訪問(wèn)所述脫敏后的跨網(wǎng)信息數(shù)據(jù)過(guò)程進(jìn)行入侵檢測(cè),包括:
7.根據(jù)權(quán)利要求2-5任一項(xiàng)所述的方法,其特征在于,獲取過(guò)采樣后的所述跨網(wǎng)信息數(shù)據(jù)的特征,基于所述跨網(wǎng)信息數(shù)據(jù)的特征,通過(guò)機(jī)器學(xué)習(xí)模型對(duì)用戶訪問(wèn)所述脫敏后的跨網(wǎng)信息數(shù)據(jù)過(guò)程進(jìn)行入侵檢測(cè),包括:
8.根據(jù)權(quán)利要求1所述的方法,其特征在于,獲取跨網(wǎng)信息數(shù)據(jù),對(duì)所述跨網(wǎng)信息數(shù)據(jù)進(jìn)行脫敏處理,包括:
9.根據(jù)權(quán)利要求1所述的方法,其特征在于,基于不同的用戶權(quán)限,對(duì)用戶請(qǐng)求進(jìn)行權(quán)限驗(yàn)證,包括:
10.一種跨網(wǎng)信息數(shù)據(jù)安全脫敏和訪問(wèn)控制系統(tǒng),其特征在于,包括: