本發(fā)明涉及網(wǎng)絡(luò)通信,尤其涉及一種網(wǎng)絡(luò)安全處理方法、系統(tǒng)、電子設(shè)備及可讀存儲(chǔ)介質(zhì)。
背景技術(shù):
1、隨著互聯(lián)網(wǎng)技術(shù)的快速發(fā)展,網(wǎng)絡(luò)內(nèi)容呈現(xiàn)出爆炸式的增長(zhǎng)趨勢(shì)。
2、傳統(tǒng)的基于關(guān)鍵詞過(guò)濾、正則表達(dá)式匹配等規(guī)則審核方法,已經(jīng)難以應(yīng)對(duì)當(dāng)前海量、多樣化的網(wǎng)絡(luò)內(nèi)容形式。這些規(guī)則方法不僅效率低下,而且缺乏語(yǔ)義理解能力,很容易被繞過(guò)。另一方面,人工審核的效率有限,成本高昂,審核質(zhì)量參差不齊,難以滿足實(shí)時(shí)審核的需求。
技術(shù)實(shí)現(xiàn)思路
1、有鑒于此,本發(fā)明實(shí)施例的目的在于提供一種網(wǎng)絡(luò)安全處理方法、系統(tǒng)、電子設(shè)備及可讀存儲(chǔ)介質(zhì),保護(hù)網(wǎng)絡(luò)通信過(guò)程中產(chǎn)生的各類數(shù)據(jù)的安全性、完整性和隱私性。
2、為達(dá)上述目的,第一方面,提供一種網(wǎng)絡(luò)安全處理方法,所述方法包括:
3、獲取歷史網(wǎng)絡(luò)安全數(shù)據(jù),得到網(wǎng)絡(luò)安全威脅信息訓(xùn)練集;
4、根據(jù)所述網(wǎng)絡(luò)安全威脅信息訓(xùn)練集,構(gòu)建網(wǎng)絡(luò)安全威脅信息識(shí)別模型;
5、收集網(wǎng)絡(luò)安全情報(bào),提取所述網(wǎng)絡(luò)安全情報(bào)中存在的威脅信息,建立戰(zhàn)術(shù)標(biāo)簽,匯總所述戰(zhàn)術(shù)標(biāo)簽構(gòu)建威脅信息標(biāo)簽數(shù)據(jù)集;
6、將所述威脅信息標(biāo)簽數(shù)據(jù)添加至所述網(wǎng)絡(luò)安全威脅信息識(shí)別模型中,更新所述網(wǎng)絡(luò)安全威脅信息識(shí)別模型;
7、采集網(wǎng)絡(luò)通信數(shù)據(jù),整理后輸出數(shù)據(jù)分析樣本;將所述數(shù)據(jù)分析樣本上傳至所述網(wǎng)絡(luò)安全威脅信息識(shí)別模型中,對(duì)其進(jìn)行網(wǎng)絡(luò)安全威脅信息識(shí)別。
8、在某些實(shí)施方式中,所述的網(wǎng)絡(luò)安全處理方法中,所述獲取歷史網(wǎng)絡(luò)安全數(shù)據(jù),得到網(wǎng)絡(luò)安全威脅信息訓(xùn)練集,包括:
9、將所述歷史網(wǎng)絡(luò)通信數(shù)據(jù)轉(zhuǎn)化為標(biāo)準(zhǔn)txt格式安全報(bào)告,并對(duì)所述標(biāo)準(zhǔn)txt格式安全報(bào)告進(jìn)行分句、分詞處理和去除噪聲信息的操作,匯總得到標(biāo)準(zhǔn)數(shù)據(jù)集;
10、其中,所述歷史網(wǎng)絡(luò)通信數(shù)據(jù)包括網(wǎng)絡(luò)安全領(lǐng)域報(bào)告和網(wǎng)絡(luò)博客。
11、在某些實(shí)施方式中,所述的網(wǎng)絡(luò)安全處理方法中,
12、所述歷史網(wǎng)絡(luò)安全數(shù)據(jù)為html格式和pdf格式。
13、在某些實(shí)施方式中,所述的網(wǎng)絡(luò)安全處理方法中,所述的根據(jù)所述網(wǎng)絡(luò)安全威脅信息訓(xùn)練集,構(gòu)建網(wǎng)絡(luò)安全威脅信息識(shí)別模型,包括:
14、采用tfidf對(duì)所述網(wǎng)絡(luò)安全威脅信息訓(xùn)練集進(jìn)行預(yù)處理,將其編碼為具有文本特征的輸出向量;
15、利用深度森林分類算法對(duì)所述輸出向量進(jìn)行處理,得到網(wǎng)絡(luò)安全威脅信息標(biāo)簽;
16、其中,tfidf特征計(jì)算所述輸出向量的相似度,合并相似的輸出向量。
17、在某些實(shí)施方式中,所述的網(wǎng)絡(luò)安全處理方法中,所述的構(gòu)建網(wǎng)絡(luò)安全威脅信息識(shí)別模型,還包括:
18、將所述網(wǎng)絡(luò)安全威脅信息訓(xùn)練集平均劃分為預(yù)設(shè)個(gè)數(shù)的數(shù)據(jù)子集;
19、重復(fù)從所述預(yù)設(shè)個(gè)數(shù)的數(shù)據(jù)子集中確定一個(gè)數(shù)據(jù)子集為驗(yàn)證子集,其余的數(shù)據(jù)子集為訓(xùn)練子集,得到所述預(yù)設(shè)個(gè)數(shù)的數(shù)據(jù)組合,其中每個(gè)所述數(shù)據(jù)組合包括一個(gè)驗(yàn)證子集和一個(gè)訓(xùn)練子集;
20、利用所述預(yù)設(shè)個(gè)數(shù)的數(shù)組組合中的訓(xùn)練子集分別重新訓(xùn)練所述訓(xùn)練后的所述目標(biāo)機(jī)器學(xué)習(xí)算法,以及利用該數(shù)據(jù)組合中的驗(yàn)證子集對(duì)重新訓(xùn)練后的所述目標(biāo)機(jī)器學(xué)習(xí)算法進(jìn)行性能評(píng)估,得到所述預(yù)設(shè)個(gè)數(shù)的第二模型性能指標(biāo);
21、確定所述預(yù)設(shè)個(gè)數(shù)的第二模型性能指標(biāo)的平均值,得到第三模型性能指標(biāo);
22、在所述第三模型性能指標(biāo)滿足預(yù)設(shè)性能條件的情況下,將重新訓(xùn)練的目標(biāo)機(jī)器學(xué)習(xí)算法確定為網(wǎng)絡(luò)安全威脅信息識(shí)別模型。
23、在某些實(shí)施方式中,所述的網(wǎng)絡(luò)安全處理方法中,所述收集網(wǎng)絡(luò)安全情報(bào),抽取開源網(wǎng)絡(luò)安全情報(bào)中存在的威脅信息的戰(zhàn)術(shù)標(biāo)簽的具體過(guò)程為:
24、收集網(wǎng)絡(luò)完全情報(bào),過(guò)濾干擾信息;
25、將網(wǎng)絡(luò)安全情報(bào)轉(zhuǎn)化為文本格式;
26、計(jì)算文本格式的所述網(wǎng)絡(luò)安全情報(bào)的tfidf文本特征;
27、調(diào)用mlcpdf算法,抽取tfidf文本特征中的威脅信息。
28、在某些實(shí)施方式中,所述的網(wǎng)絡(luò)安全處理方法中,
29、所述歷史網(wǎng)絡(luò)安全數(shù)據(jù)包括攻擊者信息、惡意軟件名稱、漏洞和位置信息
30、所述網(wǎng)絡(luò)安全情報(bào)為描述網(wǎng)絡(luò)威脅事件的整個(gè)過(guò)程的文本信息。
31、本發(fā)明第二方面提供一種應(yīng)用上述網(wǎng)絡(luò)安全處理方法進(jìn)行網(wǎng)絡(luò)安全處理的系統(tǒng),其包括:
32、數(shù)據(jù)獲取模塊,其配置為獲取歷史網(wǎng)絡(luò)安全數(shù)據(jù)、網(wǎng)絡(luò)安全情報(bào)和網(wǎng)絡(luò)通信數(shù)據(jù);
33、網(wǎng)絡(luò)安全威脅信息識(shí)別模型構(gòu)建模塊,其將所述歷史網(wǎng)絡(luò)安全數(shù)據(jù)匯總,得到網(wǎng)絡(luò)安全威脅信息訓(xùn)練集,利用所述網(wǎng)絡(luò)安全威脅信息訓(xùn)練集構(gòu)建網(wǎng)絡(luò)安全威脅信息識(shí)別模型
34、數(shù)據(jù)更新模塊,其利用所述網(wǎng)絡(luò)安全情報(bào),提取所述網(wǎng)絡(luò)安全情報(bào)中存在的威脅信息,建立戰(zhàn)術(shù)標(biāo)簽,匯總所述戰(zhàn)術(shù)標(biāo)簽構(gòu)建威脅信息標(biāo)簽數(shù)據(jù)集,將所述威脅信息標(biāo)簽數(shù)據(jù)集添加至所述網(wǎng)絡(luò)安全威脅信息識(shí)別模型中;
35、分析處理模塊,將網(wǎng)絡(luò)通信數(shù)據(jù)輸入所述網(wǎng)絡(luò)安全威脅信息識(shí)別模型中,進(jìn)行網(wǎng)絡(luò)安全威脅分析。
36、本發(fā)明第三方面提供一種電子設(shè)備,其包括:
37、存儲(chǔ)器,其用于存儲(chǔ)可執(zhí)行指令;
38、處理器,其用于執(zhí)行所述指令,使得所述電子設(shè)備執(zhí)行實(shí)現(xiàn)如權(quán)利要求1~7中任一項(xiàng)所述的網(wǎng)絡(luò)安全處理方法的操作。
39、本發(fā)明第四方面還提供一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),所述計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)存儲(chǔ)有計(jì)算機(jī)指令,所述計(jì)算機(jī)指令被處理器執(zhí)行時(shí)實(shí)現(xiàn)上述的網(wǎng)絡(luò)安全處理方法。
1.一種網(wǎng)絡(luò)安全處理方法,其特征在于,所述方法包括:
2.根據(jù)權(quán)利要求1所述的網(wǎng)絡(luò)安全處理方法,其特征在于,所述獲取歷史網(wǎng)絡(luò)安全數(shù)據(jù),得到網(wǎng)絡(luò)安全威脅信息訓(xùn)練集,包括:
3.根據(jù)權(quán)利要求2所述的網(wǎng)絡(luò)安全處理方法,其特征在于,
4.根據(jù)權(quán)利要求1所述的網(wǎng)絡(luò)安全處理方法,其特征在于,所述的根據(jù)所述網(wǎng)絡(luò)安全威脅信息訓(xùn)練集,構(gòu)建網(wǎng)絡(luò)安全威脅信息識(shí)別模型,包括:
5.根據(jù)權(quán)利要求1所述的網(wǎng)絡(luò)安全處理方法,其特征在于,所述的構(gòu)建網(wǎng)絡(luò)安全威脅信息識(shí)別模型,還包括:
6.根據(jù)權(quán)利要求1所述的網(wǎng)絡(luò)安全處理方法,其特征在于,所述收集網(wǎng)絡(luò)安全情報(bào),抽取開源網(wǎng)絡(luò)安全情報(bào)中存在的威脅信息的戰(zhàn)術(shù)標(biāo)簽的具體過(guò)程為:
7.根據(jù)權(quán)利要求1所述的網(wǎng)絡(luò)安全處理方法,其特征在于,
8.一種應(yīng)用如權(quán)利要求1至7任一項(xiàng)所述的網(wǎng)絡(luò)安全處理方法進(jìn)行網(wǎng)絡(luò)安全處理的系統(tǒng),其特征在于,包括:
9.一種電子設(shè)備,其特征在于,包括:
10.一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),其特征在于,所述計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)存儲(chǔ)有計(jì)算機(jī)指令,所述計(jì)算機(jī)指令被處理器執(zhí)行時(shí)實(shí)現(xiàn)如權(quán)利要求1~7中任一項(xiàng)所述的網(wǎng)絡(luò)安全處理方法。