本技術(shù)涉及網(wǎng)絡(luò)安全的,具體涉及一種基于網(wǎng)絡(luò)流量及元數(shù)據(jù)的涉詐實(shí)體聚類的方法和裝置。
背景技術(shù):
1、隨著網(wǎng)絡(luò)技術(shù)的飛速發(fā)展,網(wǎng)絡(luò)安全問題愈發(fā)突出,尤其是網(wǎng)絡(luò)詐騙活動(dòng)的頻發(fā),已對(duì)個(gè)人和企業(yè)造成了巨大的經(jīng)濟(jì)損失。
2、現(xiàn)有的詐騙實(shí)體反制與追蹤方法大多依賴于對(duì)域名的人工匯總和分析,然而,由于域名的快速變化和單次使用特性,這種方法不僅效率低下,而且容易遺漏關(guān)鍵信息。一些方案可能采用基本的數(shù)據(jù)分析和模式匹配來追蹤詐騙活動(dòng),但它們通常缺乏處理大規(guī)模數(shù)據(jù)的能力,以及對(duì)復(fù)雜詐騙模式的深入理解和處理能力。更為具體地說,現(xiàn)有技術(shù)主要依賴在事后收集數(shù)據(jù)以形成“污水池”,試圖從中識(shí)別涉詐信息。然而,在當(dāng)前涉案域名的重復(fù)使用率逐漸降低,新域名不斷涌現(xiàn)的背景下,尤其是很多域名僅用于單次或單日使用,這種方法已經(jīng)難以有效地收集到這些短期使用的域名。
3、因此,如何提供一種既能準(zhǔn)確識(shí)別并追蹤涉詐網(wǎng)絡(luò)實(shí)體的技術(shù)方案,成為了本領(lǐng)域技術(shù)人員亟待解決的問題。
技術(shù)實(shí)現(xiàn)思路
1、本技術(shù)提供一種基于網(wǎng)絡(luò)流量及元數(shù)據(jù)的涉詐實(shí)體聚類的方法和裝置,通過預(yù)設(shè)的聚類算法對(duì)標(biāo)記后的數(shù)據(jù)進(jìn)行聚類分析,能夠有效識(shí)別出涉詐的潛在目標(biāo)網(wǎng)絡(luò)實(shí)體,能夠自動(dòng)發(fā)現(xiàn)具有相似特征或行為模式的網(wǎng)絡(luò)實(shí)體,從而快速定位潛在的詐騙活動(dòng);結(jié)合態(tài)勢(shì)感知技術(shù),對(duì)元數(shù)據(jù)進(jìn)行聚合分析,進(jìn)一步從潛在目標(biāo)中識(shí)別并追蹤具體的目標(biāo)網(wǎng)絡(luò)實(shí)體,這種實(shí)時(shí)監(jiān)測(cè)和追蹤能力使得網(wǎng)絡(luò)安全團(tuán)隊(duì)能夠迅速響應(yīng),對(duì)涉詐行為進(jìn)行有效干預(yù)和打擊。
2、在本技術(shù)的第一方面提供了一種基于網(wǎng)絡(luò)流量及元數(shù)據(jù)的涉詐實(shí)體聚類的方法,應(yīng)用于涉詐網(wǎng)絡(luò)實(shí)體聚類及追蹤平臺(tái),所述方法包括:
3、從多個(gè)數(shù)據(jù)源獲取流量日志和元數(shù)據(jù),所述數(shù)據(jù)源包括cdn、公有云、私有云及目標(biāo)區(qū)域內(nèi)部網(wǎng)絡(luò);
4、通過預(yù)設(shè)標(biāo)簽傳播算法對(duì)所述流量日志中的流量進(jìn)行標(biāo)記,以區(qū)分cdn流量、公有云流量、私有云流量、whois隱私保護(hù)流量、惡意流量和業(yè)務(wù)流量;
5、通過預(yù)設(shè)聚類算法對(duì)標(biāo)記的數(shù)據(jù)進(jìn)行聚類分析以識(shí)別涉詐的潛在目標(biāo)網(wǎng)絡(luò)實(shí)體;
6、通過態(tài)勢(shì)感知技術(shù)對(duì)所述元數(shù)據(jù)進(jìn)行聚合分析以從所述潛在目標(biāo)網(wǎng)絡(luò)實(shí)體中識(shí)別并追蹤目標(biāo)網(wǎng)絡(luò)實(shí)體,并進(jìn)行風(fēng)險(xiǎn)評(píng)估。
7、通過采用上述技術(shù)方案,從cdn、公有云、私有云及目標(biāo)區(qū)域內(nèi)部網(wǎng)絡(luò)等多個(gè)數(shù)據(jù)源獲取流量日志和元數(shù)據(jù),確保了數(shù)據(jù)的全面性和多樣性。這種多源數(shù)據(jù)融合的方式,能夠更全面地反映網(wǎng)絡(luò)流量和元數(shù)據(jù)的真實(shí)情況,為后續(xù)的聚類分析和態(tài)勢(shì)感知提供堅(jiān)實(shí)的基礎(chǔ)。通過預(yù)設(shè)的標(biāo)簽傳播算法,對(duì)流量日志中的流量進(jìn)行精準(zhǔn)標(biāo)記,有效區(qū)分了cdn流量、公有云流量、私有云流量、whois隱私保護(hù)流量、惡意流量和業(yè)務(wù)流量。這種精細(xì)化的流量分類,有助于后續(xù)聚類分析時(shí)更準(zhǔn)確地識(shí)別涉詐網(wǎng)絡(luò)實(shí)體。采用預(yù)設(shè)的聚類算法對(duì)標(biāo)記后的數(shù)據(jù)進(jìn)行聚類分析,以識(shí)別涉詐的潛在目標(biāo)網(wǎng)絡(luò)實(shí)體。聚類算法能夠自動(dòng)發(fā)現(xiàn)數(shù)據(jù)中的潛在模式和結(jié)構(gòu),將具有相似特征的數(shù)據(jù)點(diǎn)歸為一類,從而有效識(shí)別出涉詐網(wǎng)絡(luò)實(shí)體。這種方法不僅提高了分析效率,還降低了人工干預(yù)的成本。通過態(tài)勢(shì)感知技術(shù)對(duì)元數(shù)據(jù)進(jìn)行聚合分析,從潛在目標(biāo)網(wǎng)絡(luò)實(shí)體中進(jìn)一步識(shí)別并追蹤目標(biāo)網(wǎng)絡(luò)實(shí)體,并進(jìn)行風(fēng)險(xiǎn)評(píng)估。態(tài)勢(shì)感知技術(shù)能夠?qū)崟r(shí)監(jiān)測(cè)網(wǎng)絡(luò)狀態(tài)的變化,及時(shí)發(fā)現(xiàn)并應(yīng)對(duì)潛在的安全威脅。同時(shí),通過追蹤目標(biāo)網(wǎng)絡(luò)實(shí)體,可以深入了解其行為模式和特征,為后續(xù)的打擊和防范提供有力支持。
8、可選的,所述通過預(yù)設(shè)標(biāo)簽傳播算法對(duì)所述流量日志中的流量進(jìn)行標(biāo)記包括:
9、基于配置信息為已知類別的節(jié)點(diǎn)設(shè)置初始標(biāo)簽,所述已知類別的節(jié)點(diǎn)包括cdn節(jié)點(diǎn)、公有云節(jié)點(diǎn)和whois隱私保護(hù)類節(jié)點(diǎn);
10、根據(jù)節(jié)點(diǎn)之間的連接關(guān)系確定每個(gè)節(jié)點(diǎn)的最終標(biāo)簽,所述連接關(guān)系包括流量日志中記錄的流量或網(wǎng)絡(luò)連接;
11、根據(jù)經(jīng)過節(jié)點(diǎn)的節(jié)點(diǎn)標(biāo)簽、流量特征和流量行為模式對(duì)流量進(jìn)行標(biāo)記,所述流量特征包括協(xié)議類型、端口號(hào)和請(qǐng)求url,所述流量行為模式包括訪問頻率和請(qǐng)求時(shí)間分布。
12、通過采用上述技術(shù)方案,為已知類別的節(jié)點(diǎn)(如cdn節(jié)點(diǎn)、公有云節(jié)點(diǎn)和whois隱私保護(hù)類節(jié)點(diǎn))設(shè)置初始標(biāo)簽,可以確保這些節(jié)點(diǎn)在標(biāo)簽傳播過程中的準(zhǔn)確性。這些節(jié)點(diǎn)作為“錨點(diǎn)”,為整個(gè)網(wǎng)絡(luò)流量的標(biāo)簽分配提供了可靠的基準(zhǔn)。根據(jù)節(jié)點(diǎn)之間的連接關(guān)系(如流量日志中記錄的流量或網(wǎng)絡(luò)連接)來確定每個(gè)節(jié)點(diǎn)的最終標(biāo)簽,充分考慮了網(wǎng)絡(luò)流量的實(shí)際流向和節(jié)點(diǎn)間的相互作用。通過傳播算法,未知標(biāo)簽的節(jié)點(diǎn)能夠根據(jù)與之相連的已知標(biāo)簽節(jié)點(diǎn)的信息來推斷自己的標(biāo)簽,從而提高了標(biāo)簽分配的準(zhǔn)確性。在標(biāo)記流量時(shí),不僅考慮了流量的基本特征(如協(xié)議類型、端口號(hào)和請(qǐng)求url),還結(jié)合了流量的行為模式(如訪問頻率和請(qǐng)求時(shí)間分布)。這種多維度的考慮方式使得流量標(biāo)記更加精細(xì),能夠更準(zhǔn)確地反映流量的真實(shí)屬性和潛在風(fēng)險(xiǎn)。通過引入流量行為模式(如訪問頻率和請(qǐng)求時(shí)間分布),可以更加深入地理解流量的行為特征。這些行為模式往往與涉詐活動(dòng)密切相關(guān),因此通過對(duì)其進(jìn)行分析和標(biāo)記,可以更有效地識(shí)別出潛在的詐騙行為。通過預(yù)設(shè)的標(biāo)簽傳播算法,可以自動(dòng)地為網(wǎng)絡(luò)流量分配標(biāo)簽,減少了人工干預(yù)的成本和錯(cuò)誤率。這種自動(dòng)化的標(biāo)簽分配方式提高了網(wǎng)絡(luò)流量分析的效率和準(zhǔn)確性。結(jié)合流量特征和流量行為模式進(jìn)行標(biāo)記,使得系統(tǒng)能夠智能化地識(shí)別出潛在的詐騙行為。這種智能化識(shí)別能力為網(wǎng)絡(luò)安全團(tuán)隊(duì)提供了有力的支持,有助于他們及時(shí)發(fā)現(xiàn)和應(yīng)對(duì)網(wǎng)絡(luò)詐騙活動(dòng)。
13、可選的,所述通過預(yù)設(shè)聚類算法對(duì)標(biāo)記的數(shù)據(jù)進(jìn)行聚類分析以識(shí)別涉詐的潛在目標(biāo)網(wǎng)絡(luò)實(shí)體包括:
14、根據(jù)詐騙行為的識(shí)別需求選擇目標(biāo)特征,對(duì)所述目標(biāo)特征進(jìn)行預(yù)處理和歸一化,所述目標(biāo)特征包括域名年齡、ssl證書信息、ip位置相似度、域名漢明距離、ip服務(wù)和端口信息;
15、根據(jù)所述詐騙行為的特性設(shè)置所述預(yù)設(shè)聚類算法的鄰域半徑和最小點(diǎn)數(shù),根據(jù)所述預(yù)設(shè)聚類算法和所述目標(biāo)特征對(duì)標(biāo)記的數(shù)據(jù)進(jìn)行聚類分析以生成聚類結(jié)果;
16、基于聚類結(jié)果,分析不同簇的特征和共性,以確定涉詐的潛在目標(biāo)網(wǎng)絡(luò)實(shí)體。
17、通過采用上述技術(shù)方案,根據(jù)詐騙行為的識(shí)別需求,選擇了一系列與目標(biāo)網(wǎng)絡(luò)實(shí)體相關(guān)的特征,如域名年齡、ssl證書信息、ip位置相似度、域名漢明距離、ip服務(wù)和端口信息等。這些特征的選擇基于對(duì)網(wǎng)絡(luò)詐騙行為的深入理解,能夠全面反映網(wǎng)絡(luò)實(shí)體的潛在風(fēng)險(xiǎn)。通過對(duì)這些目標(biāo)特征進(jìn)行預(yù)處理和歸一化,消除了不同特征之間的量綱差異,提高了聚類分析的準(zhǔn)確性和可靠性。根據(jù)詐騙行為的特性,對(duì)預(yù)設(shè)聚類算法的鄰域半徑和最小點(diǎn)數(shù)進(jìn)行了定制化設(shè)置。這種定制化處理使得聚類算法更加適應(yīng)于詐騙行為的識(shí)別場(chǎng)景,能夠更準(zhǔn)確地發(fā)現(xiàn)具有相似特征和行為模式的網(wǎng)絡(luò)實(shí)體。通過預(yù)設(shè)的聚類算法對(duì)標(biāo)記后的數(shù)據(jù)進(jìn)行自動(dòng)化聚類分析,無需人工干預(yù)即可生成聚類結(jié)果。這種自動(dòng)化的處理方式大大提高了詐騙行為識(shí)別的效率,降低了人力成本。基于聚類結(jié)果,系統(tǒng)能夠自動(dòng)分析不同簇的特征和共性,從而識(shí)別出涉詐的潛在目標(biāo)網(wǎng)絡(luò)實(shí)體。這種智能化的識(shí)別方式使得系統(tǒng)能夠及時(shí)發(fā)現(xiàn)并應(yīng)對(duì)潛在的詐騙威脅,提高了網(wǎng)絡(luò)安全的防御能力。聚類分析過程中考慮了多個(gè)維度的特征信息,如域名、ssl證書、ip位置等,這些信息為風(fēng)險(xiǎn)評(píng)估提供了全面的依據(jù)。通過對(duì)這些特征的綜合分析,可以更加準(zhǔn)確地評(píng)估網(wǎng)絡(luò)實(shí)體的潛在風(fēng)險(xiǎn)。
18、可選的,所述根據(jù)所述預(yù)設(shè)聚類算法和所述目標(biāo)特征對(duì)標(biāo)記的數(shù)據(jù)進(jìn)行聚類分析以生成聚類結(jié)果包括:
19、根據(jù)所述鄰域半徑、所述最小點(diǎn)數(shù)和所述目標(biāo)特征特征,對(duì)標(biāo)記的數(shù)據(jù)進(jìn)行分組;
20、遍歷標(biāo)記的數(shù)據(jù)中所有的數(shù)據(jù)點(diǎn),當(dāng)目標(biāo)數(shù)據(jù)點(diǎn)的所述領(lǐng)域半徑內(nèi)的數(shù)據(jù)點(diǎn)的數(shù)量大于或等于所述最小點(diǎn)數(shù)時(shí),將所述目標(biāo)數(shù)據(jù)點(diǎn)設(shè)置為核心點(diǎn);
21、從所述核心點(diǎn)出發(fā),通過密度可達(dá)性將相鄰的數(shù)據(jù)點(diǎn)連接成一個(gè)簇,根據(jù)所述簇生成聚類結(jié)果。
22、通過采用上述技術(shù)方案,采用基于密度的聚類算法(如dbscan等),通過鄰域半徑和最小點(diǎn)數(shù)兩個(gè)參數(shù)來控制聚類的緊密程度。這種方法能夠有效地識(shí)別出任意形狀的簇,從而提高了聚類分析的準(zhǔn)確性。在遍歷數(shù)據(jù)點(diǎn)的過程中,根據(jù)鄰域半徑內(nèi)數(shù)據(jù)點(diǎn)的數(shù)量來判斷是否為核心點(diǎn)。這種判斷方式確保了只有密度足夠高的區(qū)域才能被識(shí)別為簇的核心部分,進(jìn)一步提高了聚類的準(zhǔn)確性。從核心點(diǎn)出發(fā),通過密度可達(dá)性將相鄰的數(shù)據(jù)點(diǎn)連接成一個(gè)簇。這種連接方式不僅考慮了數(shù)據(jù)點(diǎn)之間的空間距離,還考慮了數(shù)據(jù)點(diǎn)的密度特性,使得聚類結(jié)果更加穩(wěn)定可靠。即使數(shù)據(jù)集中存在噪聲或異常點(diǎn),也能夠通過密度可達(dá)性的判斷來避免其對(duì)聚類結(jié)果的影響。鄰域半徑和最小點(diǎn)數(shù)作為聚類算法的關(guān)鍵參數(shù),可以根據(jù)具體的詐騙行為識(shí)別需求進(jìn)行靈活調(diào)整。這種可配置性使得聚類算法能夠適用于不同規(guī)模和特性的數(shù)據(jù)集,提高了算法的適用性和靈活性。通過遍歷數(shù)據(jù)點(diǎn)并基于密度可達(dá)性進(jìn)行連接,聚類算法能夠高效地處理大規(guī)模數(shù)據(jù)集。同時(shí),由于核心點(diǎn)的識(shí)別過程相對(duì)簡(jiǎn)單且直接,因此整個(gè)聚類過程的計(jì)算復(fù)雜度較低,能夠在較短的時(shí)間內(nèi)生成聚類結(jié)果。
23、可選的,所述通過態(tài)勢(shì)感知技術(shù)對(duì)所述元數(shù)據(jù)進(jìn)行聚合分析以從所述潛在目標(biāo)網(wǎng)絡(luò)實(shí)體中識(shí)別并追蹤目標(biāo)網(wǎng)絡(luò)實(shí)體包括:
24、采用數(shù)據(jù)聚合技術(shù),對(duì)預(yù)處理后的元數(shù)據(jù)進(jìn)行聚合,以揭示潛在的詐騙行為模式和趨勢(shì);
25、采用自然語(yǔ)言處理和語(yǔ)義分析技術(shù),對(duì)聚合后的元數(shù)據(jù)進(jìn)行理解,以揭示數(shù)據(jù)之間的邏輯關(guān)系,通過關(guān)聯(lián)推理算法,確定不同詐騙行為和網(wǎng)絡(luò)資產(chǎn)之間的聯(lián)系;
26、采用時(shí)間序列分析和深度學(xué)習(xí)模型,對(duì)詐騙行為的趨勢(shì)和網(wǎng)絡(luò)資產(chǎn)風(fēng)險(xiǎn)進(jìn)行預(yù)測(cè),并繪制詐騙趨勢(shì)預(yù)測(cè)圖。
27、通過采用上述技術(shù)方案,通過數(shù)據(jù)聚合技術(shù)將預(yù)處理后的元數(shù)據(jù)進(jìn)行有效整合,從而揭示出潛在的詐騙行為模式和趨勢(shì)。數(shù)據(jù)聚合不僅有助于發(fā)現(xiàn)單一數(shù)據(jù)點(diǎn)中的異常,還能通過模式匹配和趨勢(shì)分析,揭示出詐騙行為在時(shí)間、空間、行為模式等方面的共性和規(guī)律。這有助于安全團(tuán)隊(duì)更好地理解詐騙行為的本質(zhì)和演變過程。采用自然語(yǔ)言處理和語(yǔ)義分析技術(shù),對(duì)聚合后的元數(shù)據(jù)進(jìn)行深入理解和解析。這些技術(shù)能夠識(shí)別出數(shù)據(jù)中的關(guān)鍵詞、短語(yǔ)和句子,并理解它們之間的邏輯關(guān)系。通過關(guān)聯(lián)推理算法,可以進(jìn)一步確定不同詐騙行為和網(wǎng)絡(luò)資產(chǎn)之間的內(nèi)在聯(lián)系,為后續(xù)的追蹤和應(yīng)對(duì)提供有力支持?;谡Z(yǔ)義理解和關(guān)聯(lián)推理的結(jié)果,安全團(tuán)隊(duì)可以更加準(zhǔn)確地判斷詐騙行為的性質(zhì)和影響范圍,從而制定更加精準(zhǔn)和有效的應(yīng)對(duì)策略。這有助于提升安全決策的智能化水平,減少人為誤判和漏判的風(fēng)險(xiǎn)。通過時(shí)間序列分析和深度學(xué)習(xí)模型的應(yīng)用,可以對(duì)詐騙行為的趨勢(shì)和網(wǎng)絡(luò)資產(chǎn)的風(fēng)險(xiǎn)進(jìn)行精準(zhǔn)預(yù)測(cè)。這些模型能夠捕捉到數(shù)據(jù)中的微小變化和潛在規(guī)律,并據(jù)此預(yù)測(cè)未來的發(fā)展趨勢(shì)。通過繪制詐騙趨勢(shì)預(yù)測(cè)圖,安全團(tuán)隊(duì)可以直觀地了解詐騙行為的演變趨勢(shì)和潛在風(fēng)險(xiǎn)點(diǎn),為未來的安全防范工作提供有力指導(dǎo)。
28、可選的,所述采用數(shù)據(jù)聚合技術(shù),對(duì)預(yù)處理后的元數(shù)據(jù)進(jìn)行聚合,以揭示潛在的詐騙行為模式和趨勢(shì)包括:
29、將發(fā)生詐騙行為的類型信息作為聚合的關(guān)鍵字,通過統(tǒng)計(jì)每個(gè)類型在總體詐騙行為中的分布情況以識(shí)別出發(fā)生率最高的詐騙行為類型;
30、將發(fā)生詐騙行為的地理位置信息作為聚合的關(guān)鍵字,通過統(tǒng)計(jì)每個(gè)地理位置上發(fā)生的詐騙行為的數(shù)量繪制出詐騙行為的熱力圖或分布圖;
31、將發(fā)生詐騙行為的時(shí)間信息作為聚合的關(guān)鍵字,通過統(tǒng)計(jì)每個(gè)時(shí)間段內(nèi)發(fā)生的詐騙行為的數(shù)量繪制出詐騙行為的時(shí)間線圖;
32、通過將單一維度的分析結(jié)果進(jìn)行交叉組合,形成多維度交叉聚合的視圖,所述單一維度包括類型、位置和時(shí)間。
33、通過采用上述技術(shù)方案,將詐騙行為類型作為聚合的關(guān)鍵字,通過統(tǒng)計(jì)每種類型在總體詐騙行為中的分布情況,能夠直觀地識(shí)別出發(fā)生率最高的詐騙行為類型。這種精確識(shí)別有助于安全團(tuán)隊(duì)將有限的資源優(yōu)先投入到對(duì)高發(fā)詐騙行為的防范和打擊上,提高防范效率。利用地理位置信息作為聚合關(guān)鍵字,通過繪制詐騙行為的熱力圖或分布圖,能夠直觀地展示詐騙行為在不同地理區(qū)域的分布情況。這種可視化呈現(xiàn)方式有助于安全團(tuán)隊(duì)快速定位高風(fēng)險(xiǎn)區(qū)域,并采取相應(yīng)的防范措施,減少詐騙行為的發(fā)生。將時(shí)間信息作為聚合關(guān)鍵字,通過統(tǒng)計(jì)每個(gè)時(shí)間段內(nèi)發(fā)生的詐騙行為數(shù)量,并繪制時(shí)間線圖,可以清晰地展示出詐騙行為的時(shí)間分布規(guī)律。這種分析有助于安全團(tuán)隊(duì)預(yù)測(cè)未來詐騙行為的高發(fā)時(shí)段,并提前做好準(zhǔn)備,有效遏制詐騙行為的蔓延。通過將單一維度的分析結(jié)果進(jìn)行交叉組合,形成多維度交叉聚合的視圖,可以更加全面地了解詐騙行為的復(fù)雜性和多樣性。這種多維度分析不僅有助于揭示詐騙行為之間的內(nèi)在聯(lián)系和相互影響,還能為安全團(tuán)隊(duì)提供更加精準(zhǔn)的決策支持,使其能夠制定更加全面、有效的防范策略。
34、可選的,所述采用自然語(yǔ)言處理和語(yǔ)義分析技術(shù),對(duì)聚合后的元數(shù)據(jù)進(jìn)行理解,以揭示數(shù)據(jù)之間的邏輯關(guān)系,通過關(guān)聯(lián)推理算法,確定不同詐騙行為和網(wǎng)絡(luò)資產(chǎn)之間的聯(lián)系包括:
35、通過命名實(shí)體識(shí)別技術(shù)從聚合后的元數(shù)據(jù)中抽取出實(shí)體,所述實(shí)體包括詐騙手段名稱、受害者類型、ip地址和域名;
36、利用關(guān)系抽取技術(shù),識(shí)別并提取出所述實(shí)體之間的關(guān)系,結(jié)合上下文信息,對(duì)抽取出的實(shí)體和所述關(guān)系進(jìn)行語(yǔ)義理解,以揭示其背后的邏輯關(guān)系;
37、根據(jù)預(yù)設(shè)規(guī)則將不同數(shù)據(jù)點(diǎn)進(jìn)行關(guān)聯(lián),將關(guān)聯(lián)的數(shù)據(jù)點(diǎn)以網(wǎng)絡(luò)圖的形式表示,節(jié)點(diǎn)代表實(shí)體,邊代表實(shí)體之間的關(guān)系;
38、通過關(guān)聯(lián)推理算法,在網(wǎng)絡(luò)圖中進(jìn)行路徑搜索和影響力分析,以揭示不同詐騙行為和網(wǎng)絡(luò)資產(chǎn)之間的聯(lián)系。
39、通過采用上述技術(shù)方案,精確地從海量、復(fù)雜的元數(shù)據(jù)中抽取出關(guān)鍵實(shí)體,如詐騙手段名稱、受害者類型、ip地址和域名等。這些實(shí)體是理解詐騙行為和網(wǎng)絡(luò)資產(chǎn)之間關(guān)系的基礎(chǔ),精準(zhǔn)抽取有助于提高后續(xù)分析的準(zhǔn)確性和效率。利用關(guān)系抽取技術(shù),能夠識(shí)別并提取出實(shí)體之間的關(guān)系,并結(jié)合上下文信息進(jìn)行語(yǔ)義理解。這不僅能夠揭示實(shí)體之間直接的、顯性的關(guān)系,還能通過語(yǔ)義推理發(fā)現(xiàn)隱性的、深層次的邏輯關(guān)系。這種深入理解有助于更全面地把握詐騙行為和網(wǎng)絡(luò)資產(chǎn)的復(fù)雜關(guān)系網(wǎng)絡(luò)。將關(guān)聯(lián)的數(shù)據(jù)點(diǎn)以網(wǎng)絡(luò)圖的形式表示,節(jié)點(diǎn)代表實(shí)體,邊代表實(shí)體之間的關(guān)系。這種可視化呈現(xiàn)方式使得復(fù)雜的詐騙行為和網(wǎng)絡(luò)資產(chǎn)關(guān)系網(wǎng)絡(luò)變得直觀易懂,有助于安全團(tuán)隊(duì)快速定位關(guān)鍵節(jié)點(diǎn)和關(guān)系路徑,為后續(xù)的分析和決策提供有力支持。在網(wǎng)絡(luò)圖中進(jìn)行路徑搜索和影響力分析,能夠高效地揭示不同詐騙行為和網(wǎng)絡(luò)資產(chǎn)之間的聯(lián)系。通過關(guān)聯(lián)推理算法,可以識(shí)別出詐騙行為是如何通過網(wǎng)絡(luò)資產(chǎn)進(jìn)行傳播和擴(kuò)散的,這些信息對(duì)于制定針對(duì)性的防范策略具有重要意義。
40、在本技術(shù)的第二方面提供了一種基于網(wǎng)絡(luò)流量及元數(shù)據(jù)的涉詐實(shí)體聚類的系統(tǒng),包括采集模塊、標(biāo)記模塊、聚類模塊以及執(zhí)行模塊,其中:
41、采集模塊,配置用于從多個(gè)數(shù)據(jù)源獲取流量日志和元數(shù)據(jù),所述數(shù)據(jù)源包括cdn、公有云、私有云及目標(biāo)區(qū)域內(nèi)部網(wǎng)絡(luò);
42、標(biāo)記模塊,配置用于通過預(yù)設(shè)標(biāo)簽傳播算法對(duì)所述流量日志中的流量進(jìn)行標(biāo)記,以區(qū)分cdn流量、公有云流量、私有云流量、whois隱私保護(hù)流量、惡意流量和業(yè)務(wù)流量;
43、聚類模塊,配置用于通過預(yù)設(shè)聚類算法對(duì)標(biāo)記的數(shù)據(jù)進(jìn)行聚類分析以識(shí)別涉詐的潛在目標(biāo)網(wǎng)絡(luò)實(shí)體;
44、執(zhí)行模塊,配置用于通過態(tài)勢(shì)感知技術(shù)對(duì)所述元數(shù)據(jù)進(jìn)行聚合分析以從所述潛在目標(biāo)網(wǎng)絡(luò)實(shí)體中識(shí)別并追蹤目標(biāo)網(wǎng)絡(luò)實(shí)體,并進(jìn)行風(fēng)險(xiǎn)評(píng)估。
45、在本技術(shù)的第三方面提供了一種電子設(shè)備,包括處理器、存儲(chǔ)器、用戶接口以及網(wǎng)絡(luò)接口,所述存儲(chǔ)器用于存儲(chǔ)指令,所述用戶接口和所述網(wǎng)絡(luò)接口均用于與其他設(shè)備通信,所述處理器用于執(zhí)行所述存儲(chǔ)器中存儲(chǔ)的指令,以使所述電子設(shè)備執(zhí)行如上述任意一項(xiàng)所述的方法。
46、在本技術(shù)的第四方面提供了一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),所述計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)存儲(chǔ)有指令,當(dāng)所述指令被執(zhí)行時(shí),執(zhí)行如上述任意一項(xiàng)所述的方法。
47、綜上所述,本技術(shù)實(shí)施例中提供的一個(gè)或多個(gè)技術(shù)方案,至少具有如下技術(shù)效果或優(yōu)點(diǎn):
48、1、從cdn、公有云、私有云及目標(biāo)區(qū)域內(nèi)部網(wǎng)絡(luò)等多個(gè)數(shù)據(jù)源獲取流量日志和元數(shù)據(jù),這種廣泛性和多樣性的數(shù)據(jù)源確保了數(shù)據(jù)的全面性和準(zhǔn)確性,為后續(xù)的分析提供了堅(jiān)實(shí)的基礎(chǔ);
49、2、通過預(yù)設(shè)標(biāo)簽傳播算法對(duì)流量日志中的流量進(jìn)行標(biāo)記,有效區(qū)分了cdn流量、公有云流量、私有云流量、whois隱私保護(hù)流量、惡意流量和業(yè)務(wù)流量。這種精細(xì)化的分類不僅提高了數(shù)據(jù)分析的精度,還為后續(xù)的聚類分析提供了清晰的邊界條件;
50、3、利用預(yù)設(shè)聚類算法對(duì)標(biāo)記后的數(shù)據(jù)進(jìn)行聚類分析,能夠自動(dòng)識(shí)別出潛在的涉詐目標(biāo)網(wǎng)絡(luò)實(shí)體,這種基于數(shù)據(jù)驅(qū)動(dòng)的方法相比傳統(tǒng)的人工分析更加高效、準(zhǔn)確,能夠快速鎖定涉詐目標(biāo),為后續(xù)的處理提供有力支持;
51、4、通過態(tài)勢(shì)感知技術(shù)對(duì)元數(shù)據(jù)進(jìn)行聚合分析,不僅揭示了潛在的詐騙行為模式和趨勢(shì),還通過自然語(yǔ)言處理和語(yǔ)義分析技術(shù)、時(shí)間序列分析和深度學(xué)習(xí)模型等技術(shù)手段,進(jìn)一步理解了數(shù)據(jù)之間的邏輯關(guān)系,預(yù)測(cè)了詐騙行為的趨勢(shì)和網(wǎng)絡(luò)資產(chǎn)風(fēng)險(xiǎn),這種深度分析有助于安全團(tuán)隊(duì)從復(fù)雜的數(shù)據(jù)中抽絲剝繭,準(zhǔn)確識(shí)別并追蹤目標(biāo)網(wǎng)絡(luò)實(shí)體;
52、5、在識(shí)別并追蹤到目標(biāo)網(wǎng)絡(luò)實(shí)體后,該方法還進(jìn)行了風(fēng)險(xiǎn)評(píng)估。通過綜合考慮多個(gè)因素(如詐騙行為類型、發(fā)生頻率、影響范圍等),能夠精確評(píng)估目標(biāo)網(wǎng)絡(luò)實(shí)體的風(fēng)險(xiǎn)等級(jí),為后續(xù)的應(yīng)對(duì)措施提供科學(xué)依據(jù);
53、6、具備實(shí)時(shí)處理網(wǎng)絡(luò)流量和元數(shù)據(jù)的能力,能夠及時(shí)發(fā)現(xiàn)并應(yīng)對(duì)潛在的詐騙行為,同時(shí),通過動(dòng)態(tài)調(diào)整聚類算法和態(tài)勢(shì)感知技術(shù)的參數(shù),還能夠適應(yīng)網(wǎng)絡(luò)環(huán)境的變化,保持高效、準(zhǔn)確的性能。