国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      一種基于文本檢測(cè)和權(quán)重分配的惡意認(rèn)知攻擊組織挖掘方法和裝置

      文檔序號(hào):40280305發(fā)布日期:2024-12-11 13:18閱讀:11來(lái)源:國(guó)知局
      一種基于文本檢測(cè)和權(quán)重分配的惡意認(rèn)知攻擊組織挖掘方法和裝置

      本發(fā)明涉及自然語(yǔ)言處理和社交網(wǎng)絡(luò)認(rèn)知攻擊領(lǐng)域,尤其涉及一種基于文本檢測(cè)和權(quán)重分配的惡意認(rèn)知攻擊組織挖掘方法和裝置。


      背景技術(shù):

      1、在全球信息化和網(wǎng)絡(luò)化快速發(fā)展的當(dāng)今社會(huì),網(wǎng)絡(luò)空間已成為信息交流、商業(yè)交易、社交活動(dòng)等不可或缺的一部分。隨著網(wǎng)絡(luò)技術(shù)的進(jìn)步,各種網(wǎng)絡(luò)安全威脅也隨之出現(xiàn)并不斷演化,其中,認(rèn)知攻擊已成為一種新興且具有極大挑戰(zhàn)性的安全威脅。認(rèn)知攻擊者通過(guò)操縱網(wǎng)絡(luò)信息、傳播虛假消息、偽裝身份等手段,影響個(gè)人或群體的認(rèn)知判斷,進(jìn)而達(dá)到攻擊目的。其危害不僅限于信息層面,更有可能對(duì)社會(huì)穩(wěn)定、公眾心理產(chǎn)生長(zhǎng)期影響。與傳統(tǒng)的網(wǎng)絡(luò)安全威脅相比,認(rèn)知攻擊具有更加隱蔽、影響更廣的特點(diǎn)。

      2、隨著社交媒體和各種網(wǎng)絡(luò)平臺(tái)的流行,信息傳播速度越來(lái)越快,人們獲取信息的渠道也越來(lái)越多。這為攻擊者提供了更為廣闊的發(fā)揮空間。

      3、在實(shí)際情況中,惡意活動(dòng)往往不是由單個(gè)用戶獨(dú)立進(jìn)行,更深層的網(wǎng)絡(luò)威脅通常是由具有高度組織化和明確目標(biāo)的團(tuán)體所驅(qū)動(dòng)的。因此更需要關(guān)注的是那些惡意組織。這些這些惡意組織利用多元手段掌控和操縱網(wǎng)絡(luò)輿論,有可能引發(fā)更大規(guī)模的社會(huì)影響和混亂。而這些組織往往隱藏在網(wǎng)絡(luò)海量信息中,有其獨(dú)特的運(yùn)作模式和復(fù)雜的組織結(jié)構(gòu),為網(wǎng)絡(luò)安全領(lǐng)域帶來(lái)了更大的挑戰(zhàn)。

      4、因此,隨著認(rèn)知攻擊手段的多樣化、目標(biāo)的具體化,如何從海量的網(wǎng)絡(luò)信息中精準(zhǔn)識(shí)別和及時(shí)阻斷認(rèn)知攻擊活動(dòng),成為當(dāng)前網(wǎng)絡(luò)安全領(lǐng)域迫切需要解決的問(wèn)題。此外,挖掘背后的惡意組織,了解其運(yùn)作模式和組織結(jié)構(gòu),對(duì)于徹底消除認(rèn)知攻擊的根源具有非常重要的意義。

      5、在這一背景下,傳統(tǒng)的安全防御手段已不足以應(yīng)對(duì)日漸復(fù)雜的認(rèn)知攻擊場(chǎng)景。需要新的方法和技術(shù)來(lái)辨識(shí)、分析和防御這種新型的網(wǎng)絡(luò)威脅。本發(fā)明正是基于此背景提出,旨在通過(guò)有效的數(shù)據(jù)收集、模型訓(xùn)練、權(quán)重分配和組織聚類等步驟來(lái)識(shí)別和挖掘背后的惡意認(rèn)知攻擊組織,為網(wǎng)絡(luò)安全提供新的防御策略。


      技術(shù)實(shí)現(xiàn)思路

      1、針對(duì)以上技術(shù)問(wèn)題,本發(fā)明提供了一種基于文本檢測(cè)和權(quán)重分配的惡意認(rèn)知攻擊組織挖掘方法和裝置,能有效挖掘惡意認(rèn)知攻擊組織。

      2、本發(fā)明提供了如下技術(shù)方案:

      3、本發(fā)明的第一個(gè)方面涉及一種基于文本檢測(cè)和關(guān)系權(quán)重分配的惡意認(rèn)知攻擊組織挖掘方法,包括以下步驟:

      4、(1)從互聯(lián)網(wǎng)中收集涉及認(rèn)知攻擊的信息數(shù)據(jù),所述的信息數(shù)據(jù)包括文本信息和用戶信息的集合;

      5、(2)由于認(rèn)知攻擊言論往往含有特定關(guān)鍵詞,故從互聯(lián)網(wǎng)中收集已有黑詞庫(kù)結(jié)合收集的最新的部分黑詞形成相對(duì)完整的黑詞庫(kù)。

      6、(3)通過(guò)關(guān)鍵詞匹配算法結(jié)合少量人工修正找出大部分真正的認(rèn)知攻擊文本及對(duì)應(yīng)用戶。

      7、(4)利用已知的大部分正樣本和未知樣本多次訓(xùn)練han模型并測(cè)試,最終識(shí)別出所有的認(rèn)知攻擊樣本數(shù)據(jù),并找到對(duì)應(yīng)的認(rèn)知攻擊用戶。

      8、(5)利用設(shè)計(jì)的一種權(quán)重分配規(guī)則,對(duì)認(rèn)知攻擊用戶行為關(guān)系和話題關(guān)系分別賦予最合理的權(quán)重,利用經(jīng)典的louvain算法進(jìn)行組織聚類。

      9、本發(fā)明中,步驟(5)所述的權(quán)重的設(shè)計(jì)覆蓋面包括:

      10、(a)關(guān)注關(guān)系:關(guān)注通常意味著兩個(gè)用戶之間長(zhǎng)久的聯(lián)系;

      11、(b)點(diǎn)贊:點(diǎn)贊可能表示用戶對(duì)某一條內(nèi)容的喜愛(ài)和認(rèn)可;

      12、(c)回復(fù):可能表示用戶對(duì)某個(gè)話題的參與程度,更可能是想讓這個(gè)話題繼續(xù)發(fā)酵;

      13、(d)兩個(gè)用戶在一定時(shí)間內(nèi)的互動(dòng)次數(shù)表示這段時(shí)間內(nèi)的聯(lián)系緊密性,且隨著次數(shù)的增加權(quán)重會(huì)變高;

      14、(e)發(fā)表評(píng)論內(nèi)容的影響力(點(diǎn)贊數(shù)、回復(fù)數(shù)和轉(zhuǎn)發(fā)數(shù)的總和);

      15、(f)兩個(gè)用戶之間的話題重合度:用戶之間具有相同話題類型的數(shù)量;

      16、(g)一段時(shí)間內(nèi)兩個(gè)用戶之間的共同話題數(shù)超過(guò)一定閾值,權(quán)重適當(dāng)提高。

      17、步驟(1)中,從互聯(lián)網(wǎng)中收集認(rèn)知攻擊相關(guān)的信息數(shù)據(jù),包括:

      18、從人工識(shí)別的十個(gè)認(rèn)知攻擊用戶的關(guān)注列表和粉絲列表擴(kuò)展用戶,收集所述用戶發(fā)表的言論以及每條言論對(duì)應(yīng)的點(diǎn)贊、轉(zhuǎn)發(fā)、評(píng)論數(shù)量以及對(duì)應(yīng)的用戶名。

      19、步驟(2)中,從互聯(lián)網(wǎng)中收集已有黑詞庫(kù)結(jié)合收集的最新的部分黑詞形成相對(duì)完整的黑詞庫(kù)。包括:互聯(lián)網(wǎng)中以往學(xué)者收集的多年以前的黑詞庫(kù),從互聯(lián)網(wǎng)中的最新的認(rèn)知攻擊言論中歸納概括出最新的部分黑詞,最終形成一個(gè)相對(duì)完整且適應(yīng)當(dāng)前最新時(shí)事的黑詞庫(kù)。

      20、步驟(3)中,通過(guò)關(guān)鍵詞匹配算法結(jié)合少量人工修正找出大部分真正的認(rèn)知攻擊文本及對(duì)應(yīng)用戶。包括:

      21、對(duì)收集的所有的數(shù)據(jù)中的言論文本通過(guò)關(guān)鍵詞匹配算法匹配出包含上述黑詞庫(kù)中的敏感詞匯的文本,并將其識(shí)別為認(rèn)知攻擊文本,這條文本所對(duì)應(yīng)的發(fā)表、點(diǎn)贊、轉(zhuǎn)發(fā)、關(guān)注的用戶也為認(rèn)知攻擊用戶。

      22、步驟(4)中,多次訓(xùn)練han模型并測(cè)試,包括

      23、(4-i)固定包含敏感詞匯的文本為正樣本,從剩余的未知樣本n份中每次選取和正樣本等量的樣本1作為負(fù)樣本,得到訓(xùn)練集來(lái)訓(xùn)練han模型。

      24、(4-ii)將上述未知樣本中剩余的樣本n-1作為測(cè)試集,每次訓(xùn)練完,對(duì)測(cè)試集進(jìn)行測(cè)試;

      25、多次重復(fù)上述過(guò)程,將不同的未知樣本作為負(fù)樣本,每個(gè)未知樣本會(huì)有n-1個(gè)預(yù)測(cè)概率,我們選取所述n-1次概率的平均值作為這份樣本的最終預(yù)測(cè)概率;

      26、(4-iii)設(shè)置測(cè)試閾值為0.8,將預(yù)測(cè)為正樣本的概率大于0.8的樣本標(biāo)記為正樣本,否則標(biāo)記為負(fù)樣本;

      27、(5)通過(guò)權(quán)重分配規(guī)則為不同行為關(guān)系和話題關(guān)系分配合理的權(quán)重,并采用louvain算法進(jìn)行組織聚類,包括:

      28、(5-i)權(quán)重設(shè)計(jì)規(guī)則:

      29、帖子影響力:a

      30、兩個(gè)用戶一個(gè)月內(nèi)的互動(dòng)次數(shù)為b

      31、用戶一個(gè)月內(nèi)發(fā)送帖子數(shù)c

      32、用戶a的話題類型為topica(包含a用戶參與所有話題類型的數(shù)組)[1,2,4,6]

      33、用戶b的話題類型為topicb(包含b用戶參與所有話題類型的數(shù)組)[4,6]

      34、話題相同的帖子數(shù)為d

      35、初始的權(quán)重:w0

      36、用戶之間的關(guān)注權(quán)重:w1

      37、用戶之間的點(diǎn)贊?rùn)?quán)重:w2

      38、用戶之間的回復(fù)權(quán)重:w3

      39、用戶之間的轉(zhuǎn)發(fā)權(quán)重:w4

      40、用戶之間的話題權(quán)重:w5

      41、用戶之間的總權(quán)重:w=w1+w2+w3+w4+w5

      42、1.若兩個(gè)用戶之間存在單向關(guān)注,則w1=w0。

      43、2.若兩個(gè)用戶之間存在雙向關(guān)注,則w1=2w0。

      44、3.若一個(gè)帖子a<1000,且兩個(gè)用戶之間b>3,則w2=w2+0.2w0,w3=w3+0.4w0,w4=w4+0.6w0

      45、4.若一個(gè)帖子a<1000,且兩個(gè)用戶之間b≤3,則w2=w2+0.1w0,w3=w3+0.2w0,w4=w4+0.3w0

      46、5.若一個(gè)帖子a≥1000,且b/c>0.2,則w2=w2+0.2w0,w3=w3+0.4w0,w4=w4+0.6w0

      47、6.若一個(gè)帖子a≥1000,且b/c≤0.2,則w2=w2+0.1w0,w3=w3+0.2w0,w4=w4+0.3w0

      48、7.若topica∩topicb>2,d>3,則w5=w5+0.4w0

      49、8.若topica∩topicb>2,d≤3,則w5=w5+0.3w0

      50、9.若topica∩topicb≤2,d>3,則w5=w5+0.2w0

      51、10.若topica∩topicb≤2,d≤3,則w5=w5+0.1w0

      52、(5-ii)將所述權(quán)重設(shè)計(jì)規(guī)則用于認(rèn)知攻擊用戶數(shù)據(jù)中,計(jì)算出所有用戶之間的互動(dòng)關(guān)系權(quán)重;

      53、(5-iii)將所得互動(dòng)關(guān)系權(quán)重應(yīng)用于louvain算法,得到對(duì)應(yīng)的認(rèn)知攻擊群體聚類,最終通過(guò)模塊度來(lái)衡量聚類效果,包括:

      54、(a)第一階段,louvain算法嘗試通過(guò)將節(jié)點(diǎn)移動(dòng)到其鄰居節(jié)點(diǎn)所屬的社區(qū)來(lái)最大化模塊度。

      55、δq=(∑in+2ki,in)-(∑tot+ki)2-(∑tot)2

      56、其中∑tot是社區(qū)c內(nèi)部邊的總權(quán)重;ki,in是節(jié)點(diǎn)i與社區(qū)c內(nèi)節(jié)點(diǎn)的邊的總權(quán)重;∑tot是社區(qū)c的節(jié)點(diǎn)總度數(shù);ki是節(jié)點(diǎn)i的度;

      57、(b)louvain算法將第一階段識(shí)別出的社區(qū)作為新節(jié)點(diǎn)進(jìn)行聚合,構(gòu)建一個(gè)新的網(wǎng)絡(luò),并在這個(gè)新網(wǎng)絡(luò)上重復(fù)第一階段的過(guò)程。

      58、本發(fā)明的第二個(gè)方面涉及一種基于文本檢測(cè)和權(quán)重分配的惡意認(rèn)知攻擊組織挖掘裝置,包括存儲(chǔ)器和一個(gè)或多個(gè)處理器,所述存儲(chǔ)器中存儲(chǔ)有可執(zhí)行代碼,所述一個(gè)或多個(gè)處理器執(zhí)行所述可執(zhí)行代碼時(shí),用于實(shí)現(xiàn)本發(fā)明的一種基于文本檢測(cè)和權(quán)重分配的惡意認(rèn)知攻擊組織挖掘。

      59、本發(fā)明的第三個(gè)方面涉及一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),其上存儲(chǔ)有程序,該程序被處理器執(zhí)行時(shí),實(shí)現(xiàn)本發(fā)明的一種基于文本檢測(cè)和權(quán)重分配的惡意認(rèn)知攻擊組織挖掘。

      60、本發(fā)明的工作原理是(分析本發(fā)明優(yōu)點(diǎn)產(chǎn)生的原因):本發(fā)明通過(guò)以下步驟實(shí)現(xiàn)對(duì)惡意認(rèn)知攻擊組織的挖掘。首先,從互聯(lián)網(wǎng)中收集涉及認(rèn)知攻擊的信息數(shù)據(jù),包括文本信息和用戶信息,擴(kuò)展用戶數(shù)據(jù)并收集互動(dòng)數(shù)據(jù)。接著,結(jié)合已有黑詞庫(kù)和最新黑詞形成相對(duì)完整的黑詞庫(kù),確保關(guān)鍵詞的全面性和時(shí)效性。然后,通過(guò)關(guān)鍵詞匹配算法結(jié)合少量人工修正,識(shí)別出大部分認(rèn)知攻擊文本及對(duì)應(yīng)用戶。之后,利用固定正樣本和多次選取負(fù)樣本的方法訓(xùn)練han模型,對(duì)未知樣本進(jìn)行測(cè)試并計(jì)算平均預(yù)測(cè)概率,以識(shí)別所有認(rèn)知攻擊樣本。最后,通過(guò)設(shè)計(jì)權(quán)重分配規(guī)則,對(duì)認(rèn)知攻擊用戶的行為關(guān)系和話題關(guān)系賦予合理權(quán)重,并采用louvain算法進(jìn)行組織聚類,從而有效識(shí)別出惡意認(rèn)知攻擊組織。

      61、本發(fā)明的優(yōu)點(diǎn)是:本發(fā)明通過(guò)全面的數(shù)據(jù)收集、最新完整的黑詞庫(kù)、高效的文本識(shí)別、先進(jìn)的模型訓(xùn)練、合理的權(quán)重分配和有效的組織聚類,顯著提高了對(duì)惡意認(rèn)知攻擊組織的識(shí)別準(zhǔn)確性和效率。具體而言,通過(guò)收集用戶的互動(dòng)數(shù)據(jù),全面了解用戶關(guān)系;結(jié)合最新黑詞庫(kù),確保識(shí)別的準(zhǔn)確性;通過(guò)關(guān)鍵詞匹配和少量人工修正,快速識(shí)別大量攻擊文本;利用han模型多次訓(xùn)練和測(cè)試,提高模型泛化能力;根據(jù)行為和話題關(guān)系設(shè)計(jì)權(quán)重分配規(guī)則,確保權(quán)重合理性;使用louvain算法進(jìn)行高效聚類,識(shí)別出惡意組織。綜上,本發(fā)明具備高效性、準(zhǔn)確性和可靠性,具有顯著的應(yīng)用價(jià)值。

      當(dāng)前第1頁(yè)1 2 
      網(wǎng)友詢問(wèn)留言 已有0條留言
      • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
      1