所屬的技術(shù)人員能夠理解,本技術(shù)的各個方面可以實現(xiàn)為系統(tǒng)、方法或程序產(chǎn)品。因此,本技術(shù)的各個方面可以具體實現(xiàn)為以下形式,即:完全的硬件實施方式、完全的軟件實施方式(包括固件、微代碼等),或硬件和軟件方面結(jié)合的實施方式,這里可以統(tǒng)稱為“電路”、“模塊”或“系統(tǒng)”。與上述方法實施例基于同一發(fā)明構(gòu)思,本技術(shù)實施例中還提供了一種電子設(shè)備。在一種實施例中,該電子設(shè)備可以是服務(wù)器,如圖1所示的服務(wù)器。在該實施例中,電子設(shè)備的結(jié)構(gòu)可以如圖7所示,包括第一存儲器701,通訊模塊703以及一個或多個第一處理器702。第一存儲器701,用于存儲第一處理器702執(zhí)行的計算機程序。第一存儲器701可主要包括存儲程序區(qū)和存儲數(shù)據(jù)區(qū),其中,存儲程序區(qū)可存儲操作系統(tǒng),以及運行即時通訊功能所需的程序等;存儲數(shù)據(jù)區(qū)可存儲各種即時通訊信息和操作指令集等。第一存儲器701可以是易失性存儲器(volatile?memory),例如隨機存取存儲器(random-access?memory,ram);第一存儲器701也可以是非易失性存儲器(non-volatile?memory),例如只讀存儲器,快閃存儲器(flash?memory),硬盤(hard?disk?drive,hdd)或固態(tài)硬盤(solid-statedrive,ssd);或者第一存儲器701是能夠用于攜帶或存儲具有指令或數(shù)據(jù)結(jié)構(gòu)形式的期望的計算機程序并能夠由計算機存取的任何其他介質(zhì),但不限于此。第一存儲器701可以是上述存儲器的組合。第一處理器702,可以包括一個或多個中央處理單元(central?processing?unit,cpu)或者為數(shù)字處理單元等等。第一處理器702,用于調(diào)用第一存儲器701中存儲的計算機程序時實現(xiàn)上述網(wǎng)絡(luò)資源識別方法。通訊模塊703用于與終端設(shè)備和其他服務(wù)器進行通信。本技術(shù)實施例中不限定上述第一存儲器701、通訊模塊703和第一處理器702之間的具體連接介質(zhì)。本技術(shù)實施例在圖7中以第一存儲器701和第一處理器702之間通過總線704連接,總線704在圖7中以粗線描述,其它部件之間的連接方式,僅是進行示意性說明,并不引以為限??偩€704可以分為地址總線、數(shù)據(jù)總線、控制總線等。為便于描述,圖7中僅用一條粗線描述,但并不描述僅有一根總線或一種類型的總線。第一存儲器701中存儲有計算機存儲介質(zhì),計算機存儲介質(zhì)中存儲有計算機可執(zhí)行指令,計算機可執(zhí)行指令用于實現(xiàn)本技術(shù)實施例的網(wǎng)絡(luò)資源識別方法。第一處理器702用于執(zhí)行上述的網(wǎng)絡(luò)資源識別方法,如圖2所示。在另一種實施例中,電子設(shè)備也可以是其他電子設(shè)備,如圖1所示的終端設(shè)備。在該實施例中,電子設(shè)備的結(jié)構(gòu)可以如圖8所示,包括:通信組件810、第二存儲器820、顯示單元830、攝像頭840、傳感器850、音頻電路860、藍牙模塊870、第二處理器880等部件。通信組件810用于與服務(wù)器進行通信。在一些實施例中,可以包括電路無線保真(wireless?fidelity,wifi)模塊,wifi模塊屬于短距離無線傳輸技術(shù),電子設(shè)備通過wifi模塊可以幫助用戶收發(fā)信息。第二存儲器820可用于存儲軟件程序及數(shù)據(jù)。第二處理器880通過運行存儲在第二存儲器820的軟件程序或數(shù)據(jù),從而執(zhí)行終端設(shè)備的各種功能以及數(shù)據(jù)處理。第二存儲器820可以包括高速隨機存取存儲器,還可以包括非易失性存儲器,例如至少一個磁盤存儲器件、閃存器件、或其他易失性固態(tài)存儲器件。第二存儲器820存儲有使得終端設(shè)備能運行的操作系統(tǒng)。本技術(shù)中第二存儲器820可以存儲操作系統(tǒng)及各種應(yīng)用程序,還可以存儲執(zhí)行本技術(shù)實施例網(wǎng)絡(luò)資源識別方法的計算機程序。顯示單元830還可用于顯示由用戶輸入的信息或提供給用戶的信息以及終端設(shè)備的各種菜單的圖形用戶界面(graphical?user?interface,gui)。具體地,顯示單元830可以包括設(shè)置在終端設(shè)備正面的顯示屏832。其中,顯示屏832可以采用液晶顯示器、發(fā)光二極管等形式來配置。顯示單元830可以用于顯示本技術(shù)實施例中的網(wǎng)絡(luò)資源識別用戶界面等。顯示單元830還可用于接收輸入的數(shù)字或字符信息,產(chǎn)生與終端設(shè)備的用戶設(shè)置以及功能控制有關(guān)的信號輸入,具體地,顯示單元830可以包括設(shè)置在終端設(shè)備正面的觸摸屏831,可收集用戶在其上或附近的觸摸操作,例如點擊按鈕,拖動滾動框等。其中,觸摸屏831可以覆蓋在顯示屏832之上,也可以將觸摸屏831與顯示屏832集成而實現(xiàn)終端設(shè)備的輸入和輸出功能,集成后可以簡稱觸摸顯示屏。本技術(shù)中顯示單元830可以顯示應(yīng)用程序以及對應(yīng)的操作步驟。攝像頭840可用于捕獲靜態(tài)圖像,用戶可以將攝像頭840拍攝的圖像通過應(yīng)用發(fā)布評論。攝像頭840可以是一個,也可以是多個。物體通過鏡頭生成光學(xué)圖像投射到感光元件。感光元件可以是電荷耦合器件(charge?coupled?device,ccd)或互補金屬氧化物半導(dǎo)體(complementary?metal-oxide-semiconductor,cmos)光電晶體管。感光元件把光信號轉(zhuǎn)換成電信號,之后將電信號傳遞給第二處理器880轉(zhuǎn)換成數(shù)字圖像信號。終端設(shè)備還可以包括至少一種傳感器850,比如加速度傳感器851、距離傳感器852、指紋傳感器853、溫度傳感器854。終端設(shè)備還可配置有陀螺儀、氣壓計、濕度計、溫度計、紅外線傳感器、光傳感器、運動傳感器等其他傳感器。音頻電路860、揚聲器861、傳聲器862可提供用戶與終端設(shè)備之間的音頻接口。音頻電路860可將接收到的音頻數(shù)據(jù)轉(zhuǎn)換后的電信號,傳輸?shù)綋P聲器861,由揚聲器861轉(zhuǎn)換為聲音信號輸出。終端設(shè)備還可配置音量按鈕,用于調(diào)節(jié)聲音信號的音量。另一方面,傳聲器862將收集的聲音信號轉(zhuǎn)換為電信號,由音頻電路860接收后轉(zhuǎn)換為音頻數(shù)據(jù),再將音頻數(shù)據(jù)輸出至通信組件810以發(fā)送給比如另一終端設(shè)備,或者將音頻數(shù)據(jù)輸出至第二存儲器820以便進一步處理。藍牙模塊870用于通過藍牙協(xié)議來與其他具有藍牙模塊的藍牙設(shè)備進行信息交互。例如,終端設(shè)備可以通過藍牙模塊870與同樣具備藍牙模塊的可穿戴電子設(shè)備(例如智能手表)建立藍牙連接,從而進行數(shù)據(jù)交互。第二處理器880是終端設(shè)備的控制中心,利用各種接口和線路連接整個終端的各個部分,通過運行或執(zhí)行存儲在第二存儲器820內(nèi)的軟件程序,以及調(diào)用存儲在第二存儲器820內(nèi)的數(shù)據(jù),執(zhí)行終端設(shè)備的各種功能和處理數(shù)據(jù)。在一些實施例中,第二處理器880可包括一個或多個處理單元;第二處理器880還可以集成應(yīng)用處理器和基帶處理器,其中,應(yīng)用處理器主要處理操作系統(tǒng)、用戶界面和應(yīng)用程序等,基帶處理器主要處理無線通信。可以理解的是,上述基帶處理器也可以不集成到第二處理器880中。本技術(shù)中第二處理器880可以運行操作系統(tǒng)、應(yīng)用程序、用戶界面顯示及觸控響應(yīng),以及本技術(shù)實施例的網(wǎng)絡(luò)資源識別方法。另外,第二處理器880與顯示單元830耦接。在一些可能的實施方式中,本技術(shù)提供的網(wǎng)絡(luò)資源識別方法的各個方面還可以實現(xiàn)為一種程序產(chǎn)品的形式,其包括計算機程序,當(dāng)程序產(chǎn)品在電子設(shè)備上運行時,計算機程序用于使電子設(shè)備執(zhí)行本說明書上述描述的根據(jù)本技術(shù)各種示例性實施方式的網(wǎng)絡(luò)資源識別方法中的步驟,例如,電子設(shè)備可以執(zhí)行如圖2中所示的步驟。程序產(chǎn)品可以采用一個或多個可讀介質(zhì)的任意組合??勺x介質(zhì)可以是可讀信號介質(zhì)或者可讀存儲介質(zhì)??勺x存儲介質(zhì)例如可以是但不限于電、磁、光、電磁、紅外線、或半導(dǎo)體的系統(tǒng)、裝置或器件,或者任意以上的組合。可讀存儲介質(zhì)的更具體的例子(非窮舉的列表)包括:具有一個或多個導(dǎo)線的電連接、便攜式盤、硬盤、隨機存取存儲器(ram)、只讀存儲器(rom)、可擦式可編程只讀存儲器(eprom或閃存)、光纖、便攜式緊湊盤只讀存儲器(cd-rom)、光存儲器件、磁存儲器件、或者上述的任意合適的組合。本技術(shù)的實施方式的程序產(chǎn)品可以采用便攜式緊湊盤只讀存儲器(cd-rom)并包括計算機程序,并可以在電子設(shè)備上運行。然而,本技術(shù)的程序產(chǎn)品不限于此,在本文件中,可讀存儲介質(zhì)可以是任何包含或存儲程序的有形介質(zhì),該程序可以被命令執(zhí)行系統(tǒng)、裝置或者器件使用或者與其結(jié)合使用??勺x信號介質(zhì)可以包括在基帶中或者作為載波一部分傳播的數(shù)據(jù)信號,其中承載了可讀計算機程序。這種傳播的數(shù)據(jù)信號可以采用多種形式,包括但不限于電磁信號、光信號或上述的任意合適的組合??勺x信號介質(zhì)還可以是可讀存儲介質(zhì)以外的任何可讀介質(zhì),該可讀介質(zhì)可以發(fā)送、傳播或者傳輸用于由命令執(zhí)行系統(tǒng)、裝置或者器件使用或者與其結(jié)合使用的程序??勺x介質(zhì)上包含的計算機程序可以用任何適當(dāng)?shù)慕橘|(zhì)傳輸,包括但不限于無線、有線、光纜、rf等等,或者上述的任意合適的組合。可以以一種或多種程序設(shè)計語言的任意組合來編寫用于執(zhí)行本技術(shù)操作的計算機程序,程序設(shè)計語言包括面向?qū)ο蟮某绦蛟O(shè)計語言—諸如java、c++等,還包括常規(guī)的過程式程序設(shè)計語言—諸如“c”語言或類似的程序設(shè)計語言。計算機程序可以完全地在用戶電子設(shè)備上執(zhí)行、部分地在用戶設(shè)備上執(zhí)行、作為一個獨立的軟件包執(zhí)行、部分在用戶電子設(shè)備上部分在遠(yuǎn)程電子設(shè)備上執(zhí)行、或者完全在遠(yuǎn)程電子設(shè)備或服務(wù)器上執(zhí)行。在涉及遠(yuǎn)程電子設(shè)備的情形中,遠(yuǎn)程電子設(shè)備可以通過任意種類的網(wǎng)絡(luò)包括局域網(wǎng)(lan)或廣域網(wǎng)(wan)連接到用戶電子設(shè)備,或者,可以連接到外部電子設(shè)備(例如利用因特網(wǎng)服務(wù)提供商來通過因特網(wǎng)連接)。應(yīng)當(dāng)注意,盡管在上文詳細(xì)描述中提及了裝置的若干單元或子單元,但是這種劃分僅僅是示例性的并非強制性的。實際上,根據(jù)本技術(shù)的實施方式,上文描述的兩個或更多單元的特征和功能可以在一個單元中具體化。反之,上文描述的一個單元的特征和功能可以進一步劃分為由多個單元來具體化。此外,盡管在附圖中以特定順序描述了本技術(shù)方法的操作,但是,這并非要求或者暗示必須按照該特定順序來執(zhí)行這些操作,或是必須執(zhí)行全部所示的操作才能實現(xiàn)期望的結(jié)果。附加地或備選地,可以省略某些步驟,將多個步驟合并為一個步驟執(zhí)行,和/或?qū)⒁粋€步驟分解為多個步驟執(zhí)行。本領(lǐng)域內(nèi)的技術(shù)人員應(yīng)明白,本技術(shù)的實施例可提供為方法、系統(tǒng)、或計算機程序產(chǎn)品。因此,本技術(shù)可采用完全硬件實施例、完全軟件實施例、或結(jié)合軟件和硬件方面的實施例的形式。而且,本技術(shù)可采用在一個或多個其中包含有計算機可用計算機程序的計算機可用存儲介質(zhì)(包括但不限于磁盤存儲器、cd-rom、光學(xué)存儲器等)上實施的計算機程序產(chǎn)品的形式。本技術(shù)是參照根據(jù)本技術(shù)實施例的方法、設(shè)備(系統(tǒng))、和計算機程序產(chǎn)品的流程圖和/或方框圖來描述的。應(yīng)理解可由計算機程序命令實現(xiàn)流程圖和/或方框圖中的每一流程和/或方框、以及流程圖和/或方框圖中的流程和/或方框的結(jié)合??商峁┻@些計算機程序命令到通用計算機、專用計算機、嵌入式處理機或其他可編程數(shù)據(jù)處理設(shè)備的處理器以產(chǎn)生一個機器,使得通過計算機或其他可編程數(shù)據(jù)處理設(shè)備的處理器執(zhí)行的命令產(chǎn)生用于實現(xiàn)在流程圖一個流程或多個流程和/或方框圖一個方框或多個方框中指定的功能的裝置。這些計算機程序命令也可存儲在能引導(dǎo)計算機或其他可編程數(shù)據(jù)處理設(shè)備以特定方式工作的計算機可讀存儲器中,使得存儲在該計算機可讀存儲器中的命令產(chǎn)生包括命令裝置的制造品,該命令裝置實現(xiàn)在流程圖一個流程或多個流程和/或方框圖一個方框或多個方框中指定的功能。這些計算機程序命令也可裝載到計算機或其他可編程數(shù)據(jù)處理設(shè)備上,使得在計算機或其他可編程設(shè)備上執(zhí)行一系列操作步驟以產(chǎn)生計算機實現(xiàn)的處理,從而在計算機或其他可編程設(shè)備上執(zhí)行的命令提供用于實現(xiàn)在流程圖一個流程或多個流程和/或方框圖一個方框或多個方框中指定的功能的步驟。盡管已描述了本技術(shù)的優(yōu)選實施例,但本領(lǐng)域內(nèi)的技術(shù)人員一旦得知了基本創(chuàng)造性概念,則可對這些實施例做出另外的變更和修改。所以,所附權(quán)利要求意欲解釋為包括優(yōu)選實施例以及落入本技術(shù)范圍的所有變更和修改。顯然,本領(lǐng)域的技術(shù)人員可以對本技術(shù)進行各種改動和變型而不脫離本技術(shù)的精神和范圍。這樣,倘若本技術(shù)的這些修改和變型屬于本技術(shù)權(quán)利要求及其等同技術(shù)的范圍之內(nèi),則本技術(shù)也意圖包含這些改動和變型在內(nèi)。
背景技術(shù):
1、隨著網(wǎng)絡(luò)安全問題的頻發(fā),安全從業(yè)人員逐漸意識到,網(wǎng)絡(luò)安全防護最有效的方法是盡量減小暴露在網(wǎng)絡(luò)中的互聯(lián)網(wǎng)協(xié)議(internet?protocol,ip)地址,因此對于組織的ip資源的識別越來越被重視,只有在準(zhǔn)確識別組織的ip資源的前提下,才能在網(wǎng)絡(luò)安全防護時做到有的放矢。
2、相關(guān)技術(shù)中,為了識別組織的ip資源,主要是通過人工構(gòu)建出來一部分與組織相關(guān)的關(guān)鍵字,如組織名稱、域名、互聯(lián)網(wǎng)內(nèi)容提供商(internet?content?provider,icp)備案號等關(guān)鍵詞,然后根據(jù)構(gòu)建的關(guān)鍵詞獲取網(wǎng)絡(luò)中組織的相關(guān)數(shù)據(jù),再對獲取到的數(shù)據(jù)進行識別與判定,從中篩選出組織的ip資源?;谏鲜龇绞剑枰罅恐貜?fù)性的人工工作,成本較高且準(zhǔn)確性無法得到保證。
3、綜上,如何提高ip資源識別的準(zhǔn)確率和效率,成為目前亟待解決的問題。
技術(shù)實現(xiàn)思路
1、本技術(shù)實施例提供一種網(wǎng)絡(luò)資源識別方法、裝置、電子設(shè)備和存儲介質(zhì),用以提高ip資源識別的準(zhǔn)確率和效率。
2、本技術(shù)實施例提供的一種網(wǎng)絡(luò)資源識別方法,包括:
3、從預(yù)先構(gòu)建的組織資源圖中查找用于表征目標(biāo)組織的目標(biāo)組織節(jié)點、與所述目標(biāo)組織節(jié)點連通的互聯(lián)網(wǎng)協(xié)議ip地址節(jié)點,以及所述目標(biāo)組織節(jié)點與所述ip地址節(jié)點的連通路徑上的中間節(jié)點,其中,所述組織資源圖包含各候選組織各自對應(yīng)的節(jié)點集合,所述節(jié)點集合中包含:用于表征相應(yīng)候選組織的候選組織節(jié)點、所述候選組織關(guān)聯(lián)的ip地址節(jié)點,以及所述候選組織的候選組織節(jié)點與ip地址節(jié)點之間的各個中間節(jié)點,所述中間節(jié)點是基于所述候選組織的組織數(shù)據(jù)、網(wǎng)站數(shù)據(jù)和域名數(shù)據(jù)提取的;
4、基于所述目標(biāo)組織節(jié)點、所述ip地址節(jié)點和所述中間節(jié)點各自的節(jié)點特征,確定所述目標(biāo)組織節(jié)點與所述ip地址節(jié)點之間的相關(guān)性參數(shù),其中,所述節(jié)點特征用于表示相應(yīng)節(jié)點的語義和連接關(guān)系;
5、基于所述相關(guān)性參數(shù),確定所述ip地址節(jié)點對應(yīng)的ip地址與所述目標(biāo)組織的關(guān)聯(lián)關(guān)系。
6、可選的,通過以下方式構(gòu)建所述組織資源圖:
7、針對每個候選組織,從所述候選組織的組織數(shù)據(jù)和網(wǎng)站數(shù)據(jù)中提取出多條文本數(shù)據(jù),并分別對所述多條文本數(shù)據(jù)進行關(guān)鍵詞提取,獲得所述多條文本數(shù)據(jù)各自的關(guān)鍵詞集合;
8、從所述候選組織的組織數(shù)據(jù)、網(wǎng)站數(shù)據(jù)和域名數(shù)據(jù)中,提取各預(yù)設(shè)類型的參考數(shù)據(jù);
9、將各關(guān)鍵詞集合和提取的各參考數(shù)據(jù)分別作為節(jié)點,按照預(yù)設(shè)的層級結(jié)構(gòu)連接,生成所述組織資源圖。
10、可選的,所述分別對所述多條文本數(shù)據(jù)進行關(guān)鍵詞提取,獲得所述多條文本數(shù)據(jù)各自的關(guān)鍵詞集合,包括:
11、針對每條文本數(shù)據(jù),對所述文本數(shù)據(jù)進行分詞,獲得所述文本數(shù)據(jù)的分詞集合;
12、針對所述分詞集合中的每個分詞,基于所述分詞在所述文本數(shù)據(jù)中出現(xiàn)的頻率和包含所述分詞的文本數(shù)據(jù)的數(shù)量,確定所述分詞的重要性參數(shù);
13、基于各分詞各自的重要性參數(shù),對所述分詞集合中的分詞進行至少一輪篩選,獲得所述文本數(shù)據(jù)的關(guān)鍵詞集合。
14、可選的,所述基于各分詞各自的重要性參數(shù),對所述分詞集合中的分詞進行至少一輪篩選,獲得所述文本數(shù)據(jù)的關(guān)鍵詞集合,包括:
15、在每輪篩選中執(zhí)行以下步驟:
16、將所述分詞集合中對應(yīng)的重要性參數(shù)最小的兩個分詞合并為新分詞,并將所述兩個分詞的重要性參數(shù)之和作為所述新分詞的重要性參數(shù);
17、針對當(dāng)前所述分詞集合包含的各分詞,將對應(yīng)的重要性參數(shù)大于預(yù)設(shè)數(shù)值的分詞作為關(guān)鍵詞,抽取至所述文本數(shù)據(jù)的關(guān)鍵詞集合,并將抽取的分詞從所述分詞集合中刪除。
18、可選的,所述方法還包括:
19、若所述分詞集合中剩余的各分詞的重要性參數(shù)之和不大于所述預(yù)設(shè)數(shù)值,則停止篩選,將當(dāng)前的關(guān)鍵詞集合作為所述文本數(shù)據(jù)的關(guān)鍵詞集合。
20、可選的,所述基于所述目標(biāo)組織節(jié)點、所述ip地址節(jié)點和所述中間節(jié)點各自的節(jié)點特征,確定所述目標(biāo)組織節(jié)點與所述ip地址節(jié)點之間的相關(guān)性參數(shù),包括:
21、將所述目標(biāo)組織節(jié)點的節(jié)點特征與預(yù)設(shè)的初始特征進行特征融合,獲得所述目標(biāo)組織節(jié)點的輸出特征;
22、針對除所述目標(biāo)組織節(jié)點之外的各節(jié)點,將所述節(jié)點的節(jié)點特征和輸入特征進行特征融合,獲得所述節(jié)點的輸出特征,所述節(jié)點為所述ip地址節(jié)點或所述中間節(jié)點,所述輸入特征是基于指向所述節(jié)點的各上層節(jié)點的輸出特征獲得的;
23、對所述ip地址節(jié)點的輸出特征進行映射,獲得所述相關(guān)性參數(shù)。
24、可選的,所述基于所述相關(guān)性參數(shù),確定所述ip地址節(jié)點對應(yīng)的ip地址與所述目標(biāo)組織的關(guān)聯(lián)關(guān)系,包括:
25、若所述相關(guān)性參數(shù)大于預(yù)設(shè)的分?jǐn)?shù)閾值,則確定所述ip地址節(jié)點對應(yīng)的ip地址屬于所述目標(biāo)組織。
26、本技術(shù)實施例提供的一種網(wǎng)絡(luò)資源識別裝置,包括:
27、查找單元,用于從預(yù)先構(gòu)建的組織資源圖中查找用于表征目標(biāo)組織的目標(biāo)組織節(jié)點、與所述目標(biāo)組織節(jié)點連通的互聯(lián)網(wǎng)協(xié)議ip地址節(jié)點,以及所述目標(biāo)組織節(jié)點與所述ip地址節(jié)點的連通路徑上的中間節(jié)點,其中,所述組織資源圖包含各候選組織各自對應(yīng)的節(jié)點集合,所述節(jié)點集合中包含:用于表征相應(yīng)候選組織的候選組織節(jié)點、所述候選組織關(guān)聯(lián)的ip地址節(jié)點,以及所述候選組織的候選組織節(jié)點與ip地址節(jié)點之間的各個中間節(jié)點,所述中間節(jié)點是基于所述候選組織的組織數(shù)據(jù)、網(wǎng)站數(shù)據(jù)和域名數(shù)據(jù)提取的;
28、確定單元,用于基于所述目標(biāo)組織節(jié)點、所述ip地址節(jié)點和所述中間節(jié)點各自的節(jié)點特征,確定所述目標(biāo)組織節(jié)點與所述ip地址節(jié)點之間的相關(guān)性參數(shù),其中,所述節(jié)點特征用于表示相應(yīng)節(jié)點的語義和連接關(guān)系;
29、關(guān)聯(lián)單元,用于基于所述相關(guān)性參數(shù),確定所述ip地址節(jié)點對應(yīng)的ip地址與所述目標(biāo)組織的關(guān)聯(lián)關(guān)系。
30、可選的,所述裝置還包括構(gòu)建單元,用于通過以下方式構(gòu)建所述組織資源圖:
31、針對每個候選組織,從所述候選組織的組織數(shù)據(jù)和網(wǎng)站數(shù)據(jù)中提取出多條文本數(shù)據(jù),并分別對所述多條文本數(shù)據(jù)進行關(guān)鍵詞提取,獲得所述多條文本數(shù)據(jù)各自的關(guān)鍵詞集合;
32、從所述候選組織的組織數(shù)據(jù)、網(wǎng)站數(shù)據(jù)和域名數(shù)據(jù)中,提取各預(yù)設(shè)類型的參考數(shù)據(jù);
33、將各關(guān)鍵詞集合和提取的各參考數(shù)據(jù)分別作為節(jié)點,按照預(yù)設(shè)的層級結(jié)構(gòu)連接,生成所述組織資源圖。
34、可選的,所述構(gòu)建單元具體用于:
35、針對每條文本數(shù)據(jù),對所述文本數(shù)據(jù)進行分詞,獲得所述文本數(shù)據(jù)的分詞集合;
36、針對所述分詞集合中的每個分詞,基于所述分詞在所述文本數(shù)據(jù)中出現(xiàn)的頻率和包含所述分詞的文本數(shù)據(jù)的數(shù)量,確定所述分詞的重要性參數(shù);
37、基于各分詞各自的重要性參數(shù),對所述分詞集合中的分詞進行至少一輪篩選,獲得所述文本數(shù)據(jù)的關(guān)鍵詞集合。
38、可選的,所述構(gòu)建單元具體用于:
39、在每輪篩選中執(zhí)行以下步驟:
40、將所述分詞集合中對應(yīng)的重要性參數(shù)最小的兩個分詞合并為新分詞,并將所述兩個分詞的重要性參數(shù)之和作為所述新分詞的重要性參數(shù);
41、針對當(dāng)前所述分詞集合包含的各分詞,將對應(yīng)的重要性參數(shù)大于預(yù)設(shè)數(shù)值的分詞作為關(guān)鍵詞,抽取至所述文本數(shù)據(jù)的關(guān)鍵詞集合,并將抽取的分詞從所述分詞集合中刪除。
42、可選的,所述構(gòu)建單元還用于:
43、若所述分詞集合中剩余的各分詞的重要性參數(shù)之和不大于所述預(yù)設(shè)數(shù)值,則停止篩選,將當(dāng)前的關(guān)鍵詞集合作為所述文本數(shù)據(jù)的關(guān)鍵詞集合。
44、可選的,所述確定單元具體用于:
45、將所述目標(biāo)組織節(jié)點的節(jié)點特征與預(yù)設(shè)的初始特征進行特征融合,獲得所述目標(biāo)組織節(jié)點的輸出特征;
46、針對除所述目標(biāo)組織節(jié)點之外的各節(jié)點,將所述節(jié)點的節(jié)點特征和輸入特征進行特征融合,獲得所述節(jié)點的輸出特征,所述節(jié)點為所述ip地址節(jié)點或所述中間節(jié)點,所述輸入特征是基于指向所述節(jié)點的各上層節(jié)點的輸出特征獲得的;
47、對所述ip地址節(jié)點的輸出特征進行映射,獲得所述相關(guān)性參數(shù)。
48、可選的,所述關(guān)聯(lián)單元具體用于:
49、若所述相關(guān)性參數(shù)大于預(yù)設(shè)的分?jǐn)?shù)閾值,則確定所述ip地址節(jié)點對應(yīng)的ip地址屬于所述目標(biāo)組織。
50、本技術(shù)實施例提供的一種電子設(shè)備,包括處理器和存儲器,其中,所述存儲器存儲有計算機程序,當(dāng)所述計算機程序被所述處理器執(zhí)行時,使得所述處理器執(zhí)行上述任意一種網(wǎng)絡(luò)資源識別方法的步驟。
51、本技術(shù)實施例提供一種計算機可讀存儲介質(zhì),其包括計算機程序,當(dāng)所述計算機程序在電子設(shè)備上運行時,所述計算機程序用于使所述電子設(shè)備執(zhí)行上述任意一種網(wǎng)絡(luò)資源識別方法的步驟。
52、本技術(shù)實施例提供一種計算機程序產(chǎn)品,所述計算機程序產(chǎn)品包括計算機程序,所述計算機程序存儲在計算機可讀存儲介質(zhì)中;當(dāng)電子設(shè)備的處理器從計算機可讀存儲介質(zhì)讀取所述計算機程序時,所述處理器執(zhí)行所述計算機程序,使得所述電子設(shè)備執(zhí)行上述任意一種網(wǎng)絡(luò)資源識別方法的步驟。
53、本技術(shù)有益效果如下:
54、本技術(shù)實施例提供了一種網(wǎng)絡(luò)資源識別方法、裝置、電子設(shè)備和存儲介質(zhì),由于預(yù)先根據(jù)各候選組織的組織數(shù)據(jù)、網(wǎng)站數(shù)據(jù)和域名數(shù)據(jù),構(gòu)建了組織資源圖,進而能夠從企業(yè)資源圖中查找到用于表征目標(biāo)組織的目標(biāo)組織節(jié)點、與目標(biāo)組織節(jié)點連通的ip地址節(jié)點,以及目標(biāo)組織節(jié)點與ip地址節(jié)點的連通路徑上的中間節(jié)點,然后基于目標(biāo)組織節(jié)點、ip地址節(jié)點和中間節(jié)點各自的節(jié)點特征,確定目標(biāo)組織節(jié)點與ip地址節(jié)點之間的相關(guān)性參數(shù),基于相關(guān)性參數(shù),確定ip地址節(jié)點對應(yīng)的ip地址與目標(biāo)組織的關(guān)聯(lián)關(guān)系。基于上述方式,通過在目標(biāo)組織節(jié)點和ip地址節(jié)點之間進行多路徑建模,能夠充分利用多路徑的信息,確定ip地址與目標(biāo)組織的關(guān)系,提高對ip資產(chǎn)識別的準(zhǔn)確率和效率。
55、本技術(shù)的其它特征和優(yōu)點將在隨后的說明書中闡述,并且,部分地從說明書中變得顯而易見,或者通過實施本技術(shù)而了解。本技術(shù)的目的和其他優(yōu)點可通過在所寫的說明書、權(quán)利要求書、以及附圖中所特別指出的結(jié)構(gòu)來實現(xiàn)和獲得。