本發(fā)明涉及大規(guī)模社區(qū)檢測,尤其是指一種基于代理模型自適應(yīng)選擇的多目標(biāo)大規(guī)模社區(qū)檢測方法。
背景技術(shù):
1、在現(xiàn)實(shí)生活中,通過將系統(tǒng)中的每個(gè)實(shí)體定義為一個(gè)節(jié)點(diǎn),實(shí)體間的交互關(guān)系定義為邊,從而將復(fù)雜系統(tǒng)建模成復(fù)雜網(wǎng)絡(luò)來進(jìn)行分析;復(fù)雜網(wǎng)絡(luò)的社區(qū)結(jié)構(gòu)定義為內(nèi)緊外松的拓?fù)浣Y(jié)構(gòu),即一組節(jié)點(diǎn)的集合,集合內(nèi)部的節(jié)點(diǎn)交互緊密,不同集合之間的節(jié)點(diǎn)交互松散;常見的復(fù)雜網(wǎng)絡(luò)包括電力網(wǎng)絡(luò)、航空網(wǎng)絡(luò)、計(jì)算機(jī)網(wǎng)絡(luò)、交通網(wǎng)絡(luò)與社交網(wǎng)絡(luò)。
2、社區(qū)檢測是用來揭示網(wǎng)絡(luò)聚集行為的一種技術(shù),用于從復(fù)雜網(wǎng)絡(luò)中解析出模塊化的社區(qū)結(jié)構(gòu),以便了解該復(fù)雜網(wǎng)絡(luò)對應(yīng)的現(xiàn)實(shí)世界中的復(fù)雜系統(tǒng)的組織原則和拓?fù)浣Y(jié)構(gòu)。具體來說,社區(qū)檢測將復(fù)雜網(wǎng)絡(luò)劃分為社區(qū),劃分之后,同一個(gè)社區(qū)之內(nèi)的節(jié)點(diǎn)之間連接較為緊密,且越密集越好,不同社區(qū)內(nèi)的節(jié)點(diǎn)之間的連接較稀疏,且越稀疏越好。由于與現(xiàn)實(shí)世界相關(guān)的數(shù)據(jù)量的不斷增大,大規(guī)模復(fù)雜網(wǎng)絡(luò)的社區(qū)檢測在各個(gè)領(lǐng)域引起了相當(dāng)大的關(guān)注。
3、社區(qū)檢測不僅可以對復(fù)雜網(wǎng)絡(luò)進(jìn)行社區(qū)劃分,同樣也可以用于解決其他一些需要考慮節(jié)點(diǎn)間關(guān)系的問題。例如,在線社交網(wǎng)絡(luò)中的朋友推薦問題,復(fù)雜的在線社交網(wǎng)絡(luò)通常是稀疏結(jié)構(gòu),代表了用戶潛在的在線社交圈的一小部分;因此,可以將朋友推薦問題可以形式化為一個(gè)概率模型,通過檢測用戶的密集社會(huì)社區(qū)來評估未來友誼關(guān)系的概率,以便尋找兩個(gè)不相鄰用戶之間形成友誼的概率。例如,sybil防御問題,sybil是一個(gè)存在許多惡意活動(dòng)的偽造賬戶,比如刷票、通過偽造身份提供誤導(dǎo)信息控制某些賬戶;用戶利用sybil創(chuàng)建多個(gè)身份與合法賬戶建立友誼,進(jìn)而對社交網(wǎng)絡(luò)進(jìn)行攻擊,而社區(qū)檢測可以通過對社交網(wǎng)絡(luò)進(jìn)行檢測,基于每個(gè)節(jié)點(diǎn)所連接的節(jié)點(diǎn)類型,分辨出這樣的偽造用戶。例如,社區(qū)檢測還可以應(yīng)用于web社區(qū)檢測,將社區(qū)的概念應(yīng)用于萬維網(wǎng)中,以增強(qiáng)web搜索結(jié)果,進(jìn)一步提高網(wǎng)頁檢索精度。
4、目前,科學(xué)家們基于不同原理開發(fā)了許多社區(qū)發(fā)現(xiàn)算法,他們可以分為三類。第一類采用傳統(tǒng)的圖劃分和聚類方法,包括圖劃分、層次聚類、分區(qū)聚類、譜聚類。第二類則是分裂的方法,去除鏈接不同社區(qū)節(jié)點(diǎn)的邊,其中最流行的算法是由girvan?and?newman提出的。第三類是優(yōu)化算法,例如數(shù)學(xué)規(guī)劃。在這些算法中,大多數(shù)非啟發(fā)式算法是確定性的,在檢測質(zhì)量和計(jì)算效率方面均存在一定的局限性,在面對復(fù)雜網(wǎng)絡(luò)進(jìn)行社區(qū)檢測時(shí)仍然具有挑戰(zhàn)性。
5、進(jìn)化算法ea屬于元啟發(fā)式算法,當(dāng)前已經(jīng)開發(fā)了幾種有效的進(jìn)化算法ea用于復(fù)雜網(wǎng)絡(luò)的社區(qū)檢測;這些算法根據(jù)優(yōu)化的目標(biāo)數(shù)量可以分為兩種:單目標(biāo)優(yōu)化和多目標(biāo)優(yōu)化。在單目標(biāo)優(yōu)化中,通常采用模塊度作為優(yōu)化的目標(biāo);多目標(biāo)優(yōu)化通常會(huì)同時(shí)優(yōu)化多個(gè)相互沖突的目標(biāo),因此在理論研究中被廣泛應(yīng)用于復(fù)雜網(wǎng)絡(luò)的社區(qū)檢測。然而,在實(shí)際網(wǎng)絡(luò)應(yīng)用中,利用多目標(biāo)優(yōu)化方法有效檢測復(fù)雜的大規(guī)模社區(qū)結(jié)構(gòu)的研究工作卻較少;因此,利用基于多目標(biāo)優(yōu)化的大規(guī)模社區(qū)檢測算法來提高網(wǎng)絡(luò)的應(yīng)用性能將是科學(xué)界非常感興趣的問題。
6、盡管進(jìn)化算法ea在社區(qū)檢測方面表現(xiàn)出不錯(cuò)的性能,但是進(jìn)化算法基于種群迭代優(yōu)化的機(jī)制需要消耗更多的目標(biāo)函數(shù)評估次數(shù),不可避免地存在耗時(shí)的問題,無法普及至大規(guī)模的復(fù)雜網(wǎng)絡(luò)中;且隨著網(wǎng)絡(luò)規(guī)模的增加,進(jìn)化算法ea的搜索空間呈指數(shù)型增長,因此,現(xiàn)有的基于進(jìn)化算法ea的大規(guī)模社區(qū)檢測算法只適用于具有相對較少的節(jié)點(diǎn)的網(wǎng)絡(luò)社區(qū)檢測。對于大規(guī)模復(fù)雜網(wǎng)絡(luò)的社區(qū)檢測,進(jìn)化算法存在檢測耗時(shí)、資源浪費(fèi),且檢測效率低的問題。
技術(shù)實(shí)現(xiàn)思路
1、為此,本發(fā)明所要解決的技術(shù)問題在于克服現(xiàn)有技術(shù)在對大規(guī)模復(fù)雜網(wǎng)絡(luò)進(jìn)行社區(qū)檢測時(shí),算法耗時(shí),且存在資源浪費(fèi),檢測效率低的問題。
2、為解決上述技術(shù)問題,本發(fā)明提供了一種基于代理模型自適應(yīng)選擇的多目標(biāo)大規(guī)模社區(qū)檢測方法,包括:
3、獲取待檢測網(wǎng)絡(luò),構(gòu)建待檢測網(wǎng)絡(luò)的鄰接矩陣;
4、基于待檢測網(wǎng)絡(luò)的鄰接矩陣,獲取待檢測網(wǎng)絡(luò)中每個(gè)節(jié)點(diǎn)的度與待檢測網(wǎng)絡(luò)的初始平均度,選取核心節(jié)點(diǎn),構(gòu)建核心節(jié)點(diǎn)集合;
5、基于待檢測網(wǎng)絡(luò)的鄰接矩陣,構(gòu)建待檢測網(wǎng)絡(luò)中節(jié)點(diǎn)的相似度矩陣;
6、基于核心節(jié)點(diǎn)集合與相似度矩陣初始化父代種群,構(gòu)建包含多個(gè)個(gè)體的初始父代種群;每個(gè)個(gè)體均對應(yīng)一個(gè)候選解,表示待檢測網(wǎng)絡(luò)的一種劃分方式;
7、利用多目標(biāo)遺傳算法nsga-ii,對初始父代種群進(jìn)行選擇、交叉與變異,獲取更新后的父代種群,直至更新后的父代種群中個(gè)體的個(gè)數(shù)達(dá)到預(yù)設(shè)候選解集空間大小,得到目標(biāo)父代種群,計(jì)算目標(biāo)父代種群中每個(gè)個(gè)體所表示的劃分方式的kernel?k-means目標(biāo)函數(shù)值kkm與相對變化目標(biāo)函數(shù)值rc,構(gòu)建kkm樣本空間與rc樣本空間;
8、基于kkm樣本空間與rc樣本空間,對候選代理模型池中的多種代理模型分別進(jìn)行訓(xùn)練,利用交叉驗(yàn)證,計(jì)算并基于每種代理模型的肯達(dá)爾系數(shù)與斯皮爾曼系數(shù),獲取評估每種代理模型預(yù)測準(zhǔn)確度的性能評價(jià)指標(biāo)值,選取性能評價(jià)指標(biāo)值最大所對應(yīng)的代理模型作為目標(biāo)代理模型;
9、利用目標(biāo)代理模型,基于多目標(biāo)遺傳算法nsga-ii,以kernel?k-means目標(biāo)函數(shù)值kkm與相對變化目標(biāo)函數(shù)值rc最小為優(yōu)化目標(biāo),獲取最優(yōu)目標(biāo)代理模型;利用最優(yōu)目標(biāo)代理模型對待檢測網(wǎng)絡(luò)進(jìn)行社區(qū)檢測,獲取非支配解集;將非支配解集中序值最小的非支配最優(yōu)層所包含的個(gè)體,組成最優(yōu)解集輸出;
10、基于最優(yōu)解集中每個(gè)個(gè)體所表示的劃分方式中的社區(qū)個(gè)數(shù)、每個(gè)社區(qū)中的總邊數(shù),以及節(jié)點(diǎn)度之和,計(jì)算每個(gè)個(gè)體對應(yīng)的模塊度指標(biāo)值;
11、獲取模塊度指標(biāo)值最大的個(gè)體所對應(yīng)的劃分方式,對待檢測網(wǎng)絡(luò)進(jìn)行社區(qū)劃分,完成多目標(biāo)大規(guī)模社區(qū)檢測。
12、優(yōu)選地,獲取待檢測網(wǎng)絡(luò)后,對待檢測網(wǎng)絡(luò)進(jìn)行約簡,刪除其中度為1的節(jié)點(diǎn),獲取約簡待檢測網(wǎng)絡(luò)。
13、優(yōu)選地,所述基于待檢測網(wǎng)絡(luò)的鄰接矩陣,獲取待檢測網(wǎng)絡(luò)中每個(gè)節(jié)點(diǎn)的度與待檢測網(wǎng)絡(luò)的初始平均度,選取核心節(jié)點(diǎn),構(gòu)建核心節(jié)點(diǎn)集合,包括:
14、計(jì)算待檢測網(wǎng)絡(luò)中所有節(jié)點(diǎn)的度的平均值,作為初始平均度;
15、對待檢測網(wǎng)絡(luò)中每個(gè)節(jié)點(diǎn)的度,進(jìn)行排序,選擇大于所述初始平均度的節(jié)點(diǎn)中,度最大的節(jié)點(diǎn),作為核心節(jié)點(diǎn),加入核心節(jié)點(diǎn)集合;
16、將該核心節(jié)點(diǎn)及其所連接的鄰居節(jié)點(diǎn),從待檢測網(wǎng)絡(luò)中刪除,獲取更新后的待檢測網(wǎng)絡(luò);
17、重復(fù)從更新后的待檢測網(wǎng)絡(luò)中大于所述初始平均度的節(jié)點(diǎn)中,選取度最大的節(jié)點(diǎn),作為新的核心節(jié)點(diǎn),加入核心節(jié)點(diǎn)集合,并從更新待檢測網(wǎng)絡(luò)中刪除該核心節(jié)點(diǎn)及其所連接的鄰居節(jié)點(diǎn),直至更新后的待檢測網(wǎng)絡(luò)中沒有度大于所述初始平均度的節(jié)點(diǎn),完成對核心節(jié)點(diǎn)集合的構(gòu)建。
18、優(yōu)選地,所述基于待檢測網(wǎng)絡(luò)的鄰接矩陣,構(gòu)建待檢測網(wǎng)絡(luò)中節(jié)點(diǎn)的相似度矩陣,表示為:
19、;
20、其中,表示待檢測網(wǎng)絡(luò)中第i個(gè)節(jié)點(diǎn)與第j個(gè)節(jié)點(diǎn)之間的擴(kuò)散核相似性,n表示待檢測網(wǎng)絡(luò)中的節(jié)點(diǎn)總個(gè)數(shù);為預(yù)設(shè)權(quán)重,表示待檢測網(wǎng)絡(luò)的拉普拉斯矩陣,表達(dá)式為,表示待檢測網(wǎng)絡(luò)的度矩陣,表示待檢測網(wǎng)絡(luò)的鄰接矩陣。
21、優(yōu)選地,所述基于核心節(jié)點(diǎn)集合與相似度矩陣初始化父代種群,構(gòu)建包含多個(gè)個(gè)體的初始父代種群,包括:
22、基于待檢測網(wǎng)絡(luò),利用預(yù)設(shè)編碼格式,隨機(jī)生成個(gè)利用軌跡編碼表示的個(gè)體;利用解碼函數(shù)對軌跡編碼進(jìn)行解碼,獲取每個(gè)個(gè)體對應(yīng)的標(biāo)簽編碼;在每個(gè)個(gè)體中的每個(gè)社區(qū)內(nèi)選擇一個(gè)核心節(jié)點(diǎn),作為社區(qū)中心,完成對父代種群中一半個(gè)體的初始化;表示預(yù)設(shè)種群大??;
23、選取一個(gè)小于核心節(jié)點(diǎn)集合中核心節(jié)點(diǎn)的數(shù)量的隨機(jī)數(shù)rank,作為社區(qū)個(gè)數(shù);為每個(gè)社區(qū)選取一個(gè)核心節(jié)點(diǎn),基于相似度矩陣,將待檢測網(wǎng)絡(luò)中所有節(jié)點(diǎn),分別劃分至與其擴(kuò)散核相似性最高的核心節(jié)點(diǎn)所對應(yīng)的社區(qū)中,獲取一個(gè)個(gè)體;更新隨機(jī)數(shù)rank,直至獲取個(gè)個(gè)體,完成對父代種群中另一半個(gè)體的初始化,獲取初始父代種群。
24、優(yōu)選地,所述利用多目標(biāo)遺傳算法nsga-ii,對初始父代種群進(jìn)行選擇、交叉與變異,獲取更新后的父代種群,直至更新后的父代種群中個(gè)體的個(gè)數(shù)達(dá)到預(yù)設(shè)候選解集空間大小,得到目標(biāo)父代種群,計(jì)算目標(biāo)父代種群中每個(gè)個(gè)體所表示的劃分方式的kernel?k-means目標(biāo)函數(shù)值kkm與相對變化目標(biāo)函數(shù)值rc,構(gòu)建kkm樣本空間與rc樣本空間,包括:
25、對當(dāng)前父代種群進(jìn)行選擇、交叉與變異,獲取當(dāng)前子代種群;
26、將當(dāng)前子代種群與當(dāng)前父代種群合并,利用kernel?k-means目標(biāo)函數(shù)值kkm與相對變化目標(biāo)函數(shù)值rc評估合并后的種群中每個(gè)候選解的質(zhì)量,利用多目標(biāo)遺傳算法nsga-ii的非支配排序和擁擠度距離計(jì)算操作對合并后的種群進(jìn)行生存選擇,獲取更新后的父代種群;
27、對更新后的父代種群進(jìn)行選擇、交叉與變異,直至樣本空間中個(gè)體的個(gè)數(shù)達(dá)到預(yù)設(shè)候選解集空間大小,獲取目標(biāo)父代種群;
28、以目標(biāo)父代種群中的每個(gè)個(gè)體為樣本,以每個(gè)個(gè)體對應(yīng)的kernel?k-means目標(biāo)函數(shù)值kkm為標(biāo)簽,構(gòu)建為kkm樣本空間;以目標(biāo)父代種群中的每個(gè)個(gè)體為樣本,以每個(gè)個(gè)體對應(yīng)的相對變化目標(biāo)函數(shù)值rc為標(biāo)簽,構(gòu)建為rc樣本空間。
29、優(yōu)選地,計(jì)算每個(gè)個(gè)體所表示的劃分方式對應(yīng)的kernel?k-means目標(biāo)函數(shù)值kkm與相對變化目標(biāo)函數(shù)值rc,包括:
30、構(gòu)建個(gè)體所表示的劃分方式對應(yīng)的kernel?k-means目標(biāo)函數(shù)值kkm,表示為:;
31、構(gòu)建個(gè)體所表示的劃分方式對應(yīng)的相對變化目標(biāo)函數(shù)值rc,表示為:;
32、其中,表示待檢測網(wǎng)絡(luò)中的節(jié)點(diǎn)總個(gè)數(shù),表示社區(qū)數(shù)量;表示當(dāng)前計(jì)算的劃分方式中第i個(gè)社區(qū)中邊的數(shù)量,表達(dá)式為:;表示當(dāng)前計(jì)算的劃分方式中第i個(gè)社區(qū)中的節(jié)點(diǎn)個(gè)數(shù);表示當(dāng)前計(jì)算的劃分方式中第i個(gè)社區(qū)所連接的其他社區(qū)的數(shù)量,表達(dá)式為:;表示待檢測網(wǎng)絡(luò)中第i個(gè)節(jié)點(diǎn)與第j個(gè)節(jié)點(diǎn)之間的連接關(guān)系,表達(dá)式為:。
33、優(yōu)選地,對父代種群進(jìn)行選擇、交叉與變異,獲取子代種群,包括:
34、基于預(yù)設(shè)選擇算法從初始父代種群中選取父個(gè)體與母個(gè)體;
35、獲取一個(gè)長度等于初始父代種群中個(gè)體的節(jié)點(diǎn)數(shù)量的交叉點(diǎn)位掩碼;
36、獲取父個(gè)體與母個(gè)體中每個(gè)節(jié)點(diǎn)對應(yīng)的基因型,包括初始基因型與社區(qū)中心基因型;
37、若交叉點(diǎn)位掩碼中掩碼值為1,判斷父個(gè)體與母個(gè)體在該掩碼值對應(yīng)的位置處的節(jié)點(diǎn)的屬性:
38、若均為核心節(jié)點(diǎn),則將父個(gè)體與母個(gè)體中在該掩碼值對應(yīng)位置處的節(jié)點(diǎn)的屬性交換,此時(shí):
39、若節(jié)點(diǎn)由社區(qū)中心節(jié)點(diǎn)變?yōu)榉巧鐓^(qū)中心節(jié)點(diǎn),則將該節(jié)點(diǎn)及該節(jié)點(diǎn)所屬社區(qū)中的節(jié)點(diǎn)的基因型均修改為初始基因型;
40、若節(jié)點(diǎn)由非社區(qū)中心節(jié)點(diǎn)變?yōu)樯鐓^(qū)中心節(jié)點(diǎn),則將其基因型修改為社區(qū)中心基因型,并將其所在社區(qū)中的其余節(jié)點(diǎn)的基因型修改為該節(jié)點(diǎn)的索引;
41、若不均為核心節(jié)點(diǎn),判斷該節(jié)點(diǎn)的基因型對應(yīng)的核心節(jié)點(diǎn)是否為社區(qū)中心:
42、若為社區(qū)中心,則將該節(jié)點(diǎn)的基因型設(shè)置為該社區(qū)中心的索引;
43、若為非社區(qū)中心,則將該節(jié)點(diǎn)的基因型設(shè)置為社區(qū)中心基因型;
44、將其余基因型為初始基因型的節(jié)點(diǎn)按照相似度矩陣劃分至與其本身最相似的社區(qū)中,獲取交叉后的父代種群;
45、獲取一個(gè)長度等于初始父代種群中個(gè)體的節(jié)點(diǎn)數(shù)量的變異點(diǎn)位掩碼;
46、對于交叉后的父代種群中的部分個(gè)體,判斷變異點(diǎn)位掩碼中變異值為1的位置處所對應(yīng)的節(jié)點(diǎn),是否為核心節(jié)點(diǎn):
47、若為核心節(jié)點(diǎn),則判斷該核心節(jié)點(diǎn)是否為社區(qū)中心節(jié)點(diǎn):
48、若為社區(qū)中心節(jié)點(diǎn),則將該節(jié)點(diǎn)及其所屬社區(qū)中的所有節(jié)點(diǎn)的基因型設(shè)置為初始基因型;
49、若不是社區(qū)中心節(jié)點(diǎn),則將該節(jié)點(diǎn)的基因型設(shè)置為社區(qū)中心基因型,并將該節(jié)點(diǎn)的鄰居節(jié)點(diǎn)的基因型設(shè)置為該節(jié)點(diǎn)的索引;
50、若不是核心節(jié)點(diǎn),則隨機(jī)選取社區(qū)中心節(jié)點(diǎn)的索引作為變異后的基因型。
51、優(yōu)選地,所述候選代理模型池中包括多種代理模型,包括:回歸樹、徑向基函數(shù)、支持向量回歸、k-近鄰算法與圖神經(jīng)網(wǎng)絡(luò)。
52、優(yōu)選地,所述計(jì)算并基于每種代理模型的肯達(dá)爾系數(shù)與斯皮爾曼系數(shù),獲取評估每種代理模型的預(yù)測準(zhǔn)確度的性能評價(jià)指標(biāo)值,包括:
53、構(gòu)建每種代理模型對應(yīng)的肯達(dá)爾系數(shù),表示為:
54、;
55、構(gòu)建每種代理模型對應(yīng)的斯皮爾曼系數(shù),表示為:;
56、基于每種代理模型的肯達(dá)爾系數(shù)與斯皮爾曼系數(shù),計(jì)算每種代理模型對應(yīng)的性能評價(jià)指標(biāo)值,表示為:;
57、其中,為代理模型對于多個(gè)網(wǎng)絡(luò)的模型預(yù)測值,為多個(gè)網(wǎng)絡(luò)對應(yīng)的真實(shí)標(biāo)簽值;為和排序后的一致對個(gè)數(shù);為和排序后的分歧對個(gè)數(shù);分別表示數(shù)據(jù)和數(shù)據(jù)中的并列排位的個(gè)數(shù);為順序的插值,為待檢測網(wǎng)絡(luò)中的節(jié)點(diǎn)總個(gè)數(shù);表示權(quán)重系數(shù),取值范圍。
58、優(yōu)選地,所述基于最優(yōu)解集中每個(gè)個(gè)體所表示的劃分方式中的社區(qū)個(gè)數(shù)、每個(gè)社區(qū)中的總邊數(shù),以及節(jié)點(diǎn)度之和,計(jì)算每個(gè)個(gè)體對應(yīng)的模塊度指標(biāo)值,表示為:
59、;
60、其中,表示模塊度指標(biāo)值,表示連接第個(gè)社區(qū)中節(jié)點(diǎn)的邊的總數(shù),,表示個(gè)體所表示的劃分方法中的社區(qū)總個(gè)數(shù);表示第個(gè)社區(qū)中節(jié)點(diǎn)的度的總和;表示待檢測網(wǎng)絡(luò)中的邊的總數(shù)。
61、優(yōu)選地,若待檢測網(wǎng)絡(luò)存在真實(shí)標(biāo)簽,則基于其真實(shí)標(biāo)簽所對應(yīng)的劃分方式及最優(yōu)解集中每個(gè)個(gè)體的混淆矩陣,計(jì)算最優(yōu)解集中每個(gè)個(gè)體所對應(yīng)的標(biāo)準(zhǔn)化互信息nmi,表示為:
62、;
63、獲取標(biāo)準(zhǔn)化互信息nmi最大的個(gè)體所對應(yīng)的劃分方式,對待檢測網(wǎng)絡(luò)進(jìn)行社區(qū)劃分,獲取社區(qū)劃分結(jié)果;
64、其中,表示最優(yōu)解集中的解所表示的劃分方法a中的社區(qū)個(gè)數(shù),表示真實(shí)標(biāo)簽所對應(yīng)的劃分方式b中的社區(qū)個(gè)數(shù);表示混淆矩陣;表示a中第個(gè)社區(qū)與b中第個(gè)社區(qū)之間的相同節(jié)點(diǎn)數(shù),表示混淆矩陣中第行元素之和,表示混淆矩陣中第列元素之和,表示待檢測網(wǎng)絡(luò)中的節(jié)點(diǎn)總個(gè)數(shù)。
65、本發(fā)明的上述技術(shù)方案相比現(xiàn)有技術(shù)具有以下有益效果:
66、本發(fā)明所述的基于代理模型自適應(yīng)選擇的多目標(biāo)大規(guī)模社區(qū)檢測方法,從待檢測網(wǎng)絡(luò)中選取核心節(jié)點(diǎn),以便基于核心節(jié)點(diǎn),快速定位可能成為社區(qū)中心的節(jié)點(diǎn),節(jié)省了大規(guī)模復(fù)雜網(wǎng)絡(luò)社區(qū)劃分所消耗的資源,壓縮訓(xùn)練網(wǎng)絡(luò)代理模型的決策空間;本發(fā)明構(gòu)建包含多種代理模型的候選代理模型池,以個(gè)體的kernel?k-means目標(biāo)函數(shù)值kkm與相對變化目標(biāo)函數(shù)值rc作為優(yōu)化目標(biāo),利用nsga-ii多目標(biāo)遺傳算法更新kkm樣本空間和rc樣本空間,來計(jì)算候選代理模型池中不同代理模型的肯達(dá)爾系數(shù)和斯皮爾曼系數(shù),選取出最優(yōu)目標(biāo)代理模型,以便利用最優(yōu)目標(biāo)代理模型對待檢測網(wǎng)絡(luò)進(jìn)行社區(qū)劃分;本發(fā)明通過利用代理模型近似評估kkm和rc目標(biāo)函數(shù)值,代替真實(shí)的kkm和rc計(jì)算,避免進(jìn)化算法基于種群優(yōu)化導(dǎo)致的大量真實(shí)函數(shù)評估,減少了對每種代理模型的目標(biāo)函數(shù)的計(jì)算次數(shù),實(shí)現(xiàn)對大規(guī)模復(fù)雜網(wǎng)絡(luò)的社區(qū)檢測,降低了計(jì)算機(jī)資源和時(shí)間的消耗,提高了社區(qū)檢測效率,并且保證了社區(qū)劃分的質(zhì)量。