專利名稱:一種二分網(wǎng)絡(luò)中社團(tuán)檢測(cè)方法及裝置的制作方法
技術(shù)領(lǐng)域:
本發(fā)明屬于網(wǎng)絡(luò)技術(shù)領(lǐng)域,尤其涉及一種二分網(wǎng)絡(luò)中社團(tuán)檢測(cè)方法及裝置。
背景技術(shù):
隨著因特網(wǎng)、萬(wàn)維網(wǎng)等具有復(fù)雜規(guī)模的網(wǎng)絡(luò)的不斷擴(kuò)展和壯大,從萬(wàn)維網(wǎng)上獲取 數(shù)據(jù)也變得愈加方便。科學(xué)家們借助萬(wàn)維網(wǎng),將許多傳統(tǒng)的生物、物理、社會(huì)方面的網(wǎng)絡(luò) 如基因網(wǎng)絡(luò)(Gene network)、新陳代謝網(wǎng)絡(luò)(Metabolicnetwork)、電力網(wǎng)絡(luò)(Electronic network)、神經(jīng)網(wǎng)絡(luò)(Neural network)、社交網(wǎng)絡(luò)(Social network)等數(shù)字化存儲(chǔ)于萬(wàn)維 網(wǎng)上,從而使得處于不同研究領(lǐng)域的研究者們可利用計(jì)算機(jī)的計(jì)算能力對(duì)這些大規(guī)模的網(wǎng) 絡(luò)進(jìn)行各個(gè)方面的研究??茖W(xué)家們還發(fā)現(xiàn)許多網(wǎng)絡(luò)都表現(xiàn)出一些共同的特征,如小世界現(xiàn)象、無(wú)標(biāo)度特征 等。這些特征的發(fā)現(xiàn)給科學(xué)家們帶來(lái)了震撼,因?yàn)檫@些特性與人們先前對(duì)網(wǎng)絡(luò)的直觀認(rèn)識(shí) 有著很大的出入。在20世紀(jì)即將結(jié)束的年代,面對(duì)有多達(dá)約3億臺(tái)計(jì)算機(jī)和30億個(gè)網(wǎng)頁(yè)、 動(dòng)態(tài)發(fā)展的因特網(wǎng)和萬(wàn)維網(wǎng),還有其他各種社會(huì)、生物、物理網(wǎng)絡(luò),科學(xué)家們發(fā)現(xiàn)已無(wú)法用 規(guī)則網(wǎng)絡(luò)理論和隨機(jī)網(wǎng)絡(luò)理論來(lái)解釋它們的結(jié)構(gòu)和演化的一些新問(wèn)題,他們粗略地稱這類 網(wǎng)絡(luò)為“復(fù)雜網(wǎng)絡(luò)(Complex Network)”。Boccara對(duì)復(fù)雜網(wǎng)絡(luò)給出了一種新定義如果某些網(wǎng)絡(luò)的組成部分的表現(xiàn)行為已 被了解,但是由于缺乏足夠的科學(xué)知識(shí)而無(wú)法預(yù)測(cè)這些網(wǎng)絡(luò)的整體行為,則稱這些網(wǎng)絡(luò)為 復(fù)雜網(wǎng)絡(luò)。這種缺乏中央控制的復(fù)雜網(wǎng)絡(luò)具有“涌現(xiàn)”行為,即無(wú)法預(yù)測(cè)、無(wú)法用事先的設(shè) 計(jì)來(lái)產(chǎn)生的行為,而復(fù)雜網(wǎng)絡(luò)中的其中一種“涌現(xiàn)”行為是社團(tuán)的出現(xiàn)。人們發(fā)現(xiàn),許多實(shí)際網(wǎng)絡(luò)中都有社團(tuán)結(jié)構(gòu)的存在,即整個(gè)網(wǎng)絡(luò)包含若干個(gè)“群 (Group)”或“社團(tuán)(Cluster)”。雖然目前對(duì)網(wǎng)絡(luò)中的社團(tuán)還沒(méi)有一個(gè)公認(rèn)的形式化的定 義,但社團(tuán)的一個(gè)較直觀的表達(dá)是社團(tuán)是網(wǎng)絡(luò)中的節(jié)點(diǎn)以及由這些節(jié)點(diǎn)之間所連接的邊 組成的結(jié)構(gòu),每個(gè)社團(tuán)內(nèi)部的節(jié)點(diǎn)之間的邊連接相對(duì)緊密,但各個(gè)社團(tuán)之間節(jié)點(diǎn)的邊連接 則相對(duì)稀疏。當(dāng)一個(gè)網(wǎng)絡(luò)進(jìn)行演化時(shí),由于整個(gè)網(wǎng)絡(luò)缺乏中央的集中控制,因此每個(gè)節(jié)點(diǎn) 都可自由地選擇與其它節(jié)點(diǎn)進(jìn)行連接,因此我們無(wú)法預(yù)測(cè)整個(gè)網(wǎng)絡(luò)在演化一段時(shí)間后其整 體表現(xiàn)出來(lái)的拓?fù)浣Y(jié)構(gòu),而社團(tuán)則作為一種演化結(jié)果出現(xiàn)在許多的網(wǎng)絡(luò)里,譬如萬(wàn)維網(wǎng)、 蛋白質(zhì)網(wǎng)絡(luò)、社交網(wǎng)絡(luò)等。這些網(wǎng)絡(luò)中的社團(tuán)可看作具有某些共性的節(jié)點(diǎn)的集合或者某些 共同協(xié)作完成某個(gè)功能模塊的節(jié)點(diǎn)的集合。譬如,在社交網(wǎng)絡(luò)里,在人與人的相互作用過(guò) 程中,社交網(wǎng)絡(luò)里形成了大小不一的社團(tuán),有些社團(tuán)對(duì)應(yīng)社會(huì)里的家庭組織,有些社團(tuán)對(duì)應(yīng) 社會(huì)里的朋友圈,有些社團(tuán)甚至對(duì)應(yīng)現(xiàn)實(shí)生活中具有地理位置特性的人的集合,如村莊、城 鎮(zhèn)、國(guó)家等。因特網(wǎng)的快速增長(zhǎng)更是帶來(lái)了許多在萬(wàn)維網(wǎng)上生存著的社團(tuán)結(jié)構(gòu)。除了社交 網(wǎng)絡(luò)外,社團(tuán)還會(huì)存在于其他類型的網(wǎng)絡(luò)中,譬如在蛋白質(zhì)網(wǎng)絡(luò)中,社團(tuán)對(duì)應(yīng)細(xì)胞中具有相 同特定功能的蛋白質(zhì)分子集合;在萬(wàn)維網(wǎng)中,社團(tuán)對(duì)應(yīng)一組具有相似話題的網(wǎng)頁(yè);在新陳 代謝網(wǎng)絡(luò)中,社團(tuán)對(duì)應(yīng)某些功能模塊,如新陳代謝中的循環(huán);在食物網(wǎng)絡(luò)里,社團(tuán)對(duì)應(yīng)某一 層的食物集合。
5
現(xiàn)實(shí)生活中存在著許多以二分圖形式表示的網(wǎng)絡(luò),我們可稱為二分網(wǎng)絡(luò)。譬如中 文社交網(wǎng)站豆瓣(http://WWW. douban. com/)上的用戶-圖書(shū)關(guān)系即可抽象成一個(gè)二分網(wǎng) 絡(luò),用戶代表網(wǎng)絡(luò)中的一種類型的節(jié)點(diǎn),圖書(shū)代表另一種類型的節(jié)點(diǎn),當(dāng)某個(gè)用戶閱讀過(guò)某 本圖書(shū)時(shí),則在相應(yīng)的用戶節(jié)點(diǎn)和圖書(shū)節(jié)點(diǎn)之間用一條邊連接。事實(shí)上,生活中還有許多其 他類似的二分網(wǎng)絡(luò),如演員-電影網(wǎng)絡(luò)、作者-論文網(wǎng)絡(luò)、文檔-詞語(yǔ)網(wǎng)絡(luò)、p2p中的資源網(wǎng) 絡(luò)等。各種現(xiàn)實(shí)的二分網(wǎng)絡(luò)里同樣存在著有意義的社團(tuán)。如用戶-圖書(shū)網(wǎng)絡(luò)的用戶節(jié)點(diǎn) 構(gòu)成的社團(tuán),對(duì)應(yīng)著現(xiàn)實(shí)中具有相似閱讀興趣的用戶集合;演員-電影網(wǎng)絡(luò)里的演員節(jié)點(diǎn) 構(gòu)成的社團(tuán)則對(duì)應(yīng)合作較為密切的演員集合;作者-論文網(wǎng)絡(luò)里的作者節(jié)點(diǎn)構(gòu)成的社團(tuán)對(duì) 應(yīng)具有較為穩(wěn)定合作關(guān)系的研究者集合;在文檔-詞語(yǔ)網(wǎng)絡(luò)里,文檔節(jié)點(diǎn)構(gòu)成的社團(tuán)對(duì)應(yīng) 內(nèi)容的主題相近的文檔集合,而詞語(yǔ)節(jié)點(diǎn)構(gòu)成的社團(tuán)則對(duì)應(yīng)某一主題下的詞語(yǔ)集合。除此 之外,兩種不同類型的詞語(yǔ)的共現(xiàn)也可構(gòu)成一個(gè)二分網(wǎng)絡(luò)。譬如可從表示基因的名稱的詞 語(yǔ)和表示疾病的名稱的詞語(yǔ)的共現(xiàn)里構(gòu)造出一個(gè)二分網(wǎng)絡(luò),在該網(wǎng)絡(luò)里,一類節(jié)點(diǎn)表示基 因的名稱,另一類節(jié)點(diǎn)表示疾病的名稱,當(dāng)一個(gè)基因名稱和一個(gè)疾病的名稱出現(xiàn)在同一篇 文檔里,則在這兩個(gè)名稱所對(duì)應(yīng)的節(jié)點(diǎn)之間用一條邊連接。從該網(wǎng)絡(luò)檢測(cè)出的基因社團(tuán)包 含了聯(lián)系比較密切的基因,基因社團(tuán)所對(duì)應(yīng)的疾病則顯示社團(tuán)里基因的功用。正因?yàn)楝F(xiàn)實(shí)生活中存在著如此多的二分網(wǎng)絡(luò),而挖掘這些網(wǎng)絡(luò)里的社團(tuán)對(duì)理解和 分析這些網(wǎng)絡(luò)的特性有著重要的輔助作用。二分網(wǎng)絡(luò)可表現(xiàn)出許多方面的特性,如網(wǎng)絡(luò)中的節(jié)點(diǎn)的度分布、網(wǎng)絡(luò)中的節(jié)點(diǎn) 的權(quán)重分布、網(wǎng)絡(luò)中的同類節(jié)點(diǎn)之間的路徑長(zhǎng)度、網(wǎng)絡(luò)中節(jié)點(diǎn)的聚類系數(shù)、網(wǎng)絡(luò)中的社團(tuán)等 等。我們的算法用于挖掘出二分網(wǎng)絡(luò)中的社團(tuán)。二分網(wǎng)絡(luò)里存在著兩種不同類型的節(jié)點(diǎn),同一種類型的節(jié)點(diǎn)之間不存在邊連接, 因此邊連接只存在于不同類型的節(jié)點(diǎn)之間。對(duì)于社團(tuán),目前尚不存在一個(gè)統(tǒng)一的形式化的 定義。在普通的網(wǎng)絡(luò)里(即網(wǎng)絡(luò)里所有的節(jié)點(diǎn)都屬于同一種類型的情況),人們對(duì)社團(tuán)的直 觀認(rèn)識(shí)為社團(tuán)是網(wǎng)絡(luò)中的節(jié)點(diǎn)的集合,屬于同一個(gè)社團(tuán)的節(jié)點(diǎn)之間的邊連接緊密,而屬于 不同社團(tuán)的節(jié)點(diǎn)之間的邊連接則稀疏。但在二分網(wǎng)絡(luò)的情況下,網(wǎng)絡(luò)中的社團(tuán)可分為兩種 情況1) 二分網(wǎng)絡(luò)里的每個(gè)社團(tuán)只包含一種類型的節(jié)點(diǎn);2) 二分網(wǎng)絡(luò)的每個(gè)社團(tuán)可包含兩種類型的節(jié)點(diǎn)。對(duì)于1)的情況,每個(gè)社團(tuán)的內(nèi)部節(jié)點(diǎn)通過(guò)與很多共同的鄰居節(jié)點(diǎn)相連接的方式 來(lái)“緊密地聯(lián)系”,而屬于不同社團(tuán)的節(jié)點(diǎn)之間共享的相同鄰居節(jié)點(diǎn)不多,因此來(lái)體現(xiàn)“聯(lián)系 的稀疏”。而幻的情況與普通網(wǎng)絡(luò)的情況一樣,幻所挖掘出的每個(gè)社團(tuán)可包含兩種類型的 節(jié)點(diǎn),因此每個(gè)社團(tuán)里的節(jié)點(diǎn)可分為兩個(gè)子集,每個(gè)子集各自包含一種類型的節(jié)點(diǎn)。目前已設(shè)計(jì)的大多數(shù)社團(tuán)檢測(cè)算法都是面向普通網(wǎng)絡(luò)的(即網(wǎng)絡(luò)中的所有節(jié)點(diǎn) 都屬于同一種類型的情況),主要包括以下幾類1)傳統(tǒng)的方法包括圖劃分、層次聚類、分割式聚類等;2)分裂算法包括GN算法以及由此衍生的各種改進(jìn)算法;3)基于模塊度(Modularity)的算法通過(guò)利用各種優(yōu)化算法來(lái)對(duì)Newman提出的 模塊度進(jìn)行優(yōu)化,從而檢測(cè)出較好的社團(tuán)劃分;
4)譜算法如譜分解,利用圖的矩陣表示中的某些特征來(lái)檢測(cè)社團(tuán),一個(gè)典型的 例子是利用圖的拉普拉斯矩陣的特征向量來(lái)進(jìn)行矩陣的劃分,從而檢測(cè)社團(tuán);5)基于動(dòng)力模型的算法包括統(tǒng)計(jì)力學(xué)里最受歡迎的模型之一 Potts模型引出的 spin模型、隨機(jī)行走(Random walk)模型、節(jié)點(diǎn)同步(Synchronization)模型;6)基于統(tǒng)計(jì)推理的算法該類算法的特點(diǎn)是尋找一個(gè)與實(shí)際的圖拓?fù)浣Y(jié)構(gòu)最吻 合的圖模型,而該圖模型一般都假定節(jié)點(diǎn)中存在社團(tuán)結(jié)構(gòu)。這類方法利用的技術(shù)包括貝葉 5^ (Bayesian inference)等。7)多分辨率的方法實(shí)際圖中的社團(tuán)大小是無(wú)法預(yù)知的,因此多分辨率的方法是 通過(guò)調(diào)整某些參數(shù)以達(dá)到觀察多種不同大小的社團(tuán)的方法。但這些社團(tuán)檢測(cè)算法針對(duì)的是普通的網(wǎng)絡(luò),對(duì)于二分網(wǎng)絡(luò)并不適合。為了檢測(cè)二 分網(wǎng)絡(luò)中的社團(tuán),慣常的做法是對(duì)二分網(wǎng)絡(luò)進(jìn)行投影,譬如對(duì)于二分網(wǎng)絡(luò)中的某一種類型 的節(jié)點(diǎn),如果屬于該類型的兩個(gè)節(jié)點(diǎn)之間存在著相同的鄰居節(jié)點(diǎn),那么在投影后的新的網(wǎng) 絡(luò)里,這兩個(gè)節(jié)點(diǎn)之間就會(huì)存在一條邊。經(jīng)由此種投影方式可產(chǎn)生兩個(gè)普通的網(wǎng)絡(luò),分別對(duì) 應(yīng)兩種不同的節(jié)點(diǎn)類型。接著可利用上述的社團(tuán)檢測(cè)算法對(duì)產(chǎn)生的普通網(wǎng)絡(luò)進(jìn)行社團(tuán)檢 測(cè)。但這種方法的不足之處在于在對(duì)二分網(wǎng)絡(luò)進(jìn)行投影時(shí)會(huì)損失一些有用的信息,以及生 成的普通網(wǎng)絡(luò)過(guò)于龐大。除了以上所述的用于普通網(wǎng)絡(luò)的社團(tuán)檢測(cè)算法之外,還存在直接對(duì)二分網(wǎng)絡(luò)進(jìn)行 社團(tuán)檢測(cè)的算法,如1)通過(guò)提出適合二分網(wǎng)絡(luò)的模塊度定義,并基于該定義來(lái)檢測(cè)社團(tuán)。如Guimera 等人提出了一個(gè)適用于邊無(wú)權(quán)重的二分網(wǎng)絡(luò)的模塊度定義,Barber等人提出了另一種用于 二分網(wǎng)絡(luò)的模塊度定義;其中,模塊度的核心思想在于選擇一個(gè)不存在社團(tuán)結(jié)構(gòu)的參考網(wǎng)絡(luò),以及一個(gè)計(jì) 算的度量,該度量的值在具有社團(tuán)結(jié)構(gòu)的網(wǎng)絡(luò)中和在不具有社團(tuán)結(jié)構(gòu)的網(wǎng)絡(luò)中將會(huì)有很大 的差異。在選擇了適當(dāng)?shù)膮⒖季W(wǎng)絡(luò)和度量之后,計(jì)算度量分別在原網(wǎng)絡(luò)和參考網(wǎng)絡(luò)中的差 異值,差異值越大,表明該節(jié)點(diǎn)集劃分越好,差異值越小,表明該節(jié)點(diǎn)集劃分越差。2) Lehmann擴(kuò)展了在普通網(wǎng)絡(luò)上的k-clique社團(tuán)檢測(cè)算法,將其應(yīng)用于二分網(wǎng)絡(luò) 上。Guimera等人所提的模塊度定義不適用于邊帶權(quán)重的二分網(wǎng)絡(luò),而實(shí)際的很多二 分網(wǎng)絡(luò)的邊都帶有權(quán)重,因此Guimera所提的模塊度在應(yīng)用于實(shí)際的二分網(wǎng)絡(luò)時(shí),只能略 掉了邊的權(quán)重這一重要信息。而B(niǎo)arber等人所提的模塊度定義蘊(yùn)含了一個(gè)前提二分網(wǎng)絡(luò)中的兩種類型的節(jié) 點(diǎn)所構(gòu)成的社團(tuán)存在一對(duì)一的關(guān)系,但實(shí)際的二分網(wǎng)絡(luò)中,兩種類型的節(jié)點(diǎn)所構(gòu)成的社團(tuán) 之間可能存在一對(duì)多或多對(duì)多的關(guān)系。因此Barber所提的模塊度定義并不能很好地適用 于實(shí)際網(wǎng)絡(luò)的情況。Lehmann所擴(kuò)展的k-cliquc社團(tuán)檢測(cè)算法需要人工的指定輸入的相關(guān)參數(shù),譬如 需要檢測(cè)的社團(tuán)的節(jié)點(diǎn)的數(shù)目等,而這些參數(shù)人們是難以預(yù)先知道的。因利用Barber所提的模塊度定義檢測(cè)出的社團(tuán)可同時(shí)包含二分網(wǎng)絡(luò)中的兩種類 型的節(jié)點(diǎn),因此利用該模塊度進(jìn)行社團(tuán)檢測(cè),蘊(yùn)含了一個(gè)前提由二分網(wǎng)絡(luò)中的兩種類型的 節(jié)點(diǎn)各自構(gòu)成的社團(tuán)之間存在一對(duì)一的關(guān)系。
如何避免Barber所提的模塊度定義所蘊(yùn)含的前提的限制,同時(shí)又將二分網(wǎng)絡(luò)的 邊的權(quán)重信息考慮進(jìn)去,提高網(wǎng)絡(luò)社團(tuán)的檢測(cè)效率,提高網(wǎng)絡(luò)的利用效率,是網(wǎng)絡(luò)技術(shù)領(lǐng)域 研究的方向之一。
發(fā)明內(nèi)容
本發(fā)明實(shí)施例的目的在于提供一種二分網(wǎng)絡(luò)中社團(tuán)檢測(cè)方法,旨在提高網(wǎng)絡(luò)社團(tuán) 的檢測(cè)效率,提高網(wǎng)絡(luò)的利用效率。本發(fā)明實(shí)施例是這樣實(shí)現(xiàn)的,一種二分網(wǎng)絡(luò)中社團(tuán)檢測(cè)方法,所述方法包括以下 步驟獲取二分網(wǎng)絡(luò)的節(jié)點(diǎn)集,所述節(jié)點(diǎn)集由多個(gè)社團(tuán)構(gòu)成,所述社團(tuán)包括同一類型的 多個(gè)節(jié)點(diǎn);獲取所述節(jié)點(diǎn)集的模塊度值,其中,所述模塊度值為對(duì)屬于同一類型的所有節(jié)點(diǎn) 對(duì)之間的所有路徑長(zhǎng)度之和的差異值取和;對(duì)二分網(wǎng)絡(luò)中的每個(gè)社團(tuán)的任一節(jié)點(diǎn),計(jì)算該節(jié)點(diǎn)從當(dāng)前其所屬的社團(tuán)移動(dòng)到所 述節(jié)點(diǎn)集的其它社團(tuán)時(shí),所述二分網(wǎng)絡(luò)的節(jié)點(diǎn)集的模塊度值的增加量;選取使得所述二分網(wǎng)絡(luò)的節(jié)點(diǎn)集的模塊度值的增加量最大的社團(tuán)作為該節(jié)點(diǎn)的 新的劃分社團(tuán);根據(jù)新的劃分出的社團(tuán)重新構(gòu)造二分網(wǎng)絡(luò)。所述二分網(wǎng)絡(luò)中社團(tuán)檢測(cè)方法,其中,所述獲取所述節(jié)點(diǎn)集的模塊度值時(shí),使用以 下計(jì)算公式
權(quán)利要求
1.一種二分網(wǎng)絡(luò)中社團(tuán)檢測(cè)方法,其特征在于,所述方法包括以下步驟獲取二分網(wǎng)絡(luò)的節(jié)點(diǎn)集,所述節(jié)點(diǎn)集由多個(gè)社團(tuán)構(gòu)成,所述社團(tuán)包括同一類型的多個(gè) 節(jié)點(diǎn); 獲取所述節(jié)點(diǎn)集的模塊度值,其中,所述模塊度值為對(duì)屬于同一類型的所有節(jié)點(diǎn)對(duì)之 間的所有路徑長(zhǎng)度之和的差異值取和;對(duì)二分網(wǎng)絡(luò)中的每個(gè)社團(tuán)的任一節(jié)點(diǎn),計(jì)算該節(jié)點(diǎn)從當(dāng)前其所屬的社團(tuán)移動(dòng)到所述節(jié) 點(diǎn)集的其它社團(tuán)時(shí),所述二分網(wǎng)絡(luò)的節(jié)點(diǎn)集的模塊度值的增加量;選取使得所述二分網(wǎng)絡(luò)的節(jié)點(diǎn)集的模塊度值的增加量最大的社團(tuán)作為該節(jié)點(diǎn)的新的 劃分社團(tuán);根據(jù)新的劃分出的社團(tuán)重新構(gòu)造二分網(wǎng)絡(luò)。
2.如權(quán)利要求1所述的二分網(wǎng)絡(luò)中社團(tuán)檢測(cè)方法,其特征在于,所述獲取所述節(jié)點(diǎn)集 的模塊度值時(shí),使用以下計(jì)算公式
3.如權(quán)利要求1所述的二分網(wǎng)絡(luò)中社團(tuán)檢測(cè)方法,其特征在于,在所述獲取二分網(wǎng)絡(luò) 中的每個(gè)類型的節(jié)點(diǎn)集的步驟之前,所述方法還包括獲取二分網(wǎng)絡(luò)中的各個(gè)節(jié)點(diǎn);將獲取的節(jié)點(diǎn)按照類型組成相應(yīng)的社團(tuán),其中,每個(gè)類型的節(jié)點(diǎn)組成一個(gè)社團(tuán);所述多 個(gè)社團(tuán)構(gòu)成二分網(wǎng)絡(luò)中的節(jié)點(diǎn)集。
4.如權(quán)利要求1所述的二分網(wǎng)絡(luò)中社團(tuán)檢測(cè)方法,其特征在于,所述方法還包括 判斷是否有節(jié)點(diǎn)移動(dòng),若是,則繼續(xù)進(jìn)行以下步驟計(jì)算該節(jié)點(diǎn)從當(dāng)前其所屬的社團(tuán)移動(dòng)到所述節(jié)點(diǎn)集的其它社團(tuán)時(shí),所述二分網(wǎng)絡(luò)的各個(gè)社團(tuán)模塊度值的增加量;若沒(méi)有節(jié)點(diǎn)移動(dòng),則進(jìn)行如下步驟根據(jù)新的劃分出的社團(tuán)重新構(gòu)造二分網(wǎng)絡(luò)。
5.如權(quán)利要求1所述的二分網(wǎng)絡(luò)中社團(tuán)檢測(cè)方法,其特征在于,所述根據(jù)新的劃分出的社團(tuán)重新構(gòu)造二分網(wǎng)絡(luò)的步驟之后,所述方法還包括 輸出重新構(gòu)造的二分網(wǎng)絡(luò)。
6.一種二分網(wǎng)絡(luò)中社團(tuán)檢測(cè)裝置,其特征在于,所述裝置包括節(jié)點(diǎn)集獲取模塊,用于獲取二分網(wǎng)絡(luò)的節(jié)點(diǎn)集,所述節(jié)點(diǎn)集由多個(gè)社團(tuán)構(gòu)成,所述社團(tuán) 包括同一類型的多個(gè)節(jié)點(diǎn);模塊度值獲取模塊,用于獲取所述節(jié)點(diǎn)集的模塊度值,其中,所述模塊度值為對(duì)屬于同 一類型的所有節(jié)點(diǎn)對(duì)之間的所有路徑長(zhǎng)度之和的差異值取和;節(jié)點(diǎn)移動(dòng)計(jì)算模塊,用于對(duì)二分網(wǎng)絡(luò)中的每個(gè)社團(tuán)的任一節(jié)點(diǎn),計(jì)算該節(jié)點(diǎn)從當(dāng)前其 所屬的社團(tuán)移動(dòng)到所述節(jié)點(diǎn)集的其它社團(tuán)時(shí),所述二分網(wǎng)絡(luò)的節(jié)點(diǎn)集的模塊度值的增加 量;節(jié)點(diǎn)劃分模塊,用于選取使得所述二分網(wǎng)絡(luò)的節(jié)點(diǎn)集的模塊度值的增加量最大的社團(tuán) 作為該節(jié)點(diǎn)的新的劃分社團(tuán);以及二分網(wǎng)絡(luò)構(gòu)造模塊,用于根據(jù)新的劃分出的社團(tuán)重新構(gòu)造二分網(wǎng)絡(luò)。
7.如權(quán)利要求6所述的二分網(wǎng)絡(luò)中社團(tuán)檢測(cè)裝置,其特征在于,所述模塊度值獲取模 塊通過(guò)以下公式計(jì)算獲取模塊度值P P f qq11 λ =1 J=I V α=1α=] m J其中,Q為模塊度,所述二分網(wǎng)絡(luò)中存在兩種類型的節(jié)點(diǎn)A和B,屬于類型A的節(jié)點(diǎn)的數(shù) 目為P,屬于類型B的節(jié)點(diǎn)的數(shù)目為q ;節(jié)點(diǎn)i屬于類型A,節(jié)點(diǎn)j屬于類型B ;與i連接的 所有邊的權(quán)重之和表示為ti;與j連接的所有邊的權(quán)重之和表示為、;網(wǎng)絡(luò)中所有邊的權(quán)重 之和為m ;節(jié)點(diǎn)i和j屬于同一個(gè)社團(tuán),δ (gi, gj)的值為1 ;Wia^a表示從節(jié)點(diǎn)i出發(fā)經(jīng)過(guò)鄰居節(jié)點(diǎn)a,再到節(jié)點(diǎn)j的一條路徑的長(zhǎng)度;Σ表示從節(jié)點(diǎn)i到節(jié)點(diǎn)j的所有路徑0 = 1t mm t的長(zhǎng)度之和從節(jié)點(diǎn)i到節(jié)點(diǎn)a的邊的權(quán)重^從節(jié)點(diǎn)a到節(jié)點(diǎn)j的邊的權(quán)重;mmm2t tJU m2t.t;a ‘ j從節(jié)點(diǎn)i出發(fā)經(jīng)過(guò)節(jié)點(diǎn)a再到節(jié)點(diǎn)j的一條路徑的長(zhǎng)度;節(jié)點(diǎn)i到節(jié) m2a=\ mq</ m2t t點(diǎn)j的所有路徑的長(zhǎng)度之和;ZvUp 一Σ^ii表示一個(gè)節(jié)點(diǎn)對(duì)(i,j)之間的所有路α = Ιa=l m徑長(zhǎng)度之和的差異值。
8.如權(quán)利要求6所述的二分網(wǎng)絡(luò)中社團(tuán)檢測(cè)裝置,其特征在于,所述節(jié)點(diǎn)集獲取模塊 具體包括節(jié)點(diǎn)獲取模塊,用于獲取二分網(wǎng)絡(luò)中的各個(gè)節(jié)點(diǎn);社團(tuán)構(gòu)造模塊,用于將獲取的節(jié)點(diǎn)按照類型組成相應(yīng)的社團(tuán),其中,每個(gè)類型的節(jié)點(diǎn)組 成一個(gè)社團(tuán);所述多個(gè)社團(tuán)構(gòu)成二分網(wǎng)絡(luò)中的節(jié)點(diǎn)集。
9.如權(quán)利要求6所述的二分網(wǎng)絡(luò)中社團(tuán)檢測(cè)裝置,其特征在于,所述裝置還包括 節(jié)點(diǎn)移動(dòng)判斷模塊,用于判斷是否有節(jié)點(diǎn)移動(dòng),若是,則所述節(jié)點(diǎn)移動(dòng)計(jì)算模塊計(jì)算從當(dāng)前其所屬的社團(tuán)移動(dòng)到所述節(jié)點(diǎn)集的其它社團(tuán)時(shí),所述二分網(wǎng)絡(luò)的各個(gè)社團(tuán)模塊度值的 增加量;若沒(méi)有節(jié)點(diǎn)移動(dòng),則所述二分網(wǎng)絡(luò)構(gòu)造模塊根據(jù)新的劃分出的社團(tuán)重新構(gòu)造二分網(wǎng)
10.如權(quán)利要求6所述的二分網(wǎng)絡(luò)中社團(tuán)檢測(cè)裝置,其特征在于,所述裝置還包括 二分網(wǎng)絡(luò)輸出模塊,用于輸出重新構(gòu)造的二分網(wǎng)絡(luò)。
全文摘要
本發(fā)明公開(kāi)了一種二分網(wǎng)絡(luò)中社團(tuán)檢測(cè)方法及裝置,所述方法包括獲取二分網(wǎng)絡(luò)的節(jié)點(diǎn)集,所述節(jié)點(diǎn)集由多個(gè)社團(tuán)構(gòu)成,所述社團(tuán)包括同一類型的多個(gè)節(jié)點(diǎn);獲取所述節(jié)點(diǎn)集的模塊度值,其中,所述模塊度值為對(duì)屬于同一類型的所有節(jié)點(diǎn)對(duì)之間的所有路徑長(zhǎng)度之和的差異值取和;對(duì)二分網(wǎng)絡(luò)中的每個(gè)社團(tuán)的任意節(jié)點(diǎn),計(jì)算該節(jié)點(diǎn)從當(dāng)前其所屬的社團(tuán)移動(dòng)到其它社團(tuán)時(shí),所述二分網(wǎng)絡(luò)的節(jié)點(diǎn)集的模塊度值的增加量;選取使得所述節(jié)點(diǎn)集的模塊度值增加量最大的社團(tuán)作為該節(jié)點(diǎn)的新的劃分社團(tuán);根據(jù)新的劃分出的社團(tuán)重新構(gòu)造二分網(wǎng)絡(luò)。本發(fā)明避免了Barber所提的模塊度定義所蘊(yùn)含的前提的限制,同時(shí)又將二分網(wǎng)絡(luò)的邊的權(quán)重信息考慮進(jìn)去,提高了社團(tuán)的檢測(cè)效率。
文檔編號(hào)H04L12/26GK102148717SQ20101010884
公開(kāi)日2011年8月10日 申請(qǐng)日期2010年2月4日 優(yōu)先權(quán)日2010年2月4日
發(fā)明者明仲 申請(qǐng)人:明仲