專利名稱::基于智能代理系統(tǒng)的分散式社會網(wǎng)絡聚類方法
技術領域:
:本發(fā)明屬于數(shù)據(jù)挖掘和機器學習領域,是一種基于智能代理系統(tǒng)的分散式網(wǎng)絡聚類方法,特別適用于分布式復雜網(wǎng)絡聚類問題。
背景技術:
:不同種類的社會網(wǎng)絡具有完全不同的功能。然而,研究發(fā)現(xiàn),現(xiàn)存的大多數(shù)社會網(wǎng)絡雖然具有完全不同的拓撲結構和功能,但卻具有一些非常相似的統(tǒng)計特性,如小世界性,無標度性,網(wǎng)絡傳遞性和網(wǎng)絡模塊性。這些特性對于理解和分析復雜網(wǎng)絡、挖掘隱藏在其中的規(guī)律具有十分重要的意義。例如,借助于網(wǎng)絡模塊性,能夠理解一個復雜的社會網(wǎng)絡是如何基于一些基本網(wǎng)絡構造模塊(如網(wǎng)絡粒子(networkmotif)禾口網(wǎng)絡簇(networkcluster或networkcommunity))層次化地組合而成的。研究表明,大多數(shù)社會網(wǎng)絡都是由稱為網(wǎng)絡簇的基本網(wǎng)絡模塊以層次化的方式構建而成,并具有簇內(nèi)社會交互強而簇間社會交互相對較弱的特點。網(wǎng)絡聚類分析對于深入理解網(wǎng)絡拓撲結構、挖掘隱含模式和預測網(wǎng)絡動態(tài)變化都具有十分重要的意義。除社會網(wǎng)絡分析外,一旦問題空間被建模成網(wǎng)絡,很多問題都可以轉變?yōu)榫W(wǎng)絡聚類問題。例如,用于預測蛋白質(基即功能的蛋白質(基因)網(wǎng)絡聚類,基于鏈接結構分析的Web網(wǎng)頁聚類,基于網(wǎng)絡的圖像分割和用于延長網(wǎng)絡壽命的分布式傳感器網(wǎng)絡聚類等。網(wǎng)絡聚類問題已被證明是NP完全問題,現(xiàn)有的工作都是試圖給出一種快速、高效的近似算法。根據(jù)基本工作原理,現(xiàn)有主要的網(wǎng)絡聚類方法可歸結為如下四類1、基于圖論的聚類算法,如譜圖分割算法,MFC算法和HITS算法;2、層次聚類方法,如Girvan-Newman算法和其改進算法;3、貪心優(yōu)化方法,如Kernighan-Lin算法,快速Newman算法和模擬退火算法等;4、基于隨機過程的聚類方法,如FEC算法,NCMA算法和基于隨機游走相似度的聚類算法等。已有的網(wǎng)絡聚類方法大都采用集中式的處理策略。為了聚類一個給定的網(wǎng)絡,這些集中式的方法必須事先獲得網(wǎng)絡的全局拓撲結構。然而,對于規(guī)模大、地理上分布或控制上分散的分布式網(wǎng)絡,要獲得其全局拓撲結構是非常困難甚至不可能的。例如,為了聚類WWW網(wǎng)絡而企圖事先獲得其完整的網(wǎng)絡結構是不現(xiàn)實的。再如,為聚類P2P網(wǎng)絡或傳感器網(wǎng)絡而指定在某節(jié)點上運行一個集中式聚類算法的策略將不可避免的破壞網(wǎng)絡節(jié)點的平等性。同樣,對于節(jié)點頻繁動態(tài)更新的網(wǎng)絡,需要不斷獲得全局拓撲結構進行網(wǎng)絡聚類的方法顯然并不合適。
發(fā)明內(nèi)容本發(fā)明所要解決的技術問題是提供一種基于智能代理系統(tǒng)的分散式網(wǎng)絡聚類方法,即在不需要全局網(wǎng)絡信息的情況下,分布在網(wǎng)絡中的多個智能代理基于局部感知信息、采用自聚合和自組織的方式協(xié)作挖掘網(wǎng)絡簇結構,在本發(fā)明中,智能代理以完全并發(fā)和異步的方式運行而無需借助任何同步控制機制。解決上述技術問題,本發(fā)明提供一種基于智能代理系統(tǒng)的分散式社會網(wǎng)絡聚類方法,其特征在于包括以下步驟定義網(wǎng)絡聚類評價函數(shù);變量、移動代理初始化;獲取移動代理當前所在節(jié)點的標識符;更新節(jié)點特征值;更新所有鄰居局部沖突函數(shù)值;選擇新的鄰居節(jié)點;判斷當前移動代理移動步數(shù)是否大于規(guī)定的最大步數(shù),如果是,該移動代理休眠;否則移動代理移動到下一節(jié)點,獲取移動代理當前所在節(jié)點的標識符;判斷是否所有移動代理都已經(jīng)休眠,如果不是,等待,否則,方法結束。本發(fā)明運用多智能代理和移動代理共同完成網(wǎng)絡聚類,多智能代理代表網(wǎng)絡中的多個節(jié)點,每個智能代理通過管理一個三元組來刻畫每個節(jié)點的特征;移動代理在網(wǎng)絡節(jié)點間移動,每到一個新節(jié)點即更改該節(jié)點三元組的信息,當所有移動代理穩(wěn)定下來,不在網(wǎng)絡上移動時,聚類過程結束。提出了一個新的網(wǎng)絡聚類評價函數(shù),,采用局部評價的疊加來評估一個給定的劃分是否為一個最優(yōu)網(wǎng)絡簇結構,適用于分散的網(wǎng)絡聚類方法。定義了一組移動代理的動作,使智能代理可以僅僅基于局部感知信息,采用自聚合和自組織的方式協(xié)作挖掘網(wǎng)絡簇結構。綜上所述,本發(fā)明為社會網(wǎng)絡聚類提供一種全新高效的方法,適用于傳統(tǒng)方法無法解決的分布式復雜網(wǎng)絡聚類問題。圖l是本發(fā)明實施方式的流程圖;圖2—圖7是采用不同的基準網(wǎng)絡對基于智能代理系統(tǒng)的分散式社會網(wǎng)絡聚類方法進行的測試與評價,借助圖像分割問題形象地展示了該方法中智能代理的自聚合和自組織行為;圖2是WayneZachary在二十世紀七十年代建立的空手道俱樂部網(wǎng)絡圖;圖3是基于Agent系統(tǒng)的分散式社會網(wǎng)絡聚類方法計算的空手道俱樂部網(wǎng)絡簇結構圖;圖4(a)是2000賽季美國足球聯(lián)盟網(wǎng)絡的鄰接矩陣圖;圖4(b)是以矩陣形式表示的基于Agent系統(tǒng)的分散式社會網(wǎng)絡聚類方法找到的最優(yōu)12-劃分圖;圖5(a)是分布式智能PDA網(wǎng)絡的鄰接矩陣圖,該網(wǎng)絡包含82個節(jié)點和124條邊;圖5(b)是以矩陣形式表示的基于Agent系統(tǒng)的分散式社會網(wǎng)絡聚類方法找到的最優(yōu)5-劃分圖;圖5(c)是包含Miller的簇結構圖;圖6是應用基于Agent系統(tǒng)的分散式社會網(wǎng)絡聚類方法進行圖像分割;圖7是基于Agent系統(tǒng)的分散式社會網(wǎng)絡聚類方法執(zhí)行圖像分割過程的快照,每10次移動和更新對應一個快照。具體實施方式下面將對本發(fā)明進行詳細說明。參照圖l,該實施方式流程開始于步驟101;步驟102定義一個新的網(wǎng)絡聚類評價函數(shù)F,采用局部評價的疊加來評估一個給定的/t-劃分是否為一個最優(yōu)網(wǎng)絡簇結構;將一個網(wǎng)絡建模成一個圖G=(F,£),r表示節(jié)點集,£表示邊集。圖G的一個^劃分定義為尸=(^,cv,其中連通分量c;,…A滿足^q^和Sq=0如果連通分量內(nèi)邊的個數(shù)遠遠多于連通分量間邊的個數(shù),則P稱為一個網(wǎng)絡簇結構。令J為圖G的鄰接矩陣,尸為圖G的一個l劃分,則關于尸的評價函數(shù)定義為1,v,.和、屬于同一個連通分鷺pgy=io,v,鄰、.屬于不同的連通分量步驟103,初始化變量和移動代理;將節(jié)點i(v,,ia^)的特征值A初始化為1和^之間的隨機數(shù);(A為待劃分簇的個數(shù))生成"個移動Agent(..A,,并將它們隨機地分配到網(wǎng)絡節(jié)點上;對于Z=l,2,,歷,置計數(shù)變量力叩&—0;接下來,4…4(^附)并行地循環(huán)執(zhí)行如下動作直至4…A全部處于休眠狀態(tài)為止;步驟104,獲取移動代理當前所在節(jié)點的標識符A歩驟105,更新節(jié)點特征值;若概率2^0C,則更新A(使局部最小化);否則更新A(減小C(力);((X為事先給定的擾動概率值)步驟106,用A值更新i所有鄰居的局部沖突函數(shù)值(比如鄰居J對應的cO^值);步驟107,選擇新的鄰居節(jié)點;若概率r^3,則選擇具有最大值的鄰居>,否則隨機選擇一個鄰居((3為事先給定的擾動概率值)步驟108,判斷當前移動代理移動步數(shù)是否大于/fo/^值,如果是,該移動代理休眠;否則移動代理移動到鄰居J',重復步驟104(#,s為規(guī)定的移動Agent最大步數(shù));步驟109,判斷是否所有移動代理都已經(jīng)休眠,如果不是,等待,重復執(zhí)行步驟109;否則,轉入步驟110;基于智能代理系統(tǒng)的分散式社會網(wǎng)絡聚類方法流程結束于步驟110;當4…A全部處于休眠狀態(tài),P,值即為節(jié)點/所處的簇。以下通過實驗例進一步說明本發(fā)明方法的效果采用不同的基準網(wǎng)絡對基于智能代理系統(tǒng)的分散式社會網(wǎng)絡聚類方法進行了測試與評價,借助圖像分割問題形象地展示了該方法中智能代理的自聚合和自組織行為。實驗例1聚類空手道俱樂部網(wǎng)絡圖2是一個空手道俱樂部網(wǎng)絡,在多種社會因素作用下,該俱樂部最終分裂成兩個互不相交的獨立團體,分別由行政主管和教練領導。簇A對應由行政主管(由節(jié)點1表示)領導的群體,而簇B對應由教練(由節(jié)點33表示)領導的群體。圖3給出了基于智能代理系統(tǒng)的分散式社會網(wǎng)絡聚類方法得到的空手道倶樂部網(wǎng)絡的一個最優(yōu)2-劃分。與圖2所示的實際劃分相比,只有節(jié)點10被錯分。實際上,節(jié)點10的歸屬具有模糊性,因為它對2個簇發(fā)出相同的邊數(shù)。實驗例2聚類足球聯(lián)盟網(wǎng)絡圖4(a)給出了2000賽季美國大學足球聯(lián)盟網(wǎng)絡的鄰接矩陣。該網(wǎng)絡包含115個節(jié)點和613條邊。網(wǎng)絡中每個節(jié)點表示一支大學足球隊,每條邊表示兩個球隊間進行的一場比賽。根據(jù)地理位置,全部球隊組織成12個聯(lián)盟。根據(jù)比賽規(guī)則,聯(lián)盟內(nèi)的比賽遠遠多于聯(lián)盟間的比賽。因此,按照比賽的關系,12個聯(lián)盟對應12個網(wǎng)絡簇。由于具有非常明確的簇結構,該網(wǎng)絡成為測試網(wǎng)絡聚類算法有效性的基準網(wǎng)絡,被廣泛采用。圖4(b)以矩陣的方式給出了基于智能代理系統(tǒng)的分散式社會網(wǎng)絡聚類算法為該網(wǎng)絡找到的一個最優(yōu)12-劃分。通過重新安排原鄰接矩陣的行和列,將同簇節(jié)點排列在一起,可以得到能夠清晰表示網(wǎng)絡簇結構的轉換鄰接矩陣。如果網(wǎng)絡有分明的簇結構,其對應的轉換矩陣應該是一個近似的對角矩陣,主對角線的每一個塊矩陣恰好對應一個網(wǎng)絡簇。如圖4(b)所示,該轉換矩陣是一個相當規(guī)則的對角陣,分布在主對角線區(qū)域的非零元素(對應簇內(nèi)邊)遠遠多于散落在主對角線區(qū)域之外的非零元素(對應簇間邊)。分析比較后發(fā)現(xiàn),基于智能代理系統(tǒng)的分散式社會網(wǎng)絡聚類方法得到的12-劃分與12個實際的足球聯(lián)盟基本吻合,只有8支隸屬于3個相對獨立的聯(lián)盟的球隊被錯分。錯分的原因在于,這些球隊與聯(lián)盟外球隊的比賽過多。實驗例3分布式智能PDA網(wǎng)絡本節(jié)使用智能PDA(PortableDigitalAssistant,個人數(shù)字助理)網(wǎng)絡(如圖5(a)所示)測試基于智能代理系統(tǒng)的分散式社會網(wǎng)絡聚類方法聚類分布式網(wǎng)絡的有效性。在該網(wǎng)絡中,節(jié)點表示個人攜帶的智能PDA,邊表示PDA間的通信頻度。建立推薦系統(tǒng)是聚類該分布式網(wǎng)絡的應用之一。推薦系統(tǒng)中的每個智能PM能夠根據(jù)它在一段時間內(nèi)累計的通信記錄自動地向其所有者推薦潛在的商業(yè)伙伴。例如,當Miller的智能PDA發(fā)現(xiàn)其隸屬于某個簇后(該簇內(nèi)PDA間的通信頻度高于以往任何時段),將會把該簇內(nèi)的所有成員推薦給Miller.Miller在推薦名單選擇有潛在合作機會的商業(yè)伙伴。圖5(b)給出了以矩陣形式表示的基于智能代理系統(tǒng)的分散式社會網(wǎng)絡聚類算法找到的最優(yōu)5-劃分。圖5(c)給出Miller所在的簇。如圖所示,除3個直接鄰居外,PDA還將向他推薦另外11個他或許不認識的潛在合作者。實驗例4基于智能代理系統(tǒng)的分散式社會網(wǎng)絡聚類方法的自聚合和自組織特性本節(jié)借助圖像分割問題討論基于智能代理系統(tǒng)的分散式社會網(wǎng)絡聚類方法中智能代理的自聚合和自組織行為。當圖像被建模成網(wǎng)絡后,圖像分割任務就轉換為相應的網(wǎng)絡聚類問題。圖6(a)所示的簡單圖像由8個隨機產(chǎn)生的墨滴組成;圖6(b)給出其相應的網(wǎng)絡,該網(wǎng)絡按照以下方法生成(1)每個像素看作是一個網(wǎng)絡節(jié)點;(2)對于每一對像素(a,乂)和(a力),根據(jù)公式r7二exp((Or廣x^+(,-j0)"/c)計算節(jié)點i和節(jié)點力司的權值,其中c是一個預定義的常數(shù);(3)連接權值高于平均值的節(jié)點對。圖6(c)給出了應用基于智能代理系統(tǒng)的分散式社會網(wǎng)絡聚類方法經(jīng)過300次移動和更新后得到的圖分割結果,其中不同的簇用不同的顏色區(qū)分。如圖所示,8個墨滴都被正確分割。通過這個簡單的例子,可以形象地展示在基于智能代理系統(tǒng)的分散式社會網(wǎng)絡聚類算法動態(tài)運行過程中所表現(xiàn)出的自聚合和自組織特行為。圖7用30個快照給出了基于智能代理系統(tǒng)的分散式社會網(wǎng)絡聚類方法搜索最優(yōu)8-劃分的搜索過程(每10次移動和更新后取一幅快照)。如圖所示,最初的劃分接近于隨機劃分。隨著時間,隨機劃分逐漸向最優(yōu)劃分演變。當聚合了足夠多的局部搜索結果之后(大約經(jīng)過150次移動和更新),呈現(xiàn)出一個近似最優(yōu)的劃分。經(jīng)過另150步的求精,得到如圖6(c)所示的最優(yōu)8-劃分。權利要求1.一種基于智能代理系統(tǒng)的分散式社會網(wǎng)絡聚類方法,其特征在于包括下列步驟定義網(wǎng)絡聚類評價函數(shù);變量、移動代理初始化;獲取移動代理當前所在節(jié)點的標識符;更新節(jié)點特征值;更新所有鄰居局部沖突函數(shù)值;選擇新的鄰居節(jié)點;判斷當前移動代理移動步數(shù)是否大于規(guī)定的最大步數(shù),如果是,該移動代理休眠;否則移動代理移動到下一節(jié)點,獲取移動代理當前所在節(jié)點的標識符;判斷是否所有移動代理都已經(jīng)休眠,如果不是,等待,否則,結束。2、根據(jù)權利要求1所述的基于智能代理系統(tǒng)的分散式社會網(wǎng)絡聚類方法,其特征在于定義網(wǎng)絡聚類評價函數(shù),采用局部評價的疊加來評估一個給定的k-劃分是否為一個"全局意義"下的最優(yōu)網(wǎng)絡簇結構。3、根據(jù)權利要求1所述的基于智能代理系統(tǒng)的分散式社會網(wǎng)絡聚類方法,其特征在于所有移動代理異步和并行的在多智能代理系統(tǒng)中移動,移動代理到每個節(jié)點時改變其相應的變量值。4、根據(jù)權利要求1所述的基于智能代理系統(tǒng)的分散式社會網(wǎng)絡聚類方法,其特征在于在更新節(jié)點特征值的過程中加入擾動。5、根據(jù)權利要求1所述的基于智能代理系統(tǒng)的分散式社會網(wǎng)絡聚類方法,其特征在于選擇鄰居節(jié)點作為下一個移動到的目標節(jié)點時,以一定的概率選擇具有最大局部沖突函數(shù)值的鄰居節(jié)點。全文摘要一種基于智能代理系統(tǒng)的分散式社會網(wǎng)絡聚類方法,包括下列步驟定義網(wǎng)絡聚類評價函數(shù);變量、移動代理初始化;獲取移動代理當前所在節(jié)點的標識符;更新節(jié)點特征值;更新所有鄰居局部沖突函數(shù)值;選擇新的鄰居節(jié)點;判斷當前移動代理移動步數(shù)是否大于規(guī)定的最大步數(shù),如果是,該移動代理休眠;否則移動代理移動到下一節(jié)點,獲取移動代理當前所在節(jié)點的標識符;判斷是否所有移動代理都已經(jīng)休眠,如果不是,等待,否則,結束。本發(fā)明為社會網(wǎng)絡聚類提供一種全新高效的方法,適用于傳統(tǒng)方法無法解決的分布式復雜網(wǎng)絡聚類問題。文檔編號H04L12/24GK101272328SQ20081005042公開日2008年9月24日申請日期2008年2月29日優(yōu)先權日2008年2月29日發(fā)明者關菁華,劉大有,博楊,晶黃,紅齊申請人:吉林大學