一種社交網(wǎng)絡重要用戶發(fā)現(xiàn)的實現(xiàn)方法
【技術領域】
[0001] 本發(fā)明涉及一種社交網(wǎng)絡重要用戶發(fā)現(xiàn)的實現(xiàn)方法,屬于網(wǎng)絡通信技術領域。
【背景技術】
[0002] 重要節(jié)點是相比網(wǎng)絡中其他節(jié)點而言,對整個網(wǎng)絡的結構和功能夠能產(chǎn)生巨大作 用的少量節(jié)點。近年來,學者在重要節(jié)點排序上提出了很多指標和算法,主要有以下幾個方 面:1·基于節(jié)點鄰居節(jié)點的排序方法,如在文獻BonacichP《Factoringandweighting approachestostatusscoresandcliqueidentification))(JournalofMathematical Sociology. 1972,2(1) :113-120)提出度中心性(degreecentrality),即節(jié)點的鄰居節(jié)點 越多其影響力越大,其缺點是僅僅考慮了節(jié)點的局部信息;2.基于路徑的排序方法,如文 獻FreemanLC《Centralityinsocialnetworksconceptualclarification》(Social Networks, 1978, 1 (3) :215 - 239)提出接近中心性(closenesscentrality),通過計算節(jié)點 與網(wǎng)絡中其他所有節(jié)點距離平均值來衡量節(jié)點的重要性,缺點是時間復雜度比較高;3.基 于特征向量的排序方法,如文獻BrinS《TheAnatomyofaLarge-ScaleHypertextual WebSearchEngine))(ComputerNetworks&IsdnSystems, 1998, 30 (98) : 107 - 117) 提出PageRank算法,該算法認為每一個節(jié)點的重要性取決于指向它的其他節(jié)點的數(shù) 量和質(zhì)量,缺點是容易陷入懸掛節(jié)點。文獻LUL《LeadersinSocialNetworks,the DeliciousCase》(Plos0ne,2011,6(6):e21202)和文獻LiQ《Identifyinginfluential spreadersbyweightedLeaderRank》(PhysicaAStatisticalMechanics&Its Applications, 2014, 404(24) :47-55)提出LeaderRank算法在PageRank算法的基礎上,通 過加入了一個背景節(jié)點,該節(jié)點與網(wǎng)絡的所有節(jié)點雙向連接,來替代PageRank算法中跳轉 概率s,從而提高了算法的收斂速度和魯棒性。4.基于節(jié)點的移除和收縮的排序方法,通 過移除節(jié)點對網(wǎng)絡的破壞性來衡量節(jié)點的重要性,但其計算復雜度高?,F(xiàn)有的算法大多考 慮節(jié)點在全局中的重要性或者局部重要性,忽略了節(jié)點間相互作用對整個網(wǎng)絡的影響。
[0003] SIR模型是傳染病模型中最經(jīng)典的模型,其中S代表易感者(Susc印tible),指未 得病者,但缺乏免疫力,與感染者接觸后容易收到感染;I代表感染者(Infective),指染上 傳染病的人,它可以傳播給S類成員;R代表移除者(Removal),指,指被隔離,或因病愈而具 有免疫力的人。通常使用SIR傳播模型,來驗證重要節(jié)點排序算法的有效性。一般情況下, 所選擇節(jié)點的傳播速度越快,即一定時間內(nèi)I狀態(tài)節(jié)點個數(shù)增長速度越快,節(jié)點越重要。而 本發(fā)明能夠很好地解決上面的問題。
【發(fā)明內(nèi)容】
[0004] 本發(fā)明目的在于克服上述現(xiàn)有方法的不足,提供一種社交網(wǎng)絡重要用戶發(fā)現(xiàn)的實 現(xiàn)方法,該方法基于LeaderRank算法和節(jié)點相似度的重要節(jié)點發(fā)現(xiàn)算法,提高網(wǎng)絡的魯棒 性,減少迭代次數(shù),并且可以解決如PageRank算法在節(jié)點隨機游走的情況下陷入懸掛節(jié)點 的問題。
[0005] 本發(fā)明解決其技術問題所采取的技術方案是:本發(fā)明應用于社交網(wǎng)絡關注關系的 網(wǎng)絡下,對網(wǎng)絡中節(jié)點進行重要度排序,其直接的目的不是動態(tài)的抓取網(wǎng)絡中的重要節(jié)點。 本發(fā)明的方法結合現(xiàn)有的社交網(wǎng)絡,不是動態(tài)的抓取現(xiàn)有的社交網(wǎng)絡中的關注關系,給出 重要節(jié)點。
[0006] 本發(fā)明的方法是基于固有的社交網(wǎng)絡,并采用MATLAB平臺作為可視化軟件,將網(wǎng) 絡的重要節(jié)點排序結果給出。
[0007] 本發(fā)明在計算節(jié)點重要度時,充分考慮節(jié)點的全局和局部特征,考慮節(jié)點對相互 作用的力度不同,即存在親疏遠近的關系,從而給出重要度計算方法。
[0008] 方法流程:
[0009] 步驟1 :對要求分析的社交網(wǎng)絡通過關注關系構建信息收聽網(wǎng)絡Aij,采用 LeaderRank算法,計算得到每個節(jié)點的全局重要度;
[0010] 步驟2:采用定義的相似度計算兩兩節(jié)點的相似度,作為節(jié)點局部相互作用;
[0011] 步驟3 :采用SimRank算法,計算得到節(jié)點的重要度,對其進行排序;
[0012] 步驟4:采用SIR傳播模型,對比其他經(jīng)典算法,驗證有效性。
[0013] 進一步的,本發(fā)明所述步驟1中,采用LeaderRank算法求解節(jié)點的全局重要度,包 含一個背景節(jié)點,LeaderRank算法包括如下步驟:
[0014]a.在原有Au的基礎上,加入一個背景節(jié)點,即與網(wǎng)絡中其他節(jié)點相互連接,得到 新的網(wǎng)絡~/;
[0015] b.由A;/計算得1
[0016]c.根據(jù)
,不斷迭代至穩(wěn)定后,計算
2最終得到每個節(jié)點的LR值。
[0017] 其中1;嚴為節(jié)點出度,~為基本Google矩陣中的元素,η為網(wǎng)絡節(jié)點總數(shù), 即不包括背景節(jié)點,LRg(k)為第k步背景節(jié)點vg的重要度。
[0018] 進一步的,本發(fā)明所述步驟2中,節(jié)點相似度充分考慮節(jié)點入邊和出邊,相似度計 算公式為:
[0019]
[0020] 其中ai為節(jié)點vi的鄰居節(jié)點的集合,γ是調(diào)節(jié)參數(shù)(〇 <γ< 1)。Iff表示 節(jié)點Vi和節(jié)點V _j共同指向的節(jié)點個數(shù),&丨丨丨表示共同指向節(jié)點Vi和節(jié)點V _j的節(jié)點個數(shù)。
[0021] 進一步的,本發(fā)明所述步驟3中,綜合節(jié)點局部和全局特征,所述SimRank算法方 程為:
[0022]
[0023] 進一步的,本發(fā)明所述步驟4中,采用SIR傳播模型滿足節(jié)點對之間的相互影響力 不同,鄰居節(jié)點數(shù)多的一方對另一方的影響力更大;符合現(xiàn)實網(wǎng)絡中,當兩個人的共同好友 數(shù)一致時,好友數(shù)少的一方對認為另一方和其的關系會比好友數(shù)多的一方認為對方和其的 關系更為親密。采用SIR傳播模型滿足節(jié)點對的相似度為0時,節(jié)點之間仍然有相互作用。
[0024] 有益效果:
[0025] 1、本發(fā)明是采用LeaderRank算法計算節(jié)點的全局重要度,降低了迭代次數(shù)、提高 了網(wǎng)絡魯棒性,并且避免了節(jié)點陷入懸掛節(jié)點。
[0026] 2、本發(fā)明引入節(jié)點相似度的概念,充分考慮節(jié)點的入邊和出邊對節(jié)點間相互作用 的影響。
[0027] 3、本發(fā)明提出的SimRank算法,是綜合考慮節(jié)點全局和局部的特征,符合現(xiàn)實網(wǎng) 絡,其排序結果更為精確。
[0028] 4、本發(fā)明采用的驗證模型SIR傳播模型,可以簡單、直接的顯示所提出的SimRank 算法的有效性。
[0029] 5、本發(fā)明是基于LeaderRank算法綜合節(jié)點的局部網(wǎng)絡特征的方程,并采用 MATLAB平臺進行可視化,提高了節(jié)點重要度排序結果的精確性。
【附圖說明】
[0030] 圖1是本發(fā)明的架構示意圖。
[0031 ] 圖2是本發(fā)明的方法流程圖。
[0032] 圖3是本發(fā)明的實例的方法流程圖。
[0033] 圖4是本發(fā)明的仿真結果1的示意圖。
[0034] 圖5是本發(fā)明的仿真結果2的示意圖。
【具體實施方式】
[00