国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      一種基于用戶話題鏈接行為的社交網(wǎng)絡(luò)意見領(lǐng)袖識(shí)別方法

      文檔序號(hào):6360616閱讀:396來源:國(guó)知局
      專利名稱:一種基于用戶話題鏈接行為的社交網(wǎng)絡(luò)意見領(lǐng)袖識(shí)別方法
      技術(shù)領(lǐng)域
      本發(fā)明涉及一種基于用戶話題鏈接行為的社交網(wǎng)絡(luò)意見領(lǐng)袖識(shí)別方法,主要用于在社交網(wǎng)絡(luò)環(huán)境下,根據(jù)社交網(wǎng)絡(luò)話題鏈接特性識(shí)別網(wǎng)絡(luò)中的意見領(lǐng)袖。
      背景技術(shù)
      意見領(lǐng)袖的識(shí)別方法主要分為基于自然語(yǔ)言處理和基于網(wǎng)絡(luò)鏈接關(guān)系兩大類?;谧匀徽Z(yǔ)言處理的意見領(lǐng)袖識(shí)別方法首先將特定領(lǐng)域的特征提取出來,然后對(duì)網(wǎng)絡(luò)節(jié)點(diǎn)的所有帖子內(nèi)容進(jìn)行相同的特征提取,最后計(jì)算二者的相似度,相似度較高者可認(rèn)為屬于該領(lǐng)域的意見領(lǐng)袖?;诰W(wǎng)絡(luò)鏈接關(guān)系的意見領(lǐng)袖識(shí)別方法主要通過網(wǎng)絡(luò)節(jié)點(diǎn)與其他節(jié)點(diǎn)的關(guān)系來識(shí)別,目前主要的識(shí)別方法是后者。
      文獻(xiàn)1“ Identifying Opinion Leaders in the Blogosphere [CIKM, pp. 971-974,2007] ”公開了一種意見領(lǐng)袖識(shí)別方法Inf luenceRank,該方法根據(jù)與其他博客相比較來判斷用戶的重要性,以及這些用戶對(duì)整個(gè)網(wǎng)絡(luò)所做的貢獻(xiàn)來計(jì)算用戶權(quán)值,該論文采用了余弦定理計(jì)算不同博客實(shí)體的相似性,復(fù)雜性較高,開銷大。文獻(xiàn)2 “TwitterRank :Finding topic-sensitive Inuential Twitterers [WSDM,2010] ”公開了一種Twitter網(wǎng)絡(luò)節(jié)點(diǎn)計(jì)算方法TwitterRank,該方法根據(jù)Twitter中的用戶關(guān)系、粉絲與關(guān)注者之間的分布以及在信息傳播的過程中各種用戶群體所起到的作用進(jìn)行權(quán)重計(jì)算,該算法主要基于話題進(jìn)行分析,召回率不高。基于網(wǎng)絡(luò)鏈接關(guān)系的意見領(lǐng)袖的識(shí)別算法在處理網(wǎng)絡(luò)圖的時(shí)候,只要節(jié)點(diǎn)有直接相連的關(guān)系即可以認(rèn)為有邊的存在邊權(quán)值為1,否則邊權(quán)值為0,因此該網(wǎng)絡(luò)為邊權(quán)值取值范圍為{0,1},然而在社交網(wǎng)絡(luò)中,用戶的交流比較廣泛,用戶關(guān)系的有無只能粗略地反映網(wǎng)絡(luò)節(jié)點(diǎn)的關(guān)系,本發(fā)明將用戶話題鏈接關(guān)系納入研究范圍,可以更加有效識(shí)別意見領(lǐng)袖,更適合社交網(wǎng)絡(luò)環(huán)境的意見領(lǐng)袖識(shí)別。

      發(fā)明內(nèi)容
      在傳統(tǒng)模式下話題追蹤采用的自然語(yǔ)言處理方式需要對(duì)文本進(jìn)行分詞處理,追蹤時(shí)則還需要話題關(guān)鍵詞特征提取等復(fù)雜處理,對(duì)于目前海量的網(wǎng)絡(luò)數(shù)據(jù)而言具有很大的局限性。然而在社交網(wǎng)絡(luò)中已經(jīng)包含了大量的潛在用戶關(guān)系和用戶行為,因此使用社交網(wǎng)絡(luò)中拓?fù)潢P(guān)系建模來取代傳統(tǒng)話題特征提取和話題追蹤,更符合網(wǎng)絡(luò)特性。為了克服傳統(tǒng)模式下話題追蹤的局限性并適合目前流行的社交網(wǎng)絡(luò),本發(fā)明所采用的基于話題鏈接追蹤的社交網(wǎng)絡(luò)意見領(lǐng)袖識(shí)別方法提高意見領(lǐng)袖識(shí)別率和準(zhǔn)確率。本發(fā)明解決其技術(shù)問題所采用的技術(shù)方案是一種基于用戶話題鏈接行為的社交網(wǎng)絡(luò)意見領(lǐng)袖識(shí)別方法,其特點(diǎn)是包括以下步驟I.構(gòu)建社交網(wǎng)絡(luò)有向圖G= (E, V)式中,E表示用戶關(guān)系集合,V表示用戶節(jié)點(diǎn)集合;
      2.修正網(wǎng)絡(luò)邊權(quán)值在話題追蹤過程中需要將傳統(tǒng)的用戶連接關(guān)系進(jìn)行修正,邊權(quán)值將不再是離散的{0,1},在追蹤過程將根據(jù)用戶之間的互動(dòng)關(guān)系進(jìn)行加權(quán),當(dāng)用戶B對(duì)用戶A的話題Tl進(jìn)行了回復(fù)、轉(zhuǎn)發(fā)以及收藏將影響增加這個(gè)權(quán)值。結(jié)合話題追蹤模型進(jìn)行邊的加權(quán),算法將設(shè)置算法常數(shù)向量h = (α, β, A )表示用戶好友關(guān)系、回復(fù)、轉(zhuǎn)帖和收藏各項(xiàng)加權(quán)系數(shù)。定義I :好友值F(i,j),表示由用戶好友關(guān)系的邊加權(quán),用戶i與j是好友會(huì)產(chǎn)生話題邊E(i, j)加權(quán),加權(quán)系數(shù)為α定義2 :回復(fù)值R1Q, j),表示由用戶j回復(fù)用戶i某話題得到的邊E(i,j)加權(quán),加權(quán)系數(shù)為β,用戶回復(fù)該話題將使得該邊的權(quán)值增加定義3 :轉(zhuǎn)帖值R2 (i,j),表示由用戶j轉(zhuǎn)帖用戶i某話題得到的邊E (i,j)加權(quán), 加權(quán)系數(shù)為S,轉(zhuǎn)帖次數(shù)也將影響轉(zhuǎn)帖值的大小定義4:收藏值C(i,j),表示由用戶j收藏用戶i某話題得到的邊E(i,j)加權(quán),加權(quán)系數(shù)為ω,收藏次數(shù)將影響收藏值的大小定義5 :邊加權(quán)值E(i,j),表示經(jīng)過加權(quán)后的網(wǎng)絡(luò)圖邊的權(quán)重對(duì)每一個(gè)網(wǎng)絡(luò)節(jié)點(diǎn)i和j,且i幸j,計(jì)算E(i, j),邊加權(quán)值E(i, j)通過下式進(jìn)行計(jì)算。
      = . 其中6= ( ,八 & 0),方=(F,H C)因此邊加權(quán)值E (i,j)展開為E(i, j) = a* F(i, j、+ β* R1 (/', j) + S* R2 (/', j) + m*C (/', j)錯(cuò)誤!未找到引用源。經(jīng)過加權(quán)后的網(wǎng)絡(luò)圖邊權(quán)值將發(fā)生變化而變得不均勻。3.對(duì)每一個(gè)網(wǎng)絡(luò)節(jié)點(diǎn)i,計(jì)算經(jīng)過節(jié)點(diǎn)i的最短路徑條數(shù)Path (i),最短路徑的計(jì)算方法本發(fā)明沒有定義,可以采用現(xiàn)有的任何一種最短路徑計(jì)算方法,如Dijstra算法;4.定義意見領(lǐng)袖指標(biāo)網(wǎng)絡(luò)介數(shù)是指經(jīng)過節(jié)點(diǎn)i的最短路徑條數(shù),將介數(shù)計(jì)算方法進(jìn)行修改以適合加權(quán)的網(wǎng)絡(luò)圖,依然稱其為介數(shù),用符號(hào)B(i)表示,在社交網(wǎng)絡(luò)中B(i)能夠反映網(wǎng)絡(luò)中節(jié)點(diǎn)i的重要性和中心性,基于話題追蹤的意見領(lǐng)袖將由B(i)值較大的節(jié)點(diǎn)構(gòu)成。計(jì)算最短路徑長(zhǎng)度,對(duì)節(jié)點(diǎn)邊進(jìn)行加權(quán),求得加權(quán)和B (i),計(jì)算式如下所示
      Path(J)BH) = YjEiiJ)
      ;=1為了使得結(jié)果在
      之間,將上式進(jìn)行歸一化處理得到K (i),如下式所示
      Path(T)離異=4_
      YjBik) YjBik)
      k=\ k=\本發(fā)明的有益效果是由于采用社交網(wǎng)絡(luò)用戶話題中鏈接關(guān)系的計(jì)算方法,降低了網(wǎng)絡(luò)節(jié)點(diǎn)規(guī)模,從而降低了系統(tǒng)開銷,提高了算法準(zhǔn)確率和召回率。下面從統(tǒng)計(jì)學(xué)的Kendal-tau和Spareman Rank以及算法準(zhǔn)確率和召回率說明本發(fā)明的效果。在統(tǒng)計(jì)學(xué)中,肯德爾相關(guān)系數(shù)是是一個(gè)用來測(cè)量?jī)蓚€(gè)隨機(jī)變量相關(guān)性的統(tǒng)計(jì)值。一個(gè)肯德爾檢驗(yàn)是一個(gè)無參數(shù)假設(shè)檢驗(yàn),它使用計(jì)算而得的相關(guān)系數(shù)去檢驗(yàn)兩個(gè)隨機(jī)變量的統(tǒng)計(jì)依賴性??系聽栂嚓P(guān)系數(shù)的取值范圍在-I到I之間,當(dāng)τ為I時(shí),表示兩個(gè)隨機(jī)變量擁有一致的等級(jí)相關(guān)性;當(dāng)τ為-I時(shí),表示兩個(gè)隨機(jī)變量擁有完全相反的等級(jí)相關(guān)性;當(dāng)τ為O時(shí),表示兩個(gè)隨機(jī)變量是相互獨(dú)立的。表I給出了基于度意見領(lǐng)袖識(shí)別算法、基于PageRank意見領(lǐng)袖識(shí)別算法及基于TwitterRank意見領(lǐng)袖識(shí)別算法與本發(fā)明的算法之間的Kendall_tau值。表I意見領(lǐng)袖算法K-tau值
      權(quán)利要求
      1. 一種基于用戶話題鏈接行為的社交網(wǎng)絡(luò)意見領(lǐng)袖識(shí)別方法,其特征在于包括下述步驟1)構(gòu)建社交網(wǎng)絡(luò)有向圖G=(E,V),式中,E表示用戶關(guān)系集合,V表示用戶節(jié)點(diǎn)集合;2)修正網(wǎng)絡(luò)邊權(quán)值定義1 :好友值F(i,j),表示由用戶好友關(guān)系的邊加權(quán),用戶i與j是好友會(huì)產(chǎn)生話題 邊E(i,j)加權(quán),加權(quán)系數(shù)為a ;定義2 :回復(fù)值Rji,j),表示由用戶j回復(fù)用戶i某話題得到的邊E(i,j)加權(quán),加權(quán) 系數(shù)為P,用戶回復(fù)該話題將使得該邊的權(quán)值增加;定義3 :轉(zhuǎn)帖值R2(i,j),表示由用戶j轉(zhuǎn)帖用戶i某話題得到的邊E (i,j)加權(quán),加權(quán) 系數(shù)為S,轉(zhuǎn)帖次數(shù)也將影響轉(zhuǎn)帖值的大?。欢x4:收藏值C(i,j),表示由用戶j收藏用戶i某話題得到的邊E(i,j)加權(quán),加權(quán) 系數(shù)為《,收藏次數(shù)將影響收藏值的大小;定義5 :邊加權(quán)值E(i,j),表示經(jīng)過加權(quán)后的網(wǎng)絡(luò)圖邊的權(quán)重;對(duì)每一個(gè)網(wǎng)絡(luò)節(jié)點(diǎn)i和j,且i古j,
      全文摘要
      本發(fā)明公開了一種基于用戶話題鏈接行為的社交網(wǎng)絡(luò)意見領(lǐng)袖識(shí)別方法,首先構(gòu)建社交網(wǎng)絡(luò)有向圖,然后修正網(wǎng)絡(luò)邊權(quán)值,對(duì)每一個(gè)網(wǎng)絡(luò)節(jié)點(diǎn)i,計(jì)算經(jīng)過節(jié)點(diǎn)i的最短路徑條數(shù),計(jì)算最短路徑長(zhǎng)度,對(duì)節(jié)點(diǎn)邊進(jìn)行加權(quán),求得加權(quán)和B(i),基于話題追蹤的意見領(lǐng)袖將由B(i)值較大的節(jié)點(diǎn)構(gòu)成。本發(fā)明由于采用社交網(wǎng)絡(luò)用戶話題中鏈接關(guān)系的計(jì)算方法,降低了網(wǎng)絡(luò)節(jié)點(diǎn)規(guī)模,從而降低了系統(tǒng)開銷,提高了算法準(zhǔn)確率和召回率。
      文檔編號(hào)G06F17/30GK102662956SQ20121005425
      公開日2012年9月12日 申請(qǐng)日期2012年3月5日 優(yōu)先權(quán)日2012年3月5日
      發(fā)明者何軼, 姚如貴, 張兆林, 彭冬, 王伶 申請(qǐng)人:西北工業(yè)大學(xué)
      網(wǎng)友詢問留言 已有0條留言
      • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
      1