專利名稱:網(wǎng)絡(luò)論壇中輿論領(lǐng)袖分析方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種網(wǎng)絡(luò)論壇中輿論領(lǐng)袖分析方法,屬于網(wǎng)絡(luò)論壇分析方法技術(shù)領(lǐng)域。
背景技術(shù):
日本學(xué)者M(jìn)atsumura等人曾于2002年提出了基于在線網(wǎng)絡(luò)社區(qū)交流的“影響力擴(kuò)散模型”anfluence Diffusion Model,簡稱IDM),旨在從文本內(nèi)容和交往網(wǎng)絡(luò)兩個方面來區(qū)分網(wǎng)絡(luò)角色類型,區(qū)分在網(wǎng)絡(luò)中是何種參與者、參與者的特征及網(wǎng)絡(luò)交流中所擔(dān)負(fù)的角色等,篩選出輿論領(lǐng)袖。IDM模型具有明顯的優(yōu)點,它使發(fā)帖人在網(wǎng)絡(luò)中的語料影響力得以量化,便于網(wǎng)絡(luò)輿論領(lǐng)袖基于語料的甄別。但簡單影響力擴(kuò)散模型明顯存在兩個較大的缺陷。一是當(dāng)基于語料的對話鏈在傳遞的過程中出現(xiàn)簡單語料或是帖子與上一級帖子完全無詞語交集時,必然會出現(xiàn)對話鏈影響力急劇降低或是完全“斷裂”的情形。根據(jù)IDM模型算法來計算基于語料的影響力將難以得出正確的結(jié)果,因為對話鏈的“斷裂”使上級帖子對下級帖子的影響力均變?yōu)榱?。二是IDM模型計算詞匯時采用帖子所有實詞和虛詞組成的詞匯集,其實在語料的影響力擴(kuò)散過程中實詞起到了主導(dǎo)作用,虛詞的影響幾乎可以忽略不計。網(wǎng)絡(luò)輿論領(lǐng)袖僅依賴語料擴(kuò)散計算影響力是不全面的,輿論擴(kuò)散僅能從詞的傳播角度計算,其不能反映輿論領(lǐng)袖傳播內(nèi)容是否健康、正面性,故還需從被認(rèn)同度、文章影響力、網(wǎng)民的認(rèn)知力等多角度分析。
發(fā)明內(nèi)容
本發(fā)明的目的是通過對網(wǎng)絡(luò)輿論領(lǐng)袖的自動識別與篩選,為社會各職能管理部門暢通輿情信息渠道、及時處理突發(fā)事件和應(yīng)對復(fù)雜局面,為維護(hù)國家安全和社會穩(wěn)定提供強(qiáng)有力的保障,進(jìn)而提供一種網(wǎng)絡(luò)論壇中輿論領(lǐng)袖分析方法。本發(fā)明的目的是通過以下技術(shù)方案實現(xiàn)的網(wǎng)絡(luò)論壇中輿論領(lǐng)袖分析方法,—、基于論壇語料的影響力計算對于某話題,由B1A2,a3,…,知組成的回復(fù)對話鏈關(guān)系中,設(shè)巧,《2,《3,...,wj 別為4, , ,…,知發(fā)帖人所發(fā)帖子的詞匯集合,i2,i3,…,in分別為此對話鏈中a1; a2, a3,…,%發(fā)帖人對其它人的影響力指標(biāo),則對于簡單語料IDM模型計算方法改進(jìn)為如下規(guī)則(1)首先計算任意兩個發(fā)帖人之間的影響力,采用兩兩比較的方法計算,產(chǎn)生了基于對話鏈的階梯式計算次數(shù),稱為階梯式評價方法;cx、Cy表示網(wǎng)民X、y的發(fā)帖內(nèi)容,Wx、Wy 表示帖子文本詞語集合,如果y回復(fù)X,則認(rèn)為χ影響1,影響力通過對話鏈由Cx傳遞給Cy, 將Cx對Cy的影響用符號ix, y表示;影響力ix, y通過計算χ的帖子內(nèi)容Cx與y的帖子內(nèi)容 Cy得到,首先分別對Cx與Cy進(jìn)行分詞,然后計算兩分詞集合的相似程度,找出詞語交集。Cx 對Cy的影響力表示為Cx與Cy中詞語的交集占Cy詞語總數(shù)的比例;
權(quán)利要求
1. 一種網(wǎng)絡(luò)論壇中輿論領(lǐng)袖分析方法,其特征在于,一、基于論壇語料的影響力計算對于某話題,由,…,知組成的回復(fù)對話鏈關(guān)系中,設(shè)W1, w2,w3,…,Wn分別為 ai; a2, a3,…,知發(fā)帖人所發(fā)帖子的詞匯集合,I1, i2, i3,…,in分別為此對話鏈中a1; a2, a3,…,%發(fā)帖人對其它人的影響力指標(biāo),則對于簡單語料IDM模型計算方法改進(jìn)為如下規(guī)則(1)首先計算任意兩個發(fā)帖人之間的影響力,采用兩兩比較的方法計算,產(chǎn)生了基于對話鏈的階梯式計算次數(shù),稱為階梯式評價方法;Cx、Cy表示網(wǎng)民x、y的發(fā)帖內(nèi)容,Wx、Wy表示帖子文本詞語集合,如果y回復(fù)χ,則認(rèn)為χ影響1,影響力通過對話鏈由Cx傳遞給Cy,將Cx 對Cy的影響用符號ix, y表示;影響力ix, y通過計算χ的帖子內(nèi)容Cx與y的帖子內(nèi)容Cy得到;首先分別對Cx與Cy進(jìn)行分詞,然后計算兩分詞集合的相似程度,找出詞語交集。(;對(; 的影響力表示為Cx與Cy中詞語的交集占Cy詞語總數(shù)的比例;
全文摘要
本發(fā)明提供了一種網(wǎng)絡(luò)論壇中輿論領(lǐng)袖分析方法,首先計算任意兩個發(fā)帖人之間的影響力,采用兩兩比較的方法計算,產(chǎn)生了基于對話鏈的階梯式計算次數(shù),稱為階梯式評價方法;其次計算對話鏈中任一個發(fā)帖人在整個對話鏈中的影響力;對于發(fā)帖人i在該話題的多個對話鏈及總的影響力評價指標(biāo)的計算;基于參與者統(tǒng)計屬性特征帖子的支持率、發(fā)帖數(shù)、回帖數(shù)和網(wǎng)齡;刻畫網(wǎng)民在論壇中基本行為的統(tǒng)計數(shù)據(jù);綜合計算輿論領(lǐng)袖值。網(wǎng)絡(luò)輿論領(lǐng)袖的分析是在網(wǎng)絡(luò)論壇特定的板塊中,限定在某一話題內(nèi)或領(lǐng)域內(nèi),根據(jù)此話題或領(lǐng)域內(nèi)網(wǎng)民統(tǒng)計屬性特征及網(wǎng)民的發(fā)帖語料兩個方面進(jìn)行評價,再按合理的權(quán)值計算出每一位網(wǎng)民的得分,得分高者即為此話題或此領(lǐng)域內(nèi)輿論領(lǐng)袖。
文檔編號G06F17/30GK102314489SQ20111023219
公開日2012年1月11日 申請日期2011年8月15日 優(yōu)先權(quán)日2011年8月15日
發(fā)明者張偉哲, 張宏莉, 張玥, 李 東, 陳琳 申請人:哈爾濱工業(yè)大學(xué)