數(shù)由正面關(guān)鍵詞數(shù)及負(fù)面關(guān)鍵詞數(shù)計(jì)算出每一個(gè)博主屯、態(tài)指數(shù) 的屯、態(tài)指數(shù)計(jì)算單元; 由事件參與度值、基礎(chǔ)總分值及屯、態(tài)指數(shù)計(jì)算出每一個(gè)博主的博主權(quán)重值,將該博主 權(quán)重值與預(yù)設(shè)的權(quán)重闊值進(jìn)行比較來確認(rèn)重點(diǎn)博主的重點(diǎn)博主確認(rèn)單元。
[0036] 該裝置還包括與屯、態(tài)指數(shù)計(jì)算單元連接、為屯、態(tài)指數(shù)計(jì)算單元提供正面關(guān)鍵詞及 負(fù)面關(guān)鍵詞的正負(fù)關(guān)鍵詞存儲(chǔ)單元。
[0037] 本發(fā)明提供的一種重點(diǎn)博主追蹤確認(rèn)方法及裝置,其微博相關(guān)屬性值分析比較全 面,100+微博用戶屬性值,更深入的分析用戶,微博之間的關(guān)聯(lián),從多方面入手,增加了相互 關(guān)系的可靠性; 其對(duì)博主進(jìn)行深入分析,依據(jù)博主的發(fā)帖頻率來分析博主從W往的行為中及預(yù)測(cè)博主 在未來的微博事件中所表現(xiàn)出的影響力,微博影響力可W從微博的轉(zhuǎn)發(fā)量和評(píng)論量等方面 分析得出、博主屯、態(tài)分析W博主發(fā)布微博內(nèi)容的語義來分析,計(jì)算出正負(fù)面關(guān)鍵詞的相對(duì) 比例,從而得出博主在輿情事件中是推動(dòng)輿情發(fā)酵還是傳播正能量。從W上幾個(gè)方面,我們 可W將博主分口別類開來,誰有可能是重點(diǎn)博主也就有據(jù)可依。重點(diǎn)博主的篩選結(jié)果對(duì)每 個(gè)用戶都是可用的,并不是只對(duì)一個(gè)用戶服務(wù),在微博監(jiān)測(cè)中對(duì)重點(diǎn)博主的微博進(jìn)行監(jiān)測(cè), 運(yùn)樣就更有針對(duì)性,重點(diǎn)博主的信息就可W作為重點(diǎn)參考依據(jù)。
[0038] W上所述僅為本發(fā)明的較佳實(shí)施例而已,并不用W限制本發(fā)明,凡在本發(fā)明的精 神和原則之內(nèi)所作的任何修改、等同替換和改進(jìn)等,均應(yīng)包含在本發(fā)明的保護(hù)范圍之內(nèi)。
【主權(quán)項(xiàng)】
1. 一種重點(diǎn)博主追蹤確認(rèn)方法,其特征在于,包括以下步驟: 選取一個(gè)以上的微博輿情事件,根據(jù)該一個(gè)以上的微博輿情事件相對(duì)應(yīng)的事件關(guān)鍵詞 在微博上下載相關(guān)微博數(shù)據(jù),對(duì)相關(guān)微博數(shù)據(jù)內(nèi)的每一個(gè)博主進(jìn)行事件參與度統(tǒng)計(jì)計(jì)算出 每一個(gè)博主的事件參與度值; 將相關(guān)微博數(shù)據(jù)內(nèi)的微博數(shù)據(jù)屬性值均作為一個(gè)分析因子,根據(jù)統(tǒng)計(jì)學(xué)公式計(jì)算出每 一個(gè)博主的基礎(chǔ)總分值; 對(duì)每一個(gè)博主的每一個(gè)原創(chuàng)微博進(jìn)行語義分析找出正面關(guān)鍵詞及負(fù)面關(guān)鍵詞,統(tǒng)計(jì)正 面關(guān)鍵詞數(shù)及負(fù)面關(guān)鍵詞數(shù)由正面關(guān)鍵詞數(shù)及負(fù)面關(guān)鍵詞數(shù)計(jì)算出每一個(gè)博主的心態(tài)指 數(shù); 由事件參與度值、基礎(chǔ)總分值及心態(tài)指數(shù)計(jì)算出每一個(gè)博主的博主權(quán)重值,將該博主 權(quán)重值與預(yù)設(shè)的權(quán)重閾值進(jìn)行比較來確認(rèn)重點(diǎn)博主。2. 根據(jù)權(quán)利要求1所述的一種重點(diǎn)博主追蹤確認(rèn)方法,其特征在于,包括以下步驟: 選取N個(gè)微博輿情事件,根據(jù)該N個(gè)微博輿情事件相對(duì)應(yīng)的事件關(guān)鍵詞在微博上下載相 關(guān)微博數(shù)據(jù),對(duì)相關(guān)微博數(shù)據(jù)內(nèi)的每一個(gè)博主進(jìn)行事件參與度統(tǒng)計(jì)計(jì)算出每一個(gè)博主的事 件參與度值G: G=(W1*Q1+W2*Q2+…+Wd*Qd+."+Wf*Qf)*S/N,其中S為參與事件數(shù),N為輿情事件總 數(shù),d=l、2、…、f,f為相關(guān)微博數(shù)據(jù)內(nèi)的微博數(shù)據(jù)屬性值的個(gè)數(shù),f2 3,Wd為每個(gè)微博數(shù)據(jù)屬 性值的個(gè)數(shù),Qd為每個(gè)微博數(shù)據(jù)屬性值的參與度權(quán)重,Ql+Q2+"_+Qd+"_+Qf=l,N2 1; 將相關(guān)微博數(shù)據(jù)內(nèi)的微博數(shù)據(jù)屬性值均作為一個(gè)分析因子,根據(jù)統(tǒng)計(jì)學(xué)公式計(jì)算出每 一個(gè)博主的基礎(chǔ)總分值Total: Total=Vl*Tl+V2*T2+."+Vi*Ti+…+Vf*Tf,其中i=l、2、…、f,f為相關(guān)微博數(shù)據(jù)內(nèi)的 微博數(shù)據(jù)屬性值的個(gè)數(shù),f2 3,Vi為每一個(gè)分析因子的基礎(chǔ)分權(quán)重,ν?+ν2+···+ν?+…+Vf= 1,Ti為每一個(gè)分析因子的T分值; 對(duì)每一個(gè)博主的每一個(gè)原創(chuàng)微博進(jìn)行語義分析找出正面關(guān)鍵詞及負(fù)面關(guān)鍵詞,統(tǒng)計(jì)正 面關(guān)鍵詞數(shù)及負(fù)面關(guān)鍵詞數(shù)由正面關(guān)鍵詞數(shù)及負(fù)面關(guān)鍵詞數(shù)計(jì)算出每一個(gè)博主的心態(tài)指 數(shù)H: H=(hl+h2+…+hk+."+hn)/n,其中k=l、2、…、n,n2 1,n為每一個(gè)博主發(fā)出的原創(chuàng)微博 數(shù),hk=reverse/obverse,hk為每一個(gè)原創(chuàng)微博的正負(fù)關(guān)鍵詞比例,reverse為負(fù)面關(guān)鍵詞 數(shù),obverse為正面關(guān)鍵詞數(shù); 由事件參與度值、基礎(chǔ)總分值及心態(tài)指數(shù)計(jì)算出每一個(gè)博主的博主權(quán)重值Imp,將該博 主權(quán)重值與預(yù)設(shè)的權(quán)重閾值進(jìn)行比較來確認(rèn)重點(diǎn)博主: 其中,Imp=Total+G*H。3. 根據(jù)權(quán)利要求2所述的一種重點(diǎn)博主追蹤確認(rèn)方法,其特征在于,所述T=(標(biāo)準(zhǔn)分滿 分/2)+(標(biāo)準(zhǔn)分制*10/100)*標(biāo)準(zhǔn)分Ζ,標(biāo)準(zhǔn)分Z=(Xi-X_bar)/S,其中i=l、2、…、m,m2l,m為 博主的個(gè)數(shù),Xi為對(duì)應(yīng)每一個(gè)分析因子時(shí)每一個(gè)博主的樣本數(shù)值,X_bar為每一個(gè)分析因子 的樣本平均值,S為每一個(gè)分析因子的樣本標(biāo)準(zhǔn)差。4. 根據(jù)權(quán)利要求3所述的一種重點(diǎn)博主追蹤確認(rèn)方法,其特征在于,所述標(biāo)準(zhǔn)分滿分為 100,所述標(biāo)準(zhǔn)分制為100。5. 根據(jù)權(quán)利要求1-4任一項(xiàng)所述的一種重點(diǎn)博主追蹤確認(rèn)方法,其特征在于,將該博主 權(quán)重值與預(yù)設(shè)的權(quán)重閾值進(jìn)行比較,若博主權(quán)重值大于預(yù)設(shè)的權(quán)重閾值,則該博主權(quán)重值 對(duì)應(yīng)的博主確定為重點(diǎn)博主,若博主權(quán)重值小于預(yù)設(shè)的權(quán)重閾值,則該博主權(quán)重值對(duì)應(yīng)的 博主確定為非重點(diǎn)博主。6. 根據(jù)權(quán)利要求1所述的一種重點(diǎn)博主追蹤確認(rèn)方法,其特征在于,根據(jù)該一個(gè)以上的 微博輿情事件相對(duì)應(yīng)的事件關(guān)鍵詞在微博上下載相關(guān)微博數(shù)據(jù)為:對(duì)微博頁面進(jìn)行分析, 獲得解析模板,由解析模板采用數(shù)據(jù)模板匹配屬性值的方式根據(jù)該一個(gè)以上的微博輿情事 件相對(duì)應(yīng)的事件關(guān)鍵詞在微博上下載微博基本屬性數(shù)據(jù),由微博基本屬性數(shù)據(jù)拼接目標(biāo) url地址,獲取其他相關(guān)信息微博頁面,再對(duì)其他相關(guān)信息微博頁面進(jìn)行分析獲得解析模 板,由解析模板采用數(shù)據(jù)模板匹配屬性值的方式下載解析超過100個(gè)微博數(shù)據(jù)屬性值入庫 保存。7. 根據(jù)權(quán)利要求1所述的一種重點(diǎn)博主追蹤確認(rèn)方法,其特征在于,所述相關(guān)微博數(shù)據(jù) 內(nèi)的微博數(shù)據(jù)屬性值為三個(gè),分別為原創(chuàng)微博數(shù)、轉(zhuǎn)發(fā)微博數(shù)及評(píng)論微博數(shù)。8. -種重點(diǎn)博主追蹤確認(rèn)裝置,其特征在于,包括依次連接的: 選取一個(gè)以上的微博輿情事件,根據(jù)該一個(gè)以上的微博輿情事件相對(duì)應(yīng)的事件關(guān)鍵詞 在微博上下載相關(guān)微博數(shù)據(jù)的微博數(shù)據(jù)采集單元; 對(duì)相關(guān)微博數(shù)據(jù)內(nèi)的每一個(gè)博主進(jìn)行事件參與度統(tǒng)計(jì)計(jì)算出每一個(gè)博主事件參與度 值的事件參與度計(jì)算單元; 將相關(guān)微博數(shù)據(jù)內(nèi)的微博數(shù)據(jù)屬性值均作為一個(gè)分析因子,根據(jù)統(tǒng)計(jì)學(xué)公式計(jì)算出每 一個(gè)博主基礎(chǔ)總分值的基礎(chǔ)總分值計(jì)算單元; 對(duì)每一個(gè)博主的每一個(gè)原創(chuàng)微博進(jìn)行語義分析找出正面關(guān)鍵詞及負(fù)面關(guān)鍵詞,統(tǒng)計(jì)正 面關(guān)鍵詞數(shù)及負(fù)面關(guān)鍵詞數(shù)由正面關(guān)鍵詞數(shù)及負(fù)面關(guān)鍵詞數(shù)計(jì)算出每一個(gè)博主心態(tài)指數(shù) 的心態(tài)指數(shù)計(jì)算單元; 由事件參與度值、基礎(chǔ)總分值及心態(tài)指數(shù)計(jì)算出每一個(gè)博主的博主權(quán)重值,將該博主 權(quán)重值與預(yù)設(shè)的權(quán)重閾值進(jìn)行比較來確認(rèn)重點(diǎn)博主的重點(diǎn)博主確認(rèn)單元。9. 根據(jù)權(quán)利要求8所述的一種重點(diǎn)博主追蹤確認(rèn)裝置,其特征在于,該裝置還包括與心 態(tài)指數(shù)計(jì)算單元連接、為心態(tài)指數(shù)計(jì)算單元提供正面關(guān)鍵詞及負(fù)面關(guān)鍵詞的正負(fù)關(guān)鍵詞存 儲(chǔ)單元。
【專利摘要】<b>本發(fā)明涉及信息搜索領(lǐng)域,具體涉及一種重點(diǎn)博主追蹤確認(rèn)方法及裝置。該方法和裝置分別計(jì)算出每個(gè)博主的事件參與度值、基礎(chǔ)總分值及心態(tài)指數(shù),再有三者計(jì)算出每個(gè)博主的博主權(quán)重值,通過閾值比較來確認(rèn)重點(diǎn)博主;其依據(jù)博主的發(fā)帖頻率來分析博主從以往的行為中及預(yù)測(cè)博主在未來的微博事件中所表現(xiàn)出的影響力,微博影響力可以從微博的轉(zhuǎn)發(fā)量和評(píng)論量等方面分析得出、博主心態(tài)分析以博主發(fā)布微博內(nèi)容的語義來分析,計(jì)算出正負(fù)面關(guān)鍵詞的相對(duì)比例,從而得出博主在輿情事件中是推動(dòng)輿情發(fā)酵還是傳播正能量。重點(diǎn)博主的篩選結(jié)果對(duì)每個(gè)用戶都是可用的,在微博監(jiān)測(cè)中對(duì)重點(diǎn)博主的微博進(jìn)行監(jiān)測(cè),重點(diǎn)博主的信息就可以作為重點(diǎn)參考依據(jù)。</b>
【IPC分類】G06F17/30
【公開號(hào)】CN105447196
【申請(qǐng)?zhí)枴緾N201511015944
【發(fā)明人】陳志群, 李曉亮, 廖慶平, 易杰
【申請(qǐng)人】深圳中泓在線股份有限公司
【公開日】2016年3月30日
【申請(qǐng)日】2015年12月31日