一種網(wǎng)絡(luò)個(gè)體或群體情緒認(rèn)知能力預(yù)測(cè)與可視化方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及一種網(wǎng)絡(luò)個(gè)體或群體情緒認(rèn)知能力預(yù)測(cè)與可視化方法,屬于互聯(lián)網(wǎng)輿 情信息挖掘與分析領(lǐng)域。
【背景技術(shù)】
[0002] 隨著社交網(wǎng)絡(luò)技術(shù)和應(yīng)用的快速發(fā)展,人們?cè)絹?lái)越習(xí)慣于通過(guò)互聯(lián)網(wǎng)分享自己的 情感、態(tài)度、意見和觀點(diǎn),其中情感是主導(dǎo)后三者的決定力量,因?yàn)榍楦惺侨藗儍?nèi)在的心理 反應(yīng)及感受,例如喜、怒、哀、樂等,它會(huì)顯著地影響人們的決策行為。與此同時(shí),擁有一定意 見引導(dǎo)能力和話題響應(yīng)度的網(wǎng)絡(luò)個(gè)體更是通過(guò)網(wǎng)絡(luò)平臺(tái)對(duì)其跟隨者的觀點(diǎn)態(tài)度造成影響。 例如,在電影營(yíng)銷活動(dòng)中,知名藝人往往通過(guò)網(wǎng)絡(luò)平臺(tái)(包括微博、博客等)對(duì)其粉絲的情 感觀點(diǎn)甚至意見表達(dá)造成很大影響。同樣,微博"大V"、名人博客等作為一種典型網(wǎng)絡(luò)個(gè)體 往往擁有千萬(wàn)級(jí)數(shù)量的粉絲跟隨者,在網(wǎng)絡(luò)事件中擁有較高話語(yǔ)權(quán)且在較高程度上影響著 公眾情緒和決策行為的方向,扮演"意見領(lǐng)袖"的角色。因此,對(duì)網(wǎng)絡(luò)個(gè)體或群體情緒動(dòng)態(tài)變 化過(guò)程及其情緒分叉點(diǎn)的預(yù)測(cè)可視化工具的研制具有十分重要的意義。從商業(yè)角度而言, 可通過(guò)監(jiān)測(cè)網(wǎng)絡(luò)個(gè)體情緒動(dòng)態(tài)變化過(guò)程的規(guī)律制定有效的營(yíng)銷推廣方案,并根據(jù)產(chǎn)品銷售 后網(wǎng)絡(luò)群體情緒動(dòng)態(tài)變化的情況及時(shí)完善產(chǎn)品和進(jìn)行口碑維護(hù)。從社會(huì)治理角度而言,可 通過(guò)分析網(wǎng)絡(luò)個(gè)體或群體、尤其是典型網(wǎng)絡(luò)個(gè)體或群體的情緒動(dòng)態(tài)變化過(guò)程及其情緒突變 的分叉點(diǎn)預(yù)測(cè),幫助管理者對(duì)網(wǎng)絡(luò)用戶進(jìn)行有效管理,并對(duì)網(wǎng)絡(luò)輿論進(jìn)行合理引導(dǎo),營(yíng)造和 諧網(wǎng)絡(luò)環(huán)境。
[0003] Li Y等提出復(fù)雜理論與情緒結(jié)構(gòu)在組織環(huán)境中的動(dòng)態(tài)變化建模方法(Li Y, Ashkanasy N M, Ahlstrom D.Complexity theory and affect structure :A dynamic approach to modeling emotional changes in organizations[J]. Research on emotion in organizations,2010,6 :139-165.),該方法基于企業(yè)組織內(nèi)部情感事件案例,定性地提 出了情緒結(jié)構(gòu)分叉點(diǎn)模型,揭示了企業(yè)員工情緒動(dòng)態(tài)變化的本質(zhì)及規(guī)律,符合如圖1所示 的情緒認(rèn)知能力范圍劃分(〇,1],(1,3],(3,3.57],(3.57,4),分別對(duì)應(yīng)個(gè)體情緒的"消逝 態(tài)"、"均衡態(tài)"、"近似均衡態(tài)"、"紊亂態(tài)"。所述分叉點(diǎn)理論是1976年May基于混沌學(xué)理 論提出的描述復(fù)雜動(dòng)態(tài)系統(tǒng)性現(xiàn)象的數(shù)學(xué)建模(May, R.M. Simple mathematical models with very complicated dynamics. Nature,1976, 261 (5560) :459-467.),如圖 2所不,描述 了一般自然系統(tǒng)狀態(tài)的分叉突變性特征,即現(xiàn)實(shí)環(huán)境條件下的復(fù)雜系統(tǒng)狀態(tài)的跳變現(xiàn)象。 Weiss H M 等提出情感事件理論(Weiss H M,Cropanzano R. Affective events theory :A theoretical discussion of the structure, causes and consequences of affective experiences at work[J]. Research in organizational behavior :An annual series of analytical essays and critical reviews,1996,18:l_74·),對(duì)工作環(huán)境中員工情緒體驗(yàn) 的因果結(jié)構(gòu)進(jìn)行了系統(tǒng)性研究,該理論揭示了企業(yè)組織內(nèi)部環(huán)境中的情感事件與人們對(duì)其 認(rèn)知評(píng)價(jià)、情感反應(yīng)以及態(tài)度行為之間的關(guān)系。Li Y等和Weiss H M等對(duì)情緒結(jié)構(gòu)動(dòng)態(tài)變 化模型的分析只是定性的,并沒有足夠的實(shí)驗(yàn)和調(diào)查數(shù)據(jù)做基礎(chǔ),更沒有從網(wǎng)絡(luò)文本角度 通過(guò)自然語(yǔ)言對(duì)人們的情緒變化過(guò)程及其情緒認(rèn)知能力進(jìn)行分析,而只是從情緒認(rèn)知心理 學(xué)角度定性的結(jié)合混沌學(xué)分叉點(diǎn)理論分析了人類微觀情感狀態(tài)的動(dòng)態(tài)變化機(jī)理及外部情 感事件與情緒狀態(tài)之間的因果關(guān)系。上述研究及后來(lái)的相關(guān)研究均沒有提出如何對(duì)互聯(lián)網(wǎng) 社交媒體的網(wǎng)絡(luò)個(gè)體或群體進(jìn)行情感分析與預(yù)測(cè)可視化模型,例如本文提出的根據(jù)網(wǎng)絡(luò)文 本來(lái)計(jì)算情緒結(jié)構(gòu)分叉點(diǎn)和情緒認(rèn)知能力指數(shù)的方法。本發(fā)明不同之處將情感事件理論和 情緒結(jié)構(gòu)分叉點(diǎn)模型引入輿情分析和網(wǎng)絡(luò)數(shù)據(jù)挖掘領(lǐng)域,應(yīng)用文本情感分析技術(shù),提供了 一種對(duì)社交網(wǎng)絡(luò)媒體環(huán)境下網(wǎng)絡(luò)個(gè)體或群體的情緒認(rèn)知能力和情感發(fā)生紊亂態(tài)之前的分 叉點(diǎn)進(jìn)行預(yù)測(cè)與可視化的方法。
【發(fā)明內(nèi)容】
[0004] 本發(fā)明的目的在于提供一種有效的,直觀的對(duì)網(wǎng)絡(luò)個(gè)體情緒分叉點(diǎn)和情緒認(rèn)知能 力指數(shù)水平進(jìn)行預(yù)測(cè)與可視化的方法,幫助用戶了解和監(jiān)測(cè)網(wǎng)絡(luò)個(gè)體或群體情緒動(dòng)態(tài)變化 的突變分叉點(diǎn)進(jìn)而預(yù)測(cè)其情緒演化狀態(tài)("消逝態(tài)"、"均衡態(tài)","近似均衡態(tài)"、"紊亂態(tài)") 和發(fā)展趨勢(shì),可用于網(wǎng)絡(luò)群體性事件輿情動(dòng)態(tài)分析及預(yù)警、以及與網(wǎng)絡(luò)情感演化狀態(tài)有關(guān) 的眾多相關(guān)領(lǐng)域。
[0005] 本發(fā)明的思想是在社交網(wǎng)絡(luò)環(huán)境下通過(guò)對(duì)網(wǎng)絡(luò)個(gè)體或組織發(fā)布的網(wǎng)絡(luò)文本進(jìn)行 收集和分析,提出一種網(wǎng)絡(luò)個(gè)體情緒分叉點(diǎn)計(jì)算方法,建立了網(wǎng)絡(luò)情緒結(jié)構(gòu)分叉點(diǎn)模型,對(duì) 其情緒突變分叉點(diǎn)位置及其情感認(rèn)知能力水平進(jìn)行描述、預(yù)測(cè)和可視化。
[0006] 本發(fā)明的目的是通過(guò)以下技術(shù)方案實(shí)現(xiàn)的:
[0007] -種網(wǎng)絡(luò)個(gè)體或群體情緒認(rèn)知能力預(yù)測(cè)與可視化方法,包括一下步驟:
[0008] 步驟1)構(gòu)建情感詞本體庫(kù)
[0009] 為了計(jì)算網(wǎng)絡(luò)個(gè)體情緒分叉點(diǎn)的位置,需要構(gòu)建一個(gè)較全面的情感詞本體庫(kù),具 體步驟包括:1-1)對(duì)現(xiàn)有中文情感詞典進(jìn)行整合,以較全面地包含常用情感詞。1-2)從大 規(guī)模語(yǔ)料集的基礎(chǔ)上,訓(xùn)練出網(wǎng)民頻繁使用的網(wǎng)絡(luò)新詞,并對(duì)其中不具有明顯情感色彩的 詞語(yǔ)進(jìn)行剔除。1-3)從大規(guī)模語(yǔ)料集的基礎(chǔ)上,訓(xùn)練出網(wǎng)民使用較頻繁的表情字符。1-4) 常用情感詞、網(wǎng)絡(luò)情感新詞和表情符號(hào)詞共同構(gòu)成了網(wǎng)絡(luò)文本情感分析的情感元素集。 [0010] 基于上述情感元素集構(gòu)建情感詞本體庫(kù)E,包括情感詞本身、極性傾向、情感強(qiáng)度 值,E可表示為:
[0011] E = < (W1, P1, I1), (ff2, P2, I2), . . . ,, (Wi, Pi, Ii), , (ffn, Pn, In) >
[0012] 其中,Wi表示情感詞,Pi表示W(wǎng)i的極性(P iX)表示其是正情感詞;Pi<0表示其是 負(fù)情感詞),Ii表示W(wǎng)i的情感強(qiáng)度值,其絕對(duì)值越大表示具有越高的情感強(qiáng)度值,I < i < n, η為E中情感詞的個(gè)數(shù)。
[0013] a.極性整合方法。常用情感詞的極性Pi與情感詞典中的極性一致,如發(fā)生同一情 感詞在不同情感詞典中的標(biāo)注不一致的情形,使用多人投票方式修正;網(wǎng)絡(luò)情感新詞與表 情符號(hào)由于數(shù)量有限,其極性均采用多人投票方式確定。
[0014] b.情感強(qiáng)度確定方法。首先獲取大規(guī)模社交網(wǎng)絡(luò)文本集U,計(jì)算情感詞中每個(gè)字 在該集合中的分布,然后根據(jù)情感字的分布計(jì)算候選情感詞的情感權(quán)重,超過(guò)閾值的為情 感詞,最后計(jì)算出常用情感詞情感強(qiáng)度值,如下文所述。網(wǎng)絡(luò)情感新詞與表情符號(hào)由于數(shù)量 有限,其情感強(qiáng)度均在參考常用情感詞強(qiáng)度基礎(chǔ)上采用多人投票方式確定。
[0015] 下面以U表示社交網(wǎng)絡(luò)文本集,5^和Sil分別表示在U中的正情感詞和負(fù)情感詞 集合,統(tǒng)一用S it表不情感詞集。假設(shè)Si"集合中一個(gè)情感詞W可表不為字符串C AfCV^Ck, 其中Ci表示該情感詞中的一個(gè)字;情感詞中的字有正情感字和負(fù)情感字之分,而且每個(gè)情 感字的正負(fù)極性與所在情感詞極性一致。
[0016] 計(jì)算所述文本集中"字"的分布,以P (Ci I SO表示來(lái)自情感詞集S#中字C i在網(wǎng)絡(luò) 文本集合U中的概率,其計(jì)算公式如下:
[0017]
【主權(quán)項(xiàng)】
1. 一種網(wǎng)絡(luò)個(gè)體或群體情緒認(rèn)知能力預(yù)測(cè)與可視化方法,其特征在于:包括以下步 驟: 步驟1)構(gòu)建可整合多來(lái)源情感詞的本體庫(kù); 步驟2)確定網(wǎng)絡(luò)個(gè)體情緒分叉點(diǎn)位置,根據(jù)按時(shí)間序列采集的網(wǎng)絡(luò)個(gè)體發(fā)表的文本 信息集計(jì)算其情緒認(rèn)知能力指數(shù)序列; 步驟3)對(duì)步驟2)得到的情緒認(rèn)知能力指數(shù)序列進(jìn)行可視化; 步驟4)對(duì)多個(gè)網(wǎng)絡(luò)個(gè)體的情緒認(rèn)知能力指數(shù)水平進(jìn)行對(duì)比分析。
2. 根據(jù)權(quán)利要求1所述的一種網(wǎng)絡(luò)個(gè)體或群體情緒認(rèn)知能力預(yù)測(cè)與可視化方法,其特 征在于:所述步驟1)構(gòu)建情感詞本體庫(kù),進(jìn)一步包括以下步驟: 步驟1-1)將現(xiàn)有中文情感詞典中的常用情感詞以及從語(yǔ)料集中篩選出的網(wǎng)絡(luò)情感新 詞和表情符號(hào)合并得到情感元素集; 步驟1-2)對(duì)所述情感元素集