国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      一種微博情感傾向分析方法及裝置的制造方法

      文檔序號:10488923閱讀:227來源:國知局
      一種微博情感傾向分析方法及裝置的制造方法
      【專利摘要】本發(fā)明實施例提供了一種微博情感傾向分析方法及裝置,應(yīng)用于電子設(shè)備,本發(fā)明實施例能夠同時根據(jù)微博內(nèi)容中包括的表情的情感值以及文本的情感值來確定微博內(nèi)容的情感值,并且,在確定文本的情感值時,同時考慮了文本中各復(fù)句的句型,以及各復(fù)句中包括的各分句的句間關(guān)系,與現(xiàn)有技術(shù)相比,使用了更多的影響微博情感傾向的因素來確定微博的情感傾向,因此,能夠提高微博情感傾向分析的準(zhǔn)確性。
      【專利說明】
      一種微博情感傾向分析方法及裝置
      技術(shù)領(lǐng)域
      [0001] 本發(fā)明涉及自然語言處理技術(shù)領(lǐng)域,特別是涉及一種微博情感傾向分析方法及裝 置。
      【背景技術(shù)】
      [0002] 隨著互聯(lián)網(wǎng)的發(fā)展,人們越來越習(xí)慣于在網(wǎng)絡(luò)上表達(dá)自己的觀點。例如,可以通過 微博來表達(dá)自己的觀點。
      [0003] 微博是一種通過關(guān)注機(jī)制分享簡短實時信息的廣播式的社交網(wǎng)絡(luò)平臺。用戶開通 微博服務(wù)后,可以發(fā)表、轉(zhuǎn)發(fā)及評論消息,來標(biāo)記生活、分享新鮮事、表達(dá)觀點等。微博一問 世就憑借其開放性、平等性、易用性迅速吸引了大眾的目光。微博的數(shù)量大,更新快,其中很 多表達(dá)了用戶對某些事件的觀點和態(tài)度,分析微博內(nèi)容的情感傾向性具有重要的現(xiàn)實意 義。例如,網(wǎng)民針對某些熱點事件的看法,對于政府了解當(dāng)前的輿情信息、判斷當(dāng)前的輿論 形勢及決策是非常有價值的;而針對商品、用戶的評論,則對商家調(diào)整市場策略和買家選擇 商品都有一定的幫助。
      [0004] 現(xiàn)有技術(shù)中,主要可以基于語義規(guī)則來進(jìn)行微博情感傾向分析。所謂基于語義規(guī) 貝1J,就是通過統(tǒng)計微博文本中情感詞的情感值并適當(dāng)考慮與之搭配的程度副詞和否定副 詞,通過求平均或者其它運(yùn)算方式給出語句和文本的情感值。但是,在實際應(yīng)用中,由于對 微博內(nèi)容的情感傾向影響因素眾多,僅僅根據(jù)情感詞以及與之搭配的程度副詞和否定副詞 不能準(zhǔn)確地分析微博內(nèi)容的情感傾向。

      【發(fā)明內(nèi)容】

      [0005] 本發(fā)明實施例的目的在于提供一種微博情感傾向分析方法及裝置,以提高微博情 感傾向分析的精確性。具體技術(shù)方案如下:
      [0006] 第一方面,本發(fā)明實施例提供了一種微博情感傾向分析方法,應(yīng)用于電子設(shè)備,所 述方法包括:
      [0007] 針對待分析的微博內(nèi)容,提取所述微博內(nèi)容中包括的表情集合,并確定所述微博 內(nèi)容對應(yīng)的文本;
      [0008] 針對所述表情集合中的每個表情,根據(jù)預(yù)先構(gòu)建的表情數(shù)據(jù)庫,獲取每個表情對 應(yīng)的情感值,并根據(jù)所述每個表情對應(yīng)的情感值,計算所述表情集合的情感值;
      [0009] 根據(jù)預(yù)設(shè)的標(biāo)點符號,將所述文本劃分為至少一個復(fù)句;并根據(jù)各復(fù)句的句型,確 定所述各復(fù)句的句型系數(shù);
      [0010] 針對每個復(fù)句,提取該復(fù)句中包括的各分句,并根據(jù)各分句與其他分句的句間關(guān) 系,確定各分句的句間關(guān)系系數(shù);
      [0011] 針對每個分句,對該分句進(jìn)行分詞處理,得到該分句中包括的各分詞,并識別各分 詞中的情感詞;根據(jù)預(yù)先構(gòu)建的詞庫,確定各情感詞的情感值;
      [0012] 根據(jù)所述各情感詞的情感值、所述各分句的句間關(guān)系系數(shù)、以及各復(fù)句的句型系 數(shù),計算所述文本的情感值;
      [0013] 根據(jù)所述表情集合的情感值和所述文本的情感值,計算所述微博內(nèi)容的情感值。
      [0014] 進(jìn)一步地,所述根據(jù)所述每個表情對應(yīng)的情感值,計算所述表情集合的情感值包 括:
      [0015] 計算所有的表情對應(yīng)的情感值的平均值,并將所述平均值作為所述表情集合的情 感值。
      [0016] 進(jìn)一步地,所述針對每個分句,對該分句進(jìn)行分詞處理,得到該分句中包括的各分 詞之后,所述方法還包括:
      [0017] 對各分詞進(jìn)行詞性標(biāo)注處理;
      [0018] 所述識別各分詞中的情感詞之后,所述方法還包括:
      [0019] 識別所述情感詞之前的程度副詞和否定副詞;
      [0020] 所述根據(jù)預(yù)先構(gòu)建的詞庫,確定各情感詞的情感值包括:
      [0021] 根據(jù)預(yù)先構(gòu)建的詞庫,以及各情感詞之前的程度副詞和否定副詞,確定修正后的 各情感詞的情感值。
      [0022] 進(jìn)一步地,所述根據(jù)所述各情感詞的情感值、所述各分句的句間關(guān)系系數(shù)、以及各 復(fù)句的句型系數(shù),計算所述文本的情感值包括:
      [0023] 根據(jù)確定的各分句中各情感詞的情感值,計算各分句中包括的各情感詞的情感值 之和,作為各分句的詞語情感值;
      [0024] 根據(jù)各分句的詞語情感值,以及對應(yīng)各分句的句間關(guān)系系數(shù),計算各分句的詞語 情感值與對應(yīng)各分句的句間關(guān)系系數(shù)的乘積,作為各分句的情感值;
      [0025] 根據(jù)各分句的情感值,以及各復(fù)句的句型系數(shù),計算各復(fù)句中包括的各分句的情 感值之和與對應(yīng)各復(fù)句的句型系數(shù)的乘積,作為各復(fù)句的情感值;
      [0026] 計算所述各復(fù)句的情感值之和,作為所述文本的情感值。
      [0027] 進(jìn)一步地,所述根據(jù)所述表情集合的情感值和所述文本的情感值,計算所述微博 內(nèi)容的情感值包括:
      [0028] 將所述表情集合的情感值乘以預(yù)定的第一權(quán)值,將所述文本的情感值乘以預(yù)定的 第二權(quán)值,并將所計算的結(jié)果相加,得到所述微博內(nèi)容的情感值。
      [0029]第二方面,本發(fā)明實施例提供了一種微博情感傾向分析裝置,應(yīng)用于電子設(shè)備,所 述裝置包括:
      [0030] 提取模塊,用于針對待分析的微博內(nèi)容,提取所述微博內(nèi)容中包括的表情集合,并 確定所述微博內(nèi)容對應(yīng)的文本;
      [0031] 第一計算模塊,用于針對所述表情集合中的每個表情,根據(jù)預(yù)先構(gòu)建的表情數(shù)據(jù) 庫,獲取每個表情對應(yīng)的情感值,并根據(jù)所述每個表情對應(yīng)的情感值,計算所述表情集合的 情感值;
      [0032] 第一確定模塊,用于根據(jù)預(yù)設(shè)的標(biāo)點符號,將所述文本劃分為至少一個復(fù)句;并根 據(jù)各復(fù)句的句型,確定所述各復(fù)句的句型系數(shù);
      [0033] 第二確定模塊,用于針對每個復(fù)句,提取該復(fù)句中包括的各分句,并根據(jù)各分句與 其他分句的句間關(guān)系,確定各分句的句間關(guān)系系數(shù);
      [0034]第三確定模塊,用于針對每個分句,對該分句進(jìn)行分詞處理,得到該分句中包括的 各分詞,并識別各分詞中的情感詞;根據(jù)預(yù)先構(gòu)建的詞庫,確定各情感詞的情感值;
      [0035] 第二計算模塊,用于根據(jù)所述各情感詞的情感值、所述各分句的句間關(guān)系系數(shù)、以 及各復(fù)句的句型系數(shù),計算所述文本的情感值;
      [0036] 第三計算模塊,用于根據(jù)所述表情集合的情感值和所述文本的情感值,計算所述 微博內(nèi)容的情感值。
      [0037] 進(jìn)一步地,所述第一計算模塊具體用于:
      [0038]計算所有的表情對應(yīng)的情感值的平均值,并將所述平均值作為所述表情集合的情 感值。
      [0039] 進(jìn)一步地,所述裝置還包括:
      [0040] 處理模塊,用于對各分詞進(jìn)行詞性標(biāo)注處理;
      [0041]識別模塊,用于識別所述情感詞之前的程度副詞和否定副詞;
      [0042]所述第三確定模塊,還用于根據(jù)預(yù)先構(gòu)建的詞庫,以及各情感詞之前的程度副詞 和否定副詞,確定修正后的各情感詞的情感值。
      [0043]進(jìn)一步地,所述第二計算模塊包括:
      [0044] 第一計算子模塊,用于根據(jù)確定的各分句中各情感詞的情感值,計算各分句中包 括的各情感詞的情感值之和,作為各分句的詞語情感值;
      [0045] 第二計算子模塊,用于根據(jù)各分句的詞語情感值,以及對應(yīng)各分句的句間關(guān)系系 數(shù),計算各分句的詞語情感值與對應(yīng)各分句的句間關(guān)系系數(shù)的乘積,作為各分句的情感值;
      [0046] 第三計算子模塊,用于根據(jù)各分句的情感值,以及各復(fù)句的句型系數(shù),計算各復(fù)句 中包括的各分句的情感值之和與對應(yīng)各復(fù)句的句型系數(shù)的乘積,作為各復(fù)句的情感值;
      [0047] 第四計算子模塊,用于計算所述各復(fù)句的情感值之和,作為所述文本的情感值。 [0048]進(jìn)一步地,所述第三計算模塊具體用于:
      [0049]將所述表情集合的情感值乘以預(yù)定的第一權(quán)值,將所述文本的情感值乘以預(yù)定的 第二權(quán)值,并將所計算的結(jié)果相加,得到所述微博內(nèi)容的情感值。
      [0050]本發(fā)明實施例提供了一種微博情感傾向分析方法及裝置,所述方法包括:針對待 分析的微博內(nèi)容,提取所述微博內(nèi)容中包括的表情集合,并確定所述微博內(nèi)容對應(yīng)的文本; 針對所述表情集合中的每個表情,根據(jù)預(yù)先構(gòu)建的表情數(shù)據(jù)庫,獲取每個表情對應(yīng)的情感 值,并根據(jù)所述每個表情對應(yīng)的情感值,計算所述表情集合的情感值;根據(jù)預(yù)設(shè)的標(biāo)點符 號,將所述文本劃分為至少一個復(fù)句;并根據(jù)各復(fù)句的句型,確定所述各復(fù)句的句型系數(shù); 針對每個復(fù)句,提取該復(fù)句中包括的各分句,并根據(jù)各分句與其他分句的句間關(guān)系,確定各 分句的句間關(guān)系系數(shù);針對每個分句,對該分句進(jìn)行分詞處理,得到該分句中包括的各分 詞,并識別各分詞中的情感詞;根據(jù)預(yù)先構(gòu)建的詞庫,確定各情感詞的情感值;根據(jù)所述各 情感詞的情感值、所述各分句的句間關(guān)系系數(shù)、以及各復(fù)句的句型系數(shù),計算所述文本的情 感值;根據(jù)所述表情集合的情感值和所述文本的情感值,計算所述微博內(nèi)容的情感值。本發(fā) 明實施例能夠同時根據(jù)微博內(nèi)容中包括的表情的情感值以及文本的情感值來確定微博內(nèi) 容的情感值,并且,在確定文本的情感值時,同時考慮了文本中各復(fù)句的句型,以及各復(fù)句 中包括的各分句的句間關(guān)系,與現(xiàn)有技術(shù)相比,使用了更多的影響微博情感傾向的因素來 確定微博的情感傾向,因此,能夠提高微博情感傾向分析的準(zhǔn)確性。
      【附圖說明】
      [0051] 為了更清楚地說明本發(fā)明實施例或現(xiàn)有技術(shù)中的技術(shù)方案,下面將對實施例或現(xiàn) 有技術(shù)描述中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本 發(fā)明的一些實施例,對于本領(lǐng)域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動的前提下,還可以 根據(jù)這些附圖獲得其他的附圖。
      [0052] 圖1為本發(fā)明實施例提供的一種微博情感傾向分析方法的流程圖;
      [0053] 圖2為常用的圖片形式的微博表情示意圖;
      [0054] 圖3為本發(fā)明實施例提供的一種微博情感傾向分析裝置的結(jié)構(gòu)示意圖。
      【具體實施方式】
      [0055] 為了提高微博情感傾向分析的精確性,本發(fā)明實施例提供了一種微博情感傾向分 析方法及裝置。
      [0056] 下面將結(jié)合本發(fā)明實施例中的附圖,對本發(fā)明實施例中的技術(shù)方案進(jìn)行清楚、完 整地描述,顯然,所描述的實施例僅僅是本發(fā)明一部分實施例,而不是全部的實施例?;?本發(fā)明中的實施例,本領(lǐng)域普通技術(shù)人員在沒有做出創(chuàng)造性勞動前提下所獲得的所有其他 實施例,都屬于本發(fā)明保護(hù)的范圍。
      [0057] 需要說明的是,在不沖突的情況下,本發(fā)明中的實施例及實施例中的特征可以相 互組合。下面將參考附圖并結(jié)合實施例來詳細(xì)說明本發(fā)明。
      [0058] 為了提高微博情感傾向分析的精確性,本發(fā)明實施例提供了一種微博情感傾向分 析方法過程,如圖1所示,該過程包括以下步驟:
      [0059] SlOl,針對待分析的微博內(nèi)容,提取所述微博內(nèi)容中包括的表情集合,并確定所述 微博內(nèi)容對應(yīng)的文本。
      [0060] 本發(fā)明實施例提供的方法可以應(yīng)用于電子設(shè)備。具體地,該電子設(shè)備例如可以是: 筆記本電腦、智能終端、臺式計算機(jī)、便攜式計算機(jī)等等。
      [0061] 在本發(fā)明實施例中,電子設(shè)備可以首先獲取待分析的微博內(nèi)容。例如,電子設(shè)備可 以在網(wǎng)絡(luò)上通過爬蟲爬取得到待分析的整條微博內(nèi)容,如,可以通過爬蟲爬取得到新浪微 博中的任一條微博內(nèi)容,并將該微博內(nèi)容作為待分析的微博內(nèi)容;或者,為了提高微博情感 傾向分析的效率,電子設(shè)備也可以預(yù)先在網(wǎng)絡(luò)上通過爬蟲爬取得到至少一條微博內(nèi)容,并 將獲取到的微博內(nèi)容保存在數(shù)據(jù)庫中,在進(jìn)行微博情感傾向分析時,直接從數(shù)據(jù)庫中獲取 待分析的微博內(nèi)容。通過爬蟲爬取得到微博內(nèi)容的過程可以采用現(xiàn)有技術(shù),本發(fā)明實施例 對此過程不進(jìn)行贅述。
      [0062] 可以理解,有些情況下,用戶在發(fā)表微博內(nèi)容時,微博內(nèi)容中除了可以包括文本之 外,還可以包括一些表情,該表情可以是字符形式,也可以是圖片形式。并且,通常情況下, 微博內(nèi)容中的表情能夠很好地表達(dá)用戶的情感,標(biāo)識微博內(nèi)容的情感傾向。
      [0063] 如圖2所示,其示出了常用的圖片形式的微博表情示意圖,其中,表情210為"微 笑",表情220為"酷"。
      [0064] 因此,在本發(fā)明實施例中,為了提高微博情感傾向分析的準(zhǔn)確性,電子設(shè)備可以同 時根據(jù)微博內(nèi)容的表情和文本來分析微博內(nèi)容的情感傾向。
      [0065] 具體地,電子設(shè)備在獲取到待分析的微博內(nèi)容后,可以首先針對待分析的微博內(nèi) 容,提取該微博內(nèi)容中包括的表情,獲取包含各表情的表情集合,并確定該微博內(nèi)容對應(yīng)的 文本。例如,電子設(shè)備可以首先提取微博內(nèi)容中包括的每個表情,將包含所提取的包含每個 表情的集合作為表情集合,并將除表情集合之外的內(nèi)容確定為該微博內(nèi)容對應(yīng)的文本。
      [0066] 例如,當(dāng)電子設(shè)備直接在網(wǎng)絡(luò)上通過爬蟲爬取得到待分析的整條微博內(nèi)容時,該 微博內(nèi)容中包括的表情可以是圖片格式。這種情況下,電子設(shè)備可以識別待分析的微博內(nèi) 容中包括的圖片,并將識別到的圖片確定為該待分析的微博內(nèi)容中包括的表情集合。當(dāng)電 子設(shè)備從數(shù)據(jù)庫中獲取待分析的微博內(nèi)容時,數(shù)據(jù)庫中保存的微博內(nèi)容中的表情通常會以 表情文字的形式顯示,并且,該表情文字可以以預(yù)定的格式顯示。如圖2中表情210在數(shù)據(jù)庫 中可以顯示為【微笑】、表情220在數(shù)據(jù)庫中可以顯示為【酷】。這種情況下,電子設(shè)備可以提 取符號"【】"內(nèi)包括的表情文字,并將提取的表情文字確定為待分析微博內(nèi)容中包括的表情 集合。
      [0067] S102,針對所述表情集合中的每個表情,根據(jù)預(yù)先構(gòu)建的表情數(shù)據(jù)庫,獲取每個表 情對應(yīng)的情感值,并根據(jù)所述每個表情對應(yīng)的情感值,計算所述表情集合的情感值。
      [0068] 提取得到待分析微博內(nèi)容中包括的表情集合后,電子設(shè)備可以針對所提取的表情 集合中的每個表情,根據(jù)預(yù)先構(gòu)建的表情數(shù)據(jù)庫,獲取每個表情對應(yīng)的情感值,并根據(jù)每個 表情對應(yīng)的情感值,計算表情集合的情感值。
      [0069] 例如,在本發(fā)明實施例中,當(dāng)電子設(shè)備獲取到的是以圖片格式顯示的表情時,在獲 得各表情對應(yīng)的情感值之前,可以首先將各表情轉(zhuǎn)換為其對應(yīng)的表情文字,進(jìn)而可以根據(jù) 表情數(shù)據(jù)庫,查找各表情文字對應(yīng)的情感值。
      [0070] 在本發(fā)明實施例中,可以預(yù)先構(gòu)建表情數(shù)據(jù)庫,在該表情數(shù)據(jù)庫中包括有每個表 情文字及其對應(yīng)的情感值。
      [0071] 例如,本發(fā)明實施例中構(gòu)建的表情數(shù)據(jù)庫可以如下表所示:
      [0074]如上述表格所示,表情文字"微笑"對應(yīng)的情感值可以為1.0 ;,表情文字"怒罵"對 應(yīng)的情感值可以為-〇 . 9;表情文字"傷心"對應(yīng)的情感值可以為-1。其中,表情文字的情感值 的正負(fù)用來標(biāo)識該表情文字的情感傾向,當(dāng)情感值為正值時,表明該表情文字的情感傾向 為正向;當(dāng)情感值為負(fù)值時,表明該表情文字的情感傾向為負(fù)向;當(dāng)情感值為〇時,表明該表 情文字的情感傾向為中性。各情感值的數(shù)值越大,表明該表情文字的情感傾向越強(qiáng)烈。在本 發(fā)明實施例中,可以將各表情對應(yīng)的情感值設(shè)置在-1到1之間。
      [0075]電子設(shè)備在計算待分析微博內(nèi)容中包括的表情集合的情感值時,可以在表情數(shù)據(jù) 庫中查找表情集合中包括的每個表情對應(yīng)的情感值。
      [0076]需要說明的是,在本發(fā)明實施例中,當(dāng)電子設(shè)備獲取到的是以圖片格式顯示的表 情時,在獲得各表情對應(yīng)的情感值之前,可以首先將各表情轉(zhuǎn)換為其對應(yīng)的表情文字,進(jìn)而 可以根據(jù)如上述所示的表情數(shù)據(jù)庫,查找各表情文字對應(yīng)的情感值。
      [0077] 獲取到表情集合中包括的每個表情對應(yīng)的情感值后,電子設(shè)備可以進(jìn)一步地根據(jù) 每個表情對應(yīng)的情感值,計算表情集合的情感值。
      [0078] 例如,在一種實現(xiàn)方式中,電子設(shè)備可以計算所有的表情對應(yīng)的情感值的平均值, 并將計算得到的平均值作為表情集合的情感值。
      [0079] S103,根據(jù)預(yù)設(shè)的標(biāo)點符號,將所述文本劃分為至少一個復(fù)句;并根據(jù)各復(fù)句的句 型,確定所述各復(fù)句的句型系數(shù)。
      [0080] 在本發(fā)明實施例中,電子設(shè)備還可以根據(jù)文本的情感值來確定微博內(nèi)容的情感 值。
      [0081] 具體地,電子設(shè)備可以首先根據(jù)預(yù)設(shè)的標(biāo)點符號,如句號、問號、感嘆號等,將文本 劃分為至少一個復(fù)句。并且,可以根據(jù)各復(fù)句的句型,確定各復(fù)句的句型系數(shù)。將文本劃分 為至少一個復(fù)句的過程可以采用現(xiàn)有技術(shù),本發(fā)明實施例對此過程不進(jìn)行贅述。
      [0082] 得到各復(fù)句后,電子設(shè)備可以根據(jù)各復(fù)句的句型,確定各復(fù)句的句型系數(shù)。本發(fā)明 實施例中的復(fù)句句型可以包括陳述句、感嘆句、疑問句以及反問句等。具體地,電子設(shè)備可 以根據(jù)各復(fù)句中包括的標(biāo)點符號,以及預(yù)定的關(guān)鍵字等,確定各復(fù)句的句型。
      [0083] 例如,當(dāng)復(fù)句中包括的標(biāo)點符號為句號時,電子設(shè)備可以確定該復(fù)句的句型為陳 述句;當(dāng)復(fù)句中包括的標(biāo)點符號為感嘆號時,電子設(shè)備可以確定該復(fù)句的句型為感嘆句;當(dāng) 復(fù)句中包括的標(biāo)點符號為問號,且不包含如"不"、"不是"等反問詞時,電子設(shè)備可以確定該 復(fù)句的句型為疑問句;當(dāng)復(fù)句中包括的標(biāo)點符號為問號,且包含如"不"、"不是"等反問詞 時,電子設(shè)備可以確定該復(fù)句的句型為反問句。
      [0084] 并且,在本發(fā)明實施例中,當(dāng)復(fù)句為陳述句時,其句型系數(shù)可以為1;當(dāng)復(fù)句為感嘆 句時,其句型系數(shù)可以為2;當(dāng)復(fù)句為疑問句時,其句型系數(shù)可以為0;當(dāng)復(fù)句為反問句時,其 句型系數(shù)可以為-1.5。
      [0085] S104,針對每個復(fù)句,提取該復(fù)句中包括的各分句,并根據(jù)各分句與其他分句的句 間關(guān)系,確定各分句的句間關(guān)系系數(shù)。
      [0086] 電子設(shè)備確定各復(fù)句的句型及對應(yīng)的句型系數(shù)后,針對每個復(fù)句,還可以提取該 復(fù)句中包括的各分句,并可以根據(jù)各分句與其他分句的句間關(guān)系,確定各分句的句間關(guān)系 系數(shù)。電子設(shè)備提取各復(fù)句中包括的各分句的過程,可以采用現(xiàn)有技術(shù),如,電子設(shè)備可以 根據(jù)各復(fù)句中包括的逗號,提取各復(fù)句中包括的各分句,本發(fā)明實施例對此過程不進(jìn)行贅 述。
      [0087] 得到各復(fù)句中包括的各分句后,電子設(shè)備還可以針對每個復(fù)句,根據(jù)該復(fù)句中包 括的各分句與其他分句的句間關(guān)系,確定各分句的句間關(guān)系系數(shù)。
      [0088]可以理解,在一個復(fù)句中包括的各分句之間,可以存在一些連接關(guān)系,如轉(zhuǎn)折、遞 進(jìn)、假設(shè)等。而存在不同連接關(guān)系的各分句,其表達(dá)的情感傾向也可能不同。
      [0089]因此,在本發(fā)明實施例中,電子設(shè)備可以針對每個復(fù)句,根據(jù)該復(fù)句中包括的各分 句與其他分句的句間關(guān)系,確定各分句的句間關(guān)系系數(shù)。
      [0090] 具體地,電子設(shè)備可以針對每個復(fù)句,識別該復(fù)句中包含的各分句中是否包含預(yù) 定的關(guān)鍵詞,來確定各分句與其他分句的句間關(guān)系。
      [0091] 例如,當(dāng)分句中包含如"但是"、"但"、"卻"、"可是"等表示轉(zhuǎn)折的關(guān)系詞時,可以確 定該分句與其前面的分句的句間關(guān)系為轉(zhuǎn)折關(guān)系。
      [0092] 可以理解,在存在轉(zhuǎn)折關(guān)系的分句中,通常前面分句提出某種事實或情況,后面分 句轉(zhuǎn)而述說與前面分句相反或相對的意思,即后面分句才是說話人所要表達(dá)的真正意圖。 因此,在本發(fā)明實施例中,當(dāng)幾個分句間的句間關(guān)系為轉(zhuǎn)折時,各分句的句間關(guān)系系數(shù)可以 為:轉(zhuǎn)折詞前面的分句為〇,轉(zhuǎn)折詞后面的分句為1。
      [0093] 當(dāng)分句中包含如"更加"、"更有甚者"等表示遞進(jìn)的關(guān)系詞時,可以確定該分句與 其前面的分句的句間關(guān)系為遞進(jìn)關(guān)系。當(dāng)幾個分句間的句間關(guān)系為遞進(jìn)時,各分句的句間 關(guān)系系數(shù)可以為:遞進(jìn)詞前面的分句為1,遞進(jìn)詞后面的分句為1.5。
      [0094] S105,針對每個分句,對該分句進(jìn)行分詞處理,得到該分句中包括的各分詞,并識 別各分詞中的情感詞;根據(jù)預(yù)先構(gòu)建的詞庫,確定各情感詞的情感值。
      [0095] 得到各分句的句間關(guān)系系數(shù)后,進(jìn)一步地,電子設(shè)備還可以針對每個分句,對該分 句進(jìn)行分詞處理,得到該分句中包括的各分詞,并識別各分詞中的情感詞,然后可以根據(jù)預(yù) 先構(gòu)建的詞庫,確定各情感詞的情感值。
      [0096] 在本發(fā)明實施例中,電子設(shè)備針對每個分句,對該分句進(jìn)行分詞,得到該分句中包 括的各分詞,并識別各分詞中的情感詞,然后可以根據(jù)預(yù)先構(gòu)建的詞庫,確定各情感詞的情 感值的過程可以采用現(xiàn)有技術(shù),本發(fā)明實施例對此過程不進(jìn)行贅述。
      [0097] 可選地,在本發(fā)明實施例中,為了提高各情感詞的情感值確定的準(zhǔn)確性,電子設(shè)備 針對每個分句,對該分句進(jìn)行分詞處理,得到該分句中包括的各分詞之后,還可以對各分詞 進(jìn)行詞性標(biāo)注處理;進(jìn)一步地,電子設(shè)備還可以在識別各分詞中包括的情感詞之后,還可以 識別各情感詞之前的程度副詞和否定副詞;進(jìn)一步地,電子設(shè)備在確定各情感詞的情感值 時,可以根據(jù)預(yù)先構(gòu)建的詞庫,以及各情感詞之前的程度副詞和否定副詞,確定修正后的各 情感詞的情感值。
      [0098] 在本發(fā)明實施例中,電子設(shè)備對各分句進(jìn)行詞性標(biāo)注處理,識別各情感詞之前的 程度副詞和否定副詞,根據(jù)預(yù)先構(gòu)建的詞庫,以及各情感詞之前的程度副詞和否定副詞,確 定修正后的各情感詞的情感值的過程可以采用現(xiàn)有技術(shù),本發(fā)明實施例對此過程不進(jìn)行贅 述。
      [0099] S106,根據(jù)所述各情感詞的情感值、所述各分句的句間關(guān)系系數(shù)、以及各復(fù)句的句 型系數(shù),計算所述文本的情感值。
      [0100] 在本發(fā)明實施例中,電子設(shè)備可以根據(jù)各情感詞的情感值、各分句的句間關(guān)系系 數(shù)、以及各復(fù)句的句型系數(shù),計算文本的情感值。
      [0101] 具體地,電子設(shè)備可以首先根據(jù)確定的各分句中各情感詞的情感值,計算各分句 中包括的各情感詞的情感值之和,作為各分句的詞語情感值;然后,可以根據(jù)各分句的詞語 情感值,以及對應(yīng)各分句的句間關(guān)系系數(shù),計算各分句的詞語情感值與對應(yīng)各分句的句間 關(guān)系系數(shù)的乘積,作為各分句的情感值;之后,可以根據(jù)各分句的情感值,以及各復(fù)句的句 型系數(shù),計算各復(fù)句中包括的各分句的情感值之和與對應(yīng)各復(fù)句的句型系數(shù)的乘積,作為 各復(fù)句的情感值;最后,可以計算各復(fù)句的情感值之和,作為文本的情感值。
      [0102] 例如,電子設(shè)備可以首先根據(jù)以下公式,計算分句i的情感值E(S1):
      [0103] E(Si)=SE(Wi)Xri
      [0104] 其中,E(Wi)為該分句i中包括的各情感詞的情感值;SE(Wi)為該分句i的詞語情感 值;ri為分句i的句間關(guān)系系數(shù)。
      [0105] 進(jìn)一步地,電子設(shè)備可以根據(jù)以下公式,計算復(fù)句j的情感值E(Sj):
      [0106]
      [0107] 其中,E(Sj)為復(fù)句j中包括的各分句的情感值;L為復(fù)句j的句型系數(shù)。
      [0108] S107,根據(jù)所述表情集合的情感值和所述文本的情感值,計算所述微博內(nèi)容的情 感值。
      [0109] 得到待分析微博內(nèi)容中包括的表情集合的情感值和文本的情感值后,電子設(shè)備可 以根據(jù)表情集合的情感值和文本的情感值,計算待分析微博內(nèi)容的情感值。
      [0110] 具體地,電子設(shè)備可以將表情集合的情感值乘以預(yù)定的第一權(quán)值,將文本的情感 值乘以預(yù)定的第二權(quán)值,并將所計算的結(jié)果相加,得到微博內(nèi)容的情感值。
      [0111] 例如,上述第一權(quán)值可以是0.4,第二權(quán)值可以是0.6;或者,第一權(quán)值可以是0.35, 第二權(quán)值可以是0.65等。
      [0112] 本發(fā)明實施例提供的微博情感傾向分析方法,能夠同時根據(jù)微博內(nèi)容中包括的表 情的情感值以及文本的情感值來確定微博內(nèi)容的情感值,并且,在確定文本的情感值時,同 時考慮了文本中各復(fù)句的句型,以及各復(fù)句中包括的各分句的句間關(guān)系,與現(xiàn)有技術(shù)相比, 使用了更多的影響微博情感傾向的因素來確定微博的情感傾向,因此,能夠提高微博情感 傾向分析的準(zhǔn)確性。
      [0113] 相應(yīng)于上面的方法實施例,本發(fā)明實施例還提供了相應(yīng)的裝置實施例。
      [0114] 圖3為本發(fā)明實施例提供的一種微博情感傾向分析裝置,應(yīng)用于電子設(shè)備,所述裝 置包括:
      [0115]提取模塊310,用于針對待分析的微博內(nèi)容,提取所述微博內(nèi)容中包括的表情集 合,并確定所述微博內(nèi)容對應(yīng)的文本;
      [0116] 第一計算模塊320,用于針對所述表情集合中的每個表情,根據(jù)預(yù)先構(gòu)建的表情數(shù) 據(jù)庫,獲取每個表情對應(yīng)的情感值,并根據(jù)所述每個表情對應(yīng)的情感值,計算所述表情集合 的情感值;
      [0117] 第一確定模塊330,用于根據(jù)預(yù)設(shè)的標(biāo)點符號,將所述文本劃分為至少一個復(fù)句; 并根據(jù)各復(fù)句的句型,確定所述各復(fù)句的句型系數(shù);
      [0118] 第二確定模塊340,用于針對每個復(fù)句,提取該復(fù)句中包括的各分句,并根據(jù)各分 句與其他分句的句間關(guān)系,確定各分句的句間關(guān)系系數(shù);
      [0119] 第三確定模塊350,用于針對每個分句,對該分句進(jìn)行分詞處理,得到該分句中包 括的各分詞,并識別各分詞中的情感詞;根據(jù)預(yù)先構(gòu)建的詞庫,確定各情感詞的情感值;
      [0120] 第二計算模塊360,用于根據(jù)所述各情感詞的情感值、所述各分句的句間關(guān)系系 數(shù)、以及各復(fù)句的句型系數(shù),計算所述文本的情感值;
      [0121 ]第三計算模塊370,用于根據(jù)所述表情集合的情感值和所述文本的情感值,計算所 述微博內(nèi)容的情感值。
      [0122] 本發(fā)明實施例提供的微博情感傾向分析裝置,能夠同時根據(jù)微博內(nèi)容中包括的表 情的情感值以及文本的情感值來確定微博內(nèi)容的情感值,并且,在確定文本的情感值時,同 時考慮了文本中各復(fù)句的句型,以及各復(fù)句中包括的各分句的句間關(guān)系,與現(xiàn)有技術(shù)相比, 使用了更多的影響微博情感傾向的因素來確定微博的情感傾向,因此,能夠提高微博情感 傾向分析的準(zhǔn)確性。
      [0123] 進(jìn)一步地,所述第一計算模塊320具體用于:
      [0124] 計算所有的表情對應(yīng)的情感值的平均值,并將所述平均值作為所述表情集合的情 感值。
      [0125] 進(jìn)一步地,所述裝置還包括:
      [0126] 處理模塊(圖中未示出),用于對各分詞進(jìn)行詞性標(biāo)注處理;
      [0127] 識別模塊(圖中未示出),用于識別所述情感詞之前的程度副詞和否定副詞;
      [0128] 所述第三確定模塊350,還用于根據(jù)預(yù)先構(gòu)建的詞庫,以及各情感詞之前的程度副 詞和否定副詞,確定修正后的各情感詞的情感值。
      [0129] 進(jìn)一步地,所述第二計算模塊360包括:
      [0130] 第一計算子模塊(圖中未示出),用于根據(jù)確定的各分句中各情感詞的情感值,計 算各分句中包括的各情感詞的情感值之和,作為各分句的詞語情感值;
      [0131] 第二計算子模塊(圖中未示出),用于根據(jù)各分句的詞語情感值,以及對應(yīng)各分句 的句間關(guān)系系數(shù),計算各分句的詞語情感值與對應(yīng)各分句的句間關(guān)系系數(shù)的乘積,作為各 分句的情感值;
      [0132] 第三計算子模塊(圖中未示出),用于根據(jù)各分句的情感值,以及各復(fù)句的句型系 數(shù),計算各復(fù)句中包括的各分句的情感值之和與對應(yīng)各復(fù)句的句型系數(shù)的乘積,作為各復(fù) 句的情感值;
      [0133] 第四計算子模塊(圖中未示出),用于計算所述各復(fù)句的情感值之和,作為所述文 本的情感值。
      [0134] 進(jìn)一步地,所述第三計算模塊370具體用于:
      [0135] 將所述表情集合的情感值乘以預(yù)定的第一權(quán)值,將所述文本的情感值乘以預(yù)定的 第二權(quán)值,并將所計算的結(jié)果相加,得到所述微博內(nèi)容的情感值。
      [0136] 需要說明的是,在本文中,諸如第一和第二等之類的關(guān)系術(shù)語僅僅用來將一個實 體或者操作與另一個實體或操作區(qū)分開來,而不一定要求或者暗示這些實體或操作之間存 在任何這種實際的關(guān)系或者順序。而且,術(shù)語"包括"、"包含"或者其任何其他變體意在涵蓋 非排他性的包含,從而使得包括一系列要素的過程、方法、物品或者設(shè)備不僅包括那些要 素,而且還包括沒有明確列出的其他要素,或者是還包括為這種過程、方法、物品或者設(shè)備 所固有的要素。在沒有更多限制的情況下,由語句"包括一個……"限定的要素,并不排除在 包括所述要素的過程、方法、物品或者設(shè)備中還存在另外的相同要素。
      [0137] 本說明書中的各個實施例均采用相關(guān)的方式描述,各個實施例之間相同相似的部 分互相參見即可,每個實施例重點說明的都是與其他實施例的不同之處。尤其,對于系統(tǒng)實 施例而言,由于其基本相似于方法實施例,所以描述的比較簡單,相關(guān)之處參見方法實施例 的部分說明即可。
      【主權(quán)項】
      1. 一種微博情感傾向分析方法,應(yīng)用于電子設(shè)備,其特征在于,所述方法包括: 針對待分析的微博內(nèi)容,提取所述微博內(nèi)容中包括的表情集合,并確定所述微博內(nèi)容 對應(yīng)的文本; 針對所述表情集合中的每個表情,根據(jù)預(yù)先構(gòu)建的表情數(shù)據(jù)庫,獲取每個表情對應(yīng)的 情感值,并根據(jù)所述每個表情對應(yīng)的情感值,計算所述表情集合的情感值; 根據(jù)預(yù)設(shè)的標(biāo)點符號,將所述文本劃分為至少一個復(fù)句;并根據(jù)各復(fù)句的句型,確定所 述各復(fù)句的句型系數(shù); 針對每個復(fù)句,提取該復(fù)句中包括的各分句,并根據(jù)各分句與其他分句的句間關(guān)系,確 定各分句的句間關(guān)系系數(shù); 針對每個分句,對該分句進(jìn)行分詞處理,得到該分句中包括的各分詞,并識別各分詞中 的情感詞;根據(jù)預(yù)先構(gòu)建的詞庫,確定各情感詞的情感值; 根據(jù)所述各情感詞的情感值、所述各分句的句間關(guān)系系數(shù)、以及各復(fù)句的句型系數(shù),計 算所述文本的情感值; 根據(jù)所述表情集合的情感值和所述文本的情感值,計算所述微博內(nèi)容的情感值。2. 根據(jù)權(quán)利要求1所述的方法,其特征在于,所述根據(jù)所述每個表情對應(yīng)的情感值,計 算所述表情集合的情感值包括: 計算所有的表情對應(yīng)的情感值的平均值,并將所述平均值作為所述表情集合的情感 值。3. 根據(jù)權(quán)利要求1所述的方法,其特征在于,所述針對每個分句,對該分句進(jìn)行分詞處 理,得到該分句中包括的各分詞之后,所述方法還包括: 對各分詞進(jìn)行詞性標(biāo)注處理; 所述識別各分詞中的情感詞之后,所述方法還包括: 識別所述情感詞之前的程度副詞和否定副詞; 所述根據(jù)預(yù)先構(gòu)建的詞庫,確定各情感詞的情感值包括: 根據(jù)預(yù)先構(gòu)建的詞庫,以及各情感詞之前的程度副詞和否定副詞,確定修正后的各情 感詞的情感值。4. 根據(jù)權(quán)利要求3所述的方法,其特征在于,所述根據(jù)所述各情感詞的情感值、所述各 分句的句間關(guān)系系數(shù)、以及各復(fù)句的句型系數(shù),計算所述文本的情感值包括: 根據(jù)確定的各分句中各情感詞的情感值,計算各分句中包括的各情感詞的情感值之 和,作為各分句的詞語情感值; 根據(jù)各分句的詞語情感值,以及對應(yīng)各分句的句間關(guān)系系數(shù),計算各分句的詞語情感 值與對應(yīng)各分句的句間關(guān)系系數(shù)的乘積,作為各分句的情感值; 根據(jù)各分句的情感值,以及各復(fù)句的句型系數(shù),計算各復(fù)句中包括的各分句的情感值 之和與對應(yīng)各復(fù)句的句型系數(shù)的乘積,作為各復(fù)句的情感值; 計算所述各復(fù)句的情感值之和,作為所述文本的情感值。5. 根據(jù)權(quán)利要求1-4任一項所述的方法,其特征在于,所述根據(jù)所述表情集合的情感值 和所述文本的情感值,計算所述微博內(nèi)容的情感值包括: 將所述表情集合的情感值乘以預(yù)定的第一權(quán)值,將所述文本的情感值乘以預(yù)定的第二 權(quán)值,并將所計算的結(jié)果相加,得到所述微博內(nèi)容的情感值。6. -種微博情感傾向分析裝置,應(yīng)用于電子設(shè)備,其特征在于,所述裝置包括: 提取模塊,用于針對待分析的微博內(nèi)容,提取所述微博內(nèi)容中包括的表情集合,并確定 所述微博內(nèi)容對應(yīng)的文本; 第一計算模塊,用于針對所述表情集合中的每個表情,根據(jù)預(yù)先構(gòu)建的表情數(shù)據(jù)庫,獲 取每個表情對應(yīng)的情感值,并根據(jù)所述每個表情對應(yīng)的情感值,計算所述表情集合的情感 值; 第一確定模塊,用于根據(jù)預(yù)設(shè)的標(biāo)點符號,將所述文本劃分為至少一個復(fù)句;并根據(jù)各 復(fù)句的句型,確定所述各復(fù)句的句型系數(shù); 第二確定模塊,用于針對每個復(fù)句,提取該復(fù)句中包括的各分句,并根據(jù)各分句與其他 分句的句間關(guān)系,確定各分句的句間關(guān)系系數(shù); 第三確定模塊,用于針對每個分句,對該分句進(jìn)行分詞處理,得到該分句中包括的各分 詞,并識別各分詞中的情感詞;根據(jù)預(yù)先構(gòu)建的詞庫,確定各情感詞的情感值; 第二計算模塊,用于根據(jù)所述各情感詞的情感值、所述各分句的句間關(guān)系系數(shù)、以及各 復(fù)句的句型系數(shù),計算所述文本的情感值; 第三計算模塊,用于根據(jù)所述表情集合的情感值和所述文本的情感值,計算所述微博 內(nèi)容的情感值。7. 根據(jù)權(quán)利要求6所述的裝置,其特征在于,所述第一計算模塊具體用于: 計算所有的表情對應(yīng)的情感值的平均值,并將所述平均值作為所述表情集合的情感 值。8. 根據(jù)權(quán)利要求6所述的裝置,其特征在于,所述裝置還包括: 處理模塊,用于對各分詞進(jìn)行詞性標(biāo)注處理; 識別模塊,用于識別所述情感詞之前的程度副詞和否定副詞; 所述第三確定模塊,還用于根據(jù)預(yù)先構(gòu)建的詞庫,以及各情感詞之前的程度副詞和否 定副詞,確定修正后的各情感詞的情感值。9. 根據(jù)權(quán)利要求8所述的裝置,其特征在于,所述第二計算模塊包括: 第一計算子模塊,用于根據(jù)確定的各分句中各情感詞的情感值,計算各分句中包括的 各情感詞的情感值之和,作為各分句的詞語情感值; 第二計算子模塊,用于根據(jù)各分句的詞語情感值,以及對應(yīng)各分句的句間關(guān)系系數(shù),計 算各分句的詞語情感值與對應(yīng)各分句的句間關(guān)系系數(shù)的乘積,作為各分句的情感值; 第三計算子模塊,用于根據(jù)各分句的情感值,以及各復(fù)句的句型系數(shù),計算各復(fù)句中包 括的各分句的情感值之和與對應(yīng)各復(fù)句的句型系數(shù)的乘積,作為各復(fù)句的情感值; 第四計算子模塊,用于計算所述各復(fù)句的情感值之和,作為所述文本的情感值。10. 根據(jù)權(quán)利要求6-9任一項所述的裝置,其特征在于,所述第三計算模塊具體用于: 將所述表情集合的情感值乘以預(yù)定的第一權(quán)值,將所述文本的情感值乘以預(yù)定的第二 權(quán)值,并將所計算的結(jié)果相加,得到所述微博內(nèi)容的情感值。
      【文檔編號】G06F17/27GK105843796SQ201610181735
      【公開日】2016年8月10日
      【申請日】2016年3月28日
      【發(fā)明人】姚海鵬, 方超, 趙天奇, 張俊東, 張培穎
      【申請人】北京郵電大學(xué)
      網(wǎng)友詢問留言 已有0條留言
      • 還沒有人留言評論。精彩留言會獲得點贊!
      1