国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      通過計(jì)算機(jī)智能分析漢語文字情感傾向的方法

      文檔序號:6614906閱讀:530來源:國知局
      專利名稱:通過計(jì)算機(jī)智能分析漢語文字情感傾向的方法
      通過計(jì)算機(jī)智能分析漢語文字情感傾向的方法技術(shù)領(lǐng)域
      本發(fā)明屬于計(jì)算機(jī)智能分析技術(shù)領(lǐng)域,具體涉及一種通過計(jì)算機(jī)智能分析漢語文字情感傾向的方法。
      背景技術(shù)
      上世紀(jì)60年代,文本的情感傾向分析這一領(lǐng)域剛剛開始,隨著電子商務(wù)的發(fā)展,上世紀(jì)90年代以來,語義傾向性研究在國外才得到普遍關(guān)注,并迅速發(fā)展起來。 Hatzivassiloglou. V, McKeown K. R.在1997年首先開始了詞匯的語義傾向性研究。他們主要是針對形容詞作傾向性分析,利用詞匯之間的連詞(and,or, but等)訓(xùn)練生成詞匯間的同意或翻譯傾向的連接圖,然后用聚類的方法將詞匯聚成褒義和貶義兩類。
      漢語意見挖掘方法和技術(shù)的研究起步較晚。在漢語文本語義傾向自動識別方面, 徐琳宏、林鴻飛等提出了基于語義理解的文本傾向性識別機(jī)制,計(jì)算詞匯與知網(wǎng)中已標(biāo)注褒貶性的詞匯之間的相似度,獲取詞匯的傾向性,加強(qiáng)對文本褒貶義強(qiáng)度的識別;在漢語句子語義極性分析和觀點(diǎn)抽取研究方面,婁德成、姚天昉等利用自然語言處理技術(shù),對漢語語句進(jìn)行了語義極性分析和觀點(diǎn)抽取,提出了計(jì)算詞語的上下文極性的算法,并且分析了主題和極性修飾成分的匹配關(guān)系,研究并開發(fā)了用于漢語汽車論壇的意見挖掘系統(tǒng)(姚天昉、 聶青陽等);王素格研究了基于Web的評論文本情感分類問題,進(jìn)行了多層次語言粒度分析。 目前,中文詞匯傾向性研究和商品評論挖掘才剛剛起步,由于中文和英文的差異,傳統(tǒng)的基于統(tǒng)計(jì)的方法很難準(zhǔn)確地表達(dá)句子的觀點(diǎn),因此,借助自然語言處理技術(shù),對句子的成分和結(jié)構(gòu)進(jìn)行語法分析,不僅增強(qiáng)語義理解的可靠性,而且還能提高極性分析的準(zhǔn)確性。
      但是目前的算法只是單純的針對于短語或者依賴句法分析,這樣就使得分析的精準(zhǔn)度不高,尤其是召回率令人不滿意。本發(fā)明因此而來。發(fā)明內(nèi)容
      本發(fā)明目的在于提供一種通過計(jì)算機(jī)智能分析漢語文字情感傾向的方法,解決了現(xiàn)有技術(shù)中通過計(jì)算機(jī)分析漢語語言精準(zhǔn)度不高、召回率令人不滿意等問題。
      為了解決現(xiàn)有技術(shù)中的這些問題,本發(fā)明提供的技術(shù)方案是
      一種通過計(jì)算機(jī)智能分析漢語文字情感傾向的方法,其特征在于所述方法包括以下步驟
      (I)讀取漢語文字段落文件,將漢語文字段落文件進(jìn)行斷句,然后對斷句進(jìn)行分詞,詞性標(biāo)注,句法依存關(guān)系標(biāo)注,形成XML文檔;
      (2)讀取XML文檔,遍歷句子提取句法依存關(guān)系對,基于詞典對提取的詞進(jìn)行賦值;將正極性詞詞典中的詞賦值為1,負(fù)極性詞典中的詞賦值為-I ;程度副詞根據(jù)程度不同分為5個(gè)等級,分別賦值為1.8,1.5,1.2,0. 9,O. 5 ;否定副詞根據(jù)否定程度分為-1,-I. 5兩個(gè)等級;
      (3)遍歷詞典,按照公式情感得分=否定詞*副詞之和*形容詞,獲得漢語文字段落文件的情感得分;根據(jù)情感得分判斷漢語文字段落文件的情感傾向。
      優(yōu)選的,所述方法步驟(2)中提取句法依存關(guān)系對包括以下步驟
      Al)提取斷句中所有的形容詞,根據(jù)形容詞的位置向句首上搜索,判斷形容詞的前面4個(gè)詞是否有副詞;如有副詞,則進(jìn)行記錄保存;
      A2)判斷形容詞是否在依存關(guān)系對的左側(cè);當(dāng)形容詞在依存關(guān)系對的左側(cè)時(shí),查找左側(cè)的依存類型并保存相應(yīng)的詞;否則查找依存關(guān)系對右側(cè)的依存類型并保存相應(yīng)的詞;依次循環(huán)。
      本發(fā)明技術(shù)方案旨在提高文本情感傾向分析的準(zhǔn)確率和召回率,本發(fā)明技術(shù)方案在進(jìn)行智能分析前,將漢語文字段落進(jìn)行斷句后,將句子進(jìn)行預(yù)處理,包括分詞,詞性標(biāo)注和句法依存關(guān)系標(biāo)記,然后遍歷句子提取關(guān)系對。
      本發(fā)明技術(shù)方案中分詞指將一個(gè)漢字序列切分成一個(gè)一個(gè)單獨(dú)的詞。分詞就是將連續(xù)的字序列按照一定的規(guī)范重新組合成詞序列的過程。在英文的行文中,單詞之間是以空格作為自然分界符的,而中文只是字、句和段能通過明顯的分界符來簡單劃界,唯獨(dú)詞沒有一個(gè)形式上的分界符,雖然英文也同樣存在短語的劃分問題,不過在詞這一層上,中文比之英文要復(fù)雜的多、困難的多。
      詞性標(biāo)注即為對給定的一個(gè)分好詞的句子,每一個(gè)詞附上相應(yīng)的詞性。例如對晚上喝水進(jìn)行分詞和詞性標(biāo)注的過程如下
      權(quán)利要求
      1.一種通過計(jì)算機(jī)智能分析漢語文字情感傾向的方法,其特征在于所述方法包括以下步驟 (1)讀取漢語文字段落文件,將漢語文字段落文件進(jìn)行斷句,然后對斷句進(jìn)行分詞,詞性標(biāo)注,句法依存關(guān)系標(biāo)注,形成XML文檔; (2)讀取XML文檔,遍歷句子提取句法依存關(guān)系對,基于詞典對提取的詞進(jìn)行賦值;將正極性詞詞典中的詞賦值為1,負(fù)極性詞典中的詞賦值為-I ;程度副詞根據(jù)程度不同分為5個(gè)等級,分別賦值為I. 8,I. 5,I. 2,O. 9,O. 5 ;否定副詞根據(jù)否定程度分為_1,-I. 5兩個(gè)等級; (3)遍歷詞典,按照公式情感得分=否定詞*副詞之和*形容詞,獲得漢語文字段落文件的情感得分;根據(jù)情感得分判斷漢語文字段落文件的情感傾向。
      2.根據(jù)權(quán)利要求I所述的方法,其特征在于所述方法步驟(2)中提取句法依存關(guān)系對包括以下步驟 Al)提取斷句中所有的形容詞,根據(jù)形容詞的位置向句首上搜索,判斷形容詞的前面4個(gè)詞是否有副詞;如有副詞,則進(jìn)行記錄保存; A2)判斷形容詞是否在依存關(guān)系對的左側(cè);當(dāng)形容詞在依存關(guān)系對的左側(cè)時(shí),查找左側(cè)的依存類型并保存相應(yīng)的詞;否則查找依存關(guān)系對右側(cè)的依存類型并保存相應(yīng)的詞;依次循環(huán)。
      全文摘要
      本發(fā)明公開了一種通過計(jì)算機(jī)智能分析漢語文字情感傾向的方法,其特征在于所述方法包括以下步驟(1)讀取漢語文字段落文件,將漢語文字段落文件進(jìn)行斷句,然后對斷句進(jìn)行分詞,詞性標(biāo)注,句法依存關(guān)系標(biāo)注,形成XML文檔;(2)讀取XML文檔,遍歷句子提取句法依存關(guān)系對,基于詞典對提取的詞進(jìn)行賦值;將正極性詞詞典中的詞賦值為1,負(fù)極性詞典中的詞賦值為-1;程度副詞根據(jù)程度不同分為5個(gè)等級,分別賦值為1.8,1.5,1.2,0.9,0.5;否定副詞根據(jù)否定程度分為-1,-1.5兩個(gè)等級;(3)遍歷詞典,按照公式情感得分=否定詞*副詞之和*形容詞,獲得漢語文字段落文件的情感得分;根據(jù)情感得分判斷漢語文字段落文件的情感傾向。
      文檔編號G06F17/27GK102929863SQ201210438608
      公開日2013年2月13日 申請日期2012年11月6日 優(yōu)先權(quán)日2012年11月6日
      發(fā)明者陳國慶, 王嘉玲 申請人:蘇州兩江科技有限公司
      網(wǎng)友詢問留言 已有0條留言
      • 還沒有人留言評論。精彩留言會獲得點(diǎn)贊!
      1