国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      一種基于結(jié)構(gòu)句法的情緒原因事件識別方法及系統(tǒng)的制作方法_2

      文檔序號:9432628閱讀:來源:國知局
      別代表對應(yīng)的詞語 是否是情緒原因?qū)?yīng)的第一個詞、情緒原因的中間詞、情緒原因的最后一個詞、非情緒原因 中的詞;W表示待測詞序列,Z(W)是歸一化因子,fk為特征函數(shù),t為相應(yīng)特征的下標。
      [0054] 需要說明的是,本發(fā)明實施例提供的一種基于結(jié)構(gòu)句法的情緒原因事件識別方法 中,利用訓練詞組及每個訓練詞組包括的每個詞語的結(jié)構(gòu)句法特征訓練CRF模型,可W包 括W下步驟:
      [0055] 確定每個訓練詞組中與該訓練詞組的情緒原因事件對應(yīng)的訓練情緒詞;其中,訓 練詞組的情緒原因事件為與訓練詞組對應(yīng)的訓練文本的情緒原因事件;
      [0056] 確定每個訓練詞組中每個詞語的詞特征、詞性特征及詞距離;其中,每個訓練詞 組中每個詞語的詞距離為該訓練詞組中每個詞語與該訓練詞組中的訓練情緒詞之間的距 離;
      [0057] 利用每個訓練詞組及該訓練詞組中每個詞語的詞特征、詞性特征、詞距離及結(jié)構(gòu) 句法特征訓練CRF模型。
      [0058] 可W利用Stan化rd工具確定訓練詞組中每個詞語的詞特征、詞性特征及結(jié)構(gòu)句 法特征。詞特征可W是詞語本身。
      [0059] 而確定每個訓練詞組中每個詞語的詞特征、詞性特征及詞距離時,可W包括:確定 每個訓練詞組中每個詞語的詞特征、詞性特征及詞距離;其中,每個訓練詞組中位于該訓練 詞組中的訓練情緒詞左邊的詞語的詞距離為負數(shù),位于該訓練詞組中的訓練情緒詞右邊的 詞語的詞距離為正數(shù)。而詞距離的絕對值則可W是一個詞語在該訓練詞組中與訓練情緒詞 之間的字數(shù)差。舉例說明,訓練詞組為"Marie" "was" "agitated" "Agitated"為訓 練情緒詞,則每個詞語的詞特性、詞性特征、詞距離及結(jié)構(gòu)句法特征如下表所示。
      [0060] 每個詞語的詞特性、詞性特征、詞距離及結(jié)構(gòu)句法特征的統(tǒng)計表
      [0061]
      [0062] 其中,結(jié)構(gòu)句法特征中的父節(jié)點、到根節(jié)點路徑、路徑長度、左兄弟節(jié)點及右兄弟 節(jié)點均是由Stan化rd工具獲得的,如下:
      [0063]
      柳64] 圖2為結(jié)構(gòu)句法特征中各節(jié)點的示意圖,其中was的詞性特征是VBD,(VBDwas) 組成一個葉子節(jié)點;該葉子節(jié)點的父節(jié)點為VP,到根節(jié)點的路徑為VBD〉VP〉S〉R00T,路徑長 度為4,沒有左兄弟節(jié)點,右兄弟節(jié)點為VP。
      [0065] 另外,可W將每個詞語的詞特征、詞性特征、詞距離及結(jié)構(gòu)句法特征轉(zhuǎn)換成特征向 量,則每個詞語均可W具有與之對應(yīng)的一個特征向量,利用特征向量構(gòu)建CRF模型。
      [0066] 由此,獲取的CRF模型,能夠綜合考慮到文本中情緒詞的上下文特征,據(jù)其建立的 CRF模型能夠更加準確的識別待測文本的情緒原因事件。
      [0067] 需要說明的是,本發(fā)明實施例提供的一種基于結(jié)構(gòu)句法的情緒原因事件識別方法 中,利用CRF模型確定待測詞組對應(yīng)的待測文本的情緒原因事件,即步驟S16,可W包括W 下步驟:
      [0068] S31 :獲取待測文本,待測文本為未提供其情緒原因事件的文本。 W例 S32 :將待測文本進行分詞處理,得到待測詞組。
      [0070] 對于進行分詞處理的具體說明請參考上文中的相關(guān)內(nèi)容,在此不再寶述。 陽〇7US33 :確定待測詞組中包括的待測情緒詞。
      [0072]S34 :確定待測詞組中每個詞語的詞特征、詞性特征、詞距離及結(jié)構(gòu)句法特征;其 中,待測詞組中每個詞語的詞距離為該待測詞組中每個詞語與待測情緒詞之間的距離。
      [0073]對于每個詞語的詞特征、詞性特征、詞距離及結(jié)構(gòu)句法特征的具體說明請參考上 文中的相關(guān)內(nèi)容,在此不再寶述。
      [0074] S35 :利用待測詞組中每個詞語的詞特征、詞性特征、詞距離及結(jié)構(gòu)句法特征,通過 CRF模型,得到待測文本的情緒原因事件。
      [00巧]其中,可W將每個詞語的詞特征、詞性特征、詞距離及結(jié)構(gòu)句法特征轉(zhuǎn)換成特征向 量,然后將特征向量作為CRF模型的輸入,W得到與之對應(yīng)的輸出,即待測文本的情緒原因 事件。實驗證明,由此,獲取的待測文本的情緒原因事件的準確率較高。
      [0076]與上述方法實施例相對應(yīng),本發(fā)明實施例還提供了一種基于結(jié)構(gòu)句法的情緒原因 事件識別系統(tǒng),其結(jié)構(gòu)示意圖如圖4所示,可W包括:
      [0077]獲取模塊41,用于獲取預(yù)設(shè)量的訓練文本,訓練文本為已提供其情緒原因事件的 文本;
      [0078]分詞模塊42,用于將訓練文本進行分詞處理,得到分別與每個訓練文本對應(yīng)的訓 練詞組;
      [0079]第一確定模塊43,用于確定訓練詞組中每個詞語的結(jié)構(gòu)句法特征;
      [0080]訓練模塊44,用于利用訓練詞組及每個訓練詞組包括的每個詞語的結(jié)構(gòu)句法特征 訓練CRF模型;
      [0081]第二確定模塊45,用于利用CRF模型確定待測詞組對應(yīng)的待測文本的情緒原因事 件。
      [0082]通過上述系統(tǒng),利用訓練文本進行分詞后的詞組及詞組中每個詞語的結(jié)構(gòu)句法特 征構(gòu)建CRF模型,即建立一個統(tǒng)一的概率模型,進一步利用上述CRF模型確定待測文本的情 緒原因事件,實驗證明,本發(fā)明實施例提供的一種基于結(jié)構(gòu)句法的情緒原因事件識別系統(tǒng) 獲取待測文本的情緒原因事件的準確率較高,即對于情緒原因事件的識別性能較好。
      [0083]對所公開的實施例的上述說明,使本領(lǐng)域技術(shù)人員能夠?qū)崿F(xiàn)或使用本發(fā)明。對運 些實施例的多種修改對本領(lǐng)域技術(shù)人員來說將是顯而易見的,本文中所定義的一般原理可 W在不脫離本發(fā)明的精神或范圍的情況下,在其它實施例中實現(xiàn)。因此,本發(fā)明將不會被限 制于本文所示的運些實施例,而是要符合與本文所公開的原理和新穎特點相一致的最寬的 范圍。
      【主權(quán)項】
      1. 一種基于結(jié)構(gòu)句法的情緒原因事件識別方法,其特征在于,包括: 獲取預(yù)設(shè)量的訓練文本,所述訓練文本為已提供其情緒原因事件的文本; 將所述訓練文本進行分詞處理,得到分別與每個所述訓練文本對應(yīng)的訓練詞組; 確定所述訓練詞組中每個詞語的結(jié)構(gòu)句法特征; 利用所述訓練詞組及每個所述訓練詞組包括的每個詞語的結(jié)構(gòu)句法特征訓練CRF模 型; 利用所述CRF模型確定待測詞組對應(yīng)的待測文本的情緒原因事件。2. 根據(jù)權(quán)利要求1所述的方法,其特征在于,所述利用所述訓練詞組及每個所述訓練 詞組包括的每個詞語的結(jié)構(gòu)句法特征訓練CRF模型,包括: 確定每個所述訓練詞組中與該訓練詞組的情緒原因事件對應(yīng)的訓練情緒詞;其中,所 述訓練詞組的情緒原因事件為與所述訓練詞組對應(yīng)的訓練文本的情緒原因事件; 確定每個所述訓練詞組中每個詞語的詞特征、詞性特征及詞距離;其中,每個所述訓練 詞組中每個詞語的詞距離為該訓練詞組中每個詞語與該訓練詞組中的訓練情緒詞之間的 距離; 利用每個所述訓練詞組及該訓練詞組中每個詞語的詞特征、詞性特征、詞距離及結(jié)構(gòu) 句法特征訓練CRF模型。3. 根據(jù)權(quán)利要求2所述的方法,其特征在于,確定每個所述訓練詞組中每個詞語的詞 特征、詞性特征及結(jié)構(gòu)句法特征,包括: 利用Stanford工具確定所述訓練詞組中每個詞語的詞特征、詞性特征及結(jié)構(gòu)句法特 征。4. 根據(jù)權(quán)利要求2所述的方法,其特征在于,所述確定每個所述訓練詞組中每個詞語 的詞特征、詞性特征及詞距離,包括: 確定每個所述訓練詞組中每個詞語的詞特征、詞性特征及詞距離;其中,每個所述訓練 詞組中位于該訓練詞組中的訓練情緒詞左邊的詞語的詞距離為負數(shù),位于該訓練詞組中的 訓練情緒詞右邊的詞語的詞距離為正數(shù)。5. 根據(jù)權(quán)利要求1至4任一項所述的方法,其特征在于,所述利用所述CRF模型確定待 測詞組對應(yīng)的待測文本的情緒原因事件,包括: 獲取待測文本,所述待測文本為未提供其情緒原因事件的文本; 將所述待測文本進行分詞處理,得到待測詞組; 確定所述待測詞組中包括的待測情緒詞; 確定所述待測詞組中每個詞語的詞特征、詞性特征、詞距離及結(jié)構(gòu)句法特征;其中,所 述待測詞組中每個詞語的詞距離為該待測詞組中每個詞語與待測情緒詞之間的距離; 利用所述待測詞組中每個詞語的詞特征、詞性特征、詞距離及結(jié)構(gòu)句法特征,通過所述CRF模型,得到所述待測文本的情緒原因事件。6. -種基于結(jié)構(gòu)句法的情緒原因事件識別系統(tǒng),其特征在于,包括: 獲取模塊,用于獲取預(yù)設(shè)量的訓練文本,所述訓練文本為已提供其情緒原因事件的文 本; 分詞模塊,用于將所述訓練文本進行分詞處理,得到分別與每個所述訓練文本對應(yīng)的 訓練詞組; 第一確定模塊,用于確定所述訓練詞組中每個詞語的結(jié)構(gòu)句法特征; 訓練模塊,用于利用所述訓練詞組及每個所述訓練詞組包括的每個詞語的結(jié)構(gòu)句法特 征訓練CRF模型; 第二確定模塊,用于利用所述CRF模型確定待測詞組對應(yīng)的待測文本的情緒原因事 件。
      【專利摘要】本發(fā)明公開了一種基于結(jié)構(gòu)句法的情緒原因事件識別方法及系統(tǒng),包括:獲取預(yù)設(shè)量的訓練文本,所述訓練文本為已提供其情緒原因事件的文本;將所述訓練文本進行分詞處理,得到分別與每個所述訓練文本對應(yīng)的訓練詞組;確定所述訓練詞組中每個詞語的結(jié)構(gòu)句法特征;利用所述訓練詞組及每個所述訓練詞組包括的每個詞語的結(jié)構(gòu)句法特征訓練CRF模型;利用所述CRF模型確定待測詞組對應(yīng)的待測文本的情緒原因事件。本發(fā)明實施例提供的一種基于結(jié)構(gòu)句法的情緒原因事件識別方法及系統(tǒng)獲取待測文本的情緒原因事件的準確率較高,即對于情緒原因事件的識別性能較好。
      【IPC分類】G06K9/62, G06F17/30, G06F17/27
      【公開號】CN105183807
      【申請?zhí)枴緾N201510530866
      【發(fā)明人】李壽山, 徐健, 周國棟
      【申請人】蘇州大學張家港工業(yè)技術(shù)研究院
      【公開日】2015年12月23日
      【申請日】2015年8月26日
      當前第2頁1 2 
      網(wǎng)友詢問留言 已有0條留言
      • 還沒有人留言評論。精彩留言會獲得點贊!
      1