專利名稱:基于依存關(guān)系來識別語句情感的設(shè)備和方法
技術(shù)領(lǐng)域:
本發(fā)明涉及計(jì)算語言學(xué)中的情感識別技術(shù),更具體地說,本發(fā)明涉及一種用于識別語句所表達(dá)的情感種類的設(shè)備和方法。
背景技術(shù):
計(jì)算語言學(xué)(Computational Linguistics)指的是這樣一門學(xué)科,它通過建立形式化的訓(xùn)練模型,來分析、處理自然語言,并借助于計(jì)算機(jī)硬件和軟件的交互作用來實(shí)現(xiàn)語句的轉(zhuǎn)換、分析和處理,從而達(dá)到利用機(jī)器來模擬人的部分乃至全部語言能力的目的。語言的情感在人與人的交互中起著非常重要的作用,它能夠影響人的理性思維、感知、決策和學(xué)習(xí)能力?;旧?,情感可以分為高興、悲傷、生氣、驚訝、仇恨和恐懼等。當(dāng)今, 人機(jī)接口技術(shù)遇到的最大挑戰(zhàn)之一就是如何設(shè)計(jì)更加智能的人機(jī)接口,使得人和機(jī)器的交互能夠像人和人的交互那樣自然、可信。這種人機(jī)接口要求計(jì)算語言學(xué)中的機(jī)器能夠識別、理解和處理人的情感,甚至表達(dá)情感。研究人員試圖通過多種途徑識別用戶的情感,比如通過面部表情、語音、生理特征和文本等。雖然基于文本化的語句來識別用戶情感不能像從表情、語音和生理特征識別情感那么直接和準(zhǔn)確,但是文本形式(或類似文本的形式)是特別重要的一種輸入和輸出語句的方式,而目前絕大多數(shù)的人機(jī)交互應(yīng)用都基于文本輸入方式,所以基于文本的情感識別方法能夠作為其它情感識別方法的有益補(bǔ)充,提高情感識別的準(zhǔn)確率。目前,與文本形式相關(guān)的情感識別方法主要包括基于關(guān)鍵詞的方法、詞匯相關(guān)度的方法、利用大規(guī)模現(xiàn)實(shí)世界知識的方法。其中,基于關(guān)鍵詞的方法是最基礎(chǔ)、最主流的方法,它根據(jù)情感關(guān)鍵詞等來判斷語句的情感?;谠~匯相關(guān)度的方法比基于關(guān)鍵詞的方法更成熟一點(diǎn),該方法給任意詞分配對應(yīng)特定情感的相關(guān)度,所述相關(guān)度可以是一個(gè)概率值,例如,詞語“事故”有80 %的概率指示負(fù)面情感,常見的有“交通事故”、“安全生產(chǎn)事故”等。利用大規(guī)模現(xiàn)實(shí)世界知識的方法采用一個(gè)非常大的常識庫,如OMCS(Open MindCommonsense,開放常識庫)。該常識庫中有關(guān)于現(xiàn)實(shí)世界各種情況、事件、人物和活動的知識,其中一部分是情感相關(guān)的知識(大約占10% )。利用大規(guī)?,F(xiàn)實(shí)世界知識的方法就是利用情感常識進(jìn)行情感計(jì)算。例如,公開號為CN101782898的中國專利申請《一種情感詞傾向性的分析方法即公開了一種情感詞傾向性的分析方法,包括抓取網(wǎng)絡(luò)上帶有星級的評論信息;抽取評論信息中的情感詞;通過將利用星級數(shù)值化計(jì)算得到的情感詞傾向性、利用構(gòu)建的種子情感詞基于PMI-IR算法獲取的情感詞傾向性以及基于連詞性質(zhì)計(jì)算的情感詞傾向性加權(quán)求和,獲取情感詞的傾向性。上述以情感詞為基礎(chǔ)進(jìn)行語句情感識別的方式存在以下缺點(diǎn)I、以關(guān)鍵情感詞為基礎(chǔ)的方法僅依賴于表層信息,對于不含情感詞匯和表達(dá)否定意義的語句通常都無能為力。比如句子“我躲過了一場車禍”,如果僅根據(jù)關(guān)鍵詞“車禍”,該句會被錯(cuò)誤地識別成負(fù)面情感,但是該句中動詞“躲過”改變了整句的情感傾向,實(shí)際上該句表達(dá)的是一種正面情感。
2、當(dāng)語句中含有相反情感傾向的關(guān)鍵詞時(shí),以關(guān)鍵情感詞為基礎(chǔ)的方法難于做出正確的判斷。比如句子“敵人殘忍地殺害了熱心的老村長”,該句中“殘忍”是負(fù)面情感詞,而“熱心”是正面情感詞。基于關(guān)鍵詞的情感識別方法難于準(zhǔn)確識別該類句子表達(dá)的情感。3、中文多義詞比較多,情感詞匯中也有多義詞。對于多義的情感關(guān)鍵詞,基于關(guān)鍵詞的方法不管是否含有情感,或含有何種情感,都只是簡單地把它識別成預(yù)定的某種情感。t匕如“簡單”,在句子“這個(gè)改進(jìn)方案也太簡單了”中表達(dá)一個(gè)負(fù)面的情感,但在句子“請簡單地介紹一下你自己”中,它沒有明顯的情感傾向。但是上述兩種情感在基于關(guān)鍵詞的識別方法中將被識別為一種情感。因此,需要一種能夠改進(jìn)關(guān)鍵詞識別方式中存在的上述缺陷的技術(shù)方案。
發(fā)明內(nèi)容
本發(fā)明并不受限于必然解決上述技術(shù)問題,其目的在于提供一種能夠基于語句中 各個(gè)詞語的依存關(guān)系來抽取出語句的核心結(jié)構(gòu),從而識別語句情感的設(shè)備及其方法。根據(jù)本發(fā)明的一方面,提供一種基于依存關(guān)系來識別語句情感的設(shè)備,所述設(shè)備可包括存儲單元,用于存儲情感模型庫,其中,在所述情感模型庫中,從語料中預(yù)先獲得的各個(gè)詞語搭配條目被映射到對應(yīng)的情感標(biāo)簽;依存關(guān)系分析單元,用于基于構(gòu)成輸入語句的各個(gè)詞語的詞性組成來分析所述輸入語句中各個(gè)詞語的依存關(guān)系;核心結(jié)構(gòu)抽取單元,用于基于由依存關(guān)系分析單元分析出的依存關(guān)系來抽取所述輸入語句的核心結(jié)構(gòu);語句情感識別模塊,用于基于由核心結(jié)構(gòu)抽取單元抽取出的核心結(jié)構(gòu)以及由依存關(guān)系分析單元分析出的依存關(guān)系來生成所述核心結(jié)構(gòu)的詞語搭配條目,并從所述情感模型庫中搜索與所生成的詞語搭配條目對應(yīng)的情感標(biāo)簽。核心結(jié)構(gòu)抽取單元可在基于分析出的依存關(guān)系來抽取核心結(jié)構(gòu)時(shí)還依據(jù)所述輸入語句的句型結(jié)構(gòu)。所述核心結(jié)構(gòu)可以是動賓結(jié)構(gòu)或主謂結(jié)構(gòu)或被動結(jié)構(gòu)。當(dāng)核心結(jié)構(gòu)抽取單元抽取核心結(jié)構(gòu)時(shí),還可統(tǒng)計(jì)核心結(jié)構(gòu)中核心詞的否定詞個(gè)數(shù),當(dāng)否定詞個(gè)數(shù)為奇數(shù)時(shí),對搜索的情感標(biāo)簽進(jìn)行置反。當(dāng)核心結(jié)構(gòu)抽取單元抽取核心結(jié)構(gòu)時(shí),還可統(tǒng)計(jì)核心結(jié)構(gòu)中核心詞的修飾詞。語句情感識別模塊可基于知識庫來擴(kuò)展生成的詞語搭配條目。語句情感識別模塊可按照生成的全部詞語搭配條目的優(yōu)先級別來搜索對應(yīng)的情感標(biāo)簽。根據(jù)本發(fā)明的另一方面,提供一種基于依存關(guān)系來生成語句情感模型庫的方法,所述方法可包括從語料收集語句,并手動標(biāo)注每個(gè)語句的情感標(biāo)簽;基于構(gòu)成每個(gè)語句的各個(gè)詞語的詞性組成來分析所述每個(gè)語句中各個(gè)詞語的依存關(guān)系;基于依存關(guān)系來抽取所述每個(gè)語句的核心結(jié)構(gòu);基于核心結(jié)構(gòu)以及依存關(guān)系來生成所述核心結(jié)構(gòu)的詞語搭配條目列表,并將所述每個(gè)語句的情感標(biāo)簽映射到生成的各個(gè)詞語搭配條目;針對所有語句來統(tǒng)計(jì)每個(gè)詞語搭配條目與各個(gè)情感標(biāo)簽映射的概率,并將概率值最大的情感標(biāo)簽確定為所述每個(gè)詞語搭配條目對應(yīng)的情感標(biāo)簽。根據(jù)本發(fā)明的另一方面,提供一種基于依存關(guān)系來識別語句情感的方法,所述方法可包括基于構(gòu)成輸入語句的各個(gè)詞語的詞性組成來分析所述輸入語句中各個(gè)詞語的依存關(guān)系;基于分析出的依存關(guān)系來抽取所述輸入語句的核心結(jié)構(gòu);基于抽取出的核心結(jié)構(gòu)以及分析出的依存關(guān)系來生成所述核心結(jié)構(gòu)的詞語搭配條目,并從情感模型庫中搜索與所生成的詞語搭配條目對應(yīng)的情感標(biāo)簽,其中,在所述情感模型庫中,從語料中預(yù)先獲得的各個(gè)詞語搭配條目被映射到對應(yīng)的情感標(biāo)簽?;诜治龀龅囊来骊P(guān)系來抽取核心結(jié)構(gòu)的步驟還可包括依據(jù)所述輸入語句的句型結(jié)構(gòu)來抽取核心結(jié)構(gòu)。抽取核心結(jié)構(gòu)的步驟還可包括統(tǒng)計(jì)核心結(jié)構(gòu)中核心詞的否定詞個(gè)數(shù),當(dāng)否定詞個(gè)數(shù)為奇數(shù)時(shí),對搜索的情感標(biāo)簽進(jìn)行置反。
通過下面結(jié)合附圖進(jìn)行的對實(shí)施例的描述,本發(fā)明的上述和/或其它目的和優(yōu)點(diǎn)將會變得更加清楚,其中圖I是示出根據(jù)本發(fā)明示例性實(shí)施例的語句情感識別設(shè)備的框圖;圖2是示出根據(jù)本發(fā)明示例性實(shí)施例的語句情感識別方法的流程圖;圖3是示出根據(jù)本發(fā)明示例性實(shí)施例的語句依存關(guān)系的示圖;圖4示出根據(jù)本發(fā)明示例性實(shí)施例的核心結(jié)構(gòu)抽取處理的流程圖;圖5示出根據(jù)本發(fā)明示例性實(shí)施例的否定詞統(tǒng)計(jì)處理的流程圖;圖6示出根據(jù)本發(fā)明示例性實(shí)施例的動補(bǔ)關(guān)系處理的流程圖;圖7示出根據(jù)本發(fā)明示例性實(shí)施例的把字句處理過程的流程圖;圖8示出根據(jù)本發(fā)明示例性實(shí)施例的被字句處理過程的流程圖;圖9示出根據(jù)本發(fā)明示例性實(shí)施例的兼語句處理過程的流程圖;圖10示出根據(jù)本發(fā)明示例性實(shí)施例的復(fù)雜句處理過程的流程圖;以及圖11示出根據(jù)本發(fā)明示例性實(shí)施例的產(chǎn)生詞語搭配條目并從情感模型庫搜索對應(yīng)的情感標(biāo)簽的處理的流程圖。
具體實(shí)施例方式現(xiàn)將詳細(xì)說明本發(fā)明的實(shí)施例,所述實(shí)施例的示例在附圖中示出,其中,相同的標(biāo)號始終指的是相同的部件。以下將通過參照附圖來說明所述實(shí)施例,以便解釋本發(fā)明。根據(jù)本發(fā)明示例性實(shí)施例的語句情感識別設(shè)備基于語句的依存關(guān)系來抽取語句的核心結(jié)構(gòu),并基于所述核心結(jié)構(gòu)和依存關(guān)系來生成相關(guān)的詞語搭配條目,從而在事先訓(xùn)練得到的情感模型庫中搜索與上述詞語搭配條目對應(yīng)的情感標(biāo)簽,作為所述語句表達(dá)的情感。圖I是示出根據(jù)本發(fā)明示例性實(shí)施例的語句情感識別設(shè)備的框圖。如圖I所示,根據(jù)本發(fā)明示例性實(shí)施例的語句情感識別設(shè)備包括存儲單元10,用于存儲情感模型庫,其中,在所述情感模型庫中,從語料中預(yù)先獲得的各個(gè)詞語搭配條目被映射到對應(yīng)的情感標(biāo)簽;依存關(guān)系分析單元20,用于基于構(gòu)成輸入語句的各個(gè)詞語的詞性組成來分析所述語句中各個(gè)詞語的依存關(guān)系;核心結(jié)構(gòu)抽取單元30,用于基于由依存關(guān)系分析單元20分析出的依存關(guān)系來抽取所述語句的核心結(jié)構(gòu);語句情感識別模塊40,用于基于由核心結(jié)構(gòu)抽取單元30抽取出的核心結(jié)構(gòu)以及由依存關(guān)系分析單元20分析出的依存關(guān)系20來生成所述、核心結(jié)構(gòu)的詞語搭配條目,并從所述情感模型庫中搜索與所生成的詞語搭配條目對應(yīng)的情感標(biāo)簽。作為可選部件,圖I所示的語句情感識別設(shè)備還可包括詞語劃分單元50,用于對輸入的語句進(jìn)行詞語劃分,并輸出劃分的各個(gè)詞語;詞性標(biāo)注單元60,用于對由詞語劃分單元50劃分的各個(gè)詞語進(jìn)行詞性標(biāo)注,以獲得所述各個(gè)詞語的詞性組成,并將所述詞性組成提供給依存關(guān)系分析單元20。 作為示例,可通過通用的處理器或?qū)iT的情感模型庫生成模塊來生成所述情感模型庫,在所述情感模型庫中,預(yù)先從語料獲得的各個(gè)詞語搭配條目被分別映射到統(tǒng)計(jì)后對應(yīng)的情感標(biāo)簽,其中,情感標(biāo)簽被用于表示情感種類,例如,所述情感種類可包括平靜、喜悅、生氣、憤怒、后悔、同情、悲哀、憂愁、緊張、焦急、煩悶、恐懼、驚訝、喜愛、期望、失望、委屈、內(nèi)疚、厭惡、貪欲、嫉妒、傲慢、慚愧、鄙視、疑惑,中性。上述26種情感標(biāo)簽是在中國著名心理學(xué)家林傳鼎提出的18種情感分類的基礎(chǔ)上修改而成。應(yīng)理解上述分類僅僅是示例性的,并不構(gòu)成對本發(fā)明的限制。以下來描述上述情感模型庫的一種示例性訓(xùn)練生成方式,然而,本發(fā)明并不受限于情感模型庫的具體訓(xùn)練過程,任何可生成詞語搭配條目與對應(yīng)的情感標(biāo)簽的映射關(guān)系的方式均可被用于生成情感模型庫。具體說來,訓(xùn)練情感模型是指從已標(biāo)注情感的語料庫中學(xué)習(xí)情感知識,即將語言中的各個(gè)詞語搭配條目映射到特定情感,產(chǎn)生相應(yīng)的映射關(guān)系,比如映射關(guān)系“殺害姑娘I憤怒”,其中,“殺害姑娘”指示特定的詞語搭配條目,而“憤怒”指示與上述詞語搭配條目對應(yīng)的情感標(biāo)簽。這種映射關(guān)系的確定需要基于大量樣本的分析和統(tǒng)計(jì),以下將描述針對中文語句的樣本來訓(xùn)練生成情感模型庫的示例。I、收集語料從中學(xué)語文課本等標(biāo)準(zhǔn)語言資料上選取中文語句,為了建立可靠的情感模型,選取的語句需達(dá)到一定的數(shù)量,例如,可選擇大概200萬句左右。2、手動情感標(biāo)注對選取的各個(gè)語句進(jìn)行手動情感標(biāo)注,例如,可將表示上述26種情感之一的情感標(biāo)簽賦予選取的各個(gè)語句。3、語句處理3. I、詞語劃分對各個(gè)語句進(jìn)行詞語劃分。例如,對于中文句子“敵人殘忍地殺害了熱心的老村長”,詞語劃分后的輸出結(jié)果為“敵人殘忍地殺害了熱心的老村長”。3. 2、詞性標(biāo)注對以上劃分的各個(gè)詞語標(biāo)注詞性,以上面的句子“敵人殘忍地殺害了熱心的老村長”為例,其詞性標(biāo)注后的形式為“敵人/n殘忍/a地/u殺害/V 了 /u熱心/a的Al老/a村長/n”,其中,n指示名詞、a指示副詞或形容詞、u指示助詞、v指示動詞。3. 3、依存句法分析根據(jù)依存句法來分析語句中各個(gè)詞語之間的依存關(guān)系。所述依存句法是指分析語句的中心詞及詞語之間的依存關(guān)系來揭示其句法結(jié)構(gòu)。按照依存句法,一個(gè)語句只有一個(gè)成分是獨(dú)立的,語句中的其它成分直接依存于某一成分,而且任何一個(gè)成分都不能依存于兩個(gè)或兩個(gè)以上的成分。如果成分A直接依存于成分B,而成分C在語句中位于A和B之間,那么成分C或者依存于A,或者依存于B,或者依存于A和B之間的某一成分。依存分析中沒有非終結(jié)符,詞與詞之間直接發(fā)生依存關(guān)系,構(gòu)成一個(gè)依存對,其中一個(gè)是支配詞,另一個(gè)是從屬詞,依存關(guān)系用弧表示,從支配詞指向從屬詞,每個(gè)依存弧上有一個(gè)叫做關(guān)系類型的標(biāo)記。例如,上述語句的依存關(guān)系分析結(jié)果可被存儲為XML格式,其中,word id指示詞語的索引,cont指示詞語的內(nèi)容,pos指示詞語的詞性,parent指示詞語所依賴的支配詞的索引,relation指示詞語與其支配詞的依存關(guān)系
<doc>
〈sent id=”l”>
〈word id=”0” cont=,,敵人” pos=,,n” parent=”3” relation=,,SBV” /> 〈word id=”l” cont=”殘忍” pos=”a” parent=”2” relation-5DF5 /> 〈word id=”2” cont=,,地” pos=,,u” parent=,,3” relation=,,ADV” /> 〈word id=”3” cont=,,殺害” pos=”v” parent=,,-1” relation=,,HED” /> 〈word id=”4” cont=” 了 ” pos=,,u” parent=,,3” relation=,,MT” />
〈word id=,,5” cont=,,熱心” pos=’,a” parent=’,6” relation=,’DE” /> 〈word id=”6” cont=’,的” pos=,,u” parent=’,8” relation=”ATT” /> 〈word id=”7” cont=,,老” pos=,,a” parent=’,8” relation=,’ATT” /> 〈word id=”8” cont=,’村長” pos=”n” parent=,,3” relation=’,VOB” /> 〈word id=”9” cont=,,?!?pos=,,w” parent=”-2” relation=”W” /> </sent>
〈sent id=,’2,,>
</sent>
</doc>3. 4、核心結(jié)構(gòu)抽取該操作用于抽取語句中表達(dá)主要情感的核心結(jié)構(gòu),并作為優(yōu)選步驟,同時(shí)登記核心結(jié)構(gòu)的修飾詞或否定詞等信息。由于語句的主要情感是由核心結(jié)構(gòu)表達(dá)的,所以可通過識別核心結(jié)構(gòu)的情感狀態(tài)來識別語句的情感。例如,對中文語句來說,語句的核心結(jié)構(gòu)是句子的動賓結(jié)構(gòu)。如果句中沒有動賓結(jié)構(gòu),則該句可能是為了描述一種狀態(tài)或陳述一個(gè)事實(shí),此時(shí),該句的主謂結(jié)構(gòu)是其核心結(jié)構(gòu)。例如,對于上述例句,由于有動賓結(jié)構(gòu)V0B,從而抽取動賓結(jié)構(gòu)“殺害村長”作為句子的核心結(jié)構(gòu)。關(guān)于核心結(jié)構(gòu)的數(shù)據(jù)可被存儲為以下形式
權(quán)利要求
1.一種基于依存關(guān)系來識別語句情感的設(shè)備,包括 存儲單元,用于存儲情感模型庫,其中,在所述情感模型庫中,從語料中預(yù)先獲得的各個(gè)詞語搭配條目被映射到對應(yīng)的情感標(biāo)簽; 依存關(guān)系分析單元,用于基于構(gòu)成輸入語句的各個(gè)詞語的詞性組成來分析所述輸入語句中各個(gè)詞語的依存關(guān)系; 核心結(jié)構(gòu)抽取單元,用于基于由依存關(guān)系分析單元分析出的依存關(guān)系來抽取所述輸入語句的核心結(jié)構(gòu); 語句情感識別模塊,用于基于由核心結(jié)構(gòu)抽取單元抽取出的核心結(jié)構(gòu)以及由依存關(guān)系分析單元分析出的依存關(guān)系來生成所述核心結(jié)構(gòu)的詞語搭配條目,并從所述情感模型庫中搜索與所生成的詞語搭配條目對應(yīng)的情感標(biāo)簽。
2.如權(quán)利要求I所述的設(shè)備,其中,核心結(jié)構(gòu)抽取單元在基于分析出的依存關(guān)系來抽取核心結(jié)構(gòu)時(shí)還依據(jù)所述輸入語句的句型結(jié)構(gòu)。
3.如權(quán)利要求I所述的設(shè)備,其中,所述核心結(jié)構(gòu)是動賓結(jié)構(gòu)或主謂結(jié)構(gòu)或被動結(jié)構(gòu)。
4.如權(quán)利要求I所述的設(shè)備,其中,當(dāng)核心結(jié)構(gòu)抽取單元抽取核心結(jié)構(gòu)時(shí),還統(tǒng)計(jì)核心結(jié)構(gòu)中核心詞的否定詞個(gè)數(shù),當(dāng)否定詞個(gè)數(shù)為奇數(shù)時(shí),對搜索的情感標(biāo)簽進(jìn)行置反。
5.如權(quán)利要求I所述的設(shè)備,其中,當(dāng)核心結(jié)構(gòu)抽取單元抽取核心結(jié)構(gòu)時(shí),還統(tǒng)計(jì)核心結(jié)構(gòu)中核心詞的修飾詞。
6.如權(quán)利要求I或5所述的設(shè)備,其中,語句情感識別模塊基于知識庫來擴(kuò)展生成的詞語搭配條目。
7.如權(quán)利要求6所述的設(shè)備,其中,語句情感識別模塊按照生成的全部詞語搭配條目的優(yōu)先級別來搜索對應(yīng)的情感標(biāo)簽。
8.一種基于依存關(guān)系來生成語句情感模型庫的方法,包括 從語料收集語句,并手動標(biāo)注每個(gè)語句的情感標(biāo)簽; 基于構(gòu)成每個(gè)語句的各個(gè)詞語的詞性組成來分析所述每個(gè)語句中各個(gè)詞語的依存關(guān)系; 基于依存關(guān)系來抽取所述每個(gè)語句的核心結(jié)構(gòu); 基于核心結(jié)構(gòu)以及依存關(guān)系來生成所述核心結(jié)構(gòu)的詞語搭配條目列表,并將所述每個(gè)語句的情感標(biāo)簽映射到生成的各個(gè)詞語搭配條目; 針對所有語句來統(tǒng)計(jì)每個(gè)詞語搭配條目與各個(gè)情感標(biāo)簽映射的概率,并將概率值最大的情感標(biāo)簽確定為所述每個(gè)詞語搭配條目對應(yīng)的情感標(biāo)簽。
9.一種基于依存關(guān)系來識別語句情感的方法,包括 基于構(gòu)成輸入語句的各個(gè)詞語的詞性組成來分析所述輸入語句中各個(gè)詞語的依存關(guān)系; 基于分析出的依存關(guān)系來抽取所述輸入語句的核心結(jié)構(gòu); 基于抽取出的核心結(jié)構(gòu)以及分析出的依存關(guān)系來生成所述核心結(jié)構(gòu)的詞語搭配條目,并從情感模型庫中搜索與所生成的詞語搭配條目對應(yīng)的情感標(biāo)簽, 其中,在所述情感模型庫中,從語料中預(yù)先獲得的各個(gè)詞語搭配條目被映射到對應(yīng)的情感標(biāo)簽。
10.如權(quán)利要求9所述的方法,其中,基于分析出的依存關(guān)系來抽取核心結(jié)構(gòu)的步驟還包括依據(jù)所述輸入語句的句型結(jié)構(gòu)來抽取核心結(jié)構(gòu)。
11.如權(quán)利要求9所述的方法,其中,抽取核心結(jié)構(gòu)的步驟還包括統(tǒng)計(jì)核心結(jié)構(gòu)中核心詞的否定詞個(gè)數(shù),當(dāng)否定詞個(gè)數(shù)為奇數(shù)時(shí),對搜索的情感標(biāo)簽進(jìn)行置反。
全文摘要
提供一種基于依存關(guān)系來識別語句情感的設(shè)備和方法,其中,所述設(shè)備包括存儲單元,用于存儲情感模型庫,其中,在所述情感模型庫中,從語料中預(yù)先獲得的各個(gè)詞語搭配條目被映射到對應(yīng)的情感標(biāo)簽;依存關(guān)系分析單元,用于基于構(gòu)成輸入語句的各個(gè)詞語的詞性組成來分析所述輸入語句中各個(gè)詞語的依存關(guān)系;核心結(jié)構(gòu)抽取單元,用于基于由依存關(guān)系分析單元分析出的依存關(guān)系來抽取所述輸入語句的核心結(jié)構(gòu);語句情感識別模塊,用于基于由核心結(jié)構(gòu)抽取單元抽取出的核心結(jié)構(gòu)以及由依存關(guān)系分析單元分析出的依存關(guān)系來生成所述核心結(jié)構(gòu)的詞語搭配條目,并從所述情感模型庫中搜索與所生成的詞語搭配條目對應(yīng)的情感標(biāo)簽。
文檔編號G06F17/30GK102737013SQ201110090099
公開日2012年10月17日 申請日期2011年4月2日 優(yōu)先權(quán)日2011年4月2日
發(fā)明者習(xí)志囅, 周志斌, 周進(jìn)華, 唐亮, 楊慶, 陳漢文, 顏曉蔚, 龔興盛 申請人:三星電子(中國)研發(fā)中心, 三星電子株式會社