[0067][act1n]:表示動作成分的詞或短語。
[0068]比如:“信用卡如何辦理”中的“辦理”
[0069][attribute]:表示屬性成份的詞或短語。
[0070]比如:“iphone有哪些顏色”中的“顏色”
[°071 ] [adjective]:表示修飾成分的詞或短語。
[0072]比如:“冰箱哪個品牌便宜”中的“便宜”
[0073]一些主要的抽象語義類別示例有:
[0074]概念說明[concept]是什么
[0075]屬性構(gòu)成[concept]有哪些[attribute]
[0076]行為方式[concept]如何[act1n]
[0077]行為地點[concept]在什么地方[act 1n]
[0078]行為原因[concept]為什么會[act1n]
[0079]行為預(yù)測[concept]會不會[act1n]
[0080]行為判斷[concept]有沒有[attribute]
[0081 ]屬性狀況[concept]的[attribute]是不是[adjective]
[0082]屬性判斷[concept]是不是有[attribute]
[0083]屬性原因[concept]的[attribute]為什么這么[adjective]
[0084]概念比較[conceptl]和[concept2]的區(qū)別在哪里
[0085]屬性比較[conceptl ]和[concept2]的[attribute]有什么不同之處
[0086]問句在抽象語義層面的成份判斷可以通過詞性標(biāo)注來做一般的評判,concept對應(yīng)的詞性為名詞,act1n對應(yīng)的詞性為動詞、attribute對應(yīng)的詞性為名詞、adjective對應(yīng)的是形容詞。
[0087]以類別為“行為方式”的抽象語義[concept]如何[act1n]為例,該類別的抽象語義集合下可包括多條抽象語義表達式:
[0088]抽象語義類別:行為方式
[0089]抽象語義表達式:
[0090]a.[concept][需要 | 應(yīng)該?][如何]〈才[可以]?>〈進行?〉[act1n]
[0091]b.{[concept]?[act1n]}
[0092]c.[conceptK的?>[act1n]〈方法 |方式 | 步驟?〉
[0093]d.〈有哪些I有什么I有沒有X通過I用I在〉[concept] [act1nK的?〉[方法]
[0094]e.[如何][act1n]?[concept]
[0095]上述a、b、c、d四個抽象語義表達式都是用來描述“行為方式”這一抽象語義類別的。符號“ I ”表示“或”關(guān)系,符號“?”表示該成分可有可無。以上述抽象語義表達式C為例,可展開為以下的抽象語義表達:
[0096]cl.[conceptK的〉[act1nK方法〉
[0097]c2.[conceptK的〉[act1nK方式〉
[0098]c3.[conceptK的〉[act1nK步驟〉
[0099]c4.[concept]〈的〉[act1n]
[0100]c5.[concept] [act1nK方法〉
[0101]c6.[concept] [act1nK方式〉
[0102]c7.[concept] [act1nK步驟〉
[0103]c8.[concept][act1n]
[0104]以上抽象語義表達式cl-c8皆展開自抽象語義表達式c,因此,類似于抽象語義表達式c這種可以展開的抽象語義表達式也可稱為簡并抽象語義表達式。
[0105]在上述抽象語義表達式中,除了作為缺失語義成分的抽象的語義成分符之外,其他出現(xiàn)的具體的詞如“如何”、“應(yīng)該”、“方法”等等,這些詞需要在抽象語義規(guī)則中被使用,所以可統(tǒng)稱為語義規(guī)則詞。
[0106]由上可知,顯然抽象語義表達式越多,相應(yīng)的抽象語義越完善。因此,如何更新抽象語義庫是較為重要的。
[0107]在本發(fā)明中,提出了一種高效地更新抽象語義庫的方案。
[0108]圖1是示出了根據(jù)本發(fā)明的一方面的用于智能問答系統(tǒng)中抽象語義庫的更新方法100的流程圖。
[0109]在步驟102,收集語料。
[0110]這里的語料可以是生活中任何常用的語句實例??梢詮母鞣N數(shù)據(jù)庫系統(tǒng)中收集語料,如:智能問答系統(tǒng)中的用戶日志中的問題。
[0111]在步驟104,生成每個語料所對應(yīng)的抽象語義表達式。
[0112]如上所述,每一個句子都具有抽象的語義,換言之,可以由一個抽象語義表達式來表示。在本發(fā)明中,可自動地為一條語料生成其對應(yīng)的抽象語義表達式。
[0113]圖2是示出了根據(jù)本發(fā)明的一方面的用于生成抽象語義表達式的方法200的流程圖。
[0114]在步驟202,對語料進行分詞,以獲得若干單獨詞。
[0115]以下列幾條語料為例:
[0116]I)抽煙對人的傷害有什么;
[0117]2)眼霜對于黑眼圈的作用是什么;
[0118]3)熬夜給皮膚帶來的危害;
[0119]4)質(zhì)酸在皮膚中的作用。
[0120]對于語料I),分詞為:抽煙對人的危害有什么
[0121]對于語料2),分詞為:眼霜對于黑眼圈的作用是什么
[0122]對于語料3),分詞為:熬夜給皮膚帶來的危害
[0123]對于語料4),分詞為:質(zhì)酸在皮膚中的作用
[0124]在步驟204,將每一單獨詞識別為語義規(guī)則詞或非語義規(guī)則詞,該語義規(guī)則詞屬于抽象語義表達式用到的詞語。
[0125]具體而言,例如可在語義規(guī)則詞庫中查找每個單獨詞,語義規(guī)則詞庫包括屬于抽象語義表達式用到的所有詞語的集合。若某一個單獨詞存在于語義規(guī)則詞庫中則將該單獨詞識別為語義規(guī)則詞,否則識別為非語義規(guī)則詞。又如:還可以用詞類判斷,如介詞、助詞等詞性。若某一個單詞為介詞或助詞,則該單詞識別為語義規(guī)則詞,否則識別為非語義規(guī)則
Τ.κ| ο
[0126]對于語料I),語義規(guī)則詞包括:對的有什么
[0127]對于語料2),語義規(guī)則詞包括:對于的是什么
[0128]對于語料3),語義規(guī)則詞包括:給帶來的
[0129]對于語料4),語義規(guī)則詞包括:在中的作用
[0130]在步驟206,分別對每個非語義規(guī)則詞進行詞性標(biāo)注,得到每個非語義規(guī)則詞的詞性信息。
[0131]對于語料1),非語義規(guī)則詞:抽煙(動詞)人(名詞)危害(名詞)
[0132]對于語料2),非語義規(guī)則詞:眼霜(名詞)黑眼圈(名詞)作用(名詞)
[0133]對于語料3),非語義規(guī)則詞:熬夜(名詞)皮膚(名詞)危害(名詞)
[0134]對于語料4),非語義規(guī)則詞:質(zhì)酸(名詞)皮膚(名詞)作用(名詞)
[0135]在步驟208,至少基于每個非語義規(guī)則詞的詞性信息將非語義規(guī)則詞替換為相應(yīng)語義成分符以作為新生成抽象語義表達式的缺失語義成分。
[0136]例如,詞性被標(biāo)記為名詞的非語義規(guī)則詞可用表示主體或客體成份的詞或短語的語義成分符concept替換,詞性被標(biāo)記為動詞的非語義規(guī)則詞可用表示動作成分的詞或短語的語義成分符act1n來替換,詞性被標(biāo)記為形容詞的非語義規(guī)則詞可用表示修飾成分的詞或短語的語義成分符adjective來替換,詞性被標(biāo)記為名詞的非語義規(guī)則詞還可用表示屬性成分的詞或短語的語義成分符attribute替換。
[0137]此外,還基于語料的上下文將非語義規(guī)則詞替換為相應(yīng)語義成分符以作為新生成抽象語義表達式的缺失語義成分。
[0138]以上述語料1)-4)為例:
[0139]對于語料I),“抽煙”的詞性為動詞,但是考慮到上下文語境,這里的抽煙表示主語成分,因此將抽煙替換為concept; “人”的詞性為名詞,因此替換為concept; “危害”的詞性為名詞,考慮到上下文語境,被替換為“attribute”。
[0140]由此,語料I)的抽象語義表達式為:concept I對concept2的attribute有什么。
[0141]對于語料2),“眼霜”的詞性為名詞,且表示主體成分,用concept替換,“黑眼圈”的詞性為名詞,表示客體成分,用“concept”替換,“作用”的詞性為名詞,這里表示屬性成分,用 “attribute” 替換。
[0142]由此,語料2)的抽象語義表達式為:concept I對于concept2的attribute是什么。
[0143]類似地,語料3)的抽象語義表達式為:concept I給concept2帶來的attribute。
[0144]語料4)的抽象語義表達式為:concept I在concept2中的attribute。
[0145]回到流程100,在步驟106,將至少部分未存在于抽象語義庫中的新生成抽象語義表達式添加至所述抽象語義庫。
[0146]對于新生成的抽象語義表達式,有的可能已經(jīng)存在于抽象語義庫中,有的可能未存在于抽象語義庫中。
[0147]對于已經(jīng)存在于抽象語義庫中的新生成抽象語義表達式,可人工確認(rèn)其正確性。
[0148]對于未存在于抽象語義庫中的新生成抽象語義表達式,在一實例中,將經(jīng)確認(rèn)正確的未存在于抽象語義庫的所有新生成抽象語義表達式直接添加至所述抽象語義庫中。
[0149]例如上述關(guān)于語料1)-4)生成的所有抽象語義表達式直接被添加到抽象語義庫中。
[0150]在另一實例中,可對未存在于抽象語義庫中的新生成抽象語義表達式進行語義聚類處理,以形成多個新生成抽象語義表達式群集。
[015