本發(fā)明涉及信息處理領(lǐng)域,尤其涉及一種自動(dòng)問答模板匹配的方法及裝置。
背景技術(shù):
隨著服務(wù)行業(yè)的多樣化,越來越多用戶咨詢和反饋的解答工作應(yīng)運(yùn)而生。例如,互聯(lián)網(wǎng)行業(yè)的售后服務(wù)或者客戶服務(wù)。由于用戶數(shù)量的指數(shù)增長,采用人工的方式對(duì)所有用戶的咨詢進(jìn)行反饋已無法滿足需求,并且用戶的問題大多集中在某些特定的知識(shí)點(diǎn)上,人工回復(fù)往往是進(jìn)行重復(fù)性地勞動(dòng)。在此背景下,自動(dòng)問答(Question Answering,QA)系統(tǒng)應(yīng)運(yùn)而生,QA是指根據(jù)用戶輸入的自然語言問題自動(dòng)輸出對(duì)應(yīng)的答案。
現(xiàn)有技術(shù)中,自動(dòng)問答系統(tǒng)中包括問答模板數(shù)據(jù)庫,模板庫中包括若干個(gè)模板問題和答案。根據(jù)問答模板數(shù)據(jù)庫對(duì)用戶輸入的問題進(jìn)行匹配。具體地,用戶輸入問題后,系統(tǒng)根據(jù)用戶的問題進(jìn)行分詞,得到問題的關(guān)鍵字集合,然后根據(jù)關(guān)鍵字集合計(jì)算用戶的問題與問答模板數(shù)據(jù)庫中各個(gè)問題的語義相似度,將最大相似度對(duì)應(yīng)模板問題的答案輸出給用戶。對(duì)于問答模板數(shù)據(jù)庫內(nèi)容龐大的情況,現(xiàn)有的匹配的算法需要對(duì)用戶問題與問答模板數(shù)據(jù)庫中問題進(jìn)行一一匹配并計(jì)算相似度,計(jì)算過程復(fù)雜導(dǎo)致反饋時(shí)間延遲,效率較低,。
綜上所述,現(xiàn)有的自動(dòng)問答系統(tǒng)的模板匹配效率較低,在問答模板數(shù)據(jù)庫龐大的場景下適應(yīng)度較低。
技術(shù)實(shí)現(xiàn)要素:
本發(fā)明提供一種自動(dòng)問答模板匹配的方法及裝置,用以解決現(xiàn)有技術(shù)中自動(dòng)問答系統(tǒng)的模板匹配效率較低,在問答模板數(shù)據(jù)庫龐大的場景下適應(yīng)度較低的問題。
本發(fā)明實(shí)施例提供一種自動(dòng)問答模板匹配的方法,包括:
確定待解答問題對(duì)應(yīng)的第一分詞集合;
根據(jù)分詞模板數(shù)據(jù)庫,確定所述第一分詞集合中每個(gè)分詞對(duì)應(yīng)的模板問題集合,所述分詞模板數(shù)據(jù)庫包括預(yù)設(shè)的各分詞對(duì)應(yīng)的模板問題集合;
根據(jù)每個(gè)分詞對(duì)應(yīng)的模板問題集合的公共子集,確定所述待解答問題的匹配模板問題。
較佳地,所述根據(jù)每個(gè)分詞對(duì)應(yīng)的模板問題集合的公共子集,確定所述待解答問題的匹配模板問題,包括:
若所述公共子集包含一個(gè)元素,則將所述一個(gè)元素對(duì)應(yīng)的模板問題確定為所述待解答問題的匹配模板問題;
若所述公共子集包含多個(gè)元素,則確定每個(gè)元素對(duì)應(yīng)的模板問題與所述待解答問題的漢明距離,將所述漢明距離最小的模板問題作為所述待解答問題的匹配模板問題。
較佳地,所述根據(jù)每個(gè)分詞對(duì)應(yīng)的模板問題集合的公共子集,確定所述待解答問題的匹配模板問題,包括:
若所述公共子集為空集,則輸出無法識(shí)別所述待解答問題的提示信息。
較佳地,所述分詞模板數(shù)據(jù)庫還包括預(yù)設(shè)的各分詞對(duì)應(yīng)答案集合,所述根據(jù)每個(gè)分詞對(duì)應(yīng)的模板問題集合的公共子集,確定所述待解答問題的匹配模板問題之后,還包括:
根據(jù)所述分詞模板數(shù)據(jù)庫,確定所述待解答問題的匹配模板問題對(duì)應(yīng)的答案,并輸出所述答案。
較佳地,所述接收待解答問題,確定所述待解答問題對(duì)應(yīng)的第一分詞集合,包括:
根據(jù)多模匹配算法,確定所述待解答問題的第二分詞集合;
根據(jù)所述第二分詞集合查找所述分詞模板數(shù)據(jù)庫中預(yù)設(shè)的各分詞,確定所述第一分詞集合。
本發(fā)明實(shí)施例還提供一種自動(dòng)問答模板匹配的裝置,包括:
分詞集合確定模塊:用于接收待解答問題,確定所述待解答問題對(duì)應(yīng)的第一分詞集合;
問題集合確定模塊:用于根據(jù)分詞模板數(shù)據(jù)庫,確定所述第一分詞集合中每個(gè)分詞對(duì)應(yīng)的模板問題集合,所述分詞模板數(shù)據(jù)庫包括預(yù)設(shè)的各分詞對(duì)應(yīng)的模板問題集合;
匹配問題確定模塊:用于根據(jù)每個(gè)分詞對(duì)應(yīng)的模板問題集合的公共子集,確定所述待解答問題的匹配模板問題。
較佳地,所述匹配問題確定模塊,具體用于:
若所述公共子集包含一個(gè)元素,則將所述一個(gè)元素對(duì)應(yīng)的模板問題確定為所述待解答問題的匹配模板問題;
若所述公共子集包含多個(gè)元素,則確定每個(gè)元素對(duì)應(yīng)的模板問題與所述待解答問題的漢明距離,將所述漢明距離最小的模板問題作為所述待解答問題的匹配模板問題。
較佳地,所述匹配問題確定模塊,具體用于:
若所述公共子集為空集,則輸出無法識(shí)別所述待解答問題的提示信息。
較佳地,所述分詞模板數(shù)據(jù)庫還包括預(yù)設(shè)的各分詞對(duì)應(yīng)答案集合,所述匹配問題確定模塊,還用于:
根據(jù)所述分詞模板數(shù)據(jù)庫,確定所述待解答問題的匹配模板問題對(duì)應(yīng)的答案,并輸出所述答案。
較佳地,所述分詞集合確定模塊,具體用于:
根據(jù)多模匹配算法,確定所述待解答問題的第二分詞集合;
根據(jù)所述第二分詞集合查找所述分詞模板數(shù)據(jù)庫中預(yù)設(shè)的各分詞,確定所述第一分詞集合。
本發(fā)明實(shí)施例提供的一種自動(dòng)問答模板匹配的方法及裝置,首先確定待解答問題對(duì)應(yīng)的第一分詞集合;然后根據(jù)分詞模板數(shù)據(jù)庫,確定第一分詞集合中每個(gè)分詞對(duì)應(yīng)的模板問題集合,所述分詞模板數(shù)據(jù)庫包括預(yù)設(shè)的各分詞對(duì)應(yīng)的模板問題集合;最后根據(jù)每個(gè)分詞對(duì)應(yīng)的模板問題集合的公共子集,確定待解答問題的匹配模板問題。本發(fā)明實(shí)施例提供的自動(dòng)問答模板匹配的方法及裝置,通過確定待解答問題對(duì)應(yīng)各分詞的模板問題集合的子集,得到待解答問題的匹配問題,不需要對(duì)用戶問題與問答模板數(shù)據(jù)庫中問題進(jìn)行一一匹配并計(jì)算相似度,提高了自動(dòng)問答系統(tǒng)的模板匹配效率和準(zhǔn)確度。
附圖說明
為了更清楚地說明本發(fā)明實(shí)施例中的技術(shù)方案,下面將對(duì)實(shí)施例描述中所需要使用的附圖作簡要介紹,顯而易見地,下面描述中的附圖僅僅是本發(fā)明的一些實(shí)施例,對(duì)于本領(lǐng)域的普通技術(shù)人員來講,在不付出創(chuàng)造性勞動(dòng)性的前提下,還可以根據(jù)這些附圖獲得其他的附圖。
圖1為本發(fā)明實(shí)施例提供的一種模板庫的預(yù)處理方法流程示意圖;
圖2為本發(fā)明實(shí)施例提供的一種自動(dòng)問答模板匹配的方法流程示意圖;
圖3為本發(fā)明實(shí)施例提供的一種自動(dòng)問答模板匹配的方法流程圖;
圖4為本發(fā)明實(shí)施例提供的一種自動(dòng)問答模板匹配的裝置結(jié)構(gòu)示意圖。
具體實(shí)施方式
為了使本發(fā)明的目的、技術(shù)方案和優(yōu)點(diǎn)更加清楚,下面將結(jié)合附圖對(duì)本發(fā)明作進(jìn)一步地詳細(xì)描述,顯然,所描述的實(shí)施例僅僅是本發(fā)明一部份實(shí)施例,而不是全部的實(shí)施例?;诒景l(fā)明中的實(shí)施例,本領(lǐng)域普通技術(shù)人員在沒有做出創(chuàng)造性勞動(dòng)前提下所獲得的所有其它實(shí)施例,都屬于本發(fā)明保護(hù)的范圍。
本發(fā)明實(shí)施例提供的自動(dòng)問答模板匹配的方法及裝置應(yīng)用于自動(dòng)問答系統(tǒng)中。問答系統(tǒng)中包括模板庫BASE-SET,模板庫BASE-SET中包括若干個(gè)問答的模板,BASE-SET={(Q1,A1),(Q2,A2)….}。每個(gè)問答的模板由(Q,A)數(shù)據(jù)對(duì)構(gòu)成,其中Q代表模板問題,A代表該模板問題對(duì)應(yīng)的答案。
具體地,Q是由一系列的模板問題組成,模板問題既可以是一句話,也可以是帶有特定標(biāo)簽的模板;A可以是簡單的應(yīng)答答案,也可以是一個(gè)邏輯處理程序。例如:
Q1:第一家全國性股份制商業(yè)銀行?
A1:交通銀行
Q2:<BankName>的營業(yè)時(shí)間?
A2:邏輯處理:查找<BankName>的營業(yè)時(shí)間。
Q3:<BankName>的信用卡<Date>的優(yōu)惠信息?
A3:邏輯處理:查找<BankName>的信用卡在<Date>的優(yōu)惠信息。
Q4:轉(zhuǎn)賬給<Person>,<Money>?
A4:邏輯處理:執(zhí)行轉(zhuǎn)賬給<Person>,<Money>的操作。
本發(fā)明實(shí)施例提供的自動(dòng)問答模板匹配的系統(tǒng)首先需要對(duì)模板庫BASE-SET進(jìn)行預(yù)處理,如圖1所示,為本發(fā)明實(shí)施例提供的模板庫的預(yù)處理方法流程示意圖,包括:
步驟101:對(duì)于模板庫中的每個(gè)問答模板進(jìn)行編號(hào)。
步驟102:對(duì)每一個(gè)問題模板切割成片段。
具體地切割方法為:提取每一個(gè)問題模板Q中的標(biāo)簽,例如<BankName>、<Date>等;然后對(duì)除標(biāo)簽以外的部分進(jìn)行分詞操作,刪除無意義詞(例如“的”、“和”等)、多字符通配符“*”、單字符通配符“?”、符號(hào)“,”等,得到至少一個(gè)字符串。例如:
Q1:第一家全國性股份制商業(yè)銀行
切割結(jié)果:第一家全國性股份制商業(yè)銀行
Q2:<BankName>的信用卡<Date>的優(yōu)惠信息
切割結(jié)果:<BankName>信用卡<Date>優(yōu)惠
Q3:轉(zhuǎn)賬給<Person><Money>
切割結(jié)果:轉(zhuǎn)賬<Person><Money>
步驟103:根據(jù)切割后的各片段確定分詞模板數(shù)據(jù)庫。
具體地,分詞模板數(shù)據(jù)庫Diction={W1,W2,W3,…,Wn},其中W表示切割的片段信息,具體可以為字符串、標(biāo)簽等。例如,Diction={第一家,全國性,……股份制商業(yè)銀行,<BankName>,信用卡,<Date>,優(yōu)惠,轉(zhuǎn)賬,<Person>,<Money>}。
步驟104:根據(jù)每個(gè)片段在分詞模板數(shù)據(jù)庫中建立倒排索引。
具體地,建立倒排索引即確定各片段對(duì)應(yīng)的模板問題集合,其中,索引的關(guān)鍵字key可以為標(biāo)簽或字符串的片段內(nèi)容,或者片段內(nèi)容的哈希值,關(guān)鍵字對(duì)應(yīng)的值為模板庫中每個(gè)問答模板QA的編號(hào)。例如,倒排索引可以為:
片段W1 問題模板Q1 問題模板Q3 問題模板Qk……
片段W2 問題模板Q1 問題模板Q2 問題模板Qh……
……
片段Wk 問題模板Q2 問題模板Qc3 問題模板Qx……
……
片段Wx 問題模板Q3 問題模板Q6 問題模板Q10……
在對(duì)模板庫進(jìn)行預(yù)處理之后,得到分詞模板數(shù)據(jù)庫。下面對(duì)本發(fā)明實(shí)施例提供的自動(dòng)問答模板匹配的方法進(jìn)行詳細(xì)說明。如圖2所示,為本發(fā)明實(shí)施例提供的一種自動(dòng)問答模板匹配的方法流程示意圖,包括:
步驟201:確定待解答問題對(duì)應(yīng)的第一分詞集合。
具體地,首先根據(jù)多模匹配算法(例如Wu_Manber算法),確定待解答問題Qn的第二分詞集合{W1,W2,Wk,Wx……}。根據(jù)所述第二分詞集合查找分詞模板數(shù)據(jù)庫中預(yù)設(shè)的各分詞,確定第一分詞集合{W1,W2,Wk……}。
例如,待回答問題Qn為“第一家全國性股份制商業(yè)銀行的位置?”,根據(jù)Wu_Manber算法,得到第二分詞集合為{第一家全國性股份制商業(yè)銀行位置},然后在分詞模板數(shù)據(jù)庫的預(yù)設(shè)分詞中查找第二分詞集合中的各分詞,找到分詞“第一家”、“全國性”、“股份制商業(yè)銀行”,則將{第一家全國性股份制商業(yè)銀行}作為第一分詞集合。
步驟202:根據(jù)分詞模板數(shù)據(jù)庫,確定第一分詞集合中每個(gè)分詞對(duì)應(yīng)的模板問題集合。
其中,分詞模板數(shù)據(jù)庫包括預(yù)設(shè)的各分詞對(duì)應(yīng)的模板問題集合,以及各模板問題對(duì)應(yīng)的答案。具體地,根據(jù)待回答問題Qn包含的第一分詞集合{W1,W2,Wk……},在分詞模板數(shù)據(jù)庫中找到對(duì)應(yīng)的模板問題集合{Q-Set1,Q-Set2,Q-Set k……}。例如,
W1:Q-Set 1={Q1,Q3,Qa,…};
W2:Q-Set 2={Q2,Q3,Qb,…};
Wk:Q-Set k={Q2,Q3,Qc,…};……
步驟203:根據(jù)每個(gè)分詞對(duì)應(yīng)的模板問題集合的公共子集,確定待解答問題的匹配模板問題。
具體地,首先確定待回答問題Qn中每個(gè)分詞對(duì)應(yīng)的模板問題集合的公共子集Q-SET,Q-SET為{Q-Set1},{Q-Set2},{Q-Set k}等的子集,該子集Q-Set為用戶提出的待回答問題Qn的匹配模板問題。
進(jìn)一步地,若公共子集包含一個(gè)元素,則將該一個(gè)元素對(duì)應(yīng)的模板問題確定為待解答問題的匹配模板問題。
如步驟202中的舉例,若公共子集Q-Set={Q3},則將模板問題Q3作為待解答問題Qn的匹配模板問題。
進(jìn)一步地,若公共子集包含多個(gè)元素,則確定每個(gè)元素對(duì)應(yīng)的模板問題與待解答問題的漢明距離,將漢明距離最小的模板問題作為待解答問題的匹配模板問題。
如步驟202中的舉例,若公共子集Q-Set={Q3,Qx,Qy},則分別計(jì)算模板問題Q3,Qx,Qy與待解答問題的漢明距離,若其中模板問題Qx的漢明距離最小,則將模板問題Qx作為待解答問題Qn的匹配模板問題。
進(jìn)一步地,若公共子集為空集,則輸出無法識(shí)別待解答問題的提示信息。
需要說明的是,在確定出待解答問題Qn的匹配模板問題之后,還需要根據(jù)所述分詞模板數(shù)據(jù)庫中各模板問題對(duì)應(yīng)的答案,確定待解答問題Qn的匹配模板問題對(duì)應(yīng)的答案,并輸出該答案。
例如,待解答問題Qn為:第一家全國性股份制商業(yè)銀行的位置?,最后確定出待解答問題Qn的匹配模板問題為Q1:第一家全國性股份制商業(yè)銀行?,以及該模板問題Q1對(duì)應(yīng)的A1:交通銀行。
本發(fā)明實(shí)施例提供的一種自動(dòng)問答模板匹配的方法,首先確定待解答問題對(duì)應(yīng)的第一分詞集合;然后根據(jù)分詞模板數(shù)據(jù)庫,確定第一分詞集合中每個(gè)分詞對(duì)應(yīng)的模板問題集合,所述分詞模板數(shù)據(jù)庫包括預(yù)設(shè)的各分詞對(duì)應(yīng)的模板問題集合;最后根據(jù)每個(gè)分詞對(duì)應(yīng)的模板問題集合的公共子集,確定待解答問題的匹配模板問題。本發(fā)明實(shí)施例提供的自動(dòng)問答模板匹配的方法,通過對(duì)模板問題進(jìn)行預(yù)處理后在內(nèi)存中建立倒排索引。對(duì)于用戶輸入的待解答問題,通過多模匹配算法快速檢索到模板庫中對(duì)應(yīng)的候選模板問題集,然后在候選模板問題集中公共子集。由于候選模板問題集合相對(duì)于整個(gè)問答模板集合來說小很多,且不需要對(duì)待解答問題與問答模板數(shù)據(jù)庫中問題進(jìn)行一一匹配并計(jì)算相似度,提高了自動(dòng)問答系統(tǒng)的模板匹配效率和準(zhǔn)確度。
本發(fā)明實(shí)施例還提供一種自動(dòng)問答模板匹配的方法,如圖3所示,為本發(fā)明實(shí)施例提供的一種自動(dòng)問答模板匹配的方法流程圖,包括:
步驟301:用戶輸入問題Qn。
步驟302:通過Wu_Manber算法確定問題Qn包含的分詞集合;
具體地,首先根據(jù)多模匹配算法Wu_Manber算法,確定用戶輸入問題Qn包含的分詞集合{W1,W2,Wk,Wx……}。
步驟303:根據(jù)問題Qn包含的分詞集合查找分詞模板數(shù)據(jù)庫中預(yù)設(shè)的各分詞,確定問題Qn的候選分詞集合。
具體地,根據(jù)用戶輸入問題Qn包含的分詞集合{W1,W2,Wk,Wx……}查找分詞模板數(shù)據(jù)庫中預(yù)設(shè)的各分詞,確定候選分詞集合為{W1,W2,Wk……}。
例如,待回答問題Qn為“第一家全國性股份制商業(yè)銀行的位置?”,根據(jù)Wu_Manber算法,得到分詞集合{第一家全國性股份制商業(yè)銀行位置},然后在分詞模板數(shù)據(jù)庫的預(yù)設(shè)分詞,找到分詞“第一家”、“全國性”、“股份制商業(yè)銀行”,則將{第一家全國性股份制商業(yè)銀行}作為候選分詞集合。
步驟304:根據(jù)分詞模板數(shù)據(jù)庫,確定候選分詞集合中每個(gè)分詞對(duì)應(yīng)的模板問題集合。
其中,分詞模板數(shù)據(jù)庫包括預(yù)設(shè)的各分詞對(duì)應(yīng)的模板問題集合,以及各模板問題對(duì)應(yīng)的答案。具體地,根據(jù)待回答問題Qn包含的第一分詞集合{W1,W2,Wk……},在分詞模板數(shù)據(jù)庫中找到對(duì)應(yīng)的模板問題集合{Q-Set1,Q-Set2,Q-Set k……}。例如,
W1:Q-Set 1={Q1,Q3,Qa,…};
W2:Q-Set 2={Q2,Q3,Qb,…};
Wk:Q-Set k={Q2,Q3,Qc,…};……
步驟305:確定待回答問題中每個(gè)分詞對(duì)應(yīng)的模板問題集合的公共子集的數(shù)量。
具體地,首先確定待回答問題Qn中每個(gè)分詞對(duì)應(yīng)的模板問題集合的公共子集Q-SET,Q-SET為{Q-Set1},{Q-Set2},{Q-Set k}等的子集,該子集Q-Set為用戶提出的問題Qn的匹配模板問題。
步驟306:判斷公共子集的數(shù)量。若公共子集的數(shù)量為0,則執(zhí)行步驟307;若公共子集的數(shù)量為1則執(zhí)行步驟308;若公共子集的數(shù)量大于1,則執(zhí)行步驟309。
步驟307:輸出無法識(shí)別用戶輸入的問題Qn的提示信息。
步驟308:將該公共子集對(duì)應(yīng)的模板問題確定為問題Qn的匹配模板問題,繼續(xù)執(zhí)行步驟310。
例如,如步驟304中的舉例,若公共子集Q-Set={Q3},則將模板問題Q3作為問題Qn的匹配模板問題。
步驟309:確定每個(gè)集合對(duì)應(yīng)的模板問題與問題Qn的漢明距離,將漢明距離最小的模板問題作為問題Qn的匹配模板問題。繼續(xù)執(zhí)行步驟310。
如步驟202中的舉例,若公共子集Q-Set={Q3,Qx,Qy},則分別計(jì)算模板問題Q3,Qx,Qy與問題Qn的漢明距離,若其中模板問題Qx的漢明距離最小,則將模板問題Qx作為問題Qn的匹配模板問題。
步驟310:確定問題Qn的匹配模板問題對(duì)應(yīng)的答案,并輸出答案。
具體地,在確定出問題Qn的匹配模板問題之后,還需要根據(jù)所述分詞模板數(shù)據(jù)庫中各模板問題對(duì)應(yīng)的答案,確定問題Qn的匹配模板問題對(duì)應(yīng)的答案,并輸出該答案。
例如,問題Qn為:第一家全國性股份制商業(yè)銀行的位置?,最后確定出問題Qn的匹配模板問題為Q1:第一家全國性股份制商業(yè)銀行?,以及該模板問題Q1對(duì)應(yīng)的A1:交通銀行。則輸出答案:交通銀行。
基于同樣的發(fā)明構(gòu)思本發(fā)明實(shí)施例還提供一種自動(dòng)問答模板匹配的裝置,如圖4所示,為本發(fā)明實(shí)施例提供一種自動(dòng)問答模板匹配的裝置結(jié)構(gòu)示意圖,包括:
分詞集合確定模塊401:用于接收待解答問題,確定所述待解答問題對(duì)應(yīng)的第一分詞集合;
問題集合確定模塊402:用于根據(jù)分詞模板數(shù)據(jù)庫,確定所述第一分詞集合中每個(gè)分詞對(duì)應(yīng)的模板問題集合,所述分詞模板數(shù)據(jù)庫包括預(yù)設(shè)的各分詞對(duì)應(yīng)的模板問題集合;
匹配問題確定模塊403:用于根據(jù)每個(gè)分詞對(duì)應(yīng)的模板問題集合的公共子集,確定所述待解答問題的匹配模板問題。
較佳地,所述匹配問題確定模塊403,具體用于:
若所述公共子集包含一個(gè)元素,則將所述一個(gè)元素對(duì)應(yīng)的模板問題確定為所述待解答問題的匹配模板問題;
若所述公共子集包含多個(gè)元素,則確定每個(gè)元素對(duì)應(yīng)的模板問題與所述待解答問題的漢明距離,將所述漢明距離最小的模板問題作為所述待解答問題的匹配模板問題。
較佳地,所述匹配問題確定模塊403,具體用于:
若所述公共子集為空集,則輸出無法識(shí)別所述待解答問題的提示信息。
較佳地,所述分詞模板數(shù)據(jù)庫還包括預(yù)設(shè)的各分詞對(duì)應(yīng)答案集合,所述匹配問題確定模塊403,還用于:
根據(jù)所述分詞模板數(shù)據(jù)庫,確定所述待解答問題的匹配模板問題對(duì)應(yīng)的答案,并輸出所述答案。
較佳地,所述分詞集合確定模塊401,具體用于:
根據(jù)多模匹配算法,確定所述待解答問題的第二分詞集合;
根據(jù)所述第二分詞集合查找所述分詞模板數(shù)據(jù)庫中預(yù)設(shè)的各分詞,確定所述第一分詞集合。
本發(fā)明實(shí)施例提供的一種自動(dòng)問答模板匹配的裝置,首先確定待解答問題對(duì)應(yīng)的第一分詞集合;然后根據(jù)分詞模板數(shù)據(jù)庫,確定第一分詞集合中每個(gè)分詞對(duì)應(yīng)的模板問題集合,所述分詞模板數(shù)據(jù)庫包括預(yù)設(shè)的各分詞對(duì)應(yīng)的模板問題集合;最后根據(jù)每個(gè)分詞對(duì)應(yīng)的模板問題集合的公共子集,確定待解答問題的匹配模板問題。本發(fā)明實(shí)施例提供的自動(dòng)問答模板匹配的裝置,通過確定待解答問題對(duì)應(yīng)各分詞的模板問題集合的子集,得到待解答問題的匹配問題,不需要對(duì)用戶問題與問答模板數(shù)據(jù)庫中問題進(jìn)行一一匹配并計(jì)算相似度,提高了自動(dòng)問答系統(tǒng)的模板匹配效率和準(zhǔn)確度。
本發(fā)明是參照根據(jù)本發(fā)明實(shí)施例的方法、設(shè)備(系統(tǒng))、和計(jì)算機(jī)程序產(chǎn)品的流程圖和/或方框圖來描述的。應(yīng)理解可由計(jì)算機(jī)程序指令實(shí)現(xiàn)流程圖和/或方框圖中的每一流程和/或方框、以及流程圖和/或方框圖中的流程和/或方框的結(jié)合。可提供這些計(jì)算機(jī)程序指令到通用計(jì)算機(jī)、專用計(jì)算機(jī)、嵌入式處理機(jī)或其他可編程數(shù)據(jù)處理設(shè)備的處理器以產(chǎn)生一個(gè)機(jī)器,使得通過計(jì)算機(jī)或其他可編程數(shù)據(jù)處理設(shè)備的處理器執(zhí)行的指令產(chǎn)生用于實(shí)現(xiàn)在流程圖一個(gè)流程或多個(gè)流程和/或方框圖一個(gè)方框或多個(gè)方框中指定的功能的系統(tǒng)。
這些計(jì)算機(jī)程序指令也可存儲(chǔ)在能引導(dǎo)計(jì)算機(jī)或其他可編程數(shù)據(jù)處理設(shè)備以特定方式工作的計(jì)算機(jī)可讀存儲(chǔ)器中,使得存儲(chǔ)在該計(jì)算機(jī)可讀存儲(chǔ)器中的指令產(chǎn)生包括指令系統(tǒng)的制造品,該指令系統(tǒng)實(shí)現(xiàn)在流程圖一個(gè)流程或多個(gè)流程和/或方框圖一個(gè)方框或多個(gè)方框中指定的功能。
這些計(jì)算機(jī)程序指令也可裝載到計(jì)算機(jī)或其他可編程數(shù)據(jù)處理設(shè)備上,使得在計(jì)算機(jī)或其他可編程設(shè)備上執(zhí)行一系列操作步驟以產(chǎn)生計(jì)算機(jī)實(shí)現(xiàn)的處理,從而在計(jì)算機(jī)或其他可編程設(shè)備上執(zhí)行的指令提供用于實(shí)現(xiàn)在流程圖一個(gè)流程或多個(gè)流程和/或方框圖一個(gè)方框或多個(gè)方框中指定的功能的步驟。
盡管已描述了本發(fā)明的優(yōu)選實(shí)施例,但本領(lǐng)域內(nèi)的技術(shù)人員一旦得知了基本創(chuàng)造性概念,則可對(duì)這些實(shí)施例作出另外的變更和修改。所以,所附權(quán)利要求意欲解釋為包括優(yōu)選實(shí)施例以及落入本發(fā)明范圍的所有變更和修改。
顯然,本領(lǐng)域的技術(shù)人員可以對(duì)本發(fā)明進(jìn)行各種改動(dòng)和變型而不脫離本發(fā)明的精神和范圍。這樣,倘若本發(fā)明的這些修改和變型屬于本發(fā)明權(quán)利要求及其等同技術(shù)的范圍之內(nèi),則本發(fā)明也意圖包含這些改動(dòng)和變型在內(nèi)。