1.基于用戶注冊(cè)信息的人機(jī)對(duì)話控制方法,其特征在于,包括下述步驟:
S1、控制基于概率的多層次話題狀態(tài)機(jī)跳轉(zhuǎn)至下一個(gè)子狀態(tài);
S2、根據(jù)當(dāng)前狀態(tài)從知識(shí)主題樹提取對(duì)話模板或知識(shí)素材;
S3、利用語(yǔ)句生成器將模板或素材轉(zhuǎn)換成文字語(yǔ)句;
S4、將文字語(yǔ)句合成為語(yǔ)音播放給用戶聽;
S5、等待并獲取用戶語(yǔ)音回答,將語(yǔ)音回復(fù)轉(zhuǎn)換成文字,并跳轉(zhuǎn)至S1。
2.根據(jù)權(quán)利要求1所述的基于用戶注冊(cè)信息的人機(jī)對(duì)話控制方法,其特征在于,步驟S1中,基于概率的多層次話題狀態(tài)機(jī)由用戶信息注冊(cè)器采集到的信息生成。
3.根據(jù)權(quán)利要求1所述的基于用戶注冊(cè)信息的人機(jī)對(duì)話控制方法,其特征在于,步驟S1中,基于概率的多層次話題狀態(tài)機(jī)由狀態(tài)和轉(zhuǎn)移概率組成,每一個(gè)狀態(tài)對(duì)應(yīng)一類話題,而每個(gè)大狀態(tài)下又會(huì)派生出一層子狀態(tài)機(jī),代表該大類話題下的細(xì)分子話題,而子狀態(tài)機(jī)又可以繼續(xù)派生出再下一層子狀態(tài)機(jī),每個(gè)狀態(tài)之間有對(duì)應(yīng)的轉(zhuǎn)移概率;部分狀態(tài)有一個(gè)入口問(wèn)題集,進(jìn)入這類狀態(tài)的子狀態(tài)機(jī)之前,會(huì)先向用戶提問(wèn)入口問(wèn)題,然后再依據(jù)用戶回答決定下一步跳轉(zhuǎn)。
4.根據(jù)權(quán)利要求1所述的基于用戶注冊(cè)信息的人機(jī)對(duì)話控制方法,其特征在于,步驟S1中,狀態(tài)跳轉(zhuǎn)的具體過(guò)程如下:
S11、初始化當(dāng)前狀態(tài)Sc為當(dāng)前層級(jí)狀態(tài)機(jī)的初始狀態(tài);
S12、若Sc下沒有子狀態(tài)機(jī),則將Sc作為提取知識(shí)主體樹的狀態(tài);否則執(zhí)行S13;
S13、從Sc開始,依據(jù)其所連弧線上概率轉(zhuǎn)移至下一級(jí)子狀態(tài)機(jī)中的任意一個(gè)狀態(tài)Sk,則此時(shí)Sc=Sk;
S14、若狀態(tài)Sc有入口問(wèn)題集,則隨機(jī)選出一條問(wèn)題詢問(wèn)用戶,根據(jù)用戶回答選擇是否進(jìn)入子狀態(tài)機(jī),若是進(jìn)入子狀態(tài)機(jī),則Sc賦值為子狀態(tài)機(jī)的初始狀態(tài),跳轉(zhuǎn)至步驟S12;
S15、若狀態(tài)Sc沒有入口問(wèn)題集,則直接進(jìn)入子狀態(tài)機(jī),Sc賦值為子狀態(tài)機(jī)的初始狀態(tài),跳轉(zhuǎn)至步驟S12。
5.根據(jù)權(quán)利要求1所述的基于用戶注冊(cè)信息的人機(jī)對(duì)話控制方法,其特征在于,步驟S2中,知識(shí)主題樹具體如下:
按樹狀劃分,主干為一級(jí)主題,主干繼續(xù)向下延伸,繼續(xù)往下細(xì)分二級(jí)、三級(jí)、...、n級(jí)主題,葉子主題為沒有任何子主題的主題,葉子主題下的內(nèi)容由常規(guī)語(yǔ)句模板庫(kù)和擴(kuò)展素材庫(kù)組成;
其中,所述常規(guī)語(yǔ)句模板庫(kù)由模板語(yǔ)句組成,模板語(yǔ)句采用模板語(yǔ)法進(jìn)行編寫,模板結(jié)構(gòu)有多選分支、可選分支和類別項(xiàng)三種;
所述擴(kuò)展素材庫(kù)由一系列從互聯(lián)網(wǎng)搜集到的特定主題下簡(jiǎn)單句組成,可以是時(shí)事素材、人物簡(jiǎn)介或者代表某一主題下的知識(shí)。
6.根據(jù)權(quán)利要求1所述的基于用戶注冊(cè)信息的人機(jī)對(duì)話控制方法,其特征在于,步驟S2流程具體為:
S21、采用深度優(yōu)先搜索從知識(shí)主題樹中搜索與當(dāng)前狀態(tài)所屬話題相匹配的主題;
S22、搜索到與前狀態(tài)所屬話題相匹配的知識(shí)主題后,采用隨機(jī)選擇策略從該主題對(duì)應(yīng)的常規(guī)語(yǔ)句模板庫(kù)選擇一條語(yǔ)句模板,或者從擴(kuò)展素材庫(kù)選擇一個(gè)對(duì)話素材。
7.根據(jù)權(quán)利要求1所述的基于用戶注冊(cè)信息的人機(jī)對(duì)話控制方法,其特征在于,步驟S3中,將模板轉(zhuǎn)換成文字語(yǔ)句的策略為,針對(duì)不同模板結(jié)構(gòu),采用不同的替換操作:
(1)多選分支:替換時(shí)選擇根據(jù)用戶的身份信息選擇一個(gè)分支替代;
(2)可選分支:替換時(shí)可以選擇用這個(gè)分支,或者不用這個(gè)分支;
(3)類別項(xiàng):替換時(shí)可以用該類別下的任意對(duì)象替換。
8.根據(jù)權(quán)利要求1所述的基于用戶注冊(cè)信息的人機(jī)對(duì)話控制方法,其特征在于,步驟S3中,將擴(kuò)展素材轉(zhuǎn)換成文字語(yǔ)句的策略具體如下:
(1)針對(duì)人名進(jìn)行轉(zhuǎn)換,利用實(shí)體命名工具找到素材句子中的人名,然后進(jìn)行替換;
(2)針對(duì)地名進(jìn)行轉(zhuǎn)換,利用實(shí)體命名工具找到素材句子中的地名,然后進(jìn)行替換;
(3)針對(duì)原因進(jìn)行轉(zhuǎn)換,把陳述句轉(zhuǎn)換成疑問(wèn)句。
9.基于用戶注冊(cè)信息的人機(jī)對(duì)話控制系統(tǒng),其特征在于,包括:
用戶信息注冊(cè)模塊,用于采集用戶身份信息;
基于概率的多層次話題狀態(tài)機(jī),利用用戶身份信息生成,用于控制人機(jī)對(duì)話過(guò)程中的話題轉(zhuǎn)換;
知識(shí)主題樹,用于存儲(chǔ)話題知識(shí);
語(yǔ)句生成器,用于將語(yǔ)句模板或知識(shí)素材轉(zhuǎn)換成文字語(yǔ)句,由常規(guī)語(yǔ)句模板處理器和擴(kuò)展素材處理器組成;
常規(guī)語(yǔ)句模板處理器,用于將常規(guī)語(yǔ)句模板轉(zhuǎn)換成普通文字語(yǔ)句;
擴(kuò)展素材處理器,用于將擴(kuò)展素材語(yǔ)句轉(zhuǎn)換成問(wèn)題;
語(yǔ)音合成模塊,用于將文字語(yǔ)句合成為語(yǔ)音播放給用戶;
語(yǔ)音輸入模塊,用于錄取用戶語(yǔ)音輸入,并將其轉(zhuǎn)化成文字;
所述用戶信息注冊(cè)模塊、基于概率的多層次話題狀態(tài)機(jī)、知識(shí)主體樹、語(yǔ)句生成器以及語(yǔ)音合成模塊順序連接,所述語(yǔ)音輸入模塊與基于概率的多層次話題狀態(tài)機(jī)連接。
10.根據(jù)權(quán)利要求9所述基于用戶注冊(cè)信息的人機(jī)對(duì)話控制系統(tǒng),其特征在于,所述知識(shí)主體樹,按主題樹劃分,由常規(guī)語(yǔ)句模板庫(kù)和擴(kuò)展素材庫(kù)組成;
常規(guī)語(yǔ)句模板庫(kù),采用模板化技術(shù),用于存儲(chǔ)與用戶登記信息直接相關(guān)的常規(guī)問(wèn)題;
擴(kuò)展素材庫(kù),用于存儲(chǔ)從互聯(lián)網(wǎng)搜集的擴(kuò)展性素材。