對話方法、記錄介質(zhì)以及對話系統(tǒng)的制作方法
【專利摘要】本公開提供能夠縮短對話系統(tǒng)與用戶的對話時間并且能夠縮短對話系統(tǒng)的處理時間的對話方法、記錄介質(zhì)以及對話系統(tǒng)。含義網(wǎng)絡(luò)存儲部(111)將為了執(zhí)行針對用戶的言語生成應(yīng)答文的任務(wù)所需要的多個節(jié)點分別關(guān)聯(lián)地進行存儲,自然語言處理器(102)取得表示用戶的言語內(nèi)容的言語信息,從多個節(jié)點中確定與言語信息對應(yīng)的第1節(jié)點,會話生成部(121)從與所確定的第1節(jié)點相關(guān)聯(lián)的多個第2節(jié)點中,基于與多個第2節(jié)點分別相對應(yīng)的權(quán)重值,選擇一個第2節(jié)點,生成與所選擇的一個第2節(jié)點對應(yīng)的應(yīng)答文。
【專利說明】
對話方法、記錄介質(zhì)以及對話系統(tǒng)
技術(shù)領(lǐng)域
[0001]本公開涉及對用戶的言語進行應(yīng)答的對話系統(tǒng)中的對話方法、對用戶的言語進行應(yīng)答的對話程序以及對用戶的言語進行應(yīng)答的對話系統(tǒng)。
【背景技術(shù)】
[0002]近些年,提出了通過生成表達用戶的喜好的模型,高效地進行系統(tǒng)與用戶的對答的技術(shù)方案。
[0003]例如,專利文獻I所公開的聲音對話系統(tǒng)中,針對成為識別對象的關(guān)鍵字,記錄將它們包含于應(yīng)答文中的情況下所使用的替代語、表示應(yīng)答文的種類的應(yīng)答類型、以及選擇替代語和應(yīng)答類型的條件,基于選擇替代語和應(yīng)答類型的條件,決定針對識別出的關(guān)鍵字的替代語和應(yīng)答文模板,將替代語插入所決定的應(yīng)答文模板,由此生成應(yīng)答文。
[0004]另外,專利文獻2所公開的以往的聲音理解系統(tǒng)具備:知識提取部,其接收電子節(jié)目指南(EPG)的信息,處理EPG信息,形成節(jié)目數(shù)據(jù)庫;聲音識別部,接收口述請求,將口述請求翻譯為包括多個詞匯(單詞)的一系列的文本信息;自然語言處理器,其接收一系列的文本信息,處理詞匯以便解釋口述請求的語義內(nèi)容;以及會話控制部,其為了判斷是否輸入了足夠數(shù)量的關(guān)鍵字槽位(slot)而分析任務(wù)框架(task frame),為了對空的槽位進行輸入而向用戶詢問追加的信息。
[0005]現(xiàn)有技術(shù)文獻
[0006]專利文獻I:日本特開2008-39928號公報
[0007]專利文獻2:日本特開2000-250575號公報
【發(fā)明內(nèi)容】
[0008]發(fā)明要解決的問題
[0009]但是,在以往的聲音理解系統(tǒng)中,向用戶直接詢問要輸入到任務(wù)框架的槽位值,針對從用戶得到的回答進行再次確認而決定槽位值。因此,系統(tǒng)與用戶的對話時間長,并且,系統(tǒng)的處理時間長。
[0010]本公開為了解決上述的問題而提出,目的在于提供能夠縮短對話系統(tǒng)與用戶的對話時間,并且能夠縮短對話系統(tǒng)的處理時間的對話方法、對話程序以及對話系統(tǒng)。
[0011]解決問題的技術(shù)方案
[0012]本公開的一個方面所涉及的對話方法,是對用戶的言語進行應(yīng)答的對話系統(tǒng)中使用的對話方法,將為了執(zhí)行針對所述用戶的言語生成應(yīng)答文的任務(wù)所需要的多個節(jié)點分別關(guān)聯(lián)地進行存儲,取得表示所述用戶的言語內(nèi)容的言語信息,從所述多個節(jié)點中確定與所述言語信息對應(yīng)的第I節(jié)點,從與所確定的所述第I節(jié)點相關(guān)聯(lián)的多個第2節(jié)點中,基于與所述多個第2節(jié)點分別相對應(yīng)的權(quán)重值,選擇一個第2節(jié)點,生成與所選擇的所述一個第2節(jié)點對應(yīng)的應(yīng)答文。
[0013]根據(jù)該構(gòu)成,將為了執(zhí)行針對用戶的言語生成應(yīng)答文的任務(wù)所需要的多個節(jié)點分別關(guān)聯(lián)地進行存儲。取得表示用戶的言語內(nèi)容的言語信息。從多個節(jié)點中確定與言語信息對應(yīng)的第I節(jié)點。從與所確定的第I節(jié)點相關(guān)聯(lián)的多個第2節(jié)點中,基于與多個第2節(jié)點分別相對應(yīng)的權(quán)重值,選擇一個第2節(jié)點。然后,生成與所選擇的一個第2節(jié)點對應(yīng)的應(yīng)答文。
[0014]因此,無需生成用于使用戶從多個第2節(jié)點中選擇一個第2節(jié)點的詢問文,而是生成對應(yīng)于基于與多個第2節(jié)點分別相對應(yīng)的權(quán)重值選擇的一個第2節(jié)點的應(yīng)答文,因此,能夠縮短對話系統(tǒng)與用戶的對話時間,并且能夠縮短對話系統(tǒng)的處理時間。
[0015]另外,在上述的對話方法中,所述權(quán)重值也可以表示所述多個第2節(jié)點過去被所述用戶選擇的概率。
[0016]根據(jù)該構(gòu)成,權(quán)重值表示多個第2節(jié)點過去被用戶選擇的概率,因此,能夠簡單地算出權(quán)重值。
[0017]另外,在上述的對話方法中,也可以選擇所述多個第2節(jié)點中的所述概率比預(yù)定值大的第2節(jié)點。
[0018]根據(jù)該構(gòu)成,由于選擇多個第2節(jié)點中的概率比預(yù)定值大的第2節(jié)點,因此,能夠簡單地選擇一個第2節(jié)點。
[0019]另外,在上述的對話方法中,也可以在所述多個第2節(jié)點中不存在所述概率比預(yù)定值大的第2節(jié)點的情況下,生成用于使所述用戶選擇所述多個第2節(jié)點中的任意一個的應(yīng)答文。
[0020]根據(jù)該構(gòu)成,在多個第2節(jié)點中不存在概率比預(yù)定值大的第2節(jié)點的情況下,生成用于使用戶選擇多個第2節(jié)點的任意一個的應(yīng)答文,因此,即便在無法選擇一個第2節(jié)點的情況下,也能夠使用戶進行選擇。
[0021]另外,在上述的對話方法中,也可以取得表示所述用戶對所述應(yīng)答文的回答的信息,根據(jù)所述用戶的回答是否是選擇所述多個第2節(jié)點中的一個第2節(jié)點的回答,更新所述權(quán)重值。
[0022]根據(jù)該構(gòu)成,取得表示用戶對應(yīng)答文的回答的信息。根據(jù)用戶的回答是否是選擇多個第2節(jié)點中的一個第2節(jié)點的回答,更新權(quán)重值。
[0023]因此,每當用戶利用系統(tǒng)時,權(quán)重值被更新,因此,能夠選擇與用戶的利用狀況相應(yīng)的一個第2節(jié)點。
[0024]另外,在上述的對話方法中,也可以是:所述權(quán)重值同如下組合相對應(yīng),該組合為:與多個第I節(jié)點中的一個第I節(jié)點相關(guān)聯(lián)的多個第2節(jié)點中的一個第2節(jié)點和與所述多個第I節(jié)點中的其他第I節(jié)點相關(guān)聯(lián)的多個第2節(jié)點的各個的組合,判斷是否確定了所述一個第2節(jié)點,在確定了所述一個第2節(jié)點的情況下,基于同所述一個第2節(jié)點和與所述其他第I節(jié)點相關(guān)聯(lián)的多個第2節(jié)點的各個的組合相對應(yīng)的權(quán)重值,從與所述其他第I節(jié)點相關(guān)聯(lián)的所述多個第2節(jié)點中選擇一個第2節(jié)點。
[0025]根據(jù)該構(gòu)成,權(quán)重值同與多個第I節(jié)點中的I個第I節(jié)點相關(guān)聯(lián)的多個第2節(jié)點中的一個第2節(jié)點和、與多個第I節(jié)點中的其他第I節(jié)點相關(guān)聯(lián)的多個第2節(jié)點的各個的組合相對應(yīng)。判斷是否確定了一個第2節(jié)點。在確定了一個第2節(jié)點的情況下,基于對應(yīng)于一個第2節(jié)點和與其他第I節(jié)點相關(guān)聯(lián)的多個第2節(jié)點的各個的組合的權(quán)重值,從與其他第I節(jié)點相關(guān)聯(lián)的多個第2節(jié)點中選擇一個第2節(jié)點。
[0026]因此,能夠選擇與如下組合對應(yīng)的一個第2節(jié)點,上述組合是:與多個第I節(jié)點中的一個第I節(jié)點相關(guān)聯(lián)的多個第2節(jié)點中的一個第2節(jié)點和與多個第I節(jié)點中的其他第I節(jié)點相關(guān)聯(lián)的多個第2節(jié)點的各個的組合。
[0027]本公開的其他方面的對話程序是對用戶的言語進行應(yīng)答的對話程序,使計算機作為下述各部發(fā)揮功能:存儲部,將為了執(zhí)行針對所述用戶的言語生成應(yīng)答文的任務(wù)所需要的多個節(jié)點分別關(guān)聯(lián)地進行存儲;取得部,取得表示所述用戶的言語內(nèi)容的言語信息;確定部,從所述多個節(jié)點中確定與所述言語信息對應(yīng)的第I節(jié)點;選擇部,從與所述確定部所確定的所述第I節(jié)點相關(guān)聯(lián)的多個第2節(jié)點中,基于與所述多個第2節(jié)點分別相對應(yīng)的權(quán)重值,選擇一個第2節(jié)點;以及生成部,生成與所述選擇部所選擇的所述一個第2節(jié)點對應(yīng)的應(yīng)答文。
[0028]根據(jù)該構(gòu)成,將用于執(zhí)行針對用戶的言語生成應(yīng)答文的任務(wù)所需要的多個節(jié)點分別關(guān)聯(lián)地進行存儲。取得表示用戶的言語內(nèi)容的言語信息。從多個節(jié)點中確定與言語信息對應(yīng)的第I節(jié)點。從與所確定的第I節(jié)點相關(guān)聯(lián)的多個第2節(jié)點中,基于與多個第2節(jié)點分別相對應(yīng)的權(quán)重值,選擇一個第2節(jié)點。然后,生成與所選擇的一個第2節(jié)點對應(yīng)的應(yīng)答文。
[0029]因此,無需生成用于使用戶從多個第2節(jié)點中選擇一個第2節(jié)點的詢問文,而是生成對應(yīng)于基于與多個第2節(jié)點分別相對應(yīng)的權(quán)重值選擇出的一個第2節(jié)點的應(yīng)答文,因此,能夠縮短對話系統(tǒng)與用戶的對話時間,并且能夠縮短對話系統(tǒng)的處理時間。
[0030]本公開的其他方面的對話系統(tǒng)是對用戶的言語進行應(yīng)答的對話系統(tǒng),具備:存儲部,將為了執(zhí)行針對所述用戶的言語生成應(yīng)答文的任務(wù)所需要的多個節(jié)點分別關(guān)聯(lián)地進行存儲;取得部,取得表示所述用戶的言語內(nèi)容的言語信息;確定部,從所述多個節(jié)點中確定與所述言語信息對應(yīng)的第I節(jié)點;選擇部,從與所述確定部所確定的所述第I節(jié)點相關(guān)聯(lián)的多個第2節(jié)點中,基于與所述多個第2節(jié)點分別相對應(yīng)的權(quán)重值,選擇一個第2節(jié)點;以及生成部,生成與所述選擇部所選擇的所述一個第2節(jié)點對應(yīng)的應(yīng)答文。
[0031]根據(jù)該構(gòu)成,將為了執(zhí)行針對用戶的言語生成應(yīng)答文的任務(wù)所需要的多個節(jié)點分別關(guān)聯(lián)地進行存儲。取得表示用戶的言語內(nèi)容的言語信息。從多個節(jié)點中確定與言語信息對應(yīng)的第I節(jié)點。從與所確定的第I節(jié)點相關(guān)聯(lián)的多個第2節(jié)點中,基于與多個第2節(jié)點的各個相對應(yīng)的權(quán)重值,選擇一個第2節(jié)點。然后,生成與所選擇的一個第2節(jié)點對應(yīng)的應(yīng)答文。
[0032]因此,無需生成用于使用戶從多個第2節(jié)點中選擇I個第2節(jié)點的詢問文,而是生成對應(yīng)于基于與多個第2節(jié)點的各個相對應(yīng)的權(quán)重值選擇的一個第2節(jié)點的應(yīng)答文,因此,能夠縮短對話系統(tǒng)與用戶的對話時間,并且能夠縮短對話系統(tǒng)的處理時間。
[0033]發(fā)明的效果
[0034]根據(jù)本公開,能夠縮短對話系統(tǒng)與用戶的對話時間,并且能夠縮短對話系統(tǒng)的處理時間。
【附圖說明】
[0035]圖1是用于說明本實施方式中的聲音對話系統(tǒng)的概要的圖。
[0036]圖2是示出本實施方式中的聲音對話系統(tǒng)的構(gòu)成的圖。
[0037]圖3是示出判斷條件表的一例的圖。
[0038]圖4是用于對本實施方式中的聲音對話系統(tǒng)的聲音對話處理進行說明的流程圖。
[0039]圖5是用于對本實施方式中的聲音對話系統(tǒng)的權(quán)重值更新處理進行說明的流程圖。
[0040]圖6是用于說明本實施方式中的聲音對話系統(tǒng)的聲音對話處理與以往的聲音對話系統(tǒng)的聲音對話處理的差異的圖。
[0041]圖7是示出本實施方式的變形例中的聲音對話系統(tǒng)的含義網(wǎng)絡(luò)的一例的圖。
[0042]圖8是用于對本實施方式的變形例中的聲音對話系統(tǒng)的聲音對話處理進行說明的流程圖。
[0043]圖9A是示出以往例的聲音對話系統(tǒng)中使用的對話方法的對話文的一例的圖。
[0044]圖9B是示出本公開所涉及的聲音對話系統(tǒng)中使用的對話方法的對話文的一例的圖。
[0045]標號說明
[0046]101聲音識別部;102自然語言處理器;103存儲器;104會話管理部;105聲音合成部;111含義網(wǎng)絡(luò)存儲部;112權(quán)重值管理表存儲部;113判斷條件表存儲部;121會話生成部;122權(quán)重值更新部;131句子解析部;132存儲器訪問部
【具體實施方式】
[0047]以下,參照附圖對本發(fā)明的實施方式進行說明。此外,以下的實施方式是將本發(fā)明具體化的一個例子,不限定本發(fā)明的技術(shù)范圍。
[0048]圖1是用于說明本實施方式中的聲音對話系統(tǒng)的概要的圖。
[0049]圖1所示的例子示出在銷售飲料時使用的含義網(wǎng)絡(luò)的一例。圖1所示的含義網(wǎng)絡(luò)包含為了執(zhí)行針對用戶的言語生成應(yīng)答文的任務(wù)所需要的多個節(jié)點。多個節(jié)點分別相關(guān)聯(lián)。對于相關(guān)聯(lián)的兩個節(jié)點,賦予表示兩個節(jié)點的關(guān)系性的關(guān)系信息。關(guān)系信息包含:表示一方的節(jié)點相對于另一方的節(jié)點為下位概念的關(guān)系的信息、表示一方的節(jié)點是為了執(zhí)行另一方的節(jié)點所含的概念涉及的任務(wù)所必需的項目的信息、表示一方的節(jié)點是對另一方的節(jié)點所含的概念涉及的任務(wù)任意地設(shè)定的項目的信息、以及表示一方的節(jié)點是另一方的節(jié)點的值的信息。
[0050]例如,對于表示“咖啡”的節(jié)點11與表示“飲料”的節(jié)點12,建立對應(yīng)有表示如下內(nèi)容的關(guān)系信息,該內(nèi)容為:表示“咖啡”的節(jié)點11相對于表示“飲料”的節(jié)點12為下位概念(是一種飲料的關(guān)系)。此外,表示“咖啡”的節(jié)點11也被稱為域(domain)。
[0051]另外,對于表示“大小”的節(jié)點14與表示“飲料”的節(jié)點12,建立對應(yīng)有表示如下內(nèi)容的關(guān)系信息,該內(nèi)容為:表示“大小”的節(jié)點14相對于表示“飲料”的節(jié)點12為必須的項目。對于表示“數(shù)量”的節(jié)點15與表示“飲料”的節(jié)點12,建立對應(yīng)有表示如下內(nèi)容的關(guān)系信息,該內(nèi)容為:表示“數(shù)量”的節(jié)點15相對于表示“飲料”的節(jié)點12為任意設(shè)定的項目,是在用戶進行通知的情況下確定的節(jié)點。
[0052]另外,對于表示“糖”的節(jié)點17與表示“咖啡”的節(jié)點11,建立對應(yīng)有表示如下內(nèi)容的關(guān)系信息,該內(nèi)容為:表示“糖”的節(jié)點17相對于表示“咖啡”的節(jié)點11是為了執(zhí)行任務(wù)而必須的項目。對于表示“溫度”的節(jié)點18與表示“咖啡”的節(jié)點11,建立對應(yīng)有表示如下內(nèi)容的關(guān)系信息,該內(nèi)容為:表示“溫度”的節(jié)點18相對于表示“咖啡”的節(jié)點11是為了執(zhí)行任務(wù)而必須的項目。表示“糖”的節(jié)點17以及表示“溫度”的節(jié)點18被稱為必須槽位,或者被簡稱為槽位。
[0053]對于表示“熱”的節(jié)點19與表示“溫度”的節(jié)點18,建立對應(yīng)有表示如下內(nèi)容的關(guān)系信息,該內(nèi)容為:表示“熱”的節(jié)點19是表示“溫度”的節(jié)點18的值。對于表示“7令”的節(jié)點20與表示“溫度”的節(jié)點18,建立對應(yīng)有表示如下內(nèi)容的關(guān)系信息,該內(nèi)容為:表示“7令”的節(jié)點20是表示“溫度”的節(jié)點18的值。表示“熱”的節(jié)點19以及表示“7令”的節(jié)點20是相對于表示“溫度”的節(jié)點18而選擇其任一方的節(jié)點。表示“熱”的節(jié)點19以及表示“7令”的節(jié)點20被稱為槽位值。
[0054]在用戶購入飲料時,在選擇了咖啡的情況下,是否需要砂糖、是熱還是冷,這是必須要決定的,在未決定這些的情況下,無法執(zhí)行提供飲料時針對用戶的言語生成應(yīng)答文的任務(wù)。即,溫度是為了達成任務(wù)而必須的節(jié)點(槽位),系統(tǒng)需要決定槽位值(該情況下為冷或熱)。
[0055]在以往的系統(tǒng)中,關(guān)于咖啡的溫度,系統(tǒng)向用戶詢問選擇熱以及冷中的哪一個,通過聲音識別來判斷用戶的回答。在用戶選擇了熱的情況下,系統(tǒng)再次詢問熱的可以嗎,通過聲音識別來判斷用戶的回答,決定咖啡的溫度。
[0056]與此相對,在本公開的系統(tǒng)中,關(guān)于咖啡的溫度,不是系統(tǒng)向用戶詢問選擇熱以及冷中的哪一個,而是根據(jù)過去多個用戶選擇了熱以及冷中的哪一個而分別賦予權(quán)重值,根據(jù)權(quán)重值,詢問選擇熱或選擇冷。例如,在過去,冷以60 %的概率被選擇,熱以40 %的概率被選擇的情況下,系統(tǒng)向用戶詢問是否選擇冷,通過聲音識別來判斷用戶的回答,決定咖啡的溫度。在該情況下,與以往的系統(tǒng)相比,無需再次確認溫度,能夠縮短系統(tǒng)與用戶的對話時間,并且能夠縮短系統(tǒng)的處理時間。
[0057]另外,如果能夠生成內(nèi)容具體且正確的詢問,則容易從用戶獲得為了執(zhí)行任務(wù)所需的信息。例如,在用戶點了咖啡的情況下,通過系統(tǒng)詢問“熱咖啡可以吧? ”,能夠?qū)⒂脩舻幕卮鹣薅椤笆恰被颉安皇恰钡瓤隙ǖ谋磉_或否定的表達。
[0058]另外,作為其他的事例,例如,考慮用戶點了指定“芝士漢堡套餐”的套餐菜單的情況。此時,在系統(tǒng)向用戶詢問套餐菜單中的飲料種類的情況下,基于概率,例如進行“可樂還是橙汁?”這一擇一性的詢問。由此,容易將用戶的回答引導為“可樂?!被颉俺戎!钡劝到y(tǒng)能夠受理的內(nèi)容的回答。即,系統(tǒng)通過進行擇一性的詢問,促使用戶不進行預(yù)想外的回答。由此,用戶使用系統(tǒng)能夠受理的表達的可能性比應(yīng)用了以往技術(shù)的情況高,能夠從用戶更可靠地獲得信息。
[0059]圖2是表示本實施方式中的聲音對話系統(tǒng)的構(gòu)成的圖。聲音對話系統(tǒng)具備聲音識別部101、自然語言處理器102、存儲器103、會話管理部104以及聲音合成部105。
[0060]存儲器103具備含義網(wǎng)絡(luò)存儲部111、權(quán)重值管理表存儲部112以及判斷條件表存儲部113。
[0061 ]含義網(wǎng)絡(luò)存儲部111預(yù)先存儲連接了多個節(jié)點的含義網(wǎng)絡(luò)。含義網(wǎng)絡(luò)存儲部111將為了執(zhí)行針對用戶的言語生成應(yīng)答文的任務(wù)而需要的多個節(jié)點分別相關(guān)聯(lián)地存儲。
[0062]權(quán)重值管理表存儲部112將含義網(wǎng)絡(luò)所含的槽位值與權(quán)重值相對應(yīng)地存儲。
[0063]判斷條件表存儲部113將能夠選擇的槽位值的數(shù)量、選擇槽位值的條件、滿足條件時得到的槽位值、表示應(yīng)答文的模板相對應(yīng)地存儲。
[0064]聲音識別部101將由麥克風(未圖示)取得的輸入聲音轉(zhuǎn)換成文本信息。聲音識別部1I識別用戶的言語而轉(zhuǎn)換為文本信息。
[0065]自然語言處理器102取得表示用戶的言語內(nèi)容的言語信息(文本信息)。自然語言處理器102從多個節(jié)點中確定與言語信息對應(yīng)的第I節(jié)點(槽位)。自然語言處理器102分析由聲音識別部101輸出的一系列的文本信息,理解語義內(nèi)容以及用戶的言語的意圖。自然語言處理器102例如使用語言理解用數(shù)據(jù)庫(未圖示)所存儲的語言理解用知識來理解言語內(nèi)容。自然語言處理器102從文本信息提取具有含義的詞匯。自然語言處理器102在含義網(wǎng)絡(luò)存儲部111所存儲的含義網(wǎng)絡(luò)內(nèi)進行檢索,在含義網(wǎng)絡(luò)內(nèi)存在所提取的詞匯的情況下,從含義網(wǎng)絡(luò)提取與由所提取的詞匯確定的任務(wù)相關(guān)的槽位以及槽位所相對應(yīng)的多個槽位值。
[0066]自然語言處理器102具備句子解析部131以及存儲器訪問部132。句子解析部131進行從文本化的用戶的言語內(nèi)容提取詞匯的處理。存儲器訪問部132對于由句子解析部131提取的詞匯,在存儲器103所保存的含義網(wǎng)絡(luò)內(nèi)進行檢索,提取槽位等,將所提取的槽位輸出給會話管理部104(會話生成部121)。
[0067]此外,存儲器訪問部132也可以具備會話管理部104。自然語言處理器102也可以從文本化的用戶的言語內(nèi)容提取詞匯,并輸出給會話管理部104的存儲器訪問部,會話管理部104的存儲器訪問部從含義網(wǎng)絡(luò)提取槽位等。
[0068]會話管理部104具備會話生成部121以及權(quán)重值更新部122。會話生成部121從與由自然語言處理器102確定的第I節(jié)點(槽位)相關(guān)聯(lián)的多個第2節(jié)點(槽位值)中,基于與多個第2節(jié)點的各個節(jié)點相對應(yīng)的權(quán)重值,選擇一個第2節(jié)點。此外,權(quán)重值表示多個第2節(jié)點過去被用戶選擇的概率。會話生成部121從多個第2節(jié)點中,選擇概率比預(yù)定值大的第2節(jié)點。會話生成部121生成與所選擇的一個第2節(jié)點(槽位值)對應(yīng)的應(yīng)答文。會話生成部121在多個第2節(jié)點中不存在概率比預(yù)定值大的第2節(jié)點的情況下,生成用于使用戶選擇多個第2節(jié)點的某一個的應(yīng)答文。
[0069]會話生成部121從權(quán)重值管理表取得與由自然語言處理器102提取的多個槽位值的各個槽位值相對應(yīng)的權(quán)重值,基于所取得的權(quán)重值,決定I個槽位值。會話生成部121生成與所決定的槽位值對應(yīng)的應(yīng)答文。此時,會話生成部121參照判斷條件表存儲部113所存儲的判斷條件表,對某槽位判斷是否滿足與能夠選擇的槽位值的數(shù)量對應(yīng)的判斷條件。在滿足判斷條件的情況下,會話生成部121將槽位值插入預(yù)先準備的應(yīng)答文的模板,生成應(yīng)答文。
[0070]圖3是示出判斷條件表的一例的圖。
[0071]如圖3所示,判斷條件表將能夠選擇的槽位值的數(shù)量、選擇槽位值的條件、滿足條件時得到的槽位值、表示應(yīng)答文的模板建立對應(yīng)。
[0072]例如,會話生成部121在能夠選擇的槽位值為“VI”以及“V2”這兩個、VI比50%大、V2比50%小的情況下,選擇V1作為槽位值。另外,會話生成部121在能夠選擇的槽位值為“ V1 ”以及“V2”這兩個、Vl比50%小、V2比50%大的情況下,選擇V2作為槽位值。另外,在選擇了 Vl作為槽位值的情況下,會話生成部121生成“想要VI嗎?(Do you want νι?)”這一應(yīng)答文。另一方面,在選擇了V2作為槽位值的情況下,會話生成部121生成“想要V2嗎?(Do you want V2?)”這一應(yīng)答文。
[0073]另外,會話生成部121在能夠選擇的槽位值為“V1”以及“v2”這兩個、V1以及^為50%的情況下,選擇Vl以及V2作為槽位值。另外,在選擇了Vi以及V2作為槽位值的情況下,會話生成部121生成“VI或V2怎么樣?(How about vi or V2?)”這一應(yīng)答文。
[0074]另外,會話生成部121在能夠選擇的槽位值為“V1”、“v2”、...、“vx”多個、某一個槽位值Vi比50%大的情況下,選擇Vi作為槽位值。另外,在選擇了Vi作為槽位值的情況下,會話生成部121生成“想要Vi嗎?(Do you want Vi?)”這一應(yīng)答文。
[0075]另外,會話生成部121在能夠選擇的槽位值為“V1”、“v2”、...、“vx”多個、某一個槽位值Vi比40 %大、與槽位值Vi不同的某一個槽位值Vj比40 %大的情況下,選擇Vi以及Vj作為槽位值。并且,在選擇了V1以及W作為槽位值的情況下,會話生成部121生成“^或^怎么樣?(How about Vi or Vj?)”這一應(yīng)答文。
[0076]另外,會話生成部121在能夠選擇的槽位值為“V1”、“v2”、...、“vx”多個、任何槽位值V1都比40%小的情況下,不選擇槽位值。另外,在不選擇槽位值的情況下,會話生成部121生成“想要哪個XX(槽位名)?(What XX(slot name)do you want?)”這一應(yīng)答文。
[0077]另外,自然語言處理器102取得表示用戶對應(yīng)答文的回答的文本信息。自然語言處理器102判斷文本信息例如為“是”等肯定的回答、或者回答信息例如為“不是”等否定的回答。自然語言處理器102向權(quán)重值更新部122輸出表示用戶的回答是否為肯定的回答信息。權(quán)重值更新部122根據(jù)用戶的回答是否為從多個第2節(jié)點中選擇一個第2節(jié)點的回答,更新權(quán)重值。即,在回答信息為肯定的回答的情況下,權(quán)重值更新部122重新計算與能夠選擇的多個槽位值相對應(yīng)的概率并進行更新。另一方面,在回答信息為否定的回答的情況下,會話生成部121生成用于使用戶選擇多個槽值的某一個的應(yīng)答文。
[0078]聲音合成部105將由會話管理部104生成的應(yīng)答文轉(zhuǎn)換為聲音。由聲音合成部105轉(zhuǎn)換后的聲音被從揚聲器(未圖不)輸出。
[0079]此外,在圖2所示的聲音對話系統(tǒng)中,一個裝置也可以具備聲音識別部101、自然語言處理器102、存儲器103、會話管理部104以及聲音合成部105。另外,聲音識別部101、自然語言處理器102、存儲器103、會話管理部104以及聲音合成部105也可以分散于多個裝置。例如,終端裝置也可以具備聲音識別部101以及聲音合成部105,經(jīng)由網(wǎng)絡(luò)以能夠進行通信的方式與終端裝置連接的服務(wù)器也可以具備自然語言處理器102、存儲器103以及會話管理部104。
[0080]接下來,對本實施方式中的聲音對話系統(tǒng)的聲音對話處理進行說明。
[0081]圖4是用于對本實施方式中的聲音對話系統(tǒng)的聲音對話處理進行說明的流程圖。
[0082]首先,在步驟SI中,自然語言處理器102從表示用戶的言語內(nèi)容的言語信息取得詞匯。
[0083]接著,在步驟S2中,自然語言處理器102在含義網(wǎng)絡(luò)存儲部111所存儲的含義網(wǎng)絡(luò)內(nèi)進行檢索,基于與各節(jié)點間相對應(yīng)的關(guān)系信息,從含義網(wǎng)絡(luò)提取與由所提取的詞匯確定的任務(wù)相關(guān)的節(jié)點(槽位以及槽位值)。
[0084]接著,在步驟S3中,會話生成部121決定為了執(zhí)行任務(wù)而需要輸入值的槽位。
[0085]接著,在步驟S4中,會話生成部121從權(quán)重值管理表取得與所決定的槽位相對應(yīng)的多個槽位值的權(quán)重值。
[0086]接著,在步驟S5中,會話生成部121參照判斷條件表存儲部113所存儲的判斷條件表,判斷是否存在滿足判斷條件的權(quán)重值。在此,在判斷為存在滿足判斷條件的權(quán)重值的情況下(在步驟S5中:是),在步驟S6中,會話生成部121將槽位值決定為與滿足判斷條件的權(quán)重值對應(yīng)的槽位值。
[0087]接著,在步驟S7中,會話生成部121使用所決定的槽位值來生成確認應(yīng)答文。確認應(yīng)答文是向用戶確認所決定的槽位值是否可以的應(yīng)答文。
[0088]另一方面,在判斷為滿足判斷條件的權(quán)重值不存在的情況下(在步驟S5中:否),在步驟S8中,會話生成部121生成請求應(yīng)答文。請求應(yīng)答文是向用戶請求從多個能夠選擇的槽位值中選擇所期望的槽位值的應(yīng)答文。
[0089]接下來,對本實施方式中的聲音對話系統(tǒng)的權(quán)重值更新處理進行說明。
[0090]圖5是用于說明本實施方式中的聲音對話系統(tǒng)的權(quán)重值更新處理的流程圖。
[0091 ]首先,在步驟S11中,權(quán)重值更新部122確認由會話生成部121生成的應(yīng)答文所含的槽位值。
[0092]接著,在步驟S12中,權(quán)重值更新部122從自然語言處理器102取得表示用戶對應(yīng)答文的回答是否為肯定的回答信息。
[0093]接著,在步驟S13中,權(quán)重值更新部122判斷回答信息是否為肯定的回答。在此,在判斷為回答信息不為肯定的回答的情況下(在步驟S13中:否),在步驟S14中,權(quán)重值更新部122取得新的槽位值。此時,在能夠選擇的槽位值為兩個的情況下,權(quán)重值更新部122取得未向用戶提示的槽位值作為新的槽位值。另外,在能夠選擇的槽位值為三個以上的情況下,權(quán)重值更新部122取得由用戶選擇的槽位值作為新的槽位值。
[0094]另一方面,在判斷為回答信息為肯定的回答的情況下(在步驟S13中:是),在步驟SI5中,權(quán)重值更新部122重新計算權(quán)重值。
[0095]在此,對權(quán)重值的計算方法進行說明。首先,在由權(quán)重值更新部122計算權(quán)重值之前的權(quán)重值管理表中,保存權(quán)重值的初始值??梢詫δ巢畚贿x擇X個槽位值¥1、V2、…、Vx,用戶的人數(shù)為η人,選擇了各槽位值的用戶的人數(shù)設(shè)為犯、犯、...、NX時,各槽位值的權(quán)重值(概率)用犯/n、N2/n、…、Nx/n來表示。此時,向用戶的人數(shù)η以及選擇了各槽位值的用戶的人數(shù)見、他、"_具代入任意的數(shù)。例如,也可以基于過去的統(tǒng)計數(shù)據(jù),設(shè)定人數(shù)見、他、"_具。另外,權(quán)重值的初始值也可以全部設(shè)定為相同值,例如,在能夠選擇兩個槽位值的情況下,各槽位值的權(quán)重值(概率)的初始值也可以分別設(shè)定為50 %。
[0096]另外,在通過權(quán)重值更新部122對權(quán)重值重新進行計算的情況下,權(quán)重值更新部122在用戶的人數(shù)η上加上I,并且在所選擇的槽位值的人數(shù)Nx上加上I,對能夠選擇的所有的槽位值的權(quán)重值重新進行計算。例如,在選擇了槽位值V2的情況下,各槽位值Vl、V2、…、Vx的權(quán)重值(概率)成為Ni/(η+1)、(Ν2+Ι)/(η+1)、…、Nx/(n+1)。
[0097]接著,在步驟S16中,權(quán)重值更新部122將重新計算出的權(quán)重值存儲于權(quán)重值管理表存儲部112,更新權(quán)重值管理表的權(quán)重值。
[0098]圖6是用于說明本實施方式中的聲音對話系統(tǒng)的聲音對話處理與以往的聲音對話系統(tǒng)的聲音對話處理的差異的圖。圖6示出在漢堡店、用戶點漢堡套餐時的聲音對話處理的一例。
[0099]首先,用戶對聲音對話系統(tǒng),說出為“請給我漢堡套餐?!?。
[0100]在以往的聲音對話系統(tǒng)中,從用戶的言語提取“漢堡套餐”這一詞匯,確定與所提取的詞匯對應(yīng)的任務(wù)框架。該情況下,確定出提供漢堡套餐的任務(wù)框架。接著,以往的聲音對話系統(tǒng)確定執(zhí)行所確定的任務(wù)框架所需的槽位,向用戶詢問選擇與所確定的槽位對應(yīng)的多個槽位值中的哪個槽位值。在圖6所示的例子中,槽位為飲料,槽位值為可樂、茶、橙汁等。以往的聲音對話系統(tǒng)生成“飲料要什么?”這一應(yīng)答文405而進行聲音輸出。對此,用戶回答為“要可樂?!?。進而,以往的聲音對話系統(tǒng)為了確認由用戶說出的內(nèi)容,生成“飲料要可樂就行嗎?”這一應(yīng)答文而進行聲音輸出。然后,用戶回答為“是?!?。當從用戶取得肯定的回答時,以往的聲音對話系統(tǒng)設(shè)定任務(wù)框架的槽位值,執(zhí)行任務(wù)框架。此時,在向任務(wù)框架內(nèi)的所有必須槽位輸入了值的情況下,執(zhí)行與任務(wù)框架對應(yīng)的任務(wù)。在未向所有必須槽位輸入值的情況下,對用戶進行敦促值的輸入之類的詢問等。
[0101]另一方面,在本實施方式中的聲音對話系統(tǒng)中,從用戶的言語提取“漢堡套餐”這一詞匯,從含義網(wǎng)絡(luò)提取與由提取的詞匯確定的任務(wù)相關(guān)的節(jié)點(域、槽位以及槽位值)。在圖6所示的例子中,域400為“漢堡套餐”,槽位401為“飲料”,槽位值402、403、404為“可樂”、“茶”以及“橙汁”等。
[0102]接著,本實施方式的聲音對話系統(tǒng)中,決定為了執(zhí)行任務(wù)而需要輸入值的槽位。在此,所決定的槽位為飲料。接著,本實施方式中的聲音對話系統(tǒng)從權(quán)重值管理表取得與所決定的槽位相對應(yīng)的多個槽位值的權(quán)重值。在圖6所示的例子中,作為槽位值的可樂的權(quán)重值為60%,作為槽位值的茶的權(quán)重值為20%,作為槽位值的橙汁的權(quán)重值為5%。
[0103]接著,本實施方式中的聲音對話系統(tǒng)判斷是否存在滿足判斷條件的權(quán)重值。該情況下,由于可樂的權(quán)重值為60%,因此,本實施方式中的聲音對話系統(tǒng)判斷為存在滿足判斷條件的權(quán)重值。接著,本實施方式中的聲音對話系統(tǒng)將槽位值決定為“可樂”。然后,本實施方式中的聲音對話系統(tǒng)生成“要可樂嗎?”這一應(yīng)答文406而輸出聲音。對此,用戶回答為“是?!?。當從用戶取得肯定的回答時,本實施方式中的聲音對話系統(tǒng)執(zhí)行在提供漢堡套餐時針對用戶的言語生成應(yīng)答文的任務(wù)。
[0104]如上所述,在以往的系統(tǒng)中,系統(tǒng)向用戶詢問選擇哪種飲料,通過聲音識別判斷用戶的回答。在用戶選擇了可樂的情況下,以往的系統(tǒng)再次詢問可樂可以嗎,通過聲音識別判斷用戶的回答,決定飲料。
[0105]與此相對,在本公開的系統(tǒng)中,系統(tǒng)不向用戶詢問選擇哪種飲料,而是根據(jù)過去用戶選擇了哪種飲料而對各個飲料賦予權(quán)重值,根據(jù)權(quán)重值,詢問是否選擇可樂。例如,在過去可樂以60%的概率被選擇的情況下,本公開的系統(tǒng)向用戶確認飲料可以為可樂嗎。然后,本公開的系統(tǒng)通過聲音識別判斷用戶的回答,如果從用戶得到肯定的回答,則將飲料決定為可樂。
[0106]該情況下,本公開的系統(tǒng)與以往的系統(tǒng)相比,無需再次確認飲料,能夠縮短系統(tǒng)與用戶的對話時間,并且能夠縮短系統(tǒng)的處理時間。
[0107]接下來,對本實施方式中的聲音對話系統(tǒng)的變形例進行說明。
[0108]圖7是表示本實施方式的變形例中的聲音對話系統(tǒng)的含義網(wǎng)絡(luò)的一例的圖。圖7所示的含義網(wǎng)絡(luò)示出在檢索餐廳時使用的含義網(wǎng)絡(luò)的一例。
[0109]在圖7中,表示“餐廳”的節(jié)點21與表示“地域(area)”的節(jié)點22和表示“種類(type)”的節(jié)點23相鏈接。表示“地域”的節(jié)點22以及表示“種類(type)”的節(jié)點23是必須的槽位。表示“地域”的節(jié)點22與表示“北”的節(jié)點24和表示“南”的節(jié)點25相鏈接。表示“北”的節(jié)點24以及表示“南”的節(jié)點25是表示“地域”的節(jié)點(槽位)22的槽位值。另外,表示“種類”的節(jié)點23與表示“印度餐”的節(jié)點26、表示“中餐”的節(jié)點27、表示“美餐”的節(jié)點28相鏈接。表示“印度餐”的節(jié)點26、表示“中餐”的節(jié)點27以及表示“美餐”的節(jié)點28是表示“種類”的節(jié)點(槽位)23的槽位值。
[0110]進一步,在圖7所示的變形例中,不同的槽位的槽位值相鏈接,表示“北”的節(jié)點(槽位值)24與表示“印度餐”的節(jié)點(槽位值)26、表示“中餐”的節(jié)點(槽位值)27、表示“美餐”的節(jié)點(槽位值)28鏈接。對于表示“北”的節(jié)點24與表示“印度餐”的節(jié)點26的連接,賦予例如30%的權(quán)重值。另外,對于表示“北”的節(jié)點24與表示“中餐”的節(jié)點27的連接,賦予例如60%的權(quán)重值。進一步,對于表示“北”的節(jié)點24與表示“美餐”的節(jié)點(槽位值)28的連接,賦予例如10%的權(quán)重值。也即是,在過去,選擇了北的地域后,選擇了印度餐的概率為30%,選擇了北的地域后,選擇了中餐的概率為60%,選擇了北的地域后選擇了美餐的概率為10%。
[0111]在本公開的系統(tǒng)中,在用戶說出“搜索位于城鎮(zhèn)的北部的餐廳。(I’mlooking fora restaurant at the north part of town.)”的情況下,向用戶確認是否選擇中餐店,通過聲音識別判斷用戶的回答,決定餐廳。
[0112]權(quán)重值管理表存儲部112使權(quán)重值與如下組合相對應(yīng)地進行存儲,該組合為與多個第I節(jié)點中的一個第I節(jié)點相關(guān)聯(lián)的多個第2節(jié)點中的一個第2節(jié)點和與所述多個第I節(jié)點中的其他的第I節(jié)點相關(guān)聯(lián)的多個第2節(jié)點各自的組合。在此,第I節(jié)點為槽位,第2節(jié)點為槽位值。
[0113]自然語言處理器102判斷是否確定了一個第2節(jié)點。會話生成部121在確定了一個第2節(jié)點的情況下,基于同一個第2節(jié)點和與其他的第I節(jié)點相關(guān)聯(lián)的多個第2節(jié)點各自的組合相對應(yīng)的權(quán)重值,從與其他的第I節(jié)點相關(guān)聯(lián)的多個第2節(jié)點中選擇一個第2節(jié)點。
[0114]接下來,對本實施方式的變形例中的聲音對話系統(tǒng)的聲音對話處理進行說明。
[0115]圖8是用于說明本實施方式的變形例中的聲音對話系統(tǒng)的聲音對話處理的流程圖。
[0116]步驟S21以及步驟S22的處理與圖4所示的步驟SI以及步驟S2的處理相同,因此省略說明。
[0117]接著,在步驟S23中,自然語言處理器102判斷含義網(wǎng)絡(luò)內(nèi)的任意的槽位是否被確定。例如,在圖7所示的例子中,從用戶的言語內(nèi)容確定了表示“地域”的槽位。在此,在判斷為任意的槽位被確定的情況下(在步驟S23中:是),在步驟S24中,自然語言處理器102選擇所確定的槽位。
[0118]接著,在步驟S25中,自然語言處理器102選擇與所確定的槽位鏈接的下一槽位。例如,在圖7所示的例子中,與表示“地域”的槽位鏈接的表示“種類”的槽位會被選擇。
[0119]接著,在步驟S26中,會話生成部121從權(quán)重值管理表取得與所確定的槽位的槽位值和所選擇的下一槽位的多個槽位值相對應(yīng)的權(quán)重值。此外,權(quán)重值管理表使權(quán)重值與如下組合相對應(yīng)地進行存儲,該組合為與多個槽位中的一個槽位相關(guān)聯(lián)的多個槽位值中的一個槽位值和與多個槽位中的其他的槽位相關(guān)聯(lián)的多個槽位值各自的組合。
[0120]接著,在步驟S27中,會話生成部121參照判斷條件表存儲部113所存儲的判斷條件表,判斷是否存在滿足判斷條件的權(quán)重值。在此,在判斷為存在滿足判斷條件的權(quán)重值的情況下(在步驟S27中:是),在步驟S28中,會話生成部121將槽位值決定為與滿足判斷條件的權(quán)重值對應(yīng)的槽位值。例如,在圖7所示的例子中,會決定表示“中餐”的槽位值。
[0121]接著,在步驟S29中,會話生成部121使用所決定的槽位值來生成確認應(yīng)答文。確認應(yīng)答文是向用戶確認所決定的槽位值可以嗎的應(yīng)答文。例如,在圖7所示的例子中,會生成“中餐店如何?(How about a Chinese restaurant?)”這一確認應(yīng)答文。
[0122]另一方面,在判斷為未確定任意的槽位的情況下(在步驟S23中:否),或者,在判斷為不存在滿足判斷條件的權(quán)重值的情況下(在步驟S270中:否),在步驟S30中,會話生成部121生成請求應(yīng)答文。請求應(yīng)答文是向用戶請求從多個能夠選擇的槽位值中選擇所期望的槽位值的應(yīng)答文。例如,在圖7所示的例子中,在用戶說出“搜索餐廳。”的情況下,聲音對話系統(tǒng)需要決定表示“地域”以及“種類”的槽位。因此,會話生成部121生成用于選擇“地域”以及“種類”中的哪一個的槽位的槽位值的請求應(yīng)答文。例如,會話生成部121生成“北部和南部中的哪一個? ”這一請求應(yīng)答文、或“選擇印度餐、中餐以及美餐中的哪個?”這一請求應(yīng)答文。
[0123]此外,在步驟23中,在判斷為未確定任意的槽位的情況下,也可以結(jié)束聲音對話處理。
[0124]另外,本實施方式中的權(quán)重值表示能夠選擇的槽位值各自在過去被用戶選擇的概率,但本公開并不特別限定于此,也可以對能夠選擇的槽位值分別賦予值。例如,權(quán)重值更新部122也可以在由用戶選擇了槽位值的情況下,對所選擇的槽位值的權(quán)重值加I。
[0125]另外,聲音對話系統(tǒng)也可以對槽位值設(shè)定任意的權(quán)重值。例如,通過使銷售店特別想銷售的商品的槽位值的權(quán)重值比其他的商品的槽位值的權(quán)重值高,能夠向用戶推薦特別想銷售的商品。
[0126]另外,聲音對話系統(tǒng)也可以根據(jù)時期(季節(jié))設(shè)定任意的權(quán)重值。對于所參照的頻度根據(jù)時期不同而較大地變化的槽位,也可以在該時期到來時,考慮時期的影響而將到當前為止由更新處理更新著的權(quán)重值設(shè)定為任意的值。另外,也可以預(yù)先準備與各個時期對應(yīng)的權(quán)重值的信息,在該時期到來時,將所有的槽位的權(quán)重值變更為任意的值。此時,變更后的值也可以在該時期經(jīng)過之前不是固定的,也可以在進行了設(shè)定之后應(yīng)用權(quán)重值的更新處理。
[0127]另外,在本實施方式中,使用從用戶的聲音轉(zhuǎn)換得到的文本信息,但本公開不特別限定于此,也可以使用通過鍵盤或觸摸面板等輸入設(shè)備直接輸入的文本信息。
[0128]另外,本實施方式的聲音對話系統(tǒng)也可以具備確定說話的用戶的講話者確定部。在該情況下,權(quán)重值管理表按各個所確定的用戶而將槽位值與權(quán)重值相對應(yīng)地存儲。由此,能夠生成與各個用戶對應(yīng)的應(yīng)答文,能夠進一步縮短系統(tǒng)與用戶的對話時間。
[0129]另外,在本實施方式的聲音對話系統(tǒng)中,也可以設(shè)定更新權(quán)重值的期間或次數(shù)。該情況下,聲音對話系統(tǒng)也可以在從開始權(quán)重值的更新經(jīng)過了預(yù)定的期間的情況下,停止權(quán)重值的更新。另外,聲音對話系統(tǒng)也可以在權(quán)重值的更新次數(shù)達到了預(yù)定的次數(shù)的情況下,停止權(quán)重值的更新。隨著權(quán)重值的更新次數(shù)的增加,權(quán)重值有可能收斂于(趨近于)某一定的值。于是,通過設(shè)定更新權(quán)重值的期間或次數(shù),能夠減輕聲音對話系統(tǒng)的處理負擔。
[0130]另外,由于還存在僅在預(yù)定的季節(jié)或預(yù)定的期間銷售的商品等,因此本實施方式的聲音對話系統(tǒng)也可以設(shè)定僅在預(yù)定的季節(jié)或預(yù)定的期間能夠選擇的槽位值,僅在預(yù)定的季節(jié)或預(yù)定的期間更新權(quán)重值。
[0131]為了定量地確認本發(fā)明的效果,進行了模擬實驗。圖9A和圖9B是示出在兩個分別不同的條件下執(zhí)行的對話例的圖。圖9A和圖9B—起示出在漢堡店的同一狀況下,店員與顧客之間所進行的對話的一例。
[0132]在圖9A所示的對話例中,通過以往的聲音對話系統(tǒng)使用的詢問方法(條件)生成店員側(cè)的詢問文,對此進行顧客側(cè)的應(yīng)答。在圖9B所示的對話例中,通過本公開中的聲音對話系統(tǒng)使用的詢問方法(條件)生成店員側(cè)的詢問文,對此進行顧客側(cè)的應(yīng)答。以下,一邊比較這兩個詢問方法(條件)一邊進行說明。
[0133]在圖9A和圖9B中,“要配菜沙拉或炸薯條嗎?(Would you like side salad orFrench fries?)”(會話文 1001)和“要炸薯條?(Would you like French fries?)”(會話文2001)相對應(yīng)。此時,當會話文2001所示的內(nèi)容作為詢問從聲音對話系統(tǒng)輸出時,存在作為“副餐(meal side)”點“炸薯條(french fries)”的概率為閾值以上這一判斷。顧客對此的言語,分別為會話文1002的“炸薯條(french fries)"和會話文2002的“是(Yes)”,詢問與回答都是圖9B所示的例子短,效率高。另外,同樣地,在與會話文1005“想要大、小還是中?(Would you like large, small or medium?)”對應(yīng)的會話文2005中,基于點“中(medium)”的概率高這一統(tǒng)計,從會話文1005向“要中號的嗎?(Would you like medium?)”這一效率高的問法變更,顧客對此的回答,相對于在以往例中會話文1006的“中(medium)”,在本公開中的聲音對話系統(tǒng)的例子中,成為會話文2006的“是(Yes)”,應(yīng)答內(nèi)容變短。
[0134]另一方面,相對于以往例子的會話文1007的“要哪種餐飲?(What kind of mealdrink would you like?)”,在本公開的聲音對話系統(tǒng)的例子中,會話文2007的“要可樂嗎?(Would you like coke?)”作為建議型的詢問被輸出,相對于以往例為短的詢問。但是,顧客對此的應(yīng)答,相對于在以往例中會話文1008的“高維C橙汁(H1-orange lavaburst)”,在本公開的聲音對話系統(tǒng)的例子中,成為會話文2008的“不,要高維C橙汁(N0.H1-orangelavaburst)”這一回答,本公開的聲音對話系統(tǒng)的例子,會話文會部分地變長。在不存在多個期待的概率特別高的選項的情況下,如會話文1003和會話文2003、會話文1004和會話文2004那樣,詢問與回答不存在太大的差異。由圖9A和圖9B中所示的會話例受理的點餐的內(nèi)容分別為點餐受理內(nèi)容1010和點餐內(nèi)容2010,為完全相同的結(jié)果。
[0135]當計數(shù)如此進行的兩個對話的總文字數(shù)時,分別成為91字(英文330字)(1009)和73字(英文273字)(2009),可知:通過本公開的聲音對話系統(tǒng)使用的詢問方法(條件)生成店員側(cè)的詢問文時,會話的文字數(shù)少,即會話短。在此,使用文字數(shù)對兩者進行了比較,但通過對文字數(shù)乘以預(yù)定的系數(shù),能夠推定會話所需的時間。如上所述,在顧客針對店鋪側(cè)的建議型的詢問的回答為否定的情況下,會話所需的時間會部分地變長,但僅在能夠期待顧客針對店鋪側(cè)的建議型的詢問的回答為肯定的概率高的情況下,進行是/否類型的詢問,這樣可以說:與以往例的詢問相比,輸出建議型的詢問的情況下會話所需的時間變長的情況很少發(fā)生(低概率)。
[0136]與該一例同樣地,對100例的下單進行模擬后,對于總文字數(shù),利用以往的方法為28746文字,利用本公開的方法為26168文字。在本公開的方法中,總計的對話的長度與以往例相比削減了 11.4%,確認了本公開的聲音對話系統(tǒng)中的對話方法的效果顯著。
[0137]產(chǎn)業(yè)上的可利用性
[0138]本公開的對話方法、對話程序以及對話系統(tǒng)能夠縮短對話系統(tǒng)與用戶的對話時間,并且能夠縮短對話系統(tǒng)的處理時間,作為對用戶的言語進行應(yīng)答的對話系統(tǒng)中的對話方法、對用戶的言語進行應(yīng)答的對話程序以及針對用戶的言語進行應(yīng)答的對話系統(tǒng)是有用的。
【主權(quán)項】
1.一種對話方法,是對用戶的言語進行應(yīng)答的對話系統(tǒng)中使用的對話方法, 將為了執(zhí)行針對所述用戶的言語生成應(yīng)答文的任務(wù)所需要的多個節(jié)點分別關(guān)聯(lián)地進行存儲, 取得表示所述用戶的言語內(nèi)容的言語信息, 從所述多個節(jié)點中確定與所述言語信息對應(yīng)的第I節(jié)點, 從與所確定的所述第I節(jié)點相關(guān)聯(lián)的多個第2節(jié)點中,基于與所述多個第2節(jié)點分別相對應(yīng)的權(quán)重值,選擇一個第2節(jié)點, 生成與所選擇的所述一個第2節(jié)點對應(yīng)的應(yīng)答文。2.根據(jù)權(quán)利要求1所述的對話方法, 所述權(quán)重值表示所述多個第2節(jié)點過去被所述用戶選擇的概率。3.根據(jù)權(quán)利要求2所述的對話方法, 選擇所述多個第2節(jié)點中的所述概率比預(yù)定值大的第2節(jié)點。4.根據(jù)權(quán)利要求2或3所述的對話方法, 在所述多個第2節(jié)點中不存在所述概率比預(yù)定值大的第2節(jié)點的情況下,生成用于使所述用戶選擇所述多個第2節(jié)點中的任意一個的應(yīng)答文。5.根據(jù)權(quán)利要求1至4中任意一項所述的聲音對話方法, 取得表示所述用戶對所述應(yīng)答文的回答的信息, 根據(jù)所述用戶的回答是否是選擇所述多個第2節(jié)點中的一個第2節(jié)點的回答,更新所述權(quán)重值。6.根據(jù)權(quán)利要求1至5中任意一項所述的對話方法, 所述權(quán)重值同如下組合相對應(yīng),該組合為:與多個第I節(jié)點中的一個第I節(jié)點相關(guān)聯(lián)的多個第2節(jié)點中的一個第2節(jié)點和與所述多個第I節(jié)點中的其他第I節(jié)點相關(guān)聯(lián)的多個第2節(jié)點的各個的組合, 判斷是否確定了所述一個第2節(jié)點, 在確定了所述一個第2節(jié)點的情況下,基于同所述一個第2節(jié)點和與所述其他第I節(jié)點相關(guān)聯(lián)的多個第2節(jié)點的各個的組合相對應(yīng)的權(quán)重值,從與所述其他第I節(jié)點相關(guān)聯(lián)的所述多個第2節(jié)點中選擇一個第2節(jié)點。7.—種記錄介質(zhì),是記錄了對用戶的言語進行應(yīng)答的對話程序的記錄介質(zhì), 使計算機作為下述各部發(fā)揮功能: 存儲部,將為了執(zhí)行針對所述用戶的言語生成應(yīng)答文的任務(wù)所需要的多個節(jié)點分別關(guān)聯(lián)地進彳丁存儲; 取得部,取得表示所述用戶的言語內(nèi)容的言語信息; 確定部,從所述多個節(jié)點中確定與所述言語信息對應(yīng)的第I節(jié)點; 選擇部,從與所述確定部所確定的所述第I節(jié)點相關(guān)聯(lián)的多個第2節(jié)點中,基于與所述多個第2節(jié)點分別相對應(yīng)的權(quán)重值,選擇一個第2節(jié)點;以及 生成部,生成與所述選擇部所選擇的所述一個第2節(jié)點對應(yīng)的應(yīng)答文。8.一種對話系統(tǒng),對用戶的言語進行應(yīng)答,具備: 存儲部,將為了執(zhí)行針對所述用戶的言語生成應(yīng)答文的任務(wù)所需要的多個節(jié)點分別關(guān)聯(lián)地進彳丁存儲; 取得部,取得表示所述用戶的言語內(nèi)容的言語信息; 確定部,從所述多個節(jié)點中確定與所述言語信息對應(yīng)的第I節(jié)點; 選擇部,從與所述確定部所確定的所述第I節(jié)點相關(guān)聯(lián)的多個第2節(jié)點中,基于與所述多個第2節(jié)點分別相對應(yīng)的權(quán)重值,選擇一個第2節(jié)點;以及 生成部,生成與所述選擇部所選擇的所述一個第2節(jié)點對應(yīng)的應(yīng)答文。
【文檔編號】G06F17/27GK106055547SQ201610172808
【公開日】2016年10月26日
【申請日】2016年3月24日 公開號201610172808.7, CN 106055547 A, CN 106055547A, CN 201610172808, CN-A-106055547, CN106055547 A, CN106055547A, CN201610172808, CN201610172808.7
【發(fā)明人】V·高橋, 遠藤充
【申請人】松下知識產(chǎn)權(quán)經(jīng)營株式會社