專利名稱:自然語(yǔ)言對(duì)話方法及其系統(tǒng)的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種自然語(yǔ)言對(duì)話方法及其系統(tǒng),特別是涉及一種根據(jù)用戶喜好及使用習(xí)慣決定候選答案的自然語(yǔ)言對(duì)話方法及其系統(tǒng)。
背景技術(shù):
在計(jì)算機(jī)的自然語(yǔ)言理解(Nature Language Understanding)中,通常會(huì)使用特定的語(yǔ)法來(lái)抓取用戶的輸入語(yǔ)句的意圖或信息。因此,若數(shù)據(jù)庫(kù)中儲(chǔ)存有足夠多的用戶輸入語(yǔ)句的數(shù)據(jù),便能做到合理的判斷。在現(xiàn)有的作法中,有一種是利用內(nèi)置的固定詞列表來(lái)抓取用戶的輸入語(yǔ)句,而固定詞列表中包含了特定的意圖或信息所使用的特定用語(yǔ),而用戶需依照此特定用語(yǔ)來(lái)表達(dá)其意圖或信息,其意圖或信息才能被系統(tǒng)正確識(shí)別。然而,迫使用戶去記住固定詞列表的每個(gè)特定用語(yǔ)是相當(dāng)不人性化的作法。例如現(xiàn)有技術(shù)使用固定詞列表的實(shí)施方式,要求用戶在詢問(wèn)天氣的時(shí)候必須說(shuō)“上海(或北京)明天(或后天)天氣如何? ”,而若用戶使用其他比較自然的口語(yǔ)化表達(dá)也想詢問(wèn)天氣狀況時(shí),比如是“上海明天怎么樣?。俊?,因?yàn)檎Z(yǔ)句中未出現(xiàn)“天氣”,所以現(xiàn)有技術(shù)就會(huì)理解成“上海有個(gè)叫明天的地方”,這樣顯然沒(méi)有抓到用戶的真正意圖。另外,用戶所使用的語(yǔ)句種類是十分復(fù)雜的,并且又時(shí)常有所變化,甚至有時(shí)用戶可能會(huì)輸入錯(cuò)誤的語(yǔ)句,在此情況下必須要藉由模糊匹配的方式來(lái)抓取用戶的輸入語(yǔ)句。因此,僅提供僵化輸入規(guī)則的固定詞列表所能達(dá)到的效果就更差了。此外,當(dāng)利用自然語(yǔ)言理解來(lái)處理多種類型的用戶意圖時(shí),有些相異的意圖的語(yǔ)法結(jié)構(gòu)卻是相同的,例如當(dāng)用戶的輸入語(yǔ)句為"我要看三國(guó)演義",其用戶意圖有可能是想看三國(guó)演義的電影,或是想看三國(guó)演義的書,因此通常在此情況中,便會(huì)匹配到兩種可能意圖來(lái)讓用戶做選擇。然而,在很多情況下,提供不必要的可能意圖來(lái)讓用戶做選擇是十分多余且沒(méi)效率的。例如,當(dāng)用戶的輸入語(yǔ)句為〃我想看超級(jí)星光大道〃時(shí),將使用者的意圖匹配為看超級(jí)星光大道的書或者畫作是十分沒(méi)必要的(因?yàn)槌?jí)星光大道是電視節(jié)目)。再者,一般而言,在全文檢索中所獲得的搜尋結(jié)果是非結(jié)構(gòu)化的數(shù)據(jù)。非結(jié)構(gòu)化數(shù)據(jù)內(nèi)的信息是分散且不具關(guān)聯(lián)的,例如,在google或百度等搜尋引擎輸入關(guān)鍵字后,所獲得的網(wǎng)頁(yè)搜尋結(jié)果就是非結(jié)構(gòu)化數(shù)據(jù),因?yàn)樗褜そY(jié)果必須通過(guò)人為的逐項(xiàng)閱讀才能找到當(dāng)中的有用信息,而這樣的作法不僅浪費(fèi)用戶的時(shí)間,而且可能漏失想要的信息,所以在實(shí)用性上會(huì)受到很大的限制。
發(fā)明內(nèi)容
本發(fā)明提出一種自然語(yǔ)言對(duì)話系統(tǒng),包括一特性數(shù)據(jù)庫(kù)、一語(yǔ)音取樣模塊及一自然語(yǔ)言理解模塊,其中自然語(yǔ)言理解模塊耦接于特性數(shù)據(jù)庫(kù)及語(yǔ)音取樣模塊。語(yǔ)音取樣模塊接收一第一語(yǔ)音輸入,隨后由自然語(yǔ)言理解模塊解析第一語(yǔ)音輸入中所包括的至少一特征語(yǔ)義并獲得一候選列表,其中候選列表具有至少一候選答案;自然語(yǔ)言理解模塊依據(jù)一特性數(shù)據(jù)庫(kù),自候選列表中選擇至少一候選答案中的其中之一為一回報(bào)答案,且依據(jù)回報(bào)答案輸出一第一語(yǔ)音應(yīng)答,語(yǔ)音取樣模塊并接收其他多個(gè)語(yǔ)音輸入,自然語(yǔ)言理解模塊再?gòu)闹袛X取用戶喜好屬性,并將用戶喜好屬性儲(chǔ)存至特性數(shù)據(jù)庫(kù)。本發(fā)明提出一種自然語(yǔ)言對(duì)話方法,包括下列步驟接收一第一語(yǔ)音輸入;解析第一語(yǔ)音輸入中所包括的至少一特征語(yǔ)義并獲得一候選列表,其中候選列表具有至少一候選答案;依據(jù)一特性數(shù)據(jù)庫(kù)自候選列表中選擇至少一候選答案中的其中之一為一回報(bào)答案;依據(jù)回報(bào)答案輸出一第一語(yǔ)音應(yīng)答;接收其他多個(gè)語(yǔ)音輸入;根據(jù)其他多個(gè)語(yǔ)音輸入擷取用戶喜好屬性;以及將用戶喜好屬性儲(chǔ)存至特性數(shù)據(jù)庫(kù)?;谏鲜觯景l(fā)明提出一種自然語(yǔ)言對(duì)話方法及其系統(tǒng),自然語(yǔ)言對(duì)話系統(tǒng)還可依據(jù)眾人使用習(xí)慣、用戶喜好、用戶習(xí)慣或用戶所說(shuō)的前后對(duì)話等等方式,來(lái)優(yōu)先選出較適當(dāng)?shù)幕貓?bào)答案,據(jù)以輸出語(yǔ)音應(yīng)答予用戶,藉以增進(jìn)用戶與自然語(yǔ)言對(duì)話系統(tǒng)進(jìn)行對(duì)話時(shí)的便利性。為使本發(fā)明的上述特征和優(yōu)點(diǎn)能更明顯易懂,下文特舉實(shí)施例,并結(jié)合附圖詳細(xì)說(shuō)明如下。
圖1為根據(jù)本發(fā)明的一實(shí)施例的自然語(yǔ)言理解系統(tǒng)的方塊圖。圖2為根據(jù)本發(fā)明的一實(shí)施例的自然語(yǔ)言處理器對(duì)用戶的各種請(qǐng)求信息的分析結(jié)果的示意圖。圖3A是根據(jù)本發(fā)明的一實(shí)施例的結(jié)構(gòu)化數(shù)據(jù)庫(kù)所儲(chǔ)存的具有特定數(shù)據(jù)結(jié)構(gòu)的多個(gè)記錄的示意圖。圖3B是根據(jù)本發(fā)明的另一實(shí)施例的結(jié)構(gòu)化數(shù)據(jù)庫(kù)所儲(chǔ)存的具有特定數(shù)據(jù)結(jié)構(gòu)的多個(gè)記錄的示意圖。圖3C是根據(jù)本發(fā)明的另一實(shí)施例的指引數(shù)據(jù)儲(chǔ)存裝置所儲(chǔ)存的指引數(shù)據(jù)的架構(gòu)示意圖。圖4A為根據(jù)本發(fā)明的一實(shí)施例的檢索方法的流程圖。圖4B為根據(jù)本發(fā)明的另一實(shí)施例的自然語(yǔ)言理解系統(tǒng)工作過(guò)程的流程圖。圖5A是依照本發(fā)明一實(shí)施例所繪示的自然語(yǔ)言對(duì)話系統(tǒng)的方塊圖。圖5B是依照本發(fā)明一實(shí)施例所繪示的自然語(yǔ)言理解模塊的方塊圖。圖5C是依照本發(fā)明另一實(shí)施例所繪示的自然語(yǔ)言對(duì)話系統(tǒng)的方塊圖。圖6是依照本發(fā)明一實(shí)施例所繪示的修正語(yǔ)音應(yīng)答的方法流程圖。圖7A是依照本發(fā)明一實(shí)施例所繪示的自然語(yǔ)言對(duì)話系統(tǒng)的方塊圖。圖7B是依照本發(fā)明另一實(shí)施例所繪示的自然語(yǔ)言對(duì)話系統(tǒng)的方塊圖。圖8是依照本發(fā)明一實(shí)施例所繪示的自然語(yǔ)言對(duì)話方法流程圖。圖9為依據(jù)本發(fā)明一實(shí)施例的移動(dòng)終端裝置的系統(tǒng)示意圖。圖10為依據(jù)本發(fā)明一實(shí)施例的信息系統(tǒng)的系統(tǒng)示意圖。圖11為依據(jù)本發(fā)明一實(shí)施例的基于語(yǔ)音識(shí)別的選擇方法的流程圖。圖12是依照本發(fā)明一實(shí)施例所繪示的語(yǔ)音操控系統(tǒng)的方塊圖。圖13所示是語(yǔ)音操控系統(tǒng)的方塊圖。圖14是依照本發(fā)明一實(shí)施例所繪示的語(yǔ)音操控方法的流程圖。
附圖符號(hào)說(shuō)明100 :自然語(yǔ)言理解系統(tǒng)102,505,705 :請(qǐng)求信息104 :分析結(jié)果106 :可能意圖語(yǔ)法數(shù)據(jù)108 :關(guān)鍵字110:回應(yīng)結(jié)果112:意圖數(shù)據(jù)114:確定意圖語(yǔ)法數(shù)據(jù)116:分析結(jié)果輸出模塊200 :檢索系統(tǒng)220:結(jié)構(gòu)化數(shù)據(jù)庫(kù)240 :搜尋引擎260:檢索接口單元280:指引數(shù)據(jù)儲(chǔ)存裝置300 自然語(yǔ)言處理器302 :記錄304 :標(biāo)題欄3O6:內(nèi)容欄308 :分欄310:指引欄312:數(shù)值欄314 :來(lái)源欄316 :熱度欄400 :知識(shí)輔助理解模塊500、500’、700、700’ 自然語(yǔ)言對(duì)話系統(tǒng)501、701 :語(yǔ)首輸入503,703 :解析結(jié)果507,707 :語(yǔ)音應(yīng)答5O9JO9:特征語(yǔ)義510、710 :語(yǔ)音取樣模塊511、711 :候選列表520、520’、720、720’ 自然語(yǔ)言理解模塊522、722 :語(yǔ)音識(shí)別模塊524、724 自然語(yǔ)言處理模塊526、726 :語(yǔ)音合成模塊702 :語(yǔ)音綜合處理模塊730 :特性數(shù)據(jù)庫(kù)740:自然語(yǔ)言數(shù)據(jù)庫(kù)
900、1010 :移動(dòng)終端裝置910、1011 :語(yǔ)音接收單元920、1013 :數(shù)據(jù)處理單元930、1015 :顯示單元940 :存儲(chǔ)單元1000 :信息系統(tǒng)1020 :伺服器SPl :第一語(yǔ)音SP2 :第二語(yǔ)音1200、1300 :語(yǔ)音操控系統(tǒng)1210 :輔助啟動(dòng)裝置1212、1222 :無(wú)線傳輸模塊1214:觸發(fā)模塊1216:無(wú)線充電電池I2I62:電池單元12164:無(wú)線充電模塊1220、1320 :移動(dòng)終端裝置1221 :語(yǔ)音系統(tǒng)1224 :語(yǔ)音取樣模塊1226 :語(yǔ)音合成模塊1227:語(yǔ)音輸出接口1228 :通訊模塊1230 (云端)伺服器1232 :語(yǔ)音理解模塊12322 :語(yǔ)音識(shí)別模塊12324 :語(yǔ)音處理模塊
具體實(shí)施例方式由于現(xiàn)有運(yùn)用固定詞列表的實(shí)施方式只能提供僵化的輸入規(guī)則,對(duì)于用戶多變的輸入語(yǔ)句的判斷能力十分不足,所以常導(dǎo)致對(duì)用戶的意圖判斷錯(cuò)誤而找不到所需的信息、或是因?yàn)榕袛嗔Σ蛔愣敵霾槐匾男畔⒔o用戶等問(wèn)題。此外,現(xiàn)有的搜尋引擎只能對(duì)用戶提供分散、且相關(guān)不強(qiáng)的搜尋結(jié)果,于是用戶還要花時(shí)間逐條檢視才能過(guò)濾出所需信息,不僅浪費(fèi)時(shí)間而且可能漏失所需信息。本發(fā)明即針對(duì)現(xiàn)有技術(shù)的前述問(wèn)題提出一結(jié)構(gòu)化數(shù)據(jù)的檢索方法與系統(tǒng),在結(jié)構(gòu)化數(shù)據(jù)提供特定的欄位來(lái)儲(chǔ)存不同類型的數(shù)據(jù)元素,俾提供用戶使用自然語(yǔ)音輸入信息進(jìn)行檢索時(shí),能快速且正確地判斷用戶的意圖,進(jìn)而提供所需信息予用戶、或提供更精確訊息供其選取。圖1為根據(jù)本發(fā)明的一實(shí)施例的自然語(yǔ)言理解系統(tǒng)的方塊圖。如圖1所示,自然語(yǔ)言理解系統(tǒng)100包括檢索系統(tǒng)200、自然語(yǔ)言處理器300以及知識(shí)輔助理解模塊400,知識(shí)輔助理解模塊400耦接自然語(yǔ)言處理器300以及檢索系統(tǒng)200,檢索系統(tǒng)200還包括結(jié)構(gòu)化數(shù)據(jù)庫(kù)220、搜尋引擎240以及檢索接口單元260,其中搜尋引擎240耦接結(jié)構(gòu)化數(shù)據(jù)庫(kù)220以及檢索接口單元260。在本實(shí)施例中,檢索系統(tǒng)200包括有檢索接口單元260,但非以限定本發(fā)明,某些實(shí)施例中可能沒(méi)有檢索接口單元260,而以其他方式使搜尋引擎240對(duì)結(jié)構(gòu)化數(shù)據(jù)庫(kù)220進(jìn)行全文檢索。當(dāng)用戶對(duì)自然語(yǔ)言理解系統(tǒng)100發(fā)出請(qǐng)求信息102時(shí),自然語(yǔ)言處理器300可分析請(qǐng)求信息102,并在將所分析的可能意圖語(yǔ)法數(shù)據(jù)106送往知識(shí)輔助理解模塊400,其中可能意圖語(yǔ)法數(shù)據(jù)106包含關(guān)鍵字108與意圖數(shù)據(jù)112。隨后,知識(shí)輔助理解模塊400取出可能意圖語(yǔ)法數(shù)據(jù)106中的關(guān)鍵字108并送往檢索系統(tǒng)200并將意圖數(shù)據(jù)112儲(chǔ)存在知識(shí)輔助理解模塊400內(nèi)部,而檢索系統(tǒng)200中的搜尋引擎240將依據(jù)關(guān)鍵字108對(duì)結(jié)構(gòu)化數(shù)據(jù)庫(kù)220進(jìn)行全文檢索之后,再將全文檢索的回應(yīng)結(jié)果110回傳至知識(shí)輔助理解模塊400。接著,知識(shí)輔助理解模塊400依據(jù)回應(yīng)結(jié)果110對(duì)所儲(chǔ)存的意圖數(shù)據(jù)112進(jìn)行比對(duì),并將所求得的確定意圖語(yǔ)法數(shù)據(jù)114送往分析結(jié)果輸出模塊106,而分析結(jié)果輸出模塊116再依據(jù)確定意圖語(yǔ)法數(shù)據(jù)114,傳送分析結(jié)果104至伺服器,隨后在查詢到用戶所需的數(shù)據(jù)后將其送給用戶。上述的分析結(jié)果輸出模塊116可視情況與其他模塊相結(jié)合,例如在一實(shí)施例中可并入知識(shí)輔助理解模塊400中、或是在另一實(shí)施例中分離于自然語(yǔ)言理解系統(tǒng)100而位于伺服器(包含自然語(yǔ)言理解系統(tǒng)100者)中,于是伺服器將直接接收意圖語(yǔ)法數(shù)據(jù)114再進(jìn)行處理。此外,知識(shí)輔助理解模塊400可將意圖數(shù)據(jù)112儲(chǔ)存在模塊內(nèi)部的儲(chǔ)存裝置中、在自然語(yǔ)言理解系統(tǒng)100中、伺服器中(包含自然語(yǔ)言理解系統(tǒng)100者)、或是在任何可供知識(shí)輔助理解模塊400可以擷取到的儲(chǔ)存器中,本發(fā)明對(duì)此并不加以限定。再者,自然語(yǔ)言理解系統(tǒng)100包括檢索系統(tǒng)200、自然語(yǔ)言處理器300以及知識(shí)輔助理解模塊400可以用硬件、軟件、固件、或是上述方式的各種結(jié)合方式來(lái)構(gòu)筑,本發(fā)明亦未對(duì)此進(jìn)行限制。前述自然語(yǔ)言理解系統(tǒng)100可以位于云端伺服器中,也可以位于區(qū)域網(wǎng)路中的伺服器,甚或是位于個(gè)人計(jì)算機(jī)、移動(dòng)計(jì)算機(jī)裝置(如筆記型計(jì)算機(jī))或移動(dòng)通訊裝置(如手機(jī))等。自然語(yǔ)言理解系統(tǒng)100或檢索系統(tǒng)200中的各構(gòu)件也不一定需設(shè)置在同一機(jī)器中,而可視實(shí)際需要分散在不同裝置或系統(tǒng)通過(guò)各種不同的通訊協(xié)定來(lái)連結(jié)。例如,自然語(yǔ)言理解處理器300及知識(shí)輔助理解模塊400可配置于同一智能型手機(jī)內(nèi),而檢索系統(tǒng)200可配置在另一云端伺服器中;或者是,檢索接口單元260、自然語(yǔ)言理解處理器300及知識(shí)輔助理解模塊400可配置于同一筆記型計(jì)算機(jī)內(nèi),而搜尋引擎240及結(jié)構(gòu)化數(shù)據(jù)庫(kù)220可配置于區(qū)域網(wǎng)路中的另一伺服器中。此外,當(dāng)自然語(yǔ)言理解系統(tǒng)100皆位于伺服器時(shí)(不論是云端伺服器或區(qū)域網(wǎng)路伺服器),可以將檢索系統(tǒng)200、自然語(yǔ)言理解處理器300、以及知識(shí)輔助理解模塊400配置不同的計(jì)算機(jī)主機(jī)中,并由伺服器主系統(tǒng)來(lái)統(tǒng)籌其相互間的訊息與數(shù)據(jù)的傳送。當(dāng)然,檢索系統(tǒng)200、自然語(yǔ)言理解處理器300、以及知識(shí)輔助理解模塊400亦可視實(shí)際需求而將其中兩者或全部合并在一計(jì)算機(jī)主機(jī)中,本發(fā)明并不對(duì)這部分的配置進(jìn)行限制。在本發(fā)明的實(shí)施例中,用戶可以用各種方式來(lái)向自然語(yǔ)言處理器300發(fā)出請(qǐng)求信息,例如用說(shuō)話的語(yǔ)音輸入或是文字描述等方式來(lái)發(fā)出請(qǐng)求信息。舉例來(lái)說(shuō),若自然語(yǔ)言理解系統(tǒng)100是位于云端或區(qū)域網(wǎng)路中的伺服器(未顯示)內(nèi),則用戶可先藉由移動(dòng)裝置(例如手機(jī)、PDA、平板計(jì)算機(jī)或類似系統(tǒng))來(lái)輸入請(qǐng)求信息102,接著再通過(guò)電信系統(tǒng)業(yè)者來(lái)將請(qǐng)求信息102傳送至伺服器中的自然語(yǔ)言理解系統(tǒng)100,來(lái)讓自然語(yǔ)言處理器300進(jìn)行請(qǐng)求信息102的分析,最后伺服器于確認(rèn)用戶意圖后,再通過(guò)分析結(jié)果輸出模塊116將對(duì)應(yīng)的分析結(jié)果104通過(guò)伺服器的處理后,將用戶所請(qǐng)求的信息傳回用戶的移動(dòng)裝置。舉例來(lái)說(shuō),請(qǐng)求信息102可以是用戶希望藉由自然語(yǔ)言理解系統(tǒng)100來(lái)求得答案的問(wèn)題(例如"明天上海的天氣怎么樣啊〃),而自然語(yǔ)言理解系統(tǒng)100在分析出用戶的意圖是查詢上海明天的天氣時(shí),將通過(guò)分析結(jié)果輸出模塊116將所查詢的天氣數(shù)據(jù)作為輸出結(jié)果104送給用戶。此夕卜,若用戶對(duì)自然語(yǔ)言理解系統(tǒng)100所下的指令為〃我要看讓子彈飛〃、〃我想聽(tīng)一起走過(guò)的日子〃時(shí),因?yàn)椤白屪訌楋w”或“一起走過(guò)的日子”可能包含不同的領(lǐng)域,所以自然語(yǔ)言處理器300會(huì)將用戶的請(qǐng)求信息102分析成一個(gè)或一個(gè)以上的可能意圖語(yǔ)法數(shù)據(jù)106,此可能意圖語(yǔ)法數(shù)據(jù)106包括有關(guān)鍵字108及意圖數(shù)據(jù)112,然后再經(jīng)由對(duì)檢索系統(tǒng)220中的結(jié)構(gòu)化數(shù)據(jù)240進(jìn)行全文檢索后,進(jìn)而確認(rèn)用戶的意圖。進(jìn)一步來(lái)說(shuō),當(dāng)用戶的請(qǐng)求信息102為〃明天上海怎么樣???〃時(shí),自然語(yǔ)言處理器300經(jīng)過(guò)分析后,可產(chǎn)生一個(gè)可能意圖語(yǔ)法數(shù)據(jù)106 //<queryweather>,〈city〉=上海,〈時(shí)間 >=明天"。在一實(shí)施例中,如果自然語(yǔ)言理解系統(tǒng)100認(rèn)為用戶的意圖已相當(dāng)明確,便可以直接將用戶的意圖(亦即查詢明天上海的天氣)通過(guò)分析結(jié)果輸出模塊116輸出分析結(jié)果104至伺服器,而伺服器可在查詢到用戶所指定的天氣候傳送給用戶。又例如,當(dāng)用戶的請(qǐng)求信息102為〃我要看三國(guó)演義〃時(shí),自然語(yǔ)言處理器300經(jīng)過(guò)分析后,可產(chǎn)生出三個(gè)可能意圖語(yǔ)法數(shù)據(jù)106 〃〈readbook>,〈bookname〉=三國(guó)演義”;〃〈watchTV>,〈TVname〉=三國(guó)演義〃;以及〃〈watchfilm>,〈filmname〉=三國(guó)演義"。這是因?yàn)榭赡芤鈭D語(yǔ)法數(shù)據(jù)106中的關(guān)鍵字108(亦即“三國(guó)演義”)可能屬于不同的領(lǐng)域,亦即書籍(〈readbook〉)、電視劇(〈watchTV〉)、以及電影(〈readfilm〉)三個(gè)領(lǐng)域,所以一個(gè)請(qǐng)求信息102可分析成多個(gè)可能意圖語(yǔ)法數(shù)據(jù)106,因此需要通過(guò)知識(shí)輔助理解模塊400做進(jìn)一步分析,來(lái)確認(rèn)用戶的意圖。再舉另一個(gè)例子來(lái)說(shuō),若用戶輸入"我要看讓子彈飛〃時(shí),因其中的〃讓子彈飛〃有可能是電影名稱或是書名稱,所以也可能出現(xiàn)至少以下兩個(gè)可能意圖語(yǔ)法數(shù)據(jù)106 〃〈readbook>,〈bookname〉=讓子彈飛〃;以及〃〈watchfilm>,〈filmname〉=讓子彈飛";其分別屬于書籍與電影兩個(gè)領(lǐng)域。上述的可能意圖語(yǔ)法數(shù)據(jù)106隨后需通過(guò)知識(shí)輔助理解模塊400做進(jìn)一步分析,并從中求得確定意圖語(yǔ)法數(shù)據(jù)114,來(lái)表達(dá)用戶的請(qǐng)求信息的明確意圖。當(dāng)知識(shí)輔助理解模塊400分析可能意圖語(yǔ)法數(shù)據(jù)106時(shí),知識(shí)輔助理解模塊400可通過(guò)檢索接口 206傳送關(guān)鍵字108 (例如上述的“三國(guó)演義”或“讓子彈飛”)給檢索系統(tǒng)200。檢索系統(tǒng)200中的結(jié)構(gòu)化數(shù)據(jù)庫(kù)220儲(chǔ)存了具有特定數(shù)據(jù)結(jié)構(gòu)的多個(gè)記錄,而搜尋引擎240能藉由檢索接口單元260所接收的關(guān)鍵字108來(lái)對(duì)結(jié)構(gòu)化數(shù)據(jù)庫(kù)220進(jìn)行全文檢索,并將全文檢索所獲得的回應(yīng)結(jié)果回傳給知識(shí)輔助理解模塊400,隨后知識(shí)輔助理解模塊400便能藉由此回應(yīng)結(jié)果110來(lái)求得確定意圖語(yǔ)法數(shù)據(jù)114。至于對(duì)結(jié)構(gòu)化數(shù)據(jù)庫(kù)220進(jìn)行全文檢索以確定意圖語(yǔ)法數(shù)據(jù)114的細(xì)節(jié),將在后面通過(guò)圖3A、圖3B與相關(guān)段落做更詳細(xì)的描述。在本發(fā)明的概念中,自然語(yǔ)言理解系統(tǒng)100能先擷取用戶的請(qǐng)求信息102中的關(guān)鍵字108,并藉由結(jié)構(gòu)化數(shù)據(jù)庫(kù)220的全文檢索結(jié)果來(lái)判別關(guān)鍵字108的領(lǐng)域?qū)傩?,例如上述輸入“我要看三?guó)演義”時(shí),會(huì)產(chǎn)生分別屬于書籍、電視劇、電影三個(gè)領(lǐng)域的可能意圖語(yǔ)法數(shù)據(jù)106,隨后再進(jìn)一步分析并確認(rèn)用戶的明確意圖。因此用戶能夠很輕松地以口語(yǔ)化方式來(lái)表達(dá)出其意圖或信息,而不需要特別熟記特定用語(yǔ),例如現(xiàn)有作法中關(guān)于固定詞列表的特定用語(yǔ)。圖2為根據(jù)本發(fā)明的一實(shí)施例的自然語(yǔ)言處理器300對(duì)用戶的各種請(qǐng)求信息的分析結(jié)果的示意圖。如圖2所示,當(dāng)用戶的請(qǐng)求信息102為〃明天上海的天氣怎么樣啊〃時(shí),自然語(yǔ)言處理器300經(jīng)過(guò)分析后,可產(chǎn)生出可能意圖語(yǔ)法數(shù)據(jù)106為://<queryweather>,〈city〉=上海,〈時(shí)間 >=明天”其中意圖數(shù)據(jù)112為〃〈queryweather>〃、而關(guān)鍵字108為〃上?!ㄅc〃明天〃。由于經(jīng)自然語(yǔ)言處理器300的分析后只取得一組意圖語(yǔ)法數(shù)據(jù)106(查詢天氣<queryweather>),因此在一實(shí)施例中,知識(shí)輔助理解模塊400可直接取出關(guān)鍵字108〃上?!ㄅc〃明天〃作為分析結(jié)果104送往伺服器來(lái)查詢天氣的信息(例如查詢明天上海天氣概況、包含氣象、氣溫…等信息),而不需要對(duì)結(jié)構(gòu)化數(shù)據(jù)庫(kù)220進(jìn)行全文檢索來(lái)判定用戶意圖。當(dāng)然,在一實(shí)施例中,仍可對(duì)結(jié)構(gòu)化數(shù)據(jù)庫(kù)220進(jìn)行全文檢索做更精確的用戶意圖判定,本領(lǐng)域技術(shù)人員可依據(jù)實(shí)際需求進(jìn)行變更。此外,當(dāng)用戶的請(qǐng)求信息102為〃我要看讓子彈飛〃時(shí),因?yàn)榭僧a(chǎn)生出兩個(gè)可能意圖語(yǔ)法數(shù)據(jù)106:〃〈readbook>,〈bookname〉=讓子彈飛〃;以及〃〈watchfilm>,〈filmname〉=讓子彈飛";與兩個(gè)對(duì)應(yīng)的意圖數(shù)據(jù)112〃〈readbook>〃與〃〈watchfilm>〃、以及兩個(gè)相同的關(guān)鍵字108〃讓子彈飛〃,來(lái)表示其意圖可能是看〃讓子彈飛〃的書籍或是看〃讓子彈飛〃的電影。為進(jìn)一步確認(rèn)用戶的意圖,將通過(guò)知識(shí)輔助理解模塊400傳送關(guān)鍵字108〃讓子彈飛〃給檢索接口單元260,接著搜尋引擎240便藉由此關(guān)鍵字108〃讓子彈飛〃來(lái)對(duì)結(jié)構(gòu)化數(shù)據(jù)庫(kù)220進(jìn)行全文檢索,以確認(rèn)"讓子彈飛"應(yīng)該是書名稱或是電影名稱,藉以確認(rèn)用戶的意圖。再者,當(dāng)用戶的請(qǐng)求信息102為〃我想聽(tīng)一起走過(guò)的日子〃時(shí),可產(chǎn)生出兩個(gè)可能意圖語(yǔ)法數(shù)據(jù)106:"〈p I aymu s i c >,〈singer〉= 一起走過(guò),〈songname〉=曰子";//<playmusic>, <son gname>= 一起走過(guò)的日子"兩個(gè)對(duì)應(yīng)的相同的意圖數(shù)據(jù)112〃〈playmusic>〃、以及兩組對(duì)應(yīng)的關(guān)鍵字108〃 一起走過(guò)〃與〃日子〃及〃 一起走過(guò)的日子〃,來(lái)分別表示其意圖可能是聽(tīng)歌手〃 一起走過(guò)〃所唱的歌曲〃日子〃、或是聽(tīng)歌曲〃 一起走過(guò)的日子〃,此時(shí)知識(shí)輔助理解模塊400可傳送第一組關(guān)鍵字108〃 一起走過(guò)〃與〃日子〃以及第二組關(guān)鍵字〃 一起走過(guò)的日子〃給檢索接口單元260,來(lái)確認(rèn)是否有〃一起走過(guò)〃這位歌手來(lái)唱的〃日子〃這首歌(第一組關(guān)鍵字所隱含的用戶意圖)、或是否有"一起走過(guò)的日子"這首歌(第二組關(guān)鍵字所隱含的用戶意圖),藉以確認(rèn)用戶的意圖。然而,本發(fā)明并不限于在此所表示的各可能意圖語(yǔ)法數(shù)據(jù)與意圖數(shù)據(jù)所對(duì)應(yīng)的格式與名稱。圖3A是根據(jù)本發(fā)明的一實(shí)施例的結(jié)構(gòu)化數(shù)據(jù)庫(kù)220所儲(chǔ)存的具有特定數(shù)據(jù)結(jié)構(gòu)的多個(gè)記錄的示意圖。一般而言,在一些現(xiàn)有的全文檢索作法中,所獲得的搜尋結(jié)果是非結(jié)構(gòu)化的數(shù)據(jù)(例如通過(guò)google或百度所搜尋的結(jié)果),因其搜尋結(jié)果的各項(xiàng)信息是分散且不具關(guān)聯(lián)的,所以用戶必須再對(duì)各項(xiàng)信息逐一檢視,因此造成實(shí)用性的限制。然而,在本發(fā)明的概念中,能藉由結(jié)構(gòu)化數(shù)據(jù)庫(kù)來(lái)有效增進(jìn)檢索的效率與正確性。因?yàn)楸景l(fā)明所揭示的結(jié)構(gòu)化數(shù)據(jù)庫(kù)中的每個(gè)記錄內(nèi)部所包含的數(shù)值數(shù)據(jù)相互間具有關(guān)聯(lián)性,且這些數(shù)值數(shù)據(jù)共同用以表達(dá)來(lái)自用戶的請(qǐng)求信息對(duì)該記錄的意圖。于是在搜尋引擎對(duì)結(jié)構(gòu)化數(shù)據(jù)庫(kù)進(jìn)行一全文檢索時(shí),可在記錄的數(shù)值數(shù)據(jù)被匹配時(shí),輸出對(duì)應(yīng)于該數(shù)值數(shù)據(jù)的指引數(shù)據(jù)以確認(rèn)該請(qǐng)求信息的意圖。這部分的實(shí)施細(xì)節(jié)將通過(guò)下列實(shí)例作更進(jìn)一步的描述。在本發(fā)明的實(shí)施例中,結(jié)構(gòu)化數(shù)據(jù)庫(kù)220所儲(chǔ)存的每個(gè)記錄302包括標(biāo)題欄304及內(nèi)容欄306,標(biāo)題欄304內(nèi)包括多個(gè)分欄308,各分欄包括指引欄310以及數(shù)值欄312,所述多個(gè)記錄302的指引欄310用以儲(chǔ)存指引數(shù)據(jù),而所述多個(gè)記錄302的數(shù)值欄用312以儲(chǔ)存數(shù)值數(shù)據(jù)。在此以圖3A所示的記錄I來(lái)舉例說(shuō)明,記錄I的標(biāo)題欄304中的各分欄308分別儲(chǔ)存了:〃singerguid:劉德華"、^songnameguid:一起走過(guò)的日子〃;及"songtypeguid:港臺(tái),粵語(yǔ),流行";各分欄308的指引欄310分別儲(chǔ)存了指引數(shù)據(jù)〃singerguid〃、〃songnameguid〃及"songtypeguid〃、而其對(duì)應(yīng)分欄308的數(shù)值欄312則分別儲(chǔ)存了數(shù)值數(shù)據(jù)〃劉德華〃、〃 一起走過(guò)的日子〃及〃港臺(tái),粵語(yǔ),流行〃。指引數(shù)據(jù)"singerguid"代表數(shù)值數(shù)據(jù)〃劉德華〃的領(lǐng)域種類為歌手名稱(singer),指引數(shù)據(jù)"songnameguid"代表數(shù)值數(shù)據(jù)〃一起走過(guò)的日子〃的領(lǐng)域種類為歌曲名稱(song),指引數(shù)據(jù)"songtypeguid"代表數(shù)值數(shù)據(jù)〃港臺(tái),粵語(yǔ),流行"的領(lǐng)域種類為歌曲類型(song type)。在此的各指引數(shù)據(jù)實(shí)際上可分別用不同的特定一串?dāng)?shù)字或字符來(lái)表示,在本發(fā)明中不以此為限。記錄I的內(nèi)容欄306則是儲(chǔ)存了 〃一起走過(guò)的日子〃這首歌的歌詞內(nèi)容或儲(chǔ)存其他的數(shù)據(jù)(例如作曲/詞者…等),然而各記錄的內(nèi)容欄306中的真實(shí)數(shù)據(jù)并非本發(fā)明所強(qiáng)調(diào)的重點(diǎn),因此在圖3A中僅示意性地來(lái)描述。前述的實(shí)施例中,每個(gè)記錄包括標(biāo)題欄304及內(nèi)容欄306,且標(biāo)題欄304內(nèi)的分欄308包括指引欄310以及數(shù)值欄312,但非以限定本發(fā)明,某些實(shí)施例中也可以沒(méi)有內(nèi)容欄306,甚或是有些實(shí)施例中可以沒(méi)有指引欄310。除此之外,在本發(fā)明的實(shí)施例中,于各分欄308的數(shù)據(jù)間儲(chǔ)存有第一特殊字符來(lái)分隔各分欄308的數(shù)據(jù),于指引欄310與該數(shù)值欄312的數(shù)據(jù)間儲(chǔ)存有第二特殊字符來(lái)分隔指引欄與數(shù)值欄的數(shù)據(jù)。舉例來(lái)說(shuō),如圖3A所示,"singerguid〃與〃劉德華〃之間、"songnameguid"與〃 一起走過(guò)的日子〃之間、以及"songtypeguid"與〃港臺(tái),粵語(yǔ),流行〃之間是利用第二特殊字符〃:"來(lái)做分隔,而記錄I的各分欄308間是利用第一特殊字符"V來(lái)做分隔,然而本發(fā)明并不限于以〃:〃或〃|"來(lái)做為用以分隔的特殊字符。
另一方面,在本發(fā)明的實(shí)施例中,標(biāo)題欄304中的各分欄308可具有固定位數(shù),例如各分欄308的固定位數(shù)可以是32個(gè)字符,而其中的指引欄310的固定位數(shù)可以是7或8個(gè)位(最多用來(lái)指引128或256種不同的指引數(shù)據(jù)),此外,因第一特殊字符與第二特殊字符所需要的位數(shù)可以是固定的,所以分欄308的固定位數(shù)在扣除指引欄310、第一特殊字符、第二特殊字符所占去的位數(shù)后,剩下的位數(shù)便可悉數(shù)用來(lái)儲(chǔ)存數(shù)值欄312的數(shù)值數(shù)據(jù)。再者,由于分欄308的位數(shù)固定,加上分欄308儲(chǔ)存數(shù)據(jù)的內(nèi)容可如圖3A所示依序?yàn)橹敢龣?10(指引數(shù)據(jù)的指標(biāo))、第一特殊字符、數(shù)值欄312的數(shù)值數(shù)據(jù)、第二特殊字符,而且如前所述,這四個(gè)數(shù)據(jù)的位數(shù)量也是固定的,于是在實(shí)作上可跳過(guò)指引欄310的位(例如跳過(guò)前7或8個(gè)位)、以及第二特殊字符的位數(shù)(例如再跳過(guò)I個(gè)字符,亦即8個(gè)位)后,再扣掉第一特殊字符所占的位數(shù)(例如最后I個(gè)字符、8個(gè)位)之后,最后便可直接取得數(shù)值欄312的數(shù)值數(shù)據(jù)(例如在記錄I的第一個(gè)分欄308中直接取出數(shù)值數(shù)據(jù)“劉德華”),接著再進(jìn)行所需的領(lǐng)域種類判斷即可。于是,在目前所取出的數(shù)值數(shù)據(jù)比對(duì)完畢后(不論是否比對(duì)成功與否),可以再依據(jù)上述取出數(shù)值數(shù)據(jù)的方式取出下一個(gè)分欄308的數(shù)值數(shù)據(jù)(例如在記錄I的第二個(gè)分欄308中直接取出數(shù)值數(shù)據(jù)“一起走過(guò)的日子”),來(lái)進(jìn)行比對(duì)領(lǐng)域種類的比對(duì)。上述取出數(shù)值數(shù)據(jù)的方式可以從記錄I開(kāi)始進(jìn)行比對(duì),并在比對(duì)完記錄I所有的數(shù)值數(shù)據(jù)后,再取出記錄2的標(biāo)題欄308中第一個(gè)分欄308的數(shù)值數(shù)據(jù)(例如“馮小剛”)進(jìn)行比對(duì)。上述比對(duì)程序?qū)⒊掷m(xù)進(jìn)行,直到所有記錄的數(shù)值數(shù)據(jù)都被比對(duì)過(guò)為止。應(yīng)注意的是,上述的分欄308的位數(shù)、以及指引欄310、第一特殊字符、第二特殊字符個(gè)使用的位數(shù)可依實(shí)際應(yīng)用改變,本發(fā)明對(duì)此并未加以限制。前述利用比對(duì)來(lái)取出數(shù)值數(shù)據(jù)的方式只是一種實(shí)施例,但非用以限定本發(fā)明,另一實(shí)施例可以使用全文檢索的方式來(lái)進(jìn)行。此外,上述跳過(guò)指引欄310、第二特殊字符、第一特殊字符的實(shí)作方式,可以使用位平移(例如除法)來(lái)達(dá)成,此部分的實(shí)施可以用硬件、軟件、或兩者搭配的方式進(jìn)行,本領(lǐng)域技術(shù)人員可依計(jì)實(shí)際需求而變更。在本發(fā)明的另一實(shí)施例中,標(biāo)題欄304中的各分欄308可具有固定位數(shù),分欄308中的指引欄310可具有另一固定位數(shù),并且標(biāo)題欄304中可不包括第一特殊字符以及第二特殊字符,由于各分欄308以及各指引欄310的位數(shù)為固定,所以可利用跳過(guò)特定位數(shù)的方式或是使用位平移(例如除法)的方式來(lái)直接取出各分欄308中的指引數(shù)據(jù)或數(shù)值數(shù)據(jù)。應(yīng)注意的是,由于前面已提到分欄308具有一定的位數(shù),所以可以在自然語(yǔ)言理解系統(tǒng)100中(或是包含自然語(yǔ)言理解系統(tǒng)100的伺服器中)使用計(jì)數(shù)器來(lái)記錄目前所比對(duì)的是某一記錄的某分欄308。此外,比對(duì)的記錄亦可使用另一計(jì)數(shù)器來(lái)儲(chǔ)存其順序。舉例來(lái)說(shuō),當(dāng)分別使用一第一計(jì)數(shù)器記錄來(lái)表示目前所比對(duì)的記錄順序、并使用一第二計(jì)數(shù)器來(lái)表示目前所比對(duì)的分欄順序時(shí),若目前比對(duì)的是圖3A的記錄2的第3個(gè)分欄308(亦即比對(duì)“fiIenameguid:華誼兄”)時(shí),第一計(jì)數(shù)器所儲(chǔ)存的數(shù)值將是2 (表示目前比對(duì)的是記錄2),第二計(jì)數(shù)器所儲(chǔ)存的數(shù)值則為3 (表示目前比對(duì)的是第3個(gè)分欄308)。再者,上述僅以7或8個(gè)位儲(chǔ)存指引欄310的指引數(shù)據(jù)的方式,是希望將分欄308的大多數(shù)位都用來(lái)儲(chǔ)存數(shù)值數(shù)據(jù),而實(shí)際的指引數(shù)據(jù)則可通過(guò)這7、8個(gè)位當(dāng)作指標(biāo),再據(jù)以從檢索系統(tǒng)200所儲(chǔ)存的指引數(shù)據(jù)儲(chǔ)存裝置280中讀取實(shí)際的指引數(shù)據(jù),其中指引數(shù)據(jù)是以表格的方式進(jìn)行儲(chǔ)存,但其他任何可供檢索系統(tǒng)200存取的方式皆可用在本發(fā)明中。于是,在實(shí)際操作時(shí),除了可直接取出數(shù)值數(shù)據(jù)進(jìn)行比對(duì)之外,亦可在產(chǎn)生匹配結(jié)果時(shí),直接依據(jù)上述兩個(gè)計(jì)數(shù)器的數(shù)值,直接取出指引數(shù)據(jù)作為回應(yīng)結(jié)果110送給知識(shí)輔助理解模塊400。舉例來(lái)說(shuō),當(dāng)記錄6的第2個(gè)分欄308 (亦即“songnameguid:背叛”)匹配成功時(shí),將得知目前的第一計(jì)數(shù)器/第二計(jì)數(shù)器的數(shù)值分別為6與2,因此可以依據(jù)這兩個(gè)數(shù)值前往儲(chǔ)存圖3C所示的指引數(shù)據(jù)儲(chǔ)存裝置280,由記錄6的分欄2查詢出指引數(shù)據(jù)為“songnameguid”。在一實(shí)施例中,可以將分欄308的位樹(shù)固定后,再將分欄308的所有位都用來(lái)儲(chǔ)存數(shù)值數(shù)據(jù),于是可以完全除去指引欄、第一特殊字符、第二特殊字符,而搜尋引擎240只要知道每越過(guò)固定位數(shù)就是另一個(gè)分欄308,并在第二計(jì)數(shù)器中加一即可(當(dāng)然,每換下一個(gè)記錄進(jìn)行檢索時(shí)亦需將第一計(jì)數(shù)器的儲(chǔ)存值加一),這樣可以提供更多的位數(shù)來(lái)儲(chǔ)存數(shù)值數(shù)據(jù)。再舉一個(gè)實(shí)例來(lái)說(shuō)明比對(duì)產(chǎn)生匹配結(jié)果時(shí),回傳匹配記錄110至知識(shí)輔助理解模塊400做進(jìn)一步處理的過(guò)程。對(duì)應(yīng)于上述記錄302的數(shù)據(jù)結(jié)構(gòu),在本發(fā)明的實(shí)施例中,當(dāng)用戶的請(qǐng)求信息102為〃我要看讓子彈飛〃時(shí),可產(chǎn)生出兩個(gè)可能意圖語(yǔ)法數(shù)據(jù)106:〃〈readbook>,〈bookname〉=讓子彈飛〃;與〃〈watchfilm>,〈filmname〉=讓子彈飛";搜尋引擎240便藉由檢索接口單元260所接收的關(guān)鍵字108〃讓子彈飛〃來(lái)對(duì)圖3A的結(jié)構(gòu)化數(shù)據(jù)庫(kù)220所儲(chǔ)存的記錄的標(biāo)題欄304進(jìn)行全文檢索。全文檢索中,在標(biāo)題欄304中找到了儲(chǔ)存有數(shù)值數(shù)據(jù)〃讓子彈飛〃的記錄5,因此產(chǎn)生了匹配結(jié)果。接下來(lái),檢索系統(tǒng)200將回傳記錄5標(biāo)題欄304中,對(duì)應(yīng)于關(guān)鍵字108”讓子彈飛”的指引數(shù)據(jù)”filmnameguid”作為匹配記錄Iio并回傳至知識(shí)輔助理解模塊400。由于在記錄5的標(biāo)題欄中,包含對(duì)應(yīng)數(shù)值數(shù)據(jù)〃讓子彈飛〃的指引數(shù)據(jù)"filmnameguid〃,所以知識(shí)輔助理解模塊400藉由比對(duì)記錄5的指引數(shù)據(jù)"filmnameguid"與上述可能意圖語(yǔ)法數(shù)據(jù)106先前已儲(chǔ)存的意圖數(shù)據(jù)112〃〈watchfilm>〃或〃〈readbook>〃,便能判斷出此次請(qǐng)求信息的確定意圖語(yǔ)法數(shù)據(jù)114為〃〈watchfilm>,〈filmname〉=讓子彈飛〃(因?yàn)槎及?film”在其中)。換句話說(shuō),此次用戶的請(qǐng)求信息102中所描述數(shù)據(jù)"讓子彈飛"是電影名稱,而數(shù)據(jù)用戶的請(qǐng)求信息102的意圖為看電影〃讓子彈飛〃,而非閱讀書籍。再舉一個(gè)實(shí)例作更進(jìn)一步的說(shuō)明。當(dāng)用戶的請(qǐng)求信息102為〃我想聽(tīng)一起走過(guò)的日子〃時(shí),可產(chǎn)生出兩個(gè)可能意圖語(yǔ)法數(shù)據(jù)106://<playmusic>, <singer>= 一起走過(guò),<songname>=日子";與〃〈playmusic>,〈songname〉= 一起走過(guò)的日子";搜尋引擎240便藉由檢索接口單元260所接收的兩組關(guān)鍵字108:〃 一起走過(guò)〃與〃日子〃;以及〃一起走過(guò)的日子〃來(lái)對(duì)圖3A的結(jié)構(gòu)化數(shù)據(jù)庫(kù)220所儲(chǔ)存的記錄的標(biāo)題欄304進(jìn)行全文檢索。由于全文檢索中,并未在所有記錄的標(biāo)題欄304中找到對(duì)應(yīng)于第一組關(guān)鍵字108" —起走過(guò)〃與〃日子〃的匹配結(jié)果,而是找到了對(duì)應(yīng)于第二組關(guān)鍵字108〃 一起走過(guò)的日子〃的記錄1,于是檢索系統(tǒng)200將記錄I標(biāo)題欄304中對(duì)應(yīng)于第二組關(guān)鍵字108的指引數(shù)據(jù)"songnameguid",作為匹配記錄110且回傳至知識(shí)輔助理解模塊400。接下來(lái),知識(shí)輔助理解模塊400在接收對(duì)應(yīng)數(shù)值數(shù)據(jù)〃 一起走過(guò)的日子〃的指引數(shù)據(jù)"songnameguid"后,便與可能意圖語(yǔ)法數(shù)據(jù)106 (亦即〃〈playmusic>,〈singer〉= 一起走過(guò),〈songname〉=日子"與"〈playmusic〉,〈songname〉= 一起走過(guò)的日子〃)中的意圖數(shù)據(jù)112 (亦即〈singer〉、〈songname〉等)進(jìn)行比對(duì),于是便發(fā)現(xiàn)此次用戶的請(qǐng)求信息102中并未描述有歌手名稱的數(shù)據(jù),而是描述有歌曲名稱為〃 一起走過(guò)的日子〃的數(shù)據(jù)(因?yàn)橹挥小磗ongname〉比對(duì)成功)。所以,知識(shí)輔助理解模塊400可藉由上述比對(duì)而判斷出此次請(qǐng)求信息102的確定意圖語(yǔ)法數(shù)據(jù)114為〃〈playmusic>,〈songname〉= 一起走過(guò)的日子〃,而用戶的請(qǐng)求信息102的意圖為聽(tīng)歌曲〃 一起走過(guò)的日子"。在本發(fā)明的另一實(shí)施例中,檢索而得的匹配記錄110可以是與關(guān)鍵字108完全匹配的全匹配記錄、或是與關(guān)鍵字108部分匹配的部分匹配記錄。舉例來(lái)說(shuō),如果用戶的請(qǐng)求信息102為〃我想聽(tīng)蕭敬騰的背叛〃,同樣地,自然語(yǔ)言處理器300經(jīng)過(guò)分析后,產(chǎn)生出兩個(gè)可能意圖語(yǔ)法數(shù)據(jù)106:〃〈playmusic>,〈singer〉=蕭敬騰,〈songname〉=背叛〃;及"〈playmusic〉,〈songname〉=蕭敬騰的背叛”;并傳送兩組關(guān)鍵字108:〃蕭敬騰〃與〃背叛〃;以及〃蕭敬騰的背叛〃;給檢索接口單元260,搜尋引擎240接著藉由檢索接口單元260所接收的關(guān)鍵字108來(lái)對(duì)圖3A的結(jié)構(gòu)化數(shù)據(jù)庫(kù)220所儲(chǔ)存的記錄302的標(biāo)題欄304進(jìn)行全文檢索。由于在全文檢索中,對(duì)應(yīng)第二組關(guān)鍵字108"蕭敬騰的背叛〃并未匹配到任何記錄,但是對(duì)應(yīng)第一組關(guān)鍵字108〃蕭敬騰〃與〃背叛〃找到了記錄6與記錄7的匹配結(jié)果。由于第二組關(guān)鍵字108"蕭敬騰〃與〃背叛〃僅與記錄6中的數(shù)值數(shù)據(jù)〃蕭敬騰相匹配,而未匹配到其他數(shù)值數(shù)據(jù)〃楊宗緯〃及〃曹格〃,因此記錄6為部分匹配記錄(請(qǐng)注意上述對(duì)應(yīng)請(qǐng)求信息102〃我要看讓子彈飛〃的記錄5以及對(duì)應(yīng)請(qǐng)求信息〃我想聽(tīng)一起走過(guò)的日子〃的記錄I皆為部分匹配記錄),而關(guān)鍵字〃蕭敬騰〃與〃背叛〃完全匹配了記錄7的數(shù)值數(shù)據(jù)(因?yàn)榈诙M關(guān)鍵字108〃蕭敬騰〃與〃背叛〃皆匹配成功),所以記錄7為完全匹配記錄。在本發(fā)明的實(shí)施例中,當(dāng)該檢索接口單元260輸出多個(gè)匹配記錄110至知識(shí)輔助理解模塊400時(shí),可依序輸出全匹配記錄(亦即全部的數(shù)值數(shù)據(jù)都被匹配)及部分匹配記錄(亦即僅有部分的數(shù)值數(shù)據(jù)被匹配)的匹配記錄110,其中全匹配記錄的優(yōu)先順序大于部分匹配記錄的優(yōu)先順序。因此,在檢索接口單元260輸出記錄6與記錄7的匹配記錄110時(shí),記錄7的輸出優(yōu)先順序會(huì)大于記錄6的輸出優(yōu)先順序,因?yàn)橛涗?全部的數(shù)值數(shù)據(jù)〃蕭敬騰〃與〃背叛〃都產(chǎn)生匹配結(jié)果,但記錄6還包含〃楊宗緯〃與〃曹格〃未產(chǎn)生匹結(jié)果。也就是說(shuō),結(jié)構(gòu)化數(shù)據(jù)庫(kù)220中所儲(chǔ)存的記錄對(duì)其請(qǐng)求信息102中的關(guān)鍵字108的匹配程度越高,越容易優(yōu)先被輸出,以便用戶進(jìn)行查閱或挑選對(duì)應(yīng)的確定意圖語(yǔ)法數(shù)據(jù)114。在另一實(shí)施例中,可直接輸出優(yōu)先順序最高的記錄所對(duì)應(yīng)的匹配記錄110,做為確定意圖語(yǔ)法數(shù)據(jù)114之用。前述非以限定本發(fā)明,因?yàn)樵诹硪粚?shí)施例中可能采取只要搜尋到有匹配記錄即輸出的方式(例如,以〃我想聽(tīng)蕭敬騰的背叛〃為請(qǐng)求信息102而言,當(dāng)檢索到記錄6即產(chǎn)生匹配結(jié)果時(shí),即輸出記錄6對(duì)應(yīng)的指引數(shù)據(jù)做匹配記錄110),而沒(méi)有包含優(yōu)先順序的排序,以加快檢索的速度。在另一實(shí)施例中,可對(duì)優(yōu)先順序最高的記錄,直接執(zhí)行其對(duì)應(yīng)的處理方式并提供予用戶。例如當(dāng)優(yōu)先順序最高的為播放三國(guó)演義的電影時(shí),可直接播放電影與用戶。此外,若優(yōu)先順序最高的為蕭敬騰演唱的背叛時(shí),可直接將此歌曲播放與用戶。應(yīng)注意的是,本發(fā)明在此僅作說(shuō)明,并非對(duì)此加以限定。在本發(fā)明的再一實(shí)施例中,如果用戶的請(qǐng)求信息102為〃我要聽(tīng)劉德華的背叛",則其可能意圖語(yǔ)法數(shù)據(jù)106的其中之一為
〃〈playmusic>,〈singer〉=劉德華,〈songname〉=背叛,,;若檢索接口單元260將關(guān)鍵字108〃劉德華〃與〃背叛〃輸入搜尋引擎240,并不會(huì)在圖3的數(shù)據(jù)庫(kù)中找到任何的匹配結(jié)果。在本發(fā)明的又一實(shí)施例中,檢索接口單元260可分別將關(guān)鍵字108〃劉德華〃以及〃背叛〃輸入搜尋引擎240,并且分別對(duì)應(yīng)求得〃劉德華〃是歌手名稱(指引數(shù)據(jù)singerguid)以及〃背叛〃是歌曲名稱(指引數(shù)據(jù)songnameguid,且歌手可能是曹格或是蕭敬騰、楊宗緯與曹格合唱)。此時(shí),自然語(yǔ)言理解系統(tǒng)100可進(jìn)一步提醒用戶“背叛這首歌曲是否為蕭敬騰所唱(依據(jù)記錄7的匹配結(jié)果)?”,或者,“是否為蕭敬騰、楊宗緯與曹格所合唱(依據(jù)記錄6的匹配結(jié)果)?”。在本發(fā)明的再一實(shí)施例中,結(jié)構(gòu)化數(shù)據(jù)庫(kù)220所儲(chǔ)存記錄可還包括有來(lái)源欄314及熱度欄316。如圖3B所示的數(shù)據(jù)庫(kù),其除了圖3A的各項(xiàng)欄位之外,還包含來(lái)源欄314及熱度欄316。各記錄的來(lái)源欄314用以儲(chǔ)存此記錄是出自哪一個(gè)結(jié)構(gòu)化數(shù)據(jù)庫(kù)(在此圖式中僅顯示結(jié)構(gòu)化數(shù)據(jù)庫(kù)220,而實(shí)際上可存在更多不同的結(jié)構(gòu)化數(shù)據(jù)庫(kù))、或是哪一個(gè)用戶、伺服器所提供的來(lái)源值。并且,自然語(yǔ)言理解系統(tǒng)100可根據(jù)用戶在之前的請(qǐng)求訊息102中所透漏的喜好,來(lái)檢索特定來(lái)源的結(jié)構(gòu)化數(shù)據(jù)庫(kù)(例如以請(qǐng)求信息102中的關(guān)鍵字進(jìn)行全文檢索產(chǎn)生匹配時(shí),便對(duì)該記錄的熱度值加一)。而各記錄302的熱度欄316用以儲(chǔ)存此記錄302的搜尋熱度值或是熱門程度值(例如該記錄在特定時(shí)間里被單一用戶、特定用戶群組、所有用戶的匹配次數(shù)或機(jī)率),以供知識(shí)輔助理解模塊400判斷用戶意圖時(shí)的參考。詳細(xì)而論,當(dāng)用戶的請(qǐng)求信息102為〃我要看三國(guó)演義〃時(shí),自然語(yǔ)言處理器300經(jīng)過(guò)分析后,可產(chǎn)生出多個(gè)可能意圖語(yǔ)法數(shù)據(jù)106 〃〈readbook>,〈bookname〉=三國(guó)演義”;〃〈watchTV>,〈TVname〉=三國(guó)演義〃;以及〃〈watchfilm>,〈filmname〉=三國(guó)演義"。若自然語(yǔ)言理解系統(tǒng)100在用戶的請(qǐng)求信息102的歷史記錄中(例如利用通過(guò)熱度欄316儲(chǔ)存該筆記錄302被某用戶所點(diǎn)選的次數(shù)),統(tǒng)計(jì)出其大部份的請(qǐng)求為看電影,則自然語(yǔ)言理解系統(tǒng)100可針對(duì)儲(chǔ)存電影記錄的結(jié)構(gòu)化數(shù)據(jù)庫(kù)來(lái)做檢索(此時(shí)來(lái)源欄314中的來(lái)源值,是記錄儲(chǔ)存電影記錄的結(jié)構(gòu)化數(shù)據(jù)庫(kù)的代碼),從而可優(yōu)先判定〃〈watchfilm>,〈filmname〉=三國(guó)演義〃為確定意圖語(yǔ)法數(shù)據(jù)114。舉例來(lái)說(shuō),在一實(shí)施例中亦可在每個(gè)記錄302被匹配一次,就可在后面的熱度欄316加一,作為用戶的歷史記錄。于是在依據(jù)關(guān)鍵字108 “三國(guó)演義”做全文檢索時(shí),可以從所有匹配結(jié)果中挑選熱度欄316中數(shù)值最高的記錄302,作為判斷用戶意圖之用。在一實(shí)施例中,若自然語(yǔ)言理解系統(tǒng)100在關(guān)鍵字108〃三國(guó)演義〃的檢索結(jié)果中,判定對(duì)應(yīng)〃三國(guó)演義〃這出電視節(jié)目的記錄的熱度欄316所儲(chǔ)存的搜尋熱度值最高,則便可優(yōu)先判定〃〈watchTV>,〈TVname〉=三國(guó)演義〃為確定意圖語(yǔ)法數(shù)據(jù)114。此外,上述對(duì)熱度欄316所儲(chǔ)存數(shù)值的變更方式,可通過(guò)自然語(yǔ)言理解系統(tǒng)100所在的計(jì)算機(jī)系統(tǒng)進(jìn)行變更,本發(fā)明對(duì)此并不加以限制。此外、熱度欄316的數(shù)值亦可隨時(shí)間遞減,以表示用戶對(duì)某項(xiàng)記錄302的熱度已逐漸降低,本發(fā)明對(duì)這部分亦不加以限制。再舉另一個(gè)實(shí)例來(lái)說(shuō),在另一實(shí)施例中,由于用戶可能在某段時(shí)間中特別喜歡看三國(guó)演義的電視劇,由于電視劇的長(zhǎng)度可能很長(zhǎng)而用戶無(wú)法短時(shí)間看完,因此在短時(shí)間中可能重復(fù)點(diǎn)選(假設(shè)每匹配一次就將熱度欄316內(nèi)的數(shù)值加一的話),因此造成某個(gè)記錄302被重復(fù)匹配,這部分都可通過(guò)分析熱度欄316的數(shù)據(jù)而得知。再者,在另一實(shí)施例中,電信業(yè)者也可以利用熱度欄316來(lái)表示某一來(lái)源所提供數(shù)據(jù)被取用的熱度,而此數(shù)據(jù)供應(yīng)者的編碼可以用來(lái)源欄314進(jìn)行儲(chǔ)存。舉例來(lái)說(shuō),若某位供應(yīng)“三國(guó)演義電視劇”的供應(yīng)者的被點(diǎn)選的機(jī)率最高,所以當(dāng)某用戶輸入“我要看三國(guó)演義”的請(qǐng)求信息102時(shí),雖然在對(duì)圖3B的數(shù)據(jù)庫(kù)進(jìn)行全文檢索時(shí)會(huì)找到閱讀三國(guó)演義的書籍(記錄8)、觀看三國(guó)演義電視劇(記錄9)、觀看三國(guó)演義電影(記錄10)三個(gè)匹配結(jié)果,但由于熱度欄316中的數(shù)據(jù)顯示觀看三國(guó)演義電視劇是現(xiàn)在最熱門的選項(xiàng)(亦即記錄8、9、10的熱度欄的數(shù)值分別為2、5、8),所以將先提供記錄10的指引數(shù)據(jù)做匹配記錄110輸出至知識(shí)輔助理解系統(tǒng)400,作為判定用戶意圖的最優(yōu)先選項(xiàng)。在一實(shí)施例中,可同時(shí)將來(lái)源欄314的數(shù)據(jù)顯示給用戶,讓用戶判斷他所想要觀看的電視劇是否為某位供應(yīng)者所提供。應(yīng)注意的是,上述對(duì)來(lái)源欄314所儲(chǔ)存數(shù)據(jù)以及其變更方式,亦可通過(guò)自然語(yǔ)言理解系統(tǒng)100所在的計(jì)算機(jī)系統(tǒng)進(jìn)行變更,本發(fā)明對(duì)此并不加以限制。明顯的,本發(fā)明所揭示的結(jié)構(gòu)化數(shù)據(jù)庫(kù)中的每個(gè)記錄內(nèi)部所包含的數(shù)值數(shù)據(jù)相互間具有關(guān)聯(lián)性(例如記錄I中的數(shù)值數(shù)據(jù)“劉德華”、“一起走過(guò)的日子”、“港臺(tái),粵語(yǔ),流行”都是用來(lái)描述記錄I的特征),且這些數(shù)值數(shù)據(jù)共同用以表達(dá)來(lái)自用戶的請(qǐng)求信息對(duì)該記錄的意圖(例如對(duì)“一起走過(guò)的日子”產(chǎn)生匹配結(jié)果時(shí),表示用戶的意圖可能是對(duì)記錄I的數(shù)據(jù)存取),于是在搜尋引擎對(duì)結(jié)構(gòu)化數(shù)據(jù)庫(kù)進(jìn)行全文檢索時(shí),可在記錄的數(shù)值數(shù)據(jù)被匹配時(shí),輸出對(duì)應(yīng)于該數(shù)值數(shù)據(jù)的指引數(shù)據(jù)(例如輸出“songnameguid”作為回應(yīng)結(jié)果110),進(jìn)而確認(rèn)該請(qǐng)求信息的意圖(例如在知識(shí)輔助理解模塊中進(jìn)行比對(duì))?;谏鲜鍪痉缎詫?shí)施例所揭示或教示的內(nèi)容,圖4A為根據(jù)本發(fā)明的一實(shí)施例的檢索方法的流程圖。請(qǐng)參閱圖4A,本發(fā)明的實(shí)施例的檢索方法包括以下步驟提供結(jié)構(gòu)化數(shù)據(jù)庫(kù),且結(jié)構(gòu)化數(shù)據(jù)庫(kù)儲(chǔ)存多個(gè)記錄(步驟S410);接收至少一關(guān)鍵字(步驟S420);藉由關(guān)鍵字來(lái)對(duì)多個(gè)記錄的標(biāo)題欄進(jìn)行全文檢索(步驟S430)。舉例來(lái)說(shuō),將關(guān)鍵字108輸入檢索接口單元260來(lái)讓搜尋引擎240對(duì)結(jié)構(gòu)化數(shù)據(jù)庫(kù)220所儲(chǔ)存的多個(gè)記錄302的標(biāo)題欄304進(jìn)行全文檢索,至于檢索方式可如對(duì)圖3A或圖3B所進(jìn)行的檢索方式、或是不變更其精神的方式來(lái)進(jìn)行;判斷全文檢索是否有匹配結(jié)果(步驟S440)。舉例來(lái)說(shuō),藉由搜尋引擎240來(lái)判斷此關(guān)鍵字108所對(duì)應(yīng)的全文檢索是否有匹配結(jié)果;以及若有匹配結(jié)果,依序輸出全匹配記錄及部分匹配記錄(步驟S450)。舉例來(lái)說(shuō),若結(jié)構(gòu)化數(shù)據(jù)庫(kù)220中有記錄匹配此關(guān)鍵字108,則檢索接口單元260依序輸出匹配此關(guān)鍵字108的全匹配記錄及部分匹配記錄中的指引數(shù)據(jù)(可通過(guò)對(duì)圖3C的指引數(shù)據(jù)儲(chǔ)存裝置280而取得)作為匹配記錄Iio送往知識(shí)輔助理解系統(tǒng)400,其中全匹配記錄的優(yōu)先順序大于部分匹配記錄的優(yōu)先順序。前述的流程步驟非以限定本發(fā)明,有些步驟是可以忽略或移除,例如,在本發(fā)明的另一實(shí)施例中,可藉由位于檢索系統(tǒng)200外的匹配判斷模塊(未繪示于圖中)來(lái)執(zhí)行步驟S440 ;或是在本發(fā)明的另一實(shí)施例中,可忽略上述步驟S450,其依序輸出全匹配記錄及部分匹配記錄的動(dòng)作可以藉由位于檢索系統(tǒng)200外的匹配結(jié)果輸出模塊(未繪示于圖中),來(lái)執(zhí)行步驟S450中依序輸出全匹配記錄及部分匹配記錄的動(dòng)作。
基于上述示范性實(shí)施例所揭示或教示的內(nèi)容,圖4B為根據(jù)本發(fā)明的另一實(shí)施例的自然語(yǔ)言理解系統(tǒng)100工作過(guò)程的流程圖。請(qǐng)參閱圖4B,本發(fā)明的另一實(shí)施例的自然語(yǔ)言理解系統(tǒng)100工作過(guò)程包括以下步驟接收請(qǐng)求信息(步驟S510)。舉例來(lái)說(shuō),用戶將具有語(yǔ)音內(nèi)容或文字內(nèi)容的請(qǐng)求信息102傳送至自然語(yǔ)言理解系統(tǒng)100 ;提供結(jié)構(gòu)化數(shù)據(jù)庫(kù),且結(jié)構(gòu)化數(shù)據(jù)庫(kù)儲(chǔ)存多個(gè)記錄(步驟S520);將請(qǐng)求信息語(yǔ)法化(步驟S530)。舉例來(lái)說(shuō),自然語(yǔ)言處理器300分析用戶的請(qǐng)求信息102后,進(jìn)而轉(zhuǎn)為對(duì)應(yīng)的可能意圖語(yǔ)法數(shù)據(jù)106 ;辨別關(guān)鍵字的可能屬性(步驟S540)。舉例來(lái)說(shuō),知識(shí)輔助理解模塊400辨別出可能意圖語(yǔ)法數(shù)據(jù)106中的至少一關(guān)鍵字108的可能屬性,例如,關(guān)鍵字108〃三國(guó)演義〃可能是書、電影及電視節(jié)目;藉由關(guān)鍵字108來(lái)對(duì)多個(gè)記錄的標(biāo)題欄304進(jìn)行全文檢索(步驟S550)。舉例來(lái)說(shuō),將關(guān)鍵字108輸入檢索接口單元260來(lái)讓搜尋引擎240對(duì)結(jié)構(gòu)化數(shù)據(jù)庫(kù)220所儲(chǔ)存的多個(gè)記錄的標(biāo)題欄304進(jìn)行全文檢索;判斷全文檢索是否有匹配結(jié)果(步驟S560)。舉例來(lái)說(shuō),藉由搜尋引擎240來(lái)判斷此關(guān)鍵字108所對(duì)應(yīng)的全文檢索是否有匹配結(jié)果;若有匹配結(jié)果,依序輸出全匹配記錄及部分匹配記錄(步驟S570)所對(duì)應(yīng)的指引數(shù)據(jù)為匹配記錄110。舉例來(lái)說(shuō),若結(jié)構(gòu)化數(shù)據(jù)庫(kù)220中有記錄匹配此關(guān)鍵字108,則檢索接口單元260依序輸出匹配此關(guān)鍵字108的全匹配記錄及部分匹配記錄所對(duì)應(yīng)的指引數(shù)據(jù)為匹配記錄110,其中全匹配記錄的優(yōu)先順序大于部分匹配記錄的優(yōu)先順序;以及依序輸出對(duì)應(yīng)的確定意圖語(yǔ)法數(shù)據(jù)(步驟S580)。舉例來(lái)說(shuō),知識(shí)輔助理解模塊400藉由依序輸出的全匹配記錄及部分匹配記錄,藉以輸出對(duì)應(yīng)的確定意圖語(yǔ)法數(shù)據(jù)114。前述的流程步驟非以限定本發(fā)明,有些步驟是可以忽略或移除。綜上所述,本發(fā)明藉由取出用戶的請(qǐng)求信息所包括的關(guān)鍵字,并且針對(duì)結(jié)構(gòu)化數(shù)據(jù)庫(kù)中的具有數(shù)據(jù)結(jié)構(gòu)的記錄的標(biāo)題欄來(lái)進(jìn)行全文檢索,若產(chǎn)生匹配結(jié)果,便可判斷出關(guān)鍵字所屬的領(lǐng)域種類,藉以確定用戶在請(qǐng)求信息所表示的意圖。接下來(lái)針對(duì)以上結(jié)構(gòu)化數(shù)據(jù)庫(kù)在語(yǔ)音識(shí)別上的應(yīng)用做更多的說(shuō)明。首先針對(duì)在自然語(yǔ)言對(duì)話系統(tǒng)中,根據(jù)用戶的語(yǔ)音輸入來(lái)修正錯(cuò)誤的語(yǔ)音應(yīng)答,并進(jìn)一步找出其他可能的答案來(lái)回報(bào)給用戶的應(yīng)用做說(shuō)明。雖然現(xiàn)今的移動(dòng)通訊裝置已可提供自然語(yǔ)言對(duì)話功能,以讓用戶發(fā)出語(yǔ)音來(lái)和移動(dòng)通訊裝置溝通。然而在目前的語(yǔ)音對(duì)話系統(tǒng),當(dāng)用戶的語(yǔ)音輸入不明確時(shí),由于同一句語(yǔ)音輸入可能意指多個(gè)不同的意圖或目的,故系統(tǒng)容易會(huì)輸出不符合語(yǔ)音輸入的語(yǔ)音應(yīng)答。因此在很多對(duì)話情境中,用戶難以得到符合其意圖的語(yǔ)音應(yīng)答。為此,本發(fā)明提出一種修正語(yǔ)音應(yīng)答的方法以及自然語(yǔ)言對(duì)話系統(tǒng),其中自然語(yǔ)言對(duì)話系統(tǒng)可根據(jù)用戶的語(yǔ)音輸入來(lái)修至錯(cuò)誤的語(yǔ)音應(yīng)答,并進(jìn)一步找出其他可能的答案來(lái)回報(bào)給用戶。為了使本發(fā)明的內(nèi)容更為明了,以下特舉實(shí)施例作為本發(fā)明確實(shí)能夠據(jù)以實(shí)施的范例。圖5A是依照本發(fā)明一實(shí)施例所繪示的自然語(yǔ)言對(duì)話系統(tǒng)的方塊圖。請(qǐng)參照?qǐng)D5A,自然語(yǔ)言對(duì)話系統(tǒng)500包括語(yǔ)音取樣模塊510、自然語(yǔ)言理解模塊520、以及語(yǔ)音合成數(shù)據(jù)庫(kù)530。在一實(shí)施例中,語(yǔ)音取樣模塊510用以接收語(yǔ)音輸入501 (例如來(lái)自用戶的語(yǔ)音),隨后對(duì)其進(jìn)行解析而產(chǎn)生解析結(jié)果503,而自然語(yǔ)言理解模塊520會(huì)對(duì)解析結(jié)果503進(jìn)行解析而取得其中的請(qǐng)求信息505,并在找到符合請(qǐng)求信息505的答案后,依據(jù)此答案通過(guò)對(duì)語(yǔ)音合成數(shù)據(jù)庫(kù)130進(jìn)行對(duì)應(yīng)的語(yǔ)音查詢,再輸出所查詢的語(yǔ)音作為對(duì)應(yīng)于語(yǔ)音輸入501的語(yǔ)音應(yīng)答507予用戶。其中,倘若自然語(yǔ)言理解模塊520所作出的語(yǔ)音應(yīng)答505不符合語(yǔ)音輸入501中的請(qǐng)求信息505時(shí)(例如用戶輸入另一個(gè)語(yǔ)音輸入指示此事),自然語(yǔ)言理解模塊520會(huì)修正原本的答案,并輸出另一個(gè)語(yǔ)音應(yīng)答507予用戶。前述自然語(yǔ)言對(duì)話系統(tǒng)500中的各構(gòu)件可配置在同一機(jī)器中。舉例而言,語(yǔ)音取樣模塊510與自然語(yǔ)言理解模塊520例如是配置于同一電子裝置。其中,電子裝置可以是移動(dòng)電話(Cell phone)、個(gè)人數(shù)位助理(Personal Digital Assistant, PDA)手機(jī)、智能型手機(jī)(Smart phone)等移動(dòng)通訊裝置、掌上型計(jì)算機(jī)(Pocket PC)、平板型計(jì)算機(jī)(TabletPC)、筆記型計(jì)算機(jī)、個(gè)人計(jì)算機(jī)、或是其他具備通訊功能或安裝有通訊軟件的電子裝置,在此并不限制其范圍。此外,上述電子裝置可使用Android操作系統(tǒng)、Microsoft操作系統(tǒng)、Android操作系統(tǒng)、Linux操作系統(tǒng)等等,不限于此。當(dāng)然,前述自然語(yǔ)言對(duì)話系統(tǒng)500中的各構(gòu)件也不一定需設(shè)置在同一機(jī)器中,而可分散在不同裝置或系統(tǒng)并通過(guò)各種不同的通訊協(xié)定來(lái)連結(jié)。舉例而言,自然語(yǔ)言理解模塊520可以位于云端伺服器中,也可以位于區(qū)域網(wǎng)路中的伺服器。此外,自然語(yǔ)言理解模塊520中的各構(gòu)件也可分散在不同的機(jī)器,例如自然語(yǔ)言理解模塊520中的各構(gòu)件可位于與語(yǔ)音取樣模塊510相同或不同的機(jī)器。在本實(shí)施例中,語(yǔ)音取樣模塊510用以接收語(yǔ)音輸入,此語(yǔ)音取樣模塊510可以為麥克風(fēng)(Microphone)等接收音訊的裝置,而語(yǔ)音輸入501可以是來(lái)自用戶的語(yǔ)音。自然語(yǔ)言理解模塊520會(huì)接收從語(yǔ)音取樣模塊510傳來(lái)的語(yǔ)音輸入501,以對(duì)語(yǔ)音輸入501進(jìn)行解析而產(chǎn)生解析結(jié)果503。并且,自然語(yǔ)言理解模塊120會(huì)根據(jù)解析結(jié)果503中的一個(gè)或多個(gè)特征語(yǔ)義505 (例如圖1A中所提到的關(guān)鍵字108等)來(lái)產(chǎn)生至少一個(gè)包含至少一個(gè)候選答案的候選列表 111,然后再?gòu)倪@些候選答案中找出較符合特征語(yǔ)義109的答案,進(jìn)而輸出語(yǔ)音應(yīng)答107予用戶。由于語(yǔ)音應(yīng)答105輸出與用戶后,他/她可能認(rèn)為目前所新的答案的不符合他的需求、或者需要再輸入更多的選擇(例如語(yǔ)音應(yīng)答105輸出的是多個(gè)選項(xiàng)要求用戶組進(jìn)一步選擇)…等,所以用戶會(huì)再輸入另一個(gè)語(yǔ)音。是以,如果用戶輸入另一個(gè)語(yǔ)音的話,自然語(yǔ)言理解模塊520會(huì)接著依據(jù)用戶所輸入的另一個(gè)語(yǔ)音輸入501判斷先前所輸出的語(yǔ)音應(yīng)答507是否正確;若為否,則自然語(yǔ)言理解模塊520還會(huì)從上述候選列表511中找出另一個(gè)候選答案,并據(jù)以產(chǎn)生新的語(yǔ)音應(yīng)答507提供予用戶。這部分的細(xì)節(jié)將通過(guò)圖5B做更進(jìn)一步的描述。此外,本實(shí)施例的自然語(yǔ)言理解模塊520可由一個(gè)或數(shù)個(gè)邏輯門組合而成的硬件電路來(lái)實(shí)作。或者,在本發(fā)明另一實(shí)施例中,自然語(yǔ)言理解模塊520可以通過(guò)計(jì)算機(jī)程序碼來(lái)實(shí)作。舉例來(lái)說(shuō),自然語(yǔ)言理解模塊520例如是由程序語(yǔ)言所撰寫的程序碼片段來(lái)實(shí)作于應(yīng)用程序、操作系統(tǒng)或驅(qū)動(dòng)程序等,而這些程序碼片段儲(chǔ)存在儲(chǔ)存單元中,并藉由處理單元來(lái)執(zhí)行。為了使本領(lǐng)域的技術(shù)人員進(jìn)一步了解本實(shí)施例的自然語(yǔ)言理解模塊520,底下舉實(shí)例來(lái)進(jìn)行說(shuō)明。然,本發(fā)明在此僅為舉例說(shuō)明,并不以此為限,例如運(yùn)用硬件、軟件、固件、或是此三種實(shí)施方式的混合搭配等方式,皆可運(yùn)用來(lái)實(shí)施本發(fā)明。圖5B是依照本發(fā)明一實(shí)施例所繪示的自然語(yǔ)言理解模塊520的方塊圖。請(qǐng)參照?qǐng)D5B,本實(shí)施例的自然語(yǔ)言理解模塊520可包括語(yǔ)音識(shí)別模塊522、自然語(yǔ)言處理模塊524以及語(yǔ)音合成模塊526。其中,語(yǔ)音識(shí)別模塊522會(huì)接收從語(yǔ)音取樣模塊510傳來(lái)的對(duì)語(yǔ)音輸入501進(jìn)行解析的解析結(jié)果503,并轉(zhuǎn)換成一個(gè)或多個(gè)特征語(yǔ)義509(例如圖1A的關(guān)鍵字108或字句等)。自然語(yǔ)言處理模塊524則可再對(duì)這些特征語(yǔ)義509進(jìn)行解析,而獲得至少一個(gè)候選列表511 (例如通過(guò)圖1A的檢索系統(tǒng)200對(duì)結(jié)構(gòu)化數(shù)據(jù)庫(kù)220進(jìn)行全文檢索,并在取得回應(yīng)110且對(duì)意圖數(shù)據(jù)112比對(duì)后產(chǎn)生確定意圖語(yǔ)法數(shù)據(jù)114,最后由分析結(jié)果輸出模塊116所送出的分析結(jié)果104),并且會(huì)從候選列表511中選出一個(gè)較符合語(yǔ)音輸入501的答案以做為回報(bào)答案(例如挑選全匹配記錄…等)。由于此回報(bào)答案是自然語(yǔ)言理解模塊520在內(nèi)部分析而得的答案,所以還必須將轉(zhuǎn)換成語(yǔ)音輸出才能輸出予用戶,于是語(yǔ)音合成模塊526會(huì)依據(jù)回報(bào)答案來(lái)查詢語(yǔ)音合成數(shù)據(jù)庫(kù)530,而此語(yǔ)音合成數(shù)據(jù)庫(kù)530例如是記錄有文字以及其對(duì)應(yīng)的語(yǔ)音信息,可使得語(yǔ)音合成模塊526能夠找出對(duì)應(yīng)于回報(bào)答案的語(yǔ)音,藉以合成出第一語(yǔ)音應(yīng)答507。之后,語(yǔ)音合成模塊126可將合成的語(yǔ)音通過(guò)語(yǔ)音輸出接口(未繪示),其中語(yǔ)音輸出接口例如為喇叭、揚(yáng)聲器、或耳機(jī)等裝置輸出,藉以輸出語(yǔ)音予用戶。舉例來(lái)說(shuō),若用戶輸入的是“我要看三國(guó)演義”的語(yǔ)音輸入501話,語(yǔ)音識(shí)別模塊522會(huì)接收從語(yǔ)音取樣模塊510傳來(lái)的對(duì)語(yǔ)音輸入501進(jìn)行解析的解析結(jié)果503,然后轉(zhuǎn)換成例如是包含關(guān)鍵字108 “三國(guó)演義”的特征語(yǔ)義509。自然語(yǔ)言處理模塊524則可再對(duì)這個(gè)特征語(yǔ)義509 “三國(guó)演義”進(jìn)行解析,例如通過(guò)圖1A的檢索系統(tǒng)200對(duì)結(jié)構(gòu)化數(shù)據(jù)庫(kù)220進(jìn)行全文檢索,并在取得回應(yīng)110且對(duì)意圖數(shù)據(jù)112比`對(duì)后產(chǎn)生確定意圖語(yǔ)法數(shù)據(jù)114,最后由分析結(jié)果輸出模塊116所送出的分析結(jié)果104,而產(chǎn)生包含“三國(guó)演義”的三個(gè)意圖選項(xiàng)的候選答案,并將其整合成一候選列表511 (亦即包含“看書”、“看電視劇”、以及“看電影”三個(gè)選項(xiàng)),接著再?gòu)暮蜻x列表511的這三個(gè)意圖選項(xiàng)中選出一個(gè)熱度欄最高的答案(例如挑選圖1A的記錄10)做為回報(bào)答案。在一實(shí)施例中,可以直接執(zhí)行熱度欄最高者的所對(duì)應(yīng)的方式,例如直接播放蕭敬騰所演唱的“背叛”予用戶,本發(fā)明并不對(duì)此加以限制。此外,自然語(yǔ)言處理模塊524還可藉由解析后續(xù)所接收的另一個(gè)語(yǔ)音輸入501 (因?yàn)榕c先前的語(yǔ)音輸入501運(yùn)用同樣的方式饋入語(yǔ)音取樣模塊510),而判斷前次的回報(bào)答案是否正確,此語(yǔ)音是用戶針對(duì)先前提供予用戶的語(yǔ)音應(yīng)答507所做的回應(yīng),其包含用戶認(rèn)為先前的語(yǔ)音應(yīng)答507正確與否的信息。倘若上述回報(bào)答案表示用戶認(rèn)為回報(bào)答案(亦即先前通過(guò)語(yǔ)音應(yīng)答507傳達(dá)給用戶者)不正確,自然語(yǔ)言處理模塊524還會(huì)選擇上述候選列表511中的其他答案,并依據(jù)所選擇的結(jié)果,通過(guò)語(yǔ)音合成模塊526產(chǎn)生第二語(yǔ)音應(yīng)答507 (因?yàn)橐餐瑯油ㄟ^(guò)先前傳送語(yǔ)音應(yīng)答507的方式播放予用戶)。接著,語(yǔ)音合成模塊526可將合成的第二語(yǔ)音應(yīng)答507亦通過(guò)語(yǔ)音輸出接口輸出予用戶。延續(xù)先前用戶輸入“我要看三國(guó)演義”的例子來(lái)說(shuō),若用戶想要看三國(guó)演義的電視劇,所以先前輸出與用戶的圖1A記錄10的選項(xiàng)(因?yàn)槭强础叭龂?guó)演義”的電影)就不是用戶想要的,所以用戶可能輸入“我要看三國(guó)演義電視劇”、或是“我不要看三國(guó)演義電影”…等作為第二語(yǔ)音輸入501。于是第二語(yǔ)音輸入501將在解析而取得其請(qǐng)求信息505 (或是特征語(yǔ)義509)后,輸出“我現(xiàn)在為您播放三國(guó)演義電視劇”的第二語(yǔ)音應(yīng)答507 (如果用戶想觀看三國(guó)演義電視劇)、或是輸出“您想要的是哪個(gè)選項(xiàng)”(如果用戶只否定目前選項(xiàng))的第二語(yǔ)音應(yīng)答507,并搭配候選列表511其他的選項(xiàng)供用戶選取。此外,在一實(shí)施例中,先前的語(yǔ)音應(yīng)答507所輸出的是候選列表111的某個(gè)選項(xiàng)給用戶供其判定是否其所想要的信息時(shí),此時(shí)用戶將輸入此判定的“肯定”或“否定”的請(qǐng)求信息505。例如“請(qǐng)播放電影”、“這不是我要的東西”…等訊息。于是第二語(yǔ)音輸入501將在解析而取得其請(qǐng)求信息505后,輸出“我現(xiàn)在為您播放三國(guó)演義電影”的第二語(yǔ)音應(yīng)答507 (如果用戶想觀看三國(guó)演義電影)、或是輸出“您想要的是哪個(gè)選項(xiàng)”(如果用戶只否定目前選項(xiàng))的第二語(yǔ)音應(yīng)答507,并搭配輸出候選列表511其他的選項(xiàng)供用戶選取。再者,在另一實(shí)施例中,若是依照優(yōu)先順序(例如全匹配、部分匹配…)顯示候選列表511與用戶時(shí),用戶所輸入的第二語(yǔ)音輸入501可能包含“選擇”的訊息。例如顯示“觀看三國(guó)演義書籍”、“觀看三國(guó)演義電視劇”、以及“觀看三國(guó)演義電影”三個(gè)選項(xiàng)給用戶做選擇時(shí),用戶可能輸入“我要看電影”、或是“我要第三個(gè)選項(xiàng)”…等第二語(yǔ)音輸入時(shí),將在分析第二語(yǔ)音輸入501的請(qǐng)求信息505并發(fā)現(xiàn)用戶的意圖后(例如選擇觀看電影),于是第二語(yǔ)音輸入501將在解析而取得其請(qǐng)求信息505后,輸出“我現(xiàn)在為您播放三國(guó)演義電影”的第二語(yǔ)音應(yīng)答507 (如果用戶想觀看三國(guó)演義電影)然后直接播放電影予用戶、或是輸出“您想要的是閱讀三國(guó)演義書籍”(如果所選擇的是看書)的第二語(yǔ)音應(yīng)答507,并搭配顯示三國(guó)演義的電子書予用戶的動(dòng)作。在本實(shí)施例中,前述自然語(yǔ)言理解模塊520中的語(yǔ)音識(shí)別模塊522、自然語(yǔ)言處理模塊524以及語(yǔ)音合成模塊526可與語(yǔ)音取樣模塊510配置在同一機(jī)器中。在其他實(shí)施例中,語(yǔ)音識(shí)別模塊522、自然語(yǔ)言處理模塊524以及語(yǔ)音合成模塊526亦可分散在不同的機(jī)器(例如計(jì)算機(jī)系統(tǒng)、伺服器或類似裝置/系統(tǒng))中。例如圖5C所示的自然語(yǔ)言理解模塊520’,語(yǔ)音合成模塊526可與語(yǔ)音取樣·模塊510配置在同一機(jī)器502,而語(yǔ)音識(shí)別模塊522、自然語(yǔ)言處理模塊524可配置在另一機(jī)器。以下即搭配上述搭配圖5A的自然語(yǔ)言對(duì)話系統(tǒng)500來(lái)說(shuō)明修正語(yǔ)音應(yīng)答507的方法。圖6是依照本發(fā)明一實(shí)施例所繪示的修正語(yǔ)音應(yīng)答507的方法流程圖。在本實(shí)施例中的修正語(yǔ)音應(yīng)答507的方法中,當(dāng)用戶認(rèn)為目前所播放的語(yǔ)音應(yīng)答507不符合其先前所輸入的請(qǐng)求信息505時(shí),會(huì)再輸入另一個(gè)語(yǔ)音輸入501并饋入語(yǔ)音取樣模塊510,隨后再由自然語(yǔ)言理解模塊520分析而得知先前播放予用戶的語(yǔ)音應(yīng)答507并不符合用戶的意圖時(shí),自然語(yǔ)言理解模塊520可再次輸出另一個(gè)語(yǔ)音應(yīng)答507,藉以修正原本的語(yǔ)音應(yīng)答507。為了方便說(shuō)明,在此僅舉圖5A的自然語(yǔ)言對(duì)話系統(tǒng)500為例,但本實(shí)施例的修正語(yǔ)音應(yīng)答507的方法亦可適用于上述圖5C的自然語(yǔ)言對(duì)話系統(tǒng)500’。請(qǐng)同時(shí)參照?qǐng)D5A及圖6,于步驟S602中,語(yǔ)音取樣模塊510會(huì)接收第一語(yǔ)音輸入(亦同樣通過(guò)語(yǔ)音輸入501的方向饋入語(yǔ)音取樣模塊510)。其中,第一語(yǔ)音輸入501例如是來(lái)自用戶的語(yǔ)音,且第一語(yǔ)音輸入501還可具有用戶的請(qǐng)求信息105。具體而言,來(lái)自用戶的第一語(yǔ)音輸入501可以是詢問(wèn)句、命令句或其他請(qǐng)求信息505等,例如「我要看三國(guó)演義」、「我要聽(tīng)忘情水的音樂(lè)」或「今天溫度幾度」等等。于步驟S604中,自然語(yǔ)言理解模塊520會(huì)解析第一語(yǔ)音輸入501中所包括的至少一個(gè)特征語(yǔ)義509,而獲得候選列表511,其中候選列表511具有一個(gè)或多個(gè)候選答案。詳細(xì)而言,自然語(yǔ)言理解模塊520會(huì)解析第一語(yǔ)音輸入501,而獲得第一語(yǔ)音輸入501的一個(gè)或多個(gè)特征語(yǔ)義509。在此,特征語(yǔ)義509例如是自然語(yǔ)言理解模塊520解析第一語(yǔ)音輸入501后,所得到的關(guān)鍵字或請(qǐng)求信息等。舉例來(lái)說(shuō),當(dāng)用戶的第一語(yǔ)音輸入501為「我要看三國(guó)演義」時(shí),自然語(yǔ)言理解模塊520經(jīng)過(guò)分析后所獲得的特征語(yǔ)義509例如是「『三國(guó)演義』、『看』」。又例如,當(dāng)用戶的第一語(yǔ)音輸入501為「我要聽(tīng)忘情水的歌」時(shí),自然語(yǔ)言理解模塊520經(jīng)過(guò)分析后所獲得的特征語(yǔ)義509例如是「『忘情水』、『聽(tīng)』、『歌』」。接后,自然語(yǔ)言理解模塊520可依據(jù)上述特征語(yǔ)義509自搜尋數(shù)據(jù)庫(kù)(例如搜尋引擎等)進(jìn)行查詢,而獲得至少一筆搜尋結(jié)果,據(jù)以做為候選列表511中的各個(gè)候選答案。至于選擇候選答案的方式可如圖1A所述,在此不予以贅述。由于一個(gè)特征語(yǔ)義509(例如圖1A的關(guān)鍵字108)可能屬于不同的知識(shí)領(lǐng)域或?qū)傩?例如電影類、書籍類、音樂(lè)類或游戲類等等),且同一知識(shí)領(lǐng)域或?qū)傩灾幸嗫蛇M(jìn)一步分成多種類別(例如同一電影或書籍名稱的不同作者、同一歌曲名稱的不同演唱者、同一游戲名稱的不同版本等等),故針對(duì)一個(gè)特征語(yǔ)義509而言,自然語(yǔ)言理解模塊520可在搜尋數(shù)據(jù)庫(kù)中查詢到一筆或多筆相關(guān)于此特征語(yǔ)義509的搜尋結(jié)果,其中每一筆搜尋結(jié)果中可包括相關(guān)于此特征語(yǔ)義509的各類指引信息(例如以“蕭敬騰”、“背叛”為關(guān)鍵字108在圖3A、3B的結(jié)構(gòu)化數(shù)據(jù)庫(kù)220進(jìn)行全文檢索時(shí),將得到兩組匹配結(jié)果)。其中,指引信息例如是在搜尋結(jié)果中,除了特征語(yǔ)義509以外的其他關(guān)鍵字等等。因此從另一觀點(diǎn)來(lái)看,當(dāng)用戶所輸入的第一語(yǔ)音輸入501具有多個(gè)特征語(yǔ)義509時(shí)(例如可解析出的關(guān)鍵字108越多),則表示用戶的請(qǐng)求信息505較明確,使得自然語(yǔ)言理解模塊520較能查詢到與請(qǐng)求信息505接近的搜尋結(jié)果。舉例來(lái)說(shuō),當(dāng)特征語(yǔ)義509為「三國(guó)演義」時(shí),自然語(yǔ)言理解模塊520所查訊到的搜尋結(jié)果例如是關(guān)于「...『三國(guó)演義』...『電視劇』」的數(shù)據(jù)、「...『三國(guó)演義』...『小說(shuō)』」的數(shù)據(jù)、「...『三國(guó)演義』...『羅貫中』...『小說(shuō)』」的數(shù)據(jù),其中『電視劇』、『羅貫中』及『小說(shuō)』為所列舉的指引信息。又例如,當(dāng)特征語(yǔ)義509為「『忘情水』『音樂(lè)』」時(shí),自然語(yǔ)言理解模塊520所查訊到的搜尋結(jié)果例如關(guān)于「...『忘情水』...『音樂(lè)』...『劉德華』」的數(shù)據(jù)、「...『忘情水』...『音樂(lè)』...『李翊君』」的數(shù)據(jù)、「...『忘情水』...『音樂(lè)』...『歌詞』」的數(shù)據(jù),其中『劉德華』、『李翊君』及『歌詞』為所列舉的指引信息。換言之,每一筆搜尋結(jié)果可包括特征語(yǔ)義509以及相關(guān)于特征語(yǔ)義的指引信息,而自然語(yǔ)言理解模塊520會(huì)依據(jù)所查詢到的搜尋結(jié)果,將搜尋結(jié)果中所包括的數(shù)據(jù)轉(zhuǎn)換成候選答案,并將候選答案記錄于候選列表511中,以供后續(xù)步驟使用。
于步驟S606中,自然語(yǔ)言理解模塊520會(huì)自候選列表511中選擇至少一候選答案中作為回報(bào)答案,并依據(jù)回報(bào)答案,輸出對(duì)應(yīng)的第一語(yǔ)音應(yīng)答507。在本實(shí)施例中,自然語(yǔ)言理解模塊520可按照優(yōu)先順序排列候選列表中的候選答案,并依據(jù)此優(yōu)先順序自候選列表中選出回報(bào)答案,據(jù)以輸出第一語(yǔ)音應(yīng)答507。舉例來(lái)說(shuō),當(dāng)特征語(yǔ)義509為「三國(guó)演義」時(shí),假設(shè)自然語(yǔ)言理解模塊520查詢到很多筆關(guān)于「...『三國(guó)演義』...『書籍』」的數(shù)據(jù),其次為「...『三國(guó)演義』...『音樂(lè)』」的數(shù)據(jù),而關(guān)于「...『三國(guó)演義』...『電視劇』」的數(shù)據(jù)最少,則自然語(yǔ)言理解模塊520會(huì)將「三國(guó)演義的書籍」做為第一優(yōu)先候選答案,「三國(guó)演義的音樂(lè)」做為第二優(yōu)先候選答案,「三國(guó)演義的電視劇」做為第三優(yōu)先候選答案。其他細(xì)節(jié)前面已提過(guò),在此不予贅述。接著,于步驟S608,語(yǔ)音取樣模塊510會(huì)接收第二語(yǔ)音輸入501,而自然語(yǔ)言理解模塊520會(huì)解析此第二語(yǔ)音輸入501,并判斷先前所選出的回報(bào)答案是否正確。在此,語(yǔ)音取樣模塊510會(huì)對(duì)第二語(yǔ)音輸入501進(jìn)行解析,以解析出第二語(yǔ)音輸入501所包括的特征語(yǔ)義509 (因?yàn)閷⒔?jīng)由標(biāo)號(hào)509的方向由語(yǔ)音取樣模塊522輸出至自然語(yǔ)言處理模塊524),其中此特征語(yǔ)義509例如是用戶進(jìn)一步提供的關(guān)鍵字(例如時(shí)間、意圖、知識(shí)領(lǐng)域或?qū)傩缘鹊?。并且,當(dāng)?shù)诙Z(yǔ)音輸入501中的特征語(yǔ)義509不符合回報(bào)答案中所相關(guān)的指引信息時(shí),自然語(yǔ)言理解模塊520則會(huì)判斷先前所選出的回報(bào)答案為不正確。至于判斷第二語(yǔ)音輸入501的請(qǐng)求信息505包含的是“正確”或“否定”第一語(yǔ)音應(yīng)答507的方式前面已提過(guò),在此不予贅述。進(jìn)一步而言,自然語(yǔ)言理解模塊520所解析的第二語(yǔ)音輸入501可包括或不包括明確的特征語(yǔ)義509。舉例來(lái)說(shuō),語(yǔ)音取樣模塊510例如是接收到來(lái)自用戶所說(shuō)的「我不是指三國(guó)演義的書籍」(情況A)、「我不是指三國(guó)演義的書籍,我是指三國(guó)演義的電視劇」(情況B)、「我是指三國(guó)演義的電視劇」(情況C)等等。上述情況A中的特征語(yǔ)義509例如為「『不是』『三國(guó)演義』『書籍』」,情況B中的特征語(yǔ)義509例如為「『不是』『三國(guó)演義』『書籍』,『是』『三國(guó)演義』『電視劇』」,而情況C中的特征語(yǔ)義509例如為「『是』『三國(guó)演義』『電視劇』J。為了方便說(shuō)明,上述僅列舉情況A、B及C為例,但本實(shí)施例并不限于此。接著,自然語(yǔ)言理解模塊520會(huì)依據(jù)上述第二語(yǔ)音輸入501所包括的特征語(yǔ)義509,來(lái)判斷回報(bào)答案中相關(guān)的指引信息是否正確。也就是說(shuō),倘若斷回報(bào)答案為「三國(guó)演義的書籍」,而上述特征語(yǔ)義509為「『三國(guó)演義』『電視劇』」,則自然語(yǔ)言理解模塊520會(huì)判斷回報(bào)答案中相關(guān)的指引信息(即『書籍』)不符合來(lái)自用戶第二語(yǔ)音輸入501的特征語(yǔ)義509 (即『電視劇』),藉以判斷回報(bào)答案不正確。類似地,倘若斷回報(bào)答案為「三國(guó)演義的書籍」,而上述特征語(yǔ)義509為『不是』『三國(guó)演義』『書籍』」,則自然語(yǔ)言理解模塊520亦會(huì)判斷出回報(bào)答案不正確。當(dāng)自然語(yǔ)言理解模塊520解析第二語(yǔ)音輸入501之后,判斷之前輸出的第一語(yǔ)音應(yīng)答501為正確時(shí),則如步驟S610所示,自然語(yǔ)言理解模塊120會(huì)做出對(duì)應(yīng)于第二語(yǔ)音輸Λ 501的回應(yīng)。舉例來(lái)說(shuō),假設(shè)來(lái)自用戶的第二語(yǔ)音輸入501為「是的,是三國(guó)演義的書籍」,則自然語(yǔ)言理解模塊520可以是輸出「正在幫您開(kāi)啟三國(guó)演義的書籍」的第二語(yǔ)音應(yīng)答507。或者,自然語(yǔ)言理解模塊520可在播放第二語(yǔ)音應(yīng)答507的同時(shí),直接通過(guò)處理單元(未繪示)來(lái)載入三國(guó)演義的書籍內(nèi)容。
然而,當(dāng)自然語(yǔ)言理解模塊520解析第二語(yǔ)音輸入501之后,判斷之前輸出的第一語(yǔ)音應(yīng)答507不正確時(shí),則如步驟S612所示,自然語(yǔ)言理解模塊520會(huì)自候選列表511中選擇候選答案中的另一者,并依據(jù)所選擇的結(jié)果輸出第二語(yǔ)音應(yīng)答507。在此,倘若用戶所提供的第二語(yǔ)音輸入501中不具有明確的特征語(yǔ)義509 (如上述情況A的第二語(yǔ)音輸入501),則自然語(yǔ)言理解模塊520可從候選列表511中選出另一個(gè)候選答案?;蛘?,倘若用戶所提供的第二語(yǔ)音輸入501中具有明確的特征語(yǔ)義509 (如上述情況B及C的第二語(yǔ)音輸入501),則自然語(yǔ)言理解模塊520可直接依據(jù)用戶所指引的特征語(yǔ)義509,在從候選列表511中選出另一個(gè)候選答案。另一方面,倘若用戶所提供的第二語(yǔ)音輸入501中具有明確的特征語(yǔ)義509(如上述情況B及C的第二語(yǔ)音輸入),但自然語(yǔ)言理解模塊520在候選列表511中查無(wú)符合此特征語(yǔ)義509的指引信息的候選答案,則自然語(yǔ)言理解模塊520會(huì)輸出第三語(yǔ)音應(yīng)答507,例如「查無(wú)此書」或「我不知道」等。為了使本領(lǐng)域的技術(shù)人員進(jìn)一步了解本實(shí)施例的修正語(yǔ)音應(yīng)答的方法以及自然語(yǔ)言對(duì)話系統(tǒng),以下再舉一實(shí)施例進(jìn)行詳細(xì)的說(shuō)明。首先,假設(shè)語(yǔ)音取樣模塊510接收的第一語(yǔ)音輸入501為「我要看三國(guó)演義」(步驟S602),接著,自然語(yǔ)言理解模塊520可解析出為「『看』『三國(guó)演義』」的特征語(yǔ)義509,并獲得具有多個(gè)候選答案的候選列表511,其中每一個(gè)候選答案具有相關(guān)的指引信息(步驟S604),如表一所不。表一
權(quán)利要求
1.一種自然語(yǔ)言對(duì)話系統(tǒng),包括: 一特性數(shù)據(jù)庫(kù); 一語(yǔ)音取樣模塊,接收一第一語(yǔ)音輸入;以及 一自然語(yǔ)言理解模塊,耦接于該特性數(shù)據(jù)庫(kù)及該語(yǔ)音取樣模塊,該自然語(yǔ)言理解模塊解析該第一語(yǔ)音輸入中所包括的至少一特征語(yǔ)義,而獲得一候選列表,其中該候選列表具有至少一候選答案,該自然語(yǔ)言理解模塊依據(jù)一特性數(shù)據(jù)庫(kù),自該候選列表中選擇該至少一候選答案中的其中之一為一回報(bào)答案,且依據(jù)該回報(bào)答案,輸出一第一語(yǔ)音應(yīng)答,該語(yǔ)音取樣模塊并接收其他多個(gè)語(yǔ)音輸入,該自然語(yǔ)言理解模塊根據(jù)該其他多個(gè)語(yǔ)音輸入,擷取用戶喜好屬性,并將該用戶喜好屬性儲(chǔ)存至該特性數(shù)據(jù)庫(kù)。
2.如權(quán)利要求1所述的自然語(yǔ)言對(duì)話系統(tǒng),其中該自然語(yǔ)言理解模塊按照一優(yōu)先順序排列該候選列表中的該至少一候選答案,以及依據(jù)該優(yōu)先順序自該候選列表中選擇該回報(bào)答案。
3.如權(quán)利要求2所述的自然語(yǔ)言對(duì)話系統(tǒng),還包括該自然語(yǔ)言理解模塊依據(jù)該特性數(shù)據(jù)庫(kù)所儲(chǔ)存的該用戶喜好屬性,決定該至少一候選答案的該優(yōu)先順序,該至少一候選答案相關(guān)于一指引信息。
4.如權(quán)利要求2所述的自然語(yǔ)言對(duì)話系統(tǒng),其中該特性數(shù)據(jù)庫(kù)更儲(chǔ)存用戶習(xí)慣,而該自然語(yǔ)言理解模塊依據(jù)該用戶習(xí)慣,以決定該至少一候選答案的該優(yōu)先順序,該至少一候選答案相關(guān)于一指引信息。
5.如權(quán)利要求2所述的自然語(yǔ)言對(duì)話系統(tǒng),其中該特性數(shù)據(jù)庫(kù)更儲(chǔ)存眾人使用習(xí)慣,該自然語(yǔ)言理解模塊依據(jù)該眾人使用習(xí)慣,以決定該至少一候選答案的該優(yōu)先順序,該至少一候選答案相關(guān)于一指引信息。
6.如權(quán)利要求2所述的自然語(yǔ)言對(duì)話系統(tǒng),還包括: 一自然語(yǔ)言數(shù)據(jù)庫(kù),耦接至該自然語(yǔ)言理解模塊,根據(jù)該自然語(yǔ)言數(shù)據(jù)庫(kù),該自然語(yǔ)言理解模塊查詢?cè)摰谝徽Z(yǔ)音輸入的該至少一特征語(yǔ)義在該自然語(yǔ)言數(shù)據(jù)庫(kù)中所對(duì)應(yīng)的一應(yīng)答信息,以及選取具有與該應(yīng)答信息符合的一指引信息的該至少一候選答案,以做為該回報(bào)答案。
7.如權(quán)利要求2所述的自然語(yǔ)言對(duì)話系統(tǒng),該自然語(yǔ)言理解模塊解析一第二語(yǔ)音輸入,并獲得至少一關(guān)鍵詞匯,其中該第二語(yǔ)音輸入于該第一語(yǔ)音輸入之前被該語(yǔ)音取樣模塊接收,以及該自然語(yǔ)言理解模塊選取具有與該至少一關(guān)鍵詞匯符合的一指引信息的該至少一候選答案,以做為該回報(bào)答案。
8.如權(quán)利要求1所述的自然語(yǔ)言對(duì)話系統(tǒng),適用于一移動(dòng)通訊裝置。
9.一種自然語(yǔ)言對(duì)話方法,包括: 接收一第一語(yǔ)音輸入; 解析第一語(yǔ)音輸入中所包括的至少一特征語(yǔ)義,而獲得一候選列表,其中該候選列表具有至少一候選答案; 依據(jù)一特性數(shù)據(jù)庫(kù),自該候選列表中選擇該至少一候選答案中的其中之一為一回報(bào)答案; 依據(jù)該回報(bào)答案,輸出一第一語(yǔ)音應(yīng)答; 接收其他多個(gè)語(yǔ)音輸入;根據(jù)該其他多個(gè)語(yǔ)音輸入,擷取用戶喜好屬性;以及 將該用戶喜好屬性儲(chǔ)存至該特性數(shù)據(jù)庫(kù)。
10.如權(quán)利要求9所述的自然語(yǔ)言對(duì)話方法,還包括: 按照一優(yōu)先順序排列該候選列表中的該至少一候選答案;以及 依據(jù)該優(yōu)先順序自該候選列表中選擇該回報(bào)答案。
11.如權(quán)利要求10所述的自然語(yǔ)言對(duì)話方法,還包括: 依據(jù)該特性數(shù)據(jù)庫(kù)所儲(chǔ)存的該用戶喜好屬性,決定該至少一候選答案的該優(yōu)先順序,其中該至少一候選答案相關(guān)于一指引信息。
12.如權(quán)利要求10所述的自然語(yǔ)言對(duì)話系方法,還包括: 利用該特定數(shù)據(jù)庫(kù)儲(chǔ)存用戶習(xí)慣;以及 依據(jù)該用戶習(xí)慣,決定該至少一候選答案的該優(yōu)先順序,其中該至少一候選答案相關(guān)于一指引信息。
13.如權(quán)利要求10所述的自然語(yǔ)言對(duì)話方法,還包括: 利用該特定數(shù)據(jù)庫(kù)儲(chǔ)存眾人使用習(xí)慣;以及 依據(jù)該眾人使用習(xí)慣,決定該至少一候選答案的該優(yōu)先順序,其中該至少一候選答案相關(guān)于一指引信息。
14.如權(quán)利要 求10所述的自然語(yǔ)言對(duì)話方法,其中該至少一候選答案相關(guān)于一指引信息,以及在選擇該回報(bào)答案的步驟包括: 依照一自然語(yǔ)言數(shù)據(jù)庫(kù),查詢?cè)摰谝徽Z(yǔ)音輸入的該至少一特征語(yǔ)義在該自然語(yǔ)言數(shù)據(jù)庫(kù)中所對(duì)應(yīng)的一應(yīng)答信息;以及 選取具有與該應(yīng)答信息符合的該指引信息的該至少一候選答案,以做為該回報(bào)答案。
15.如權(quán)利要求10所述的自然語(yǔ)言對(duì)話方法,其中該至少一候選答案相關(guān)于一指引信息,以及選擇該回報(bào)答案步驟還包括: 解析一第二語(yǔ)音輸入,并獲得至少一關(guān)鍵詞匯,其中該第二語(yǔ)音輸入于該第一語(yǔ)音輸入之前輸入;以及 選取具有與該少一關(guān)鍵詞匯符合的該指引信息的該至少一候選答案,以做為該回報(bào)答案。
16.如權(quán)利要求9所述的自然語(yǔ)言對(duì)話系統(tǒng),適用于一移動(dòng)通訊裝置。
全文摘要
一種自然語(yǔ)言對(duì)話方法及其系統(tǒng),此方法包括下列步驟接收第一語(yǔ)音輸入,并解析第一語(yǔ)音輸入中所包括的至少一特征語(yǔ)義,而獲得候選列表,其中候選列表具有至少一候選答案。根據(jù)一特性數(shù)據(jù)庫(kù),自候選列表中選擇候選答案中的其中之一為回報(bào)答案,并依據(jù)回報(bào)答案,輸出第一語(yǔ)音應(yīng)答。接收其他多個(gè)語(yǔ)音輸入,根據(jù)其他多個(gè)語(yǔ)音輸入,擷取用戶喜好屬性,并將用戶喜好屬性儲(chǔ)存至特性數(shù)據(jù)庫(kù)。
文檔編號(hào)G06F17/28GK103077165SQ20121059223
公開(kāi)日2013年5月1日 申請(qǐng)日期2012年12月31日 優(yōu)先權(quán)日2012年12月31日
發(fā)明者張國(guó)峰 申請(qǐng)人:威盛電子股份有限公司