用戶可以通過提供諸如鍵入的或者口語(yǔ)的搜索查詢之類的搜索查詢,來搜索內(nèi)容倉(cāng)庫(kù)中的內(nèi)容,并且作為響應(yīng),接收與搜索查詢有關(guān)的內(nèi)容項(xiàng)目(有時(shí)稱作“條目”)的列表。在一些系統(tǒng)中,條目的列表(有時(shí)也稱作“搜索結(jié)果”)可以由分類器識(shí)別,分類器已經(jīng)被訓(xùn)練為將查詢和內(nèi)容倉(cāng)庫(kù)中的相關(guān)條目相關(guān)聯(lián)。在先前的訓(xùn)練的基礎(chǔ)上,分類器可以通過識(shí)別與查詢有關(guān)的一個(gè)或多個(gè)條目,將新的查詢分類為與特定的內(nèi)容有關(guān)。
技術(shù)實(shí)現(xiàn)要素:
一些實(shí)施例包括響應(yīng)用戶話音查詢而搜索至少一個(gè)內(nèi)容倉(cāng)庫(kù)中的內(nèi)容的方法,該方法包括下面的動(dòng)作:接收用戶話音查詢;對(duì)用戶話音查詢執(zhí)行語(yǔ)音辨識(shí),以生成針對(duì)用戶話音查詢的N個(gè)最佳語(yǔ)音辨識(shí)結(jié)果,其中N等于一個(gè)或多個(gè),并且其中N個(gè)最佳語(yǔ)音辨識(shí)結(jié)果包括第一語(yǔ)音辨識(shí)結(jié)果;執(zhí)行對(duì)至少一個(gè)內(nèi)容倉(cāng)庫(kù)的有監(jiān)督搜索,以識(shí)別一個(gè)或多個(gè)有監(jiān)督搜索結(jié)果的集合,其中一個(gè)或多個(gè)有監(jiān)督搜索結(jié)果中的每一個(gè)有監(jiān)督搜索結(jié)果與分?jǐn)?shù)相關(guān)聯(lián),該分?jǐn)?shù)指示一個(gè)或多個(gè)有監(jiān)督搜索結(jié)果中的這個(gè)有監(jiān)督搜索結(jié)果與用戶話音查詢的預(yù)測(cè)相關(guān)性,其中執(zhí)行有監(jiān)督搜索包括使用一個(gè)或多個(gè)分類器處理第一語(yǔ)音辨識(shí)結(jié)果,該一個(gè)或多個(gè)分類器將第一語(yǔ)音辨識(shí)結(jié)果分類成識(shí)別在至少一個(gè)內(nèi)容倉(cāng)庫(kù)中的先前被分類的內(nèi)容的至少一個(gè)分類;執(zhí)行對(duì)至少一個(gè)內(nèi)容倉(cāng)庫(kù)的無(wú)監(jiān)督搜索,以識(shí)別一個(gè)或多個(gè)無(wú)監(jiān)督搜索結(jié)果的集合,其中一個(gè)或多個(gè)無(wú)監(jiān)督搜索結(jié)果中的每一個(gè)無(wú)監(jiān)督搜索結(jié)果與分?jǐn)?shù)相關(guān)聯(lián),該分?jǐn)?shù)指示一個(gè)或多個(gè)無(wú)監(jiān)督搜索結(jié)果中的這個(gè)無(wú)監(jiān)督搜索結(jié)果與用戶話音查詢的預(yù)測(cè)相關(guān)性,其中執(zhí)行無(wú)監(jiān)督搜索包括使用從第一語(yǔ)音辨識(shí)結(jié)果得出的一個(gè)或多個(gè)單詞執(zhí)行對(duì)至少一個(gè)內(nèi)容倉(cāng)庫(kù)的單詞搜索;以及從一個(gè)或多個(gè)有監(jiān)督搜索結(jié)果的集合和一個(gè)或多個(gè)無(wú)監(jiān)督搜索結(jié)果的集合中生成經(jīng)組合的結(jié)果的集合。
一些實(shí)施例提供一種裝置,該裝置包括至少一個(gè)處理器,以及存儲(chǔ)處理器可執(zhí)行指令的至少一個(gè)存儲(chǔ)介質(zhì),處理器可執(zhí)行指令在由至少一個(gè)處理器執(zhí)行時(shí),執(zhí)行響應(yīng)用戶話音查詢而搜索至少一個(gè)內(nèi)容倉(cāng)庫(kù)中的內(nèi)容的方法,該方法包括下面的動(dòng)作:接收用戶話音查詢;對(duì)用戶話音查詢執(zhí)行語(yǔ)音辨識(shí),以生成針對(duì)用戶話音查詢的N個(gè)最佳語(yǔ)音辨識(shí)結(jié)果,其中N等于一個(gè)或多個(gè),并且其中N個(gè)最佳語(yǔ)音辨識(shí)結(jié)果包括第一語(yǔ)音辨識(shí)結(jié)果;執(zhí)行對(duì)至少一個(gè)內(nèi)容倉(cāng)庫(kù)的有監(jiān)督搜索,以識(shí)別一個(gè)或多個(gè)有監(jiān)督搜索結(jié)果的集合,其中一個(gè)或多個(gè)有監(jiān)督搜索結(jié)果中的每一個(gè)有監(jiān)督搜索結(jié)果與分?jǐn)?shù)相關(guān)聯(lián),該分?jǐn)?shù)指示一個(gè)或多個(gè)有監(jiān)督搜索結(jié)果中的這個(gè)有監(jiān)督搜索結(jié)果與用戶話音查詢的預(yù)測(cè)相關(guān)性,其中執(zhí)行有監(jiān)督搜索包括使用一個(gè)或多個(gè)分類器處理第一語(yǔ)音辨識(shí)結(jié)果,該一個(gè)或多個(gè)分類器將第一語(yǔ)音辨識(shí)結(jié)果分類成識(shí)別在至少一個(gè)內(nèi)容倉(cāng)庫(kù)中的先前被分類的內(nèi)容的至少一個(gè)分類;執(zhí)行對(duì)至少一個(gè)內(nèi)容倉(cāng)庫(kù)的無(wú)監(jiān)督搜索,以識(shí)別一個(gè)或多個(gè)無(wú)監(jiān)督搜索結(jié)果的集合,其中一個(gè)或多個(gè)無(wú)監(jiān)督搜索結(jié)果中的每一個(gè)無(wú)監(jiān)督搜索結(jié)果與分?jǐn)?shù)相關(guān)聯(lián),該分?jǐn)?shù)指示一個(gè)或多個(gè)無(wú)監(jiān)督搜索結(jié)果中的這個(gè)無(wú)監(jiān)督搜索結(jié)果與用戶話音查詢的預(yù)測(cè)相關(guān)性,其中執(zhí)行無(wú)監(jiān)督搜索包括使用從第一語(yǔ)音辨識(shí)結(jié)果得出的一個(gè)或多個(gè)單詞執(zhí)行對(duì)至少一個(gè)內(nèi)容倉(cāng)庫(kù)的單詞搜索;以及從一個(gè)或多個(gè)有監(jiān)督搜索結(jié)果的集合和一個(gè)或多個(gè)無(wú)監(jiān)督搜索結(jié)果的集合中生成經(jīng)組合的結(jié)果的集合。
一些實(shí)施例提供存儲(chǔ)計(jì)算機(jī)可執(zhí)行指令的至少一種計(jì)算機(jī)可讀介質(zhì),計(jì)算機(jī)可執(zhí)行指令在被執(zhí)行時(shí),執(zhí)行響應(yīng)于用戶話音查詢而搜索至少一個(gè)內(nèi)容倉(cāng)庫(kù)中的內(nèi)容的方法,該方法包括下面的動(dòng)作:接收用戶話音查詢;對(duì)用戶話音查詢執(zhí)行語(yǔ)音辨識(shí),以生成針對(duì)用戶話音查詢的N個(gè)最佳語(yǔ)音辨識(shí)結(jié)果,其中N等于一個(gè)或多個(gè),并且其中N個(gè)最佳語(yǔ)音辨識(shí)結(jié)果包括第一語(yǔ)音辨識(shí)結(jié)果;執(zhí)行對(duì)至少一個(gè)內(nèi)容倉(cāng)庫(kù)的有監(jiān)督搜索,以識(shí)別一個(gè)或多個(gè)有監(jiān)督搜索結(jié)果的集合,其中一個(gè)或多個(gè)有監(jiān)督搜索結(jié)果中的每一個(gè)與分?jǐn)?shù)相關(guān)聯(lián),該分?jǐn)?shù)指示一個(gè)或多個(gè)有監(jiān)督搜索結(jié)果中的這個(gè)有監(jiān)督搜索結(jié)果與用戶話音查詢的預(yù)測(cè)相關(guān)性,其中執(zhí)行有監(jiān)督搜索包括使用一個(gè)或多個(gè)分類器處理第一語(yǔ)音辨識(shí)結(jié)果,該一個(gè)或多個(gè)分類器將第一語(yǔ)音辨識(shí)結(jié)果分類成識(shí)別在至少一個(gè)內(nèi)容倉(cāng)庫(kù)中的先前被分類的內(nèi)容的至少一個(gè)分類;執(zhí)行對(duì)至少一個(gè)內(nèi)容倉(cāng)庫(kù)的無(wú)監(jiān)督搜索,以識(shí)別一個(gè)或多個(gè)無(wú)監(jiān)督搜索結(jié)果的集合,其中一個(gè)或多個(gè)無(wú)監(jiān)督搜索結(jié)果中的每一個(gè)無(wú)監(jiān)督搜索結(jié)果與分?jǐn)?shù)相關(guān)聯(lián),該分?jǐn)?shù)指示一個(gè)或多個(gè)無(wú)監(jiān)督搜索結(jié)果中的這個(gè)無(wú)監(jiān)督搜索結(jié)果與用戶話音查詢的預(yù)測(cè)相關(guān)性,其中執(zhí)行無(wú)監(jiān)督搜索包括使用從第一語(yǔ)音辨識(shí)結(jié)果得出的一個(gè)或多個(gè)單詞執(zhí)行對(duì)至少一個(gè)內(nèi)容倉(cāng)庫(kù)的單詞搜索;以及從一個(gè)或多個(gè)有監(jiān)督搜索結(jié)果的集合和一個(gè)或多個(gè)無(wú)監(jiān)督搜索結(jié)果的集合中生成經(jīng)組合的結(jié)果的集合。
前述概述是以例示方式提供的并且不旨在是限制性的。
附圖說明
附圖不旨在按照比例繪制。在附圖中,在各種圖中例示的每個(gè)相同或者幾乎相同的組件由相似的數(shù)字表示。為了清楚,可能不是每個(gè)組件都在每個(gè)附圖中標(biāo)注。在附圖中:
圖1描繪根據(jù)一些實(shí)施例的存儲(chǔ)與機(jī)動(dòng)車輛的操作有關(guān)的內(nèi)容的例示性內(nèi)容倉(cāng)庫(kù);
圖2是根據(jù)一些實(shí)施例的執(zhí)行對(duì)內(nèi)容倉(cāng)庫(kù)的有監(jiān)督搜索和/或無(wú)監(jiān)督搜索的例示性過程的流程圖;
圖3是根據(jù)一些實(shí)施例的基于一個(gè)或多個(gè)語(yǔ)音辨識(shí)結(jié)果執(zhí)行有監(jiān)督搜索和無(wú)監(jiān)督搜索兩者的例示性過程的流程圖;
圖4描繪根據(jù)一些實(shí)施例的搜索內(nèi)容倉(cāng)庫(kù)中的內(nèi)容的例示性過程;
圖5是根據(jù)一些實(shí)施例的基于一個(gè)或多個(gè)搜索查詢執(zhí)行有監(jiān)督搜索或者無(wú)監(jiān)督搜索的例示性過程的流程圖;
圖6描繪根據(jù)一些實(shí)施例的搜索內(nèi)容倉(cāng)庫(kù)中的內(nèi)容的例示性過程;
圖7描繪根據(jù)一些實(shí)施例的可以用來為有監(jiān)督搜索或者為無(wú)監(jiān)督搜索補(bǔ)充搜索查詢的例示性本體(ontology);以及
圖8例示在其上可以實(shí)現(xiàn)本發(fā)明的方面的計(jì)算系統(tǒng)環(huán)境的示例。
具體實(shí)施方式
如上面所討論的,分類器可以被訓(xùn)練為將查詢分類為與內(nèi)容倉(cāng)庫(kù)中的一個(gè)或多個(gè)已知條目有關(guān)。常規(guī)地,使用大集合的訓(xùn)練數(shù)據(jù)完成該訓(xùn)練,訓(xùn)練數(shù)據(jù)可以包括樣本輸入查詢,其中每個(gè)樣本輸入查詢具有識(shí)別倉(cāng)庫(kù)中與該查詢有關(guān)的內(nèi)容的一個(gè)或多個(gè)經(jīng)手工編碼(亦即,由人編碼)的結(jié)果。一旦經(jīng)過訓(xùn)練,分類器隨后就可以將新的查詢分類為與內(nèi)容有關(guān)(有時(shí)稱作“有監(jiān)督搜索”)。另外,分類器只有在將輸入查詢分類為與分類器已經(jīng)為其被訓(xùn)練的內(nèi)容有關(guān)時(shí)是有效的,使得如果新的內(nèi)容被添加到倉(cāng)庫(kù),那么它不能夠由分類器識(shí)別為與輸入查詢相關(guān),除非使用包括該新內(nèi)容的訓(xùn)練數(shù)據(jù)重新訓(xùn)練分類器。
發(fā)明者已經(jīng)認(rèn)識(shí)到并且領(lǐng)會(huì),新查詢的有效分類受用來訓(xùn)練分類器的訓(xùn)練數(shù)據(jù)的數(shù)量影響,有效的分類典型地需要大量的訓(xùn)練數(shù)據(jù)。為了執(zhí)行對(duì)內(nèi)容倉(cāng)庫(kù)中所有內(nèi)容的有監(jiān)督搜索并且獲得準(zhǔn)確的搜索結(jié)果,例如,分類器必須已經(jīng)預(yù)先在內(nèi)容倉(cāng)庫(kù)中的所有內(nèi)容上被訓(xùn)練。分類器可以替代地僅在內(nèi)容倉(cāng)庫(kù)中的內(nèi)容的一部分上被訓(xùn)練,但是這可能將搜索結(jié)果限制為僅來自內(nèi)容倉(cāng)庫(kù)的那部分的內(nèi)容,由此限制對(duì)用戶可用的信息。
發(fā)明者已經(jīng)認(rèn)識(shí)到并且領(lǐng)會(huì),通過使用有監(jiān)督技術(shù)和無(wú)監(jiān)督技術(shù)(亦即,不采用經(jīng)訓(xùn)練的分類器的技術(shù))來搜索內(nèi)容倉(cāng)庫(kù)能夠?qū)崿F(xiàn)有益的結(jié)果。例如,無(wú)監(jiān)督搜索可以包括關(guān)鍵字搜索和/或統(tǒng)計(jì)技術(shù)來識(shí)別內(nèi)容中的樣式,并且可以被用來將來自內(nèi)容倉(cāng)庫(kù)的一個(gè)或多個(gè)條目識(shí)別為與搜索查詢有關(guān)。一些例示性無(wú)監(jiān)督搜索技術(shù)在下面描述。
在一些實(shí)施例中,使用有監(jiān)督搜索技術(shù)和無(wú)監(jiān)督搜索技術(shù)兩者的“混合”方法允許分類器的訓(xùn)練辨識(shí)比使用僅有監(jiān)督方法將采用的條目更少的條目。分類器可以在內(nèi)容倉(cāng)庫(kù)中的條目的經(jīng)選擇的部分上訓(xùn)練,并且可以執(zhí)行使用混合方法的搜索?;旌纤阉骺梢酝ㄟ^有監(jiān)督分類來識(shí)別經(jīng)選擇的條目中的一個(gè)或多個(gè),并且可以使用無(wú)監(jiān)督搜索附加地識(shí)別條目(其可以包括經(jīng)選擇的條目、未經(jīng)選擇的條目和/或在分類器的訓(xùn)練之后添加到倉(cāng)庫(kù)的條目)。因此,在一些情況下,即使當(dāng)訓(xùn)練有監(jiān)督分類器時(shí)僅識(shí)別所有條目中的經(jīng)選擇的部分,也可以搜索內(nèi)容倉(cāng)庫(kù)中的所有條目。
在其他實(shí)施例中,與上面討論的僅有監(jiān)督方法相比較,混合方法可以允許使用較少的訓(xùn)練數(shù)據(jù)(例如,較少的訓(xùn)練查詢)訓(xùn)練分類器。一般來說,內(nèi)容的有監(jiān)督分類具有隨著用來訓(xùn)練分類器的訓(xùn)練實(shí)例(例如,示例性查詢)的數(shù)量增加而增加的準(zhǔn)確度(例如,將新的查詢正確地匹配到內(nèi)容的有效性)。為了使用僅有監(jiān)督方法從分類器獲得特定的準(zhǔn)確度,可能需要特定量的訓(xùn)練數(shù)據(jù)。使用混合方法可以允許使用減少的訓(xùn)練數(shù)據(jù)集合而獲得相同(或者更好)的期望準(zhǔn)確度,因?yàn)閷?duì)內(nèi)容倉(cāng)庫(kù)的無(wú)監(jiān)督搜索可以產(chǎn)生附加的搜索結(jié)果,這些附加的搜索結(jié)果可以至少部分地補(bǔ)償由于訓(xùn)練數(shù)據(jù)集合的大小的減小而導(dǎo)致的分類器的準(zhǔn)確度的任何降低。
根據(jù)一些實(shí)施例,可以通過將來自使用搜索查詢的對(duì)內(nèi)容倉(cāng)庫(kù)的有監(jiān)督搜索的搜索結(jié)果和從使用搜索查詢的對(duì)內(nèi)容倉(cāng)庫(kù)的無(wú)監(jiān)督搜索中產(chǎn)生的搜索結(jié)果組合,來執(zhí)行使用搜索查詢的對(duì)內(nèi)容倉(cāng)庫(kù)的搜索??梢院喜⒒蛘咭云渌绞浇M合搜索結(jié)果以產(chǎn)生搜索結(jié)果的單個(gè)集合,該搜索結(jié)果的單個(gè)集合可以被展示給用戶或者以任何其他適當(dāng)?shù)姆绞教幚怼T谝粋€(gè)實(shí)施例中,展示搜索結(jié)果的次序可以至少部分地基于與每個(gè)搜索結(jié)果相關(guān)聯(lián)的一個(gè)或多個(gè)分?jǐn)?shù)。例如,可以組合搜索結(jié)果的兩個(gè)集合,以基于與每個(gè)搜索結(jié)果相關(guān)聯(lián)的一個(gè)或多個(gè)分?jǐn)?shù)(例如,由分類器產(chǎn)生的置信度分?jǐn)?shù))的遞減次序或遞增次序來產(chǎn)生搜索結(jié)果的單個(gè)集合。然而,因?yàn)榭梢允褂糜糜诮M合搜索結(jié)果的任何適當(dāng)?shù)募夹g(shù),所以本文描述的本發(fā)明的方面在這一點(diǎn)上不受限制。
在一些實(shí)施例中,語(yǔ)音辨識(shí)結(jié)果基于用戶語(yǔ)音輸入而確定,并且被用來執(zhí)行對(duì)內(nèi)容倉(cāng)庫(kù)的無(wú)監(jiān)督搜索和有監(jiān)督搜索兩者。語(yǔ)音辨識(shí)結(jié)果可以是例如通過對(duì)用戶語(yǔ)音輸入執(zhí)行語(yǔ)音辨識(shí)而產(chǎn)生的N最佳列表中的一個(gè)語(yǔ)音辨識(shí)結(jié)果。由有監(jiān)督搜索和無(wú)監(jiān)督搜索中的每一者基于語(yǔ)音辨識(shí)結(jié)果產(chǎn)生的一個(gè)或多個(gè)搜索結(jié)果可以組合成搜索結(jié)果的集合。在一些實(shí)施例中,代表對(duì)用戶語(yǔ)音輸入的不同假設(shè)的多個(gè)語(yǔ)音辨識(shí)結(jié)果可以全都被用來執(zhí)行對(duì)內(nèi)容倉(cāng)庫(kù)的有監(jiān)督搜索和無(wú)監(jiān)督搜索,并且然后可以組合搜索結(jié)果以產(chǎn)生搜索結(jié)果的集合。
在一些實(shí)施例中,基于用戶語(yǔ)音輸入而確定的語(yǔ)音辨識(shí)結(jié)果可以被分類為有監(jiān)督搜索的候選、無(wú)監(jiān)督搜索的候選或者這二者。可以使用先前被訓(xùn)練為基于語(yǔ)音辨識(shí)結(jié)果識(shí)別內(nèi)容的類型的分類器將語(yǔ)音辨識(shí)結(jié)果分類成這些分類的一個(gè)。例如,如果由將輸入分類成內(nèi)容的相對(duì)較少數(shù)量分類中之一的分類器執(zhí)行有監(jiān)督搜索,那么將查詢識(shí)別為與這些分類中之一無(wú)關(guān)的第一階段分類器可以導(dǎo)致該輸入不被用來執(zhí)行有監(jiān)督搜索,這是考慮到有監(jiān)督搜索不太可能返回有關(guān)的結(jié)果。一旦被分類,語(yǔ)音辨識(shí)結(jié)果就可以按照由分類指定的方式使用,以從有監(jiān)督搜索、無(wú)監(jiān)督搜索或者這二者中產(chǎn)生一個(gè)或多個(gè)搜索結(jié)果。以這種方式,多個(gè)語(yǔ)音辨識(shí)結(jié)果可以被用來產(chǎn)生搜索結(jié)果,并且可以組合這些搜索結(jié)果以產(chǎn)生搜索結(jié)果的集合,該集合可以包括來自有監(jiān)督搜索和無(wú)監(jiān)督搜索這二者的搜索結(jié)果。在一些實(shí)施例中,使用分類器對(duì)語(yǔ)音辨識(shí)結(jié)果進(jìn)行分類以與有監(jiān)督搜索、無(wú)監(jiān)督搜索或者這二者一起使用,可以通過在執(zhí)行搜索之前基于語(yǔ)音辨識(shí)結(jié)果選擇一種類型或者另一種類型的搜索,來減少基于語(yǔ)音辨識(shí)結(jié)果執(zhí)行的無(wú)監(jiān)督搜索和/或有監(jiān)督搜索的數(shù)量。
如上面所討論的,一些實(shí)施例涉及使用經(jīng)訓(xùn)練的分類器對(duì)諸如語(yǔ)音辨識(shí)結(jié)果之類的查詢進(jìn)行分類。本文描述的技術(shù)不限于與任何特定的分類器技術(shù)一起使用,并且可以例如使用邏輯回歸分類器、支持向量機(jī)(SVM)分類器、指數(shù)族模型分類器或者任何其他適當(dāng)類型的分類器。本文描述的本發(fā)明的方面不局限于分類器的任何特定實(shí)現(xiàn)方式,并且能夠與任何適當(dāng)?shù)姆诸惼饕黄鹗褂谩?/p>
如上面所討論的,一些實(shí)施例涉及對(duì)內(nèi)容的無(wú)監(jiān)督搜索。無(wú)監(jiān)督搜索可以包括任何適當(dāng)?shù)臒o(wú)監(jiān)督技術(shù),無(wú)監(jiān)督技術(shù)的非限制性示例包括詞頻-逆文檔頻率法(TF/IDF)、Okapi BM25、向量空間模型、頁(yè)面排名(PageRank)以及關(guān)鍵字搜索。本文描述的本發(fā)明的方面不限于任何特定的無(wú)監(jiān)督技術(shù),并且能夠與任何適當(dāng)?shù)臒o(wú)監(jiān)督技術(shù)一起使用。
如本文描述的內(nèi)容倉(cāng)庫(kù)可以包括數(shù)字內(nèi)容的任何適當(dāng)匯集,包括但不局限于一個(gè)或多個(gè)文檔數(shù)據(jù)文件、一個(gè)或多個(gè)關(guān)系數(shù)據(jù)庫(kù)和/或一個(gè)或多個(gè)非臨時(shí)性數(shù)據(jù)流或流程,它們中的任何一個(gè)或多個(gè)可以存儲(chǔ)任何類型的內(nèi)容,包括但不局限于文本/文檔、音頻和/或視頻內(nèi)容。由內(nèi)容倉(cāng)庫(kù)存儲(chǔ)的條目可以包括任何數(shù)量的內(nèi)容類型(包括上面描述的那些),并且可以以任何適當(dāng)?shù)姆绞酱鎯?chǔ)。
在一些實(shí)施例中,分類器被訓(xùn)練為將輸入分類成代表常見請(qǐng)求的內(nèi)容的分類。例如,本文描述的混合方法中的有監(jiān)督搜索的分類器可以被訓(xùn)練為對(duì)輸入進(jìn)行分類,以識(shí)別描述常見問題的解決方案和/或常見詢問的問題的答案的條目。由此,可以通過使用被訓(xùn)練為基于對(duì)應(yīng)查詢識(shí)別所選擇條目中之一的分類器來提供搜索結(jié)果。在一些實(shí)施例中,搜索結(jié)果可以附加地基于對(duì)剩余內(nèi)容的無(wú)監(jiān)督搜索而產(chǎn)生。
在一些實(shí)施例中,搜索查詢中(例如,語(yǔ)音辨識(shí)結(jié)果中)的一個(gè)或多個(gè)單詞可以被用來訪問包括有關(guān)單詞和/或短語(yǔ)的分層結(jié)構(gòu)的本體。搜索查詢可以基于由本體識(shí)別為與查詢中的單詞有關(guān)的單詞和/或短語(yǔ)來補(bǔ)充,例如,通過將來自本體的一個(gè)或多個(gè)相關(guān)聯(lián)的元素并入到搜索查詢中(例如,通過將單詞添加到查詢)。由此,可以使用相關(guān)聯(lián)的元素?cái)U(kuò)展查詢的搜索空間。例如,元素“電話”可以在本體中與元素“電話機(jī)”和“移動(dòng)”相關(guān)聯(lián)。搜索查詢“我如何關(guān)閉我的電話?”可以由本體補(bǔ)充而生成額外包括單詞“電話機(jī)”和/或“移動(dòng)”的搜索查詢。然后可以基于經(jīng)補(bǔ)充的查詢來執(zhí)行搜索,這可以搜索比未經(jīng)補(bǔ)充的查詢更大部分的內(nèi)容倉(cāng)庫(kù)。
在一些實(shí)施例中,一個(gè)或多個(gè)搜索結(jié)果經(jīng)由用戶接口(例如,經(jīng)由顯示器和/或經(jīng)由合成語(yǔ)音)展示給用戶。可以使用用戶接口以任何適當(dāng)?shù)姆绞秸故颈蛔R(shí)別為搜索結(jié)果的任何條目。在一個(gè)實(shí)施例中,可以提供多個(gè)搜索結(jié)果的標(biāo)題或者摘要或者某個(gè)其他速記標(biāo)識(shí)符,并且用戶可以選擇用戶期望完整展示的一個(gè)或多個(gè)結(jié)果。在一些實(shí)施例中,使用多個(gè)模態(tài)(modality)。例如,識(shí)別為搜索結(jié)果的條目的標(biāo)題可以通過語(yǔ)音提供而條目的主體可以經(jīng)由顯示器提供。替代地或者附加地,由搜索結(jié)果代表的整個(gè)條目(例如,最高得分結(jié)果)可以經(jīng)由語(yǔ)音合成提供給用戶。然而,本文描述的本發(fā)明的方面不限于用于展示搜索結(jié)果和/或由搜索結(jié)果識(shí)別的內(nèi)容的任何特定技術(shù),并且可以與任何適當(dāng)?shù)恼故炯夹g(shù)一起使用。
如上面所討論的,分類器可以被訓(xùn)練為將輸入分類成與內(nèi)容倉(cāng)庫(kù)中的內(nèi)容的一部分有關(guān)的分類。然后可以隨后基于新的查詢?cè)谟斜O(jiān)督搜索中(亦即,使用經(jīng)訓(xùn)練的分類器和/或經(jīng)由無(wú)監(jiān)督搜索)搜索該部分內(nèi)容,而內(nèi)容倉(cāng)庫(kù)中的另一部分內(nèi)容可以僅經(jīng)由無(wú)監(jiān)督搜索進(jìn)行搜索。圖1例示包括兩個(gè)部分的內(nèi)容的例示性內(nèi)容倉(cāng)庫(kù),一個(gè)可用于有監(jiān)督搜索(并且可選地?zé)o監(jiān)督搜索)而另一個(gè)僅可用于無(wú)監(jiān)督搜索。
圖1描繪例示性實(shí)施例,其中內(nèi)容倉(cāng)庫(kù)存儲(chǔ)與機(jī)動(dòng)車輛的操作有關(guān)的內(nèi)容。內(nèi)容倉(cāng)庫(kù)100存儲(chǔ)包括例示性條目110的內(nèi)容部分101,以及包括例示性條目121和122的內(nèi)容部分102。包括例示性條目110的內(nèi)容部分101描繪典型地可以在機(jī)動(dòng)車輛所有者的手冊(cè)的主體中找到的內(nèi)容,而包括例示性條目121和122的內(nèi)容部分102以問/答格式的類型提供,其可以作為所有者的手冊(cè)的補(bǔ)充材料而創(chuàng)建。條目110、121和122可以以任何適當(dāng)?shù)母袷酱鎯?chǔ)在內(nèi)容倉(cāng)庫(kù)100中,諸如文本和/或音頻。在圖1的示例中,分類器可以已經(jīng)被訓(xùn)練為將查詢與內(nèi)容部分102的條目相關(guān)聯(lián),使得使用本文描述的混合方法的對(duì)內(nèi)容倉(cāng)庫(kù)100的搜索可以執(zhí)行對(duì)內(nèi)容部分101的無(wú)監(jiān)督搜索和/或可以執(zhí)行對(duì)內(nèi)容部分102的有監(jiān)督搜索(以及可選地還有無(wú)監(jiān)督搜索)。
在圖1的示例中,內(nèi)容部分102的問/答格式可以便于經(jīng)訓(xùn)練的分類器基于查詢可接受地識(shí)別相關(guān)問/答對(duì)(諸如條目121和/或122)以識(shí)別簡(jiǎn)明地解決用戶遇到的問題的內(nèi)容。
相比之下,條目110可能需要由用戶進(jìn)行仔細(xì)的解析以識(shí)別期望的信息(例如,如何打開霧燈)。不僅條目110包括與如何打開霧燈的特定問題不直接有關(guān)的不相干信息,而且在指示如何激活大燈開關(guān)以打開霧燈的文本附近也沒有提供重要的上下文信息,也就是“大燈開關(guān)”位于哪里。因此,雖然對(duì)條目110的搜索可以最終提供有幫助的信息,但是與訪問條目121相比較,用戶可能需要更費(fèi)勁來確定該信息,因?yàn)橛脩舯仨氃L問內(nèi)容的多個(gè)章節(jié)并且綜合這些章節(jié)中的信息來確定期望的信息。
如上面所討論的,發(fā)明者已經(jīng)認(rèn)識(shí)到并且領(lǐng)會(huì),雖然內(nèi)容102在可用時(shí)可以具有某些優(yōu)點(diǎn),但是該內(nèi)容的范圍可能是有限的。因此,雖然內(nèi)容部分102的方面(諸如問/答格式的簡(jiǎn)潔之類)在內(nèi)容倉(cāng)庫(kù)中用于搜索時(shí)可以提供優(yōu)于內(nèi)容部分101的優(yōu)點(diǎn),但是這些優(yōu)點(diǎn)仍然限于在內(nèi)容部分102中提供的特定內(nèi)容。例如,可能在內(nèi)容部分101中存在的信息(諸如如何打開停車燈)可能不存在于內(nèi)容部分102中。如上面所討論的,訓(xùn)練分類器執(zhí)行對(duì)該材料(例如,整個(gè)用戶手冊(cè))的有監(jiān)督搜索可能需要比僅僅針對(duì)內(nèi)容部分102訓(xùn)練數(shù)據(jù)來訓(xùn)練分類器多得多的訓(xùn)練數(shù)據(jù)。代替地,如果除了對(duì)內(nèi)容部分102的有監(jiān)督搜索之外,還執(zhí)行對(duì)內(nèi)容部分101的無(wú)監(jiān)督搜索,那么內(nèi)容(例如,如何打開停車燈)可以作為搜索結(jié)果而提供,而沒有必要獲得訓(xùn)練分類器搜索內(nèi)容部分101將必需的訓(xùn)練數(shù)據(jù)。
另外,在圖1的示例中,因?yàn)闂l目110的長(zhǎng)度,展示條目110可能不方便,而條目121更加簡(jiǎn)明。例如,用戶可能發(fā)現(xiàn)當(dāng)使用條目110展示(例如,通過閱讀或者收聽內(nèi)容)時(shí)難以回憶有關(guān)信息,因?yàn)橛脩粽谒阉鞯男畔?例如,如何打開霧燈)可能在比條目121中長(zhǎng)的展示上展開。對(duì)于用戶不方便或者難以閱讀來自內(nèi)容倉(cāng)庫(kù)的內(nèi)容(或者收聽內(nèi)容等)的情況和/或應(yīng)用而言,諸如條目121這樣的簡(jiǎn)明展示由此可以提供特定的優(yōu)點(diǎn)。例如,機(jī)動(dòng)車輛的駕駛員可能希望在駕駛同時(shí)學(xué)習(xí)車輛的操作。諸如條目121這樣的內(nèi)容可以為駕駛員在操作期間學(xué)習(xí)如何操作車輛的特征(諸如如何打開霧燈)提供快捷的方式。
在一些實(shí)施例中,接收用戶話音查詢并且使用從用戶話音查詢中生成的一個(gè)或多個(gè)語(yǔ)音辨識(shí)結(jié)果來執(zhí)行對(duì)內(nèi)容倉(cāng)庫(kù)的有監(jiān)督搜索和/或無(wú)監(jiān)督搜索。圖2是執(zhí)行對(duì)內(nèi)容倉(cāng)庫(kù)的有監(jiān)督搜索和/或無(wú)監(jiān)督搜索并且組合搜索結(jié)果的一個(gè)非限制性例示性過程200的流程圖。過程200可以由任何適當(dāng)?shù)脑O(shè)備執(zhí)行,在下面關(guān)于圖8討論設(shè)備的示例。
在動(dòng)作202中,接收用戶話音查詢。用戶話音查詢可以包括音頻數(shù)據(jù)并且可以以任何適當(dāng)?shù)姆绞浇邮?。例如,麥克風(fēng)或者其他音頻捕獲設(shè)備可以接收語(yǔ)音并且從語(yǔ)音中生成音頻數(shù)據(jù)。替代地或者附加地,可以提供包括音頻數(shù)據(jù)的數(shù)據(jù)文件(例如,如果在其上執(zhí)行過程200的計(jì)算機(jī)與具有麥克風(fēng)以接收話音輸入的計(jì)算機(jī)不同的話)。然而,因?yàn)榭梢允褂糜糜诮邮沼脩粼捯舨樵兊娜魏渭夹g(shù),所以這些是非限制性示例。
在動(dòng)作204中,基于用戶話音查詢生成語(yǔ)音辨識(shí)結(jié)果。該生成可以由自動(dòng)語(yǔ)音辨識(shí)(ASR)引擎執(zhí)行。例如,可以對(duì)用戶話音查詢執(zhí)行ASR,并且可以生成語(yǔ)音辨識(shí)結(jié)果的N最佳列表。在一些實(shí)施例中,語(yǔ)音辨識(shí)結(jié)果的一個(gè)或多個(gè)與指示語(yǔ)音辨識(shí)結(jié)果的預(yù)測(cè)相關(guān)性的分?jǐn)?shù)相關(guān)聯(lián)。例如,經(jīng)由ASR生成的語(yǔ)音辨識(shí)結(jié)果的N最佳列表中的每個(gè)結(jié)果可以與置信度分?jǐn)?shù)相關(guān)聯(lián),該置信度分?jǐn)?shù)可以由ASR過程產(chǎn)生。
在動(dòng)作206中,使用在動(dòng)作204中生成的語(yǔ)音辨識(shí)結(jié)果中的一個(gè)或多個(gè)來執(zhí)行對(duì)內(nèi)容倉(cāng)庫(kù)的一個(gè)或多個(gè)有監(jiān)督搜索和/或無(wú)監(jiān)督搜索。一個(gè)或多個(gè)有監(jiān)督搜索和/或無(wú)監(jiān)督搜索可以產(chǎn)生包括識(shí)別內(nèi)容倉(cāng)庫(kù)中的內(nèi)容的信息的一個(gè)或多個(gè)搜索結(jié)果。例如,搜索結(jié)果可以包括識(shí)別相關(guān)聯(lián)的內(nèi)容的標(biāo)識(shí)符、到相關(guān)聯(lián)的內(nèi)容的鏈接、相關(guān)聯(lián)的內(nèi)容的標(biāo)題、相關(guān)聯(lián)的內(nèi)容的概述、相關(guān)聯(lián)的內(nèi)容的一部分、或者識(shí)別倉(cāng)庫(kù)中的內(nèi)容的任何其他適當(dāng)?shù)男畔ⅰ?/p>
在動(dòng)作204中生成的語(yǔ)音辨識(shí)結(jié)果中的任何一個(gè)或多個(gè)可以被用作搜索查詢以使用該語(yǔ)音辨識(shí)結(jié)果執(zhí)行有監(jiān)督搜索和/或無(wú)監(jiān)督搜索。如上面所討論的,在一些實(shí)施例中,語(yǔ)音辨識(shí)結(jié)果可以用來執(zhí)行對(duì)內(nèi)容倉(cāng)庫(kù)的有監(jiān)督搜索和無(wú)監(jiān)督搜索兩者,而在其他實(shí)施例中,語(yǔ)音辨識(shí)結(jié)果可以被用來執(zhí)行對(duì)內(nèi)容倉(cāng)庫(kù)的有監(jiān)督搜索或者無(wú)監(jiān)督搜索。在動(dòng)作206中執(zhí)行的任何有監(jiān)督搜索和/或無(wú)監(jiān)督搜索可以搜索內(nèi)容倉(cāng)庫(kù)的一部分或者全部。
在一些實(shí)施例中,可以通過將語(yǔ)音辨識(shí)結(jié)果中的一個(gè)或多個(gè)單詞識(shí)別為與本體中的一個(gè)或多個(gè)元素對(duì)應(yīng)來補(bǔ)充搜索查詢,并且在動(dòng)作206中所執(zhí)行的無(wú)監(jiān)督搜索和/或有監(jiān)督搜索可以基于一個(gè)或多個(gè)經(jīng)補(bǔ)充的搜索查詢。在下面關(guān)于圖7討論基于本體生成經(jīng)補(bǔ)充的搜索查詢的示例。
根據(jù)一些實(shí)施例,在動(dòng)作206中執(zhí)行的有監(jiān)督分類可以搜索內(nèi)容倉(cāng)庫(kù)的一部分。如上面所討論的,分類器可以被訓(xùn)練為將輸入分類為與內(nèi)容倉(cāng)庫(kù)的一部分中的內(nèi)容相關(guān),并且使用該分類器對(duì)查詢的隨后分類可以從那部分中提供搜索結(jié)果。例如,在圖1中描繪的例示性內(nèi)容倉(cāng)庫(kù)中,可以已經(jīng)在內(nèi)容部分102上訓(xùn)練分類器,并且隨后對(duì)查詢的有監(jiān)督分類可以識(shí)別內(nèi)容部分102內(nèi)的內(nèi)容,諸如內(nèi)容121或者122。
根據(jù)一些實(shí)施例,在動(dòng)作206中執(zhí)行的無(wú)監(jiān)督搜索可以搜索內(nèi)容倉(cāng)庫(kù)的全部。在其他實(shí)施例中,無(wú)監(jiān)督搜索可以限于搜索內(nèi)容倉(cāng)庫(kù)的僅一部分。例如,在圖1中描繪的例示性內(nèi)容倉(cāng)庫(kù)中,無(wú)監(jiān)督搜索可以僅在沒有由分類器分類并且經(jīng)歷有監(jiān)督搜索的內(nèi)容(例如,內(nèi)容部分101)上執(zhí)行。
無(wú)論如何搜索內(nèi)容倉(cāng)庫(kù),一個(gè)或多個(gè)搜索結(jié)果可以由有監(jiān)督搜索和/或無(wú)監(jiān)督搜索產(chǎn)生。在一些實(shí)施例中,給一個(gè)或多個(gè)搜索結(jié)果分配指示對(duì)應(yīng)搜索結(jié)果的預(yù)測(cè)相關(guān)性的相關(guān)聯(lián)的分?jǐn)?shù)。例如,在判定第一搜索結(jié)果比第二搜索結(jié)果與搜索查詢更相關(guān)的情況下,第一搜索結(jié)果可以與比關(guān)聯(lián)于第二搜索結(jié)果的分?jǐn)?shù)高的分?jǐn)?shù)相關(guān)聯(lián)。在一些實(shí)施例中,與一個(gè)或多個(gè)相應(yīng)的搜索結(jié)果相關(guān)聯(lián)的一個(gè)或多個(gè)分?jǐn)?shù)被規(guī)格化。例如,可以通過一個(gè)或多個(gè)數(shù)學(xué)運(yùn)算對(duì)一個(gè)或多個(gè)分?jǐn)?shù)進(jìn)行縮放、轉(zhuǎn)換和/或以其他方式變換,使得一個(gè)或多個(gè)分?jǐn)?shù)的總和等于特定的值(諸如1)。這可以具有允許在以不同方式(例如,通過無(wú)監(jiān)督搜索對(duì)比通過有監(jiān)督搜索、使用不同ASR結(jié)果的查詢、使用(或者不使用)來自本體的不同元素的查詢,等)產(chǎn)生的搜索結(jié)果的潛在相關(guān)性之間準(zhǔn)確比較的益處。
在動(dòng)作208中,可以組合由在動(dòng)作206中執(zhí)行的一個(gè)或多個(gè)有監(jiān)督搜索和/或無(wú)監(jiān)督搜索產(chǎn)生的搜索結(jié)果。如上面所討論的,動(dòng)作206可以包括對(duì)內(nèi)容倉(cāng)庫(kù)的一個(gè)或多個(gè)有監(jiān)督搜索和/或無(wú)監(jiān)督搜索,并且每個(gè)搜索可以產(chǎn)生一個(gè)或多個(gè)搜索結(jié)果。可以在動(dòng)作208中使用任何適當(dāng)?shù)募夹g(shù)組合由動(dòng)作206產(chǎn)生的搜索結(jié)果。在一些實(shí)施例中,使用與一個(gè)或多個(gè)搜索結(jié)果相關(guān)聯(lián)的一個(gè)或多個(gè)分?jǐn)?shù)產(chǎn)生搜索結(jié)果的經(jīng)組合的集合,諸如通過至少部分地基于一個(gè)或多個(gè)分?jǐn)?shù)對(duì)搜索結(jié)果的集合進(jìn)行排序。例如,如上面所討論的,在動(dòng)作204中生成的語(yǔ)音辨識(shí)結(jié)果可以與每個(gè)結(jié)果的置信度分?jǐn)?shù)相關(guān)聯(lián),和/或由有監(jiān)督搜索或者無(wú)監(jiān)督搜索產(chǎn)生的搜索結(jié)果可以與另外的分?jǐn)?shù)(例如,經(jīng)規(guī)格化的分?jǐn)?shù))相關(guān)聯(lián)。這些分?jǐn)?shù)中的任何一個(gè)或多個(gè)可以至少部分地用來確定搜索結(jié)果的經(jīng)組合的集合的次序。
在一些用例中,一個(gè)或多個(gè)搜索結(jié)果可能識(shí)別內(nèi)容倉(cāng)庫(kù)中的相同內(nèi)容。例如,基于兩個(gè)不同搜索查詢的有監(jiān)督搜索可能識(shí)別相同的搜索結(jié)果,和/或基于相同搜索查詢的無(wú)監(jiān)督搜索和有監(jiān)督搜索可能識(shí)別相同的搜索結(jié)果。在這種情況下,諸如當(dāng)在步驟208中執(zhí)行組合步驟時(shí),可以從搜索結(jié)果的經(jīng)組合的列表中排除或移除重復(fù)的搜索結(jié)果。在一個(gè)或多個(gè)分?jǐn)?shù)與重復(fù)的搜索結(jié)果相關(guān)聯(lián)的情況下(例如,如上面所討論的任何分?jǐn)?shù)),分?jǐn)?shù)中的任一個(gè)或者基于組合分?jǐn)?shù)的值,可以用于重復(fù)的搜索結(jié)果。例如,當(dāng)組合搜索結(jié)果時(shí),可以保留多個(gè)重復(fù)的搜索結(jié)果的最高分?jǐn)?shù),或者可以使用多個(gè)分?jǐn)?shù)的平均值。
在動(dòng)作210中,可以展示在動(dòng)作208中確定的搜索結(jié)果的經(jīng)組合的集合中的一個(gè)或多個(gè)搜索結(jié)果??梢砸匀魏芜m當(dāng)?shù)姆绞秸故舅阉鹘Y(jié)果,包括經(jīng)由一個(gè)或多個(gè)顯示器和/或經(jīng)由話音,因?yàn)楸疚拿枋龅谋景l(fā)明的方面不限于任何特定的展示技術(shù)。在動(dòng)作210中,可以使用與搜索結(jié)果相關(guān)聯(lián)的內(nèi)容的任何適當(dāng)部分展示搜索結(jié)果。例如,可以使用與搜索結(jié)果相關(guān)聯(lián)的條目的方面(例如,標(biāo)題和/或概述)來展示搜索結(jié)果。此外,可以提供使得系統(tǒng)調(diào)整搜索結(jié)果的展示的一個(gè)或多個(gè)方面的用戶輸入給實(shí)現(xiàn)過程200的系統(tǒng)。作為搜索結(jié)果的展示的一個(gè)非限制性示例,可以通過在顯示器上顯示與搜索結(jié)果相關(guān)聯(lián)的條目的標(biāo)題來展示搜索結(jié)果。當(dāng)(例如,經(jīng)由話音命令、到顯示器的觸摸輸入或者以任何其他適當(dāng)?shù)姆绞?選擇條目中的一個(gè)時(shí),可以通過話音展示該條目(例如,通過對(duì)條目中文本執(zhí)行文本到語(yǔ)音轉(zhuǎn)換)。
在下面更詳細(xì)描述的圖3-圖6描繪用于執(zhí)行圖2中描述的動(dòng)作中的一些或全部的技術(shù)的非限制性示例。下面的示例可以以任何適當(dāng)?shù)姆绞綄?shí)現(xiàn)并且不限于任何特定的實(shí)現(xiàn)技術(shù)(例如,用于對(duì)內(nèi)容的分類或者執(zhí)行對(duì)內(nèi)容的無(wú)監(jiān)督搜索)。
根據(jù)一些實(shí)施例,搜索查詢可以被用來執(zhí)行對(duì)內(nèi)容倉(cāng)庫(kù)的有監(jiān)督搜索和無(wú)監(jiān)督搜索這二者。圖3是基于語(yǔ)音辨識(shí)結(jié)果執(zhí)行有監(jiān)督搜索和無(wú)監(jiān)督搜索這兩者的一個(gè)非限制性例示性過程300的流程圖。由每種類型的搜索生成的搜索結(jié)果隨后可以被組合成搜索結(jié)果的單個(gè)集合。雖然圖3中的例示性過程被描繪為使用第一語(yǔ)音辨識(shí)結(jié)果執(zhí)行一個(gè)無(wú)監(jiān)督搜索和一個(gè)有監(jiān)督搜索,但是應(yīng)當(dāng)領(lǐng)會(huì),任何數(shù)量的語(yǔ)音辨識(shí)結(jié)果可以類似地被用來以下面描述的方式執(zhí)行對(duì)內(nèi)容的附加的有監(jiān)督搜索和無(wú)監(jiān)督搜索。
如上面分別關(guān)于圖2中所示的動(dòng)作202和204描述的,在動(dòng)作302中,接收用戶話音查詢,并且在動(dòng)作304中,基于用戶話音查詢生成語(yǔ)音辨識(shí)結(jié)果。
在動(dòng)作306中,使用在動(dòng)作304中生成的語(yǔ)音辨識(shí)結(jié)果中的第一語(yǔ)音辨識(shí)結(jié)果來執(zhí)行對(duì)內(nèi)容倉(cāng)庫(kù)的無(wú)監(jiān)督搜索。可以在動(dòng)作306中執(zhí)行的無(wú)監(jiān)督搜索中搜索存儲(chǔ)在內(nèi)容倉(cāng)庫(kù)中的內(nèi)容的任何適當(dāng)?shù)姆矫?。例如,可以搜索存?chǔ)在內(nèi)容倉(cāng)庫(kù)中的條目的標(biāo)題,和/或可以搜索存儲(chǔ)在內(nèi)容倉(cāng)庫(kù)中的條目的全文。
在一些實(shí)施例中,僅內(nèi)容倉(cāng)庫(kù)的一部分是由無(wú)監(jiān)督搜索來搜索的。在一些用例中,由無(wú)監(jiān)督搜索搜索的內(nèi)容倉(cāng)庫(kù)的部分可以被選擇為與由有監(jiān)督搜索搜索的部分不同的內(nèi)容部分。例如,除了其他內(nèi)容之外,內(nèi)容倉(cāng)庫(kù)還可以包括問題/解決方案格式的內(nèi)容(例如,如圖1中所例示的)。選擇用于由動(dòng)作306中的無(wú)監(jiān)督搜索進(jìn)行搜索的內(nèi)容倉(cāng)庫(kù)的部分可以被選擇為排除問題/解決方案格式的內(nèi)容的部分。然而,這僅是一個(gè)示例,因?yàn)楸景l(fā)明的方面可以用來執(zhí)行對(duì)內(nèi)容倉(cāng)庫(kù)的全部或者任何部分的有監(jiān)督搜索和無(wú)監(jiān)督搜索。
除了基于其他查詢(在動(dòng)作306和/或動(dòng)作308中)產(chǎn)生的任何其他搜索結(jié)果之外,由動(dòng)作306產(chǎn)生的搜索結(jié)果可以在下面描述的動(dòng)作310中與在動(dòng)作308中由使用相同查詢的有監(jiān)督搜索產(chǎn)生的搜索結(jié)果組合。
在動(dòng)作308中,使用在動(dòng)作304中生成的語(yǔ)音辨識(shí)結(jié)果中的第一語(yǔ)音辨識(shí)結(jié)果執(zhí)行對(duì)內(nèi)容倉(cāng)庫(kù)的有監(jiān)督搜索。使用先前在訓(xùn)練數(shù)據(jù)上訓(xùn)練的分類器執(zhí)行有監(jiān)督搜索,其中訓(xùn)練數(shù)據(jù)將示例性查詢與來自內(nèi)容倉(cāng)庫(kù)的對(duì)應(yīng)條目相關(guān)聯(lián)。如上面所討論的,用于有監(jiān)督分類的分類器可以被訓(xùn)練為識(shí)別來自內(nèi)容倉(cāng)庫(kù)的任何數(shù)量的內(nèi)容。分類器可以在動(dòng)作308中使用,以將第一語(yǔ)音辨識(shí)結(jié)果分類為與內(nèi)容倉(cāng)庫(kù)中的一個(gè)或多個(gè)條目有關(guān)。
在一些實(shí)施例中,分類器被訓(xùn)練為以識(shí)別內(nèi)容倉(cāng)庫(kù)的僅一部分的方式對(duì)輸入進(jìn)行分類。例如,除了其他內(nèi)容之外,內(nèi)容倉(cāng)庫(kù)可以包括問題/解決方案格式的內(nèi)容(例如,如圖1中所例示的)。選擇用于由動(dòng)作308中的有監(jiān)督搜索進(jìn)行搜索的內(nèi)容倉(cāng)庫(kù)的部分可以被選擇為包括問題/解決方案格式的內(nèi)容。然而,這僅是一個(gè)示例,因?yàn)楸景l(fā)明的方面可以被用來執(zhí)行對(duì)內(nèi)容倉(cāng)庫(kù)的全部或者任何部分的有監(jiān)督搜索。
無(wú)論如何搜索內(nèi)容倉(cāng)庫(kù),一個(gè)或多個(gè)搜索結(jié)果可以由有監(jiān)督搜索產(chǎn)生。在一些實(shí)施例中,一個(gè)或多個(gè)搜索結(jié)果具有指示對(duì)應(yīng)搜索結(jié)果的預(yù)測(cè)相關(guān)性的相關(guān)聯(lián)的分?jǐn)?shù)。例如,當(dāng)?shù)谝凰阉鹘Y(jié)果與比關(guān)聯(lián)于第二搜索結(jié)果的分?jǐn)?shù)高的分?jǐn)?shù)相關(guān)聯(lián)時(shí),可以判定第一搜索結(jié)果比第二搜索結(jié)果與搜索查詢更相關(guān)。在一些實(shí)施例中,與一個(gè)或多個(gè)相應(yīng)的搜索結(jié)果相關(guān)聯(lián)的一個(gè)或多個(gè)分?jǐn)?shù)被規(guī)格化。例如,可以通過一個(gè)或多個(gè)數(shù)學(xué)運(yùn)算對(duì)一個(gè)或多個(gè)分?jǐn)?shù)集體地進(jìn)行縮放、轉(zhuǎn)換和/或以其他方式變換。這可以具有允許在由無(wú)監(jiān)督搜索和/或有監(jiān)督搜索產(chǎn)生的其他搜索結(jié)果(該其他搜索結(jié)果可以由與用來產(chǎn)生經(jīng)規(guī)格化的搜索結(jié)果的查詢不同的查詢或者相同的查詢?cè)斐?之間準(zhǔn)確比較的益處。
在一些實(shí)施例中,與一個(gè)或多個(gè)搜索結(jié)果相關(guān)聯(lián)的分?jǐn)?shù)可以至少部分地基于對(duì)分?jǐn)?shù)的熵的測(cè)量而進(jìn)行縮放。如下面描述的,與有監(jiān)督搜索結(jié)果相關(guān)聯(lián)的分?jǐn)?shù)可以和與無(wú)監(jiān)督搜索結(jié)果相關(guān)聯(lián)的分?jǐn)?shù)比較,以便在動(dòng)作310中組合搜索結(jié)果。然而,在一些用例中,由兩種類型的搜索產(chǎn)生的分?jǐn)?shù)可能單獨(dú)不體現(xiàn)經(jīng)組合的搜索結(jié)果的最準(zhǔn)確相關(guān)性排名,即使兩個(gè)分?jǐn)?shù)的集合已經(jīng)被規(guī)格化。例如,基于搜索查詢的有監(jiān)督搜索可以產(chǎn)生具有低的經(jīng)規(guī)格化的置信度值的搜索結(jié)果。在這種例示性情況下,有可能沒有搜索結(jié)果與搜索查詢相關(guān),因?yàn)樗鼈兪墙?jīng)由有監(jiān)督分類產(chǎn)生的并且如果查詢與正在搜索的內(nèi)容相關(guān),則預(yù)期它們將產(chǎn)生更高的值。然而,相同的搜索查詢可以從對(duì)內(nèi)容的無(wú)監(jiān)督搜索中產(chǎn)生可比較的經(jīng)規(guī)格化的置信度分?jǐn)?shù),其實(shí)際上可以比類似得分的有監(jiān)督分類搜索結(jié)果更相關(guān)?;趯?duì)搜索結(jié)果的熵的測(cè)量對(duì)與搜索結(jié)果相關(guān)聯(lián)的分?jǐn)?shù)進(jìn)行縮放可以更加恰當(dāng)?shù)貙?duì)搜索結(jié)果進(jìn)行加權(quán),使得可以更加準(zhǔn)確地比較它們的相關(guān)性。
在一些實(shí)施例中,針對(duì)一個(gè)或多個(gè)搜索結(jié)果計(jì)算熵縮放因子,使得當(dāng)一個(gè)分?jǐn)?shù)比其他分?jǐn)?shù)高得多時(shí)熵最小,并且當(dāng)所有分?jǐn)?shù)具有相同的值時(shí)熵最大。熵縮放因子可以乘以與搜索結(jié)果相關(guān)聯(lián)的分?jǐn)?shù),以產(chǎn)生熵加權(quán)的分?jǐn)?shù)。例如,熵縮放因子可以如下計(jì)算:
其中“分?jǐn)?shù)(Score)”可以是與搜索結(jié)果相關(guān)聯(lián)的任何分?jǐn)?shù)(例如,置信度分?jǐn)?shù)、經(jīng)規(guī)格化的置信度分?jǐn)?shù)等),并且N是正在針對(duì)其計(jì)算熵縮放因子的搜索結(jié)果(Search Results)的數(shù)量。在該示例中,N個(gè)分?jǐn)?shù)中的每個(gè)分?jǐn)?shù)可以乘以如上面的例示性公式所定義的縮放因子以確定熵加權(quán)的分?jǐn)?shù)。然而,通常,因?yàn)楸疚拿枋龅谋景l(fā)明的方面在這一點(diǎn)上不受限制,所以可以應(yīng)用任何適當(dāng)?shù)撵乜s放因子。
適當(dāng)?shù)撵乜s放因子可以應(yīng)用于搜索結(jié)果的任何集合。例如,基于搜索查詢從有監(jiān)督搜索輸出的一個(gè)或多個(gè)搜索結(jié)果可以基于針對(duì)該一個(gè)或多個(gè)搜索結(jié)果而計(jì)算的熵縮放因子進(jìn)行熵加權(quán)。替代地或者附加地,基于多個(gè)搜索查詢從有監(jiān)督搜索輸出的一個(gè)或多個(gè)搜索結(jié)果可以基于針對(duì)該一個(gè)或多個(gè)搜索結(jié)果而計(jì)算的熵縮放因子一起進(jìn)行熵加權(quán)。
在一些實(shí)施例中,可以識(shí)別與內(nèi)容倉(cāng)庫(kù)中的內(nèi)容不相關(guān)的搜索查詢。這種“超出領(lǐng)域”搜索查詢可能不產(chǎn)生準(zhǔn)確地代表用戶希望獲得的信息的搜索結(jié)果,并且因此,識(shí)別超出領(lǐng)域的搜索查詢或者識(shí)別由超出領(lǐng)域的搜索查詢導(dǎo)致的搜索結(jié)果可以是有益的。在一些實(shí)施例中,通過在訓(xùn)練期間提供適當(dāng)?shù)氖纠梢詫⒃趧?dòng)作308中使用的分類器訓(xùn)練為辨別超出領(lǐng)域的搜索查詢。在一些實(shí)施例中,當(dāng)與基于搜索查詢產(chǎn)生的一個(gè)或多個(gè)搜索結(jié)果相關(guān)聯(lián)的所有置信度分?jǐn)?shù)都低于閾值時(shí),可以識(shí)別出超出領(lǐng)域的搜索查詢。在一些用例中,由超出領(lǐng)域的搜索查詢產(chǎn)生的搜索結(jié)果可以從提供給用戶的搜索結(jié)果中排除。
作為識(shí)別超出領(lǐng)域的搜索查詢的一個(gè)非限制性示例,內(nèi)容倉(cāng)庫(kù)可以包括與機(jī)動(dòng)車輛的操作有關(guān)的內(nèi)容,并且用戶話音查詢可以是“How do I close the trunk?(我如何關(guān)閉行李箱?)”,但是針對(duì)該查詢的一個(gè)語(yǔ)音辨別結(jié)果可以是“How do I nose the junk?(我如何嗅到廢物?)”。在該例示性情況下,排除由“How do I nose the junk?”的搜索導(dǎo)致的搜索結(jié)果可以是有益的,因?yàn)閮?nèi)容倉(cāng)庫(kù)中最相關(guān)的內(nèi)容匹配不太可能與用戶試圖識(shí)別的信息相關(guān)。如上面所討論的,在一些實(shí)施例中,查詢“How do I nose the junk?”可能產(chǎn)生具有全部低于閾值的置信度值的搜索結(jié)果,這可以將查詢識(shí)別為超出領(lǐng)域,并且這可以使得這些搜索結(jié)果被排除。在一些實(shí)施例中,分類器可以已經(jīng)被訓(xùn)練為識(shí)別超出領(lǐng)域的搜索查詢,并且分類器可以將查詢“How do I nose the junk?”分類為超出領(lǐng)域的搜索查詢。在這種情況下,分類器可以不將任何內(nèi)容識(shí)別為對(duì)應(yīng)于搜索查詢,并且因此可以不必排除由超出領(lǐng)域的搜索而產(chǎn)生的搜索結(jié)果。
在動(dòng)作310中,可以組合由在動(dòng)作308和動(dòng)作306中執(zhí)行的有監(jiān)督搜索和無(wú)監(jiān)督搜索產(chǎn)生的搜索結(jié)果??梢允褂萌魏芜m當(dāng)?shù)募夹g(shù)組合搜索結(jié)果。在一些實(shí)施例中,與搜索結(jié)果相關(guān)聯(lián)的一個(gè)或多個(gè)分?jǐn)?shù)(例如,置信度值、經(jīng)規(guī)格化的置信度值、熵加權(quán)的置信度值和/或經(jīng)規(guī)格化的熵加權(quán)的置信度值)被用來產(chǎn)生搜索結(jié)果的經(jīng)組合的集合,諸如通過至少部分地基于一個(gè)或多個(gè)分?jǐn)?shù)對(duì)搜索結(jié)果的集合進(jìn)行排序。例如,如上面所討論的,由動(dòng)作308中的有監(jiān)督搜索產(chǎn)生的一個(gè)或多個(gè)搜索結(jié)果可以與可以經(jīng)過規(guī)格化和熵加權(quán)的各自的置信度分?jǐn)?shù)相關(guān)聯(lián),并且由動(dòng)作306中的無(wú)監(jiān)督搜索產(chǎn)生的一個(gè)或多個(gè)搜索結(jié)果可以與可以經(jīng)過規(guī)格化的各自的置信度分?jǐn)?shù)相關(guān)聯(lián)??梢酝ㄟ^整理這些搜索結(jié)果的全部并且根據(jù)它們各自的置信度分?jǐn)?shù)對(duì)它們進(jìn)行排序而產(chǎn)生搜索結(jié)果的經(jīng)組合的集合。
圖4描繪分別根據(jù)圖2和圖3中所示的過程200和300,搜索內(nèi)容倉(cāng)庫(kù)中的內(nèi)容的例示性過程。在圖4的示例中,用戶執(zhí)行對(duì)內(nèi)容倉(cāng)庫(kù)的搜索,該內(nèi)容倉(cāng)庫(kù)包括與機(jī)動(dòng)車輛的操作有關(guān)的內(nèi)容。過程400接收用戶話音查詢,并且生成兩個(gè)例示性語(yǔ)音辨識(shí)結(jié)果410,標(biāo)注為A和B。在圖4的示例中,用戶說“How do I start the car?(我如何發(fā)動(dòng)轎車?)”,這在語(yǔ)音辨識(shí)結(jié)果B中被正確地辨識(shí),但是在語(yǔ)音辨識(shí)結(jié)果A中被錯(cuò)誤地辨識(shí)。例示性過程400使用上面描述的任何技術(shù)針對(duì)每個(gè)語(yǔ)音辨識(shí)結(jié)果執(zhí)行無(wú)監(jiān)督搜索和有監(jiān)督搜索。
兩個(gè)語(yǔ)音辨識(shí)結(jié)果A和B中的每一個(gè)都被用作無(wú)監(jiān)督搜索和有監(jiān)督搜索這兩者的搜索查詢。語(yǔ)音辨識(shí)結(jié)果A被用作無(wú)監(jiān)督搜索的查詢并且產(chǎn)生來自內(nèi)容倉(cāng)庫(kù)的三個(gè)搜索結(jié)果,并且語(yǔ)音辨識(shí)結(jié)果B被用作無(wú)監(jiān)督搜索的查詢并且也產(chǎn)生來自內(nèi)容倉(cāng)庫(kù)的三個(gè)搜索結(jié)果。搜索結(jié)果中的每一個(gè)與代表對(duì)應(yīng)搜索結(jié)果的預(yù)測(cè)相關(guān)性的置信度分?jǐn)?shù)相關(guān)聯(lián)。搜索結(jié)果的兩個(gè)集合的分?jǐn)?shù)獨(dú)立地規(guī)格化,使得與每個(gè)語(yǔ)音辨識(shí)結(jié)果對(duì)應(yīng)的搜索結(jié)果的分?jǐn)?shù)的總數(shù)合計(jì)為1。搜索結(jié)果和經(jīng)規(guī)格化的分?jǐn)?shù)作為經(jīng)規(guī)格化的無(wú)監(jiān)督搜索結(jié)果420在圖4中示出。
語(yǔ)音辨識(shí)結(jié)果A被用作有監(jiān)督搜索的查詢并且產(chǎn)生來自內(nèi)容倉(cāng)庫(kù)的兩個(gè)搜索結(jié)果,并且語(yǔ)音辨識(shí)結(jié)果B被用作有監(jiān)督搜索的查詢并且產(chǎn)生來自內(nèi)容倉(cāng)庫(kù)的兩個(gè)搜索結(jié)果。搜索結(jié)果中的每一個(gè)與代表對(duì)應(yīng)搜索結(jié)果的預(yù)測(cè)相關(guān)性的置信度分?jǐn)?shù)相關(guān)聯(lián)。搜索結(jié)果的兩個(gè)集合的分?jǐn)?shù)獨(dú)立地規(guī)格化,使得與每個(gè)語(yǔ)音辨識(shí)結(jié)果對(duì)應(yīng)的搜索結(jié)果的分?jǐn)?shù)的總數(shù)合計(jì)為1。搜索結(jié)果和經(jīng)規(guī)格化的分?jǐn)?shù)作為經(jīng)規(guī)格化的有監(jiān)督搜索結(jié)果430在圖4中示出。
在圖4的示例中,針對(duì)其使用分類器在動(dòng)作308中對(duì)搜索查詢進(jìn)行分類的內(nèi)容包括問題/解決方案格式的條目(諸如圖1中所示的條目121)。在例示性過程400中,經(jīng)規(guī)格化的有監(jiān)督搜索結(jié)果430識(shí)別具有該形式的內(nèi)容的條目,而經(jīng)規(guī)格化的無(wú)監(jiān)督搜索結(jié)果420識(shí)別包括更典型地在車輛的所有者手冊(cè)中找到的散文(prose)的條目。
如上所述,在一些實(shí)施例中,與搜索結(jié)果相關(guān)聯(lián)的分?jǐn)?shù)可以熵加權(quán)。在圖4的示例中,通過將經(jīng)規(guī)格化的有監(jiān)督搜索結(jié)果430中的每一個(gè)乘以相同的熵縮放因子,對(duì)經(jīng)規(guī)格化的有監(jiān)督搜索結(jié)果430進(jìn)行熵加權(quán)以產(chǎn)生熵加權(quán)的有監(jiān)督搜索結(jié)果440。因?yàn)樵诮?jīng)規(guī)格化的有監(jiān)督搜索結(jié)果430中與針對(duì)語(yǔ)音辨識(shí)結(jié)果B的搜索結(jié)果相關(guān)聯(lián)的分?jǐn)?shù)具有非常不同的值,所以所確定的熵縮放因子接近1;在圖4的示例中,應(yīng)用于這些分?jǐn)?shù)的熵縮放因子是0.9。相比之下,因?yàn)樵诮?jīng)規(guī)格化的有監(jiān)督搜索結(jié)果430中與針對(duì)語(yǔ)音辨識(shí)結(jié)果A的搜索結(jié)果相關(guān)聯(lián)的分?jǐn)?shù)有些相似,所以所確定的熵縮放因子較?。辉趫D4的示例中,應(yīng)用于這些分?jǐn)?shù)的縮放因子是0.5。
組合搜索結(jié)果420和440以產(chǎn)生搜索結(jié)果的經(jīng)組合的集合450。在圖4的示例中,搜索結(jié)果以相關(guān)聯(lián)的分?jǐn)?shù)的遞減次序排序,使得問題/解決方案條目“How do I start the car?”被認(rèn)為是最相關(guān)的內(nèi)容匹配,緊接著是與“Ignition Controls(點(diǎn)火控制)”有關(guān)的條目等。注意在圖4的示例中,識(shí)別條目“How do I start the car?”的重復(fù)的搜索結(jié)果已經(jīng)從經(jīng)組合的搜索結(jié)果中排除。在例示性過程400中,排除具有較低分?jǐn)?shù)值0.6的重復(fù)的搜索結(jié)果。
根據(jù)一些實(shí)施例,語(yǔ)音辨識(shí)結(jié)果可以被用來執(zhí)行對(duì)內(nèi)容倉(cāng)庫(kù)的有監(jiān)督搜索或者無(wú)監(jiān)督搜索。圖5是基于搜索查詢執(zhí)行有監(jiān)督搜索或者無(wú)監(jiān)督搜索的一個(gè)非限制性例示性過程500的流程圖。由每種類型的搜索以及基于每個(gè)語(yǔ)音辨識(shí)結(jié)果生成的搜索結(jié)果可以隨后被組合成搜索結(jié)果的單個(gè)集合。雖然圖5的例示性過程被描繪為使用第一語(yǔ)音辨識(shí)結(jié)果執(zhí)行無(wú)監(jiān)督搜索或者有監(jiān)督搜索,但是應(yīng)當(dāng)領(lǐng)會(huì),任何數(shù)量的語(yǔ)音辨識(shí)結(jié)果可以類似地被用來以下面描述的方式執(zhí)行對(duì)內(nèi)容的附加的有監(jiān)督搜索和/或無(wú)監(jiān)督搜索。
如上面分別關(guān)于圖2中所示的動(dòng)作202和204描述的,在動(dòng)作502中,接收用戶話音查詢,并且在動(dòng)作504中,基于用戶話音查詢生成語(yǔ)音辨識(shí)結(jié)果。
在動(dòng)作506中,在動(dòng)作504中生成的語(yǔ)音辨識(shí)結(jié)果中的第一語(yǔ)音辨識(shí)結(jié)果被分類為對(duì)應(yīng)于多個(gè)分類的一個(gè),該多個(gè)分類包括與對(duì)內(nèi)容倉(cāng)庫(kù)的無(wú)監(jiān)督搜索相關(guān)聯(lián)的第一分類以及與對(duì)內(nèi)容倉(cāng)庫(kù)的有監(jiān)督搜索相關(guān)聯(lián)的第二分類。如上面描述的,使用附加的分類器可以通過在執(zhí)行搜索之前基于語(yǔ)音辨識(shí)結(jié)果選擇一種或者另一種類型的搜索,來減少基于語(yǔ)音辨識(shí)結(jié)果執(zhí)行的無(wú)監(jiān)督搜索和/或有監(jiān)督搜索的數(shù)量。
在動(dòng)作506中被用來對(duì)第一語(yǔ)音辨識(shí)結(jié)果進(jìn)行分類的分類器可以已經(jīng)針對(duì)示例性搜索查詢以及每個(gè)查詢所屬的分類的對(duì)應(yīng)指示被訓(xùn)練。示例性查詢可以由系統(tǒng)的開發(fā)者編寫,和/或可以從內(nèi)容倉(cāng)庫(kù)中的內(nèi)容中生成和/或逐字獲取。示例性查詢對(duì)應(yīng)于哪個(gè)分類可以取決于選擇用于訓(xùn)練對(duì)內(nèi)容倉(cāng)庫(kù)的有監(jiān)督搜索的分類器的內(nèi)容的部分。
在一些實(shí)施例中,在動(dòng)作506中使用的分類器將一個(gè)或多個(gè)語(yǔ)音辨識(shí)結(jié)果識(shí)別為對(duì)應(yīng)于超出領(lǐng)域的搜索查詢。如上面所討論的,超出領(lǐng)域的搜索查詢可能不產(chǎn)生準(zhǔn)確地代表用戶希望獲得的信息的搜索結(jié)果,并且因此識(shí)別超出領(lǐng)域的搜索查詢或者識(shí)別由超出領(lǐng)域的搜索查詢導(dǎo)致的搜索結(jié)果可以是有益的。雖然圖5中沒有示出,但是過程500可以允許拒絕由在動(dòng)作506中使用的分類器識(shí)別出的超出領(lǐng)域的搜索查詢,而不執(zhí)行基于那些搜索查詢的搜索。
作為用于訓(xùn)練分類器的非限制性例示性用例,在內(nèi)容倉(cāng)庫(kù)中的內(nèi)容包括問題/解決方案格式的條目的情況下,條目(例如,“How do I start the car?”)的“問題”部分的文本可以作為與有監(jiān)督搜索分類相關(guān)聯(lián)的示例性查詢而提供。沒有以問題/解決方案格式提供的條目的標(biāo)題可以作為與無(wú)監(jiān)督搜索分類相關(guān)聯(lián)的示例性查詢而提供。其他內(nèi)容,包括沒有包括在內(nèi)容倉(cāng)庫(kù)中的任何內(nèi)容,可以作為被認(rèn)為超出領(lǐng)域的示例性查詢而提供。作為到分類器的輸入而提供的隨后的查詢可以被識(shí)別為對(duì)應(yīng)于這三種分類(有監(jiān)督、無(wú)監(jiān)督或者超出領(lǐng)域)中的一種。
當(dāng)?shù)谝徽Z(yǔ)音辨識(shí)結(jié)果在動(dòng)作506中被分類為對(duì)應(yīng)于無(wú)監(jiān)督搜索時(shí),在動(dòng)作508中執(zhí)行使用第一語(yǔ)音辨識(shí)結(jié)果作為搜索查詢的無(wú)監(jiān)督搜索。在動(dòng)作508中執(zhí)行的無(wú)監(jiān)督搜索可以以任何適當(dāng)?shù)姆绞綀?zhí)行,包括使用上面關(guān)于圖3中所示的動(dòng)作306而描述的任何技術(shù)。當(dāng)?shù)谝徽Z(yǔ)音辨識(shí)結(jié)果在動(dòng)作506中被分類為對(duì)應(yīng)于有監(jiān)督搜索時(shí),在動(dòng)作510中執(zhí)行使用第一語(yǔ)音辨識(shí)結(jié)果作為搜索查詢的有監(jiān)督搜索。在動(dòng)作510中執(zhí)行的有監(jiān)督搜索可以以任何適當(dāng)?shù)姆绞綀?zhí)行,包括使用上面關(guān)于圖3中所示的動(dòng)作308而描述的任何技術(shù)。
圖6描繪分別根據(jù)圖2和圖5中所示的過程200和過程500,搜索內(nèi)容倉(cāng)庫(kù)中的內(nèi)容的例示性過程。在圖6的示例中,用戶執(zhí)行對(duì)內(nèi)容倉(cāng)庫(kù)的搜索,該內(nèi)容倉(cāng)庫(kù)包括與機(jī)動(dòng)車輛的操作有關(guān)的內(nèi)容。過程600接收用戶話音查詢并且生成兩個(gè)例示性語(yǔ)音辨識(shí)結(jié)果610,標(biāo)注為A和B。在圖6的示例中,用戶說“How do I start the car?”,這在語(yǔ)音辨識(shí)結(jié)果B中被正確地辨識(shí),但是在語(yǔ)音辨識(shí)結(jié)果A中被錯(cuò)誤地辨識(shí)。例示性過程600基于分類器的輸出針對(duì)每個(gè)語(yǔ)音辨識(shí)結(jié)果執(zhí)行無(wú)監(jiān)督搜索或者有監(jiān)督搜索,這可以使用上面描述的任何技術(shù)完成。在圖6的示例中,語(yǔ)音辨識(shí)結(jié)果A和B被示為分別具有由語(yǔ)音辨識(shí)提供的置信度值0.6和0.5。
基于分類器615的輸出,語(yǔ)音辨識(shí)結(jié)果A和B各自被用作針對(duì)無(wú)監(jiān)督搜索或者有監(jiān)督搜索的搜索查詢。如上面所討論的,經(jīng)訓(xùn)練的分類器可以確定查詢對(duì)應(yīng)于多個(gè)分類中的哪些,其中分類包括與有監(jiān)督搜索相關(guān)聯(lián)的分類和與無(wú)監(jiān)督搜索相關(guān)聯(lián)的分類。在圖6的示例中,語(yǔ)音辨識(shí)結(jié)果A被識(shí)別為對(duì)應(yīng)于與無(wú)監(jiān)督搜索相關(guān)聯(lián)的分類,并且語(yǔ)音辨識(shí)結(jié)果B被識(shí)別為對(duì)應(yīng)于與有監(jiān)督搜索相關(guān)聯(lián)的分類。
語(yǔ)音辨識(shí)結(jié)果A用作針對(duì)無(wú)監(jiān)督搜索的查詢并且產(chǎn)生來自內(nèi)容倉(cāng)庫(kù)的三個(gè)搜索結(jié)果。搜索結(jié)果中的每一個(gè)都與代表對(duì)應(yīng)搜索結(jié)果的預(yù)測(cè)相關(guān)性的置信度分?jǐn)?shù)相關(guān)聯(lián)。搜索結(jié)果的每個(gè)集合(在圖4的示例中,僅存在其中的一個(gè))的分?jǐn)?shù)被規(guī)格化(例如,使得與每個(gè)語(yǔ)音辨識(shí)結(jié)果對(duì)應(yīng)的搜索結(jié)果的分?jǐn)?shù)的總數(shù)合計(jì)為1)。搜索結(jié)果和經(jīng)規(guī)格化的分?jǐn)?shù)作為經(jīng)規(guī)格化的無(wú)監(jiān)督搜索結(jié)果620在圖6中示出。
然后由用來產(chǎn)生搜索結(jié)果的語(yǔ)音辨識(shí)結(jié)果的置信度值對(duì)經(jīng)規(guī)格化的無(wú)監(jiān)督搜索結(jié)果620進(jìn)行加權(quán),在圖4的示例中該置信度值是值0.6。該步驟產(chǎn)生置信度加權(quán)的無(wú)監(jiān)督搜索結(jié)果640。
語(yǔ)音辨識(shí)結(jié)果B被用作針對(duì)有監(jiān)督搜索的查詢并且產(chǎn)生來自內(nèi)容倉(cāng)庫(kù)的三個(gè)搜索結(jié)果。搜索結(jié)果中的每一個(gè)與代表對(duì)應(yīng)搜索結(jié)果的預(yù)測(cè)相關(guān)性的置信度分?jǐn)?shù)相關(guān)聯(lián)。搜索結(jié)果的每個(gè)集合(在圖4的示例中,僅存在其中的一個(gè))的分?jǐn)?shù)被規(guī)格化(例如,使得與每個(gè)語(yǔ)音辨識(shí)結(jié)果對(duì)應(yīng)的搜索結(jié)果的分?jǐn)?shù)的總數(shù)合計(jì)為1)。搜索結(jié)果和經(jīng)規(guī)格化的分?jǐn)?shù)作為經(jīng)規(guī)格化的有監(jiān)督搜索結(jié)果630在圖6中示出。
然后由用來產(chǎn)生搜索結(jié)果的語(yǔ)音辨識(shí)結(jié)果的置信度值對(duì)經(jīng)規(guī)格化的有監(jiān)督搜索結(jié)果630進(jìn)行加權(quán),在圖4的示例中該置信度值是值0.5。該步驟產(chǎn)生置信度加權(quán)的有監(jiān)督搜索結(jié)果650。
組合搜索結(jié)果640和650以產(chǎn)生搜索結(jié)果的經(jīng)組合的集合660。在圖6的示例中,搜索結(jié)果以相關(guān)聯(lián)的分?jǐn)?shù)的遞減次序排序,使得問題/解決方案條目“How do I start the car?”被認(rèn)為是最相關(guān)的內(nèi)容匹配,按照該次序緊接著是與“Towing the car(拖車)”有關(guān)的條目,緊接著是“Connecting your cellphone(連接你的蜂窩電話)”、“Accessing the Radio(訪問收音機(jī))”以及“How do I clean the car?(我如何清潔轎車?)”。
根據(jù)一些實(shí)施例,并且如上面所討論的,搜索查詢(例如,語(yǔ)音辨識(shí)結(jié)果)中的一個(gè)或多個(gè)單詞可以在本體中被識(shí)別出來并且被用來補(bǔ)充搜索查詢。圖7例示與汽車有關(guān)的例示性本體700的一部分。有關(guān)的元素之間的連接在圖7中作為實(shí)線示出,而同義詞之間的連接作為虛線示出。本體中元素之間的連接代表元素之間的概念相似性。下面進(jìn)一步描述的與每個(gè)連接相關(guān)聯(lián)的權(quán)重被示為鄰近連接線,并且可以識(shí)別所連接元素之間的概念相似性的強(qiáng)度。
采用本體的實(shí)施例可以使用任何類型的本體,以及以任何方式創(chuàng)建的本體,因?yàn)楸疚拿枋龅募夹g(shù)在這一點(diǎn)上不受限制。在一些實(shí)施例中,諸如本體700這樣的本體可以已經(jīng)整體或者部分地自動(dòng)生成。內(nèi)容倉(cāng)庫(kù)中的任何內(nèi)容或者與內(nèi)容倉(cāng)庫(kù)中的內(nèi)容有關(guān)的任何內(nèi)容(諸如索引、條目標(biāo)題或頭條的匯集,和/或內(nèi)容的表格)可以被用來生成諸如本體700這樣的本體。替代地或者附加地,本體可以整體或者部分地基于在公開可用的本體(諸如“ConceptNet”)中找到的分組和/或分層結(jié)構(gòu)而生成。
如在圖7的例示性本體中由連接元素的線所示的本體中元素之間的映射,可以與代表元素之間相似性的級(jí)別的一個(gè)或多個(gè)權(quán)重相關(guān)聯(lián)。在一些用例中,因?yàn)樽鳛橥x詞的元素指代相同的概念,所以同義詞可以經(jīng)由比典型地用于元素之間的非同義詞連接高的權(quán)重值來連接。在例示性本體700中與元素之間的連接相關(guān)聯(lián)的權(quán)重值在圖7中在連接元素的線旁邊示出。
當(dāng)使用上面描述的任何技術(shù)和/或過程執(zhí)行對(duì)內(nèi)容的無(wú)監(jiān)督搜索時(shí),通過識(shí)別本體中與搜索查詢中的一個(gè)或多個(gè)單詞對(duì)應(yīng)的一個(gè)或多個(gè)元素,可以使用附加的信息補(bǔ)充搜索查詢。例如,通過識(shí)別本體700中元素“引擎蓋”并且基于本體識(shí)別“發(fā)動(dòng)機(jī)室”和“發(fā)動(dòng)機(jī)蓋”與“引擎蓋”有關(guān),可以使用“發(fā)動(dòng)機(jī)室”和“發(fā)動(dòng)機(jī)蓋”補(bǔ)充搜索查詢“我如何打開引擎蓋”。
在一些實(shí)施例中,通過將被識(shí)別為與搜索查詢中的一個(gè)或多個(gè)單詞有關(guān)的元素添加到該搜索查詢,使用搜索查詢執(zhí)行無(wú)監(jiān)督搜索。因此,使用上面的示例,無(wú)監(jiān)督搜索可以使用查詢“我如何打開引擎蓋發(fā)動(dòng)機(jī)室發(fā)動(dòng)機(jī)蓋”來搜索。在一些實(shí)施例中,如上述針對(duì)無(wú)監(jiān)督搜索的添加到搜索查詢的單詞基于本體中到所識(shí)別元素的連接而被加權(quán)。例如,使用上面的無(wú)監(jiān)督搜索,所有單詞可以具有權(quán)重1,除了具有權(quán)重0.8的“發(fā)動(dòng)機(jī)室”和具有權(quán)重0.95的“發(fā)動(dòng)機(jī)蓋”。然而,通常無(wú)監(jiān)督搜索可以使用任何合適的技術(shù)基于將搜索中的一個(gè)或多個(gè)單詞識(shí)別為本體中的元素來增強(qiáng),因?yàn)楸疚拿枋龅谋景l(fā)明的方面在這一點(diǎn)上不受限制。
在一些實(shí)施例中,使用由本體的一個(gè)或多個(gè)元素補(bǔ)充的搜索查詢執(zhí)行有監(jiān)督搜索。向用于有監(jiān)督搜索的分類器提供的搜索查詢可以以任何適當(dāng)?shù)姆绞窖a(bǔ)充。在一些用例中,提供給分類器的特征向量可以包括對(duì)具體有關(guān)概念的存在進(jìn)行編碼的一個(gè)或多個(gè)附加的特征。例如,特征向量可以包括針對(duì)“引擎蓋”的特征以及針對(duì)有關(guān)的“發(fā)動(dòng)機(jī)室”概念的附加特征。在特征向量中,該附加特征可以高于“發(fā)動(dòng)機(jī)室”的特征被提供,由此允許“發(fā)動(dòng)機(jī)室”短語(yǔ)在它作為搜索查詢的部分時(shí)和在“發(fā)動(dòng)機(jī)室”被識(shí)別為與查詢中的一個(gè)或多個(gè)單詞(諸如“引擎蓋”)有關(guān)的概念時(shí)被有區(qū)別地對(duì)待。由此,可以通過將如由本體識(shí)別的有關(guān)概念的特征添加到被用作分類器的輸入的特征向量,來擴(kuò)展搜索查詢。
在一些實(shí)施例中,在分類器的訓(xùn)練期間執(zhí)行特征向量擴(kuò)展。訓(xùn)練數(shù)據(jù)可以還包括包含單詞或短語(yǔ)的一個(gè)或多個(gè)示例性搜索查詢,除了識(shí)別與那個(gè)單詞或短語(yǔ)有關(guān)的概念(例如,經(jīng)由本體)的一個(gè)或多個(gè)示例性搜索查詢之外。這可以允許將分類器訓(xùn)練為對(duì)當(dāng)概念在搜索查詢中被提供時(shí)和當(dāng)同一概念是通過使用在本體中識(shí)別的有關(guān)概念擴(kuò)展搜索查詢而被識(shí)別出來時(shí)的概念進(jìn)行區(qū)分(例如,以提供不同的分類結(jié)果)。
例如,單詞“噴水(mist)”可以在訓(xùn)練期間的一個(gè)或多個(gè)示例性搜索查詢中被提供為與將水施加到擋風(fēng)玻璃的汽車功能有關(guān)。另外,單詞“霧(fog)”可以在訓(xùn)練期間的一個(gè)或多個(gè)示例性搜索查詢中被提供為與汽車的霧燈功能有關(guān)。單詞“霧”和“噴水”也可以在本體中是有關(guān)的。在分類器的訓(xùn)練期間,如果包含單詞“噴水”的搜索查詢與用“噴水”補(bǔ)充的搜索查詢(例如,通過辨識(shí)本體中“霧”和“噴水”之間的關(guān)聯(lián)性)被相同地對(duì)待,那么汽車的霧燈功能和水施加功能可能被分類器混為一談,導(dǎo)致對(duì)與汽車的這些功能有關(guān)的查詢進(jìn)行分類時(shí)準(zhǔn)確性降低(例如,搜索查詢“霧按鈕在哪里?”和“噴水按鈕在哪里”可能被分類為相似或者相同的查詢)。通過將分類器訓(xùn)練為對(duì)當(dāng)概念在搜索查詢中被提供時(shí)和當(dāng)概念是基于本體而識(shí)別出來時(shí)的概念進(jìn)行區(qū)分,分類器在查詢基于本體而擴(kuò)展時(shí)可以被更準(zhǔn)確地訓(xùn)練。如上面所討論的,在一些實(shí)施例中,這可以包括:當(dāng)單詞或短語(yǔ)是提供在搜索查詢中時(shí),在特征向量中為其提供與當(dāng)單詞或短語(yǔ)是基于本體而識(shí)別出來時(shí)為其提供的特征不同的特征。
圖8是可以被用來實(shí)現(xiàn)上面描述的任何技術(shù)的例示性計(jì)算設(shè)備800的框圖。計(jì)算設(shè)備800可以包括一個(gè)或多個(gè)處理器801以及一個(gè)或多個(gè)有形的、非臨時(shí)性計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)(例如,存儲(chǔ)器803)。存儲(chǔ)器803可以將實(shí)現(xiàn)上面描述的任何功能性的計(jì)算機(jī)程序指令存儲(chǔ)在有形的非臨時(shí)性計(jì)算機(jī)可讀介質(zhì)中。處理器801可以耦合到存儲(chǔ)器803并且可以執(zhí)行這種計(jì)算機(jī)程序指令以使得功能性被實(shí)現(xiàn)和執(zhí)行。
計(jì)算設(shè)備800也可以包括網(wǎng)絡(luò)輸入/輸出(I/O)接口805,計(jì)算設(shè)備可以經(jīng)由網(wǎng)絡(luò)輸入/輸出(I/O)接口805與其他計(jì)算機(jī)(例如,經(jīng)由網(wǎng)絡(luò))通信,并且計(jì)算設(shè)備800還可以包括一個(gè)或多個(gè)用戶I/O接口807,計(jì)算機(jī)可以經(jīng)由用戶I/O接口807提供輸出給用戶以及接收來自用戶的輸入。用戶I/O接口可以包括諸如鍵盤、鼠標(biāo)、麥克風(fēng)、顯示設(shè)備(例如,監(jiān)視器或者觸摸屏)、揚(yáng)聲器、照相機(jī)這樣的設(shè)備和/或各種其他類型的I/O設(shè)備。
本公開的上述實(shí)施例可以以許多方式中的任何一種實(shí)現(xiàn)。例如,可以使用硬件、軟件或者它們的組合來實(shí)現(xiàn)實(shí)施例。當(dāng)以軟件實(shí)現(xiàn)實(shí)施例時(shí),軟件代碼可以在任何適當(dāng)?shù)奶幚砥骰蛘咛幚砥鞯膮R集上執(zhí)行,無(wú)論軟件代碼是提供在單個(gè)計(jì)算機(jī)中還是分布在多個(gè)計(jì)算機(jī)之間。應(yīng)當(dāng)領(lǐng)會(huì),執(zhí)行上述功能的任何組件或者組件的匯集可以一般地認(rèn)為是控制上面討論的功能的一個(gè)或多個(gè)控制器。該一個(gè)或多個(gè)控制器能夠以許多方式實(shí)現(xiàn),諸如使用專用硬件、或者使用利用微碼或者軟件編程的通用硬件(例如,一個(gè)或多個(gè)處理器),以執(zhí)行上面陳述的功能。
在這一點(diǎn)上,應(yīng)當(dāng)領(lǐng)會(huì),本公開的實(shí)施例的一種實(shí)現(xiàn)方式包括使用計(jì)算機(jī)程序(亦即,多個(gè)指令)編碼的至少一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)(即,有形的非臨時(shí)性計(jì)算機(jī)可讀介質(zhì),諸如計(jì)算機(jī)存儲(chǔ)器、軟盤、壓縮盤、磁帶或者其他有形的、非臨時(shí)性計(jì)算機(jī)可讀介質(zhì)),計(jì)算機(jī)程序當(dāng)在一個(gè)或多個(gè)處理器上執(zhí)行時(shí),執(zhí)行本公開的實(shí)施例的上面討論的功能。計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)可以是可傳送的,使得存儲(chǔ)在其上的程序可以加載到任何計(jì)算機(jī)資源上以實(shí)現(xiàn)本文討論的本公開的方面。另外,應(yīng)當(dāng)領(lǐng)會(huì),對(duì)于當(dāng)執(zhí)行時(shí)執(zhí)行上面討論的任何功能的計(jì)算機(jī)程序的引用不限于在主機(jī)計(jì)算機(jī)上運(yùn)行的應(yīng)用程序。更確切地說,本文在一般的意義上使用術(shù)語(yǔ)“計(jì)算機(jī)程序”,以引用可以被采用以編程一個(gè)或多個(gè)處理器實(shí)現(xiàn)本公開的上面討論的方面的任何類型的計(jì)算機(jī)代碼(例如,軟件或者微碼)。
本文使用的語(yǔ)法和術(shù)語(yǔ)是為了描述的目的而不應(yīng)當(dāng)看作限制?!鞍ā薄ⅰ鞍?、“具有”、“內(nèi)含”、“涉及”及其變形的使用意在涵蓋在其后列出的項(xiàng)目以及附加的項(xiàng)目。在權(quán)利要求書中諸如“第一”、“第二”、“第三”等這樣的次序術(shù)語(yǔ)的使用以修飾權(quán)利要求元素,本身不意味著一個(gè)權(quán)利要求元素優(yōu)于另一個(gè)的任何優(yōu)先級(jí)、優(yōu)先序或者次序,或者執(zhí)行過程的動(dòng)作的時(shí)間次序。次序術(shù)語(yǔ)僅用作標(biāo)注,以區(qū)分具有某個(gè)名稱的一個(gè)權(quán)利要求元素與(若非使用次序術(shù)語(yǔ))具有相同名稱的另一個(gè)元素,以彼此區(qū)分權(quán)利要求元素。
本文已經(jīng)詳細(xì)地描述了本公開的幾個(gè)實(shí)施例,各種修改和改進(jìn)將容易由本領(lǐng)域技術(shù)人員想到。這種修改和改進(jìn)旨在在本發(fā)明的精神和范圍內(nèi)。因此,前面的描述僅作為示例,并且不旨在成為限制。本發(fā)明僅如由權(quán)利要求書及其等同物所定義的而限制。