br>[0073]—些實施例中,所述交互界面模塊51還用于:
[0074]當(dāng)所述查詢詞是語音形式的查詢詞時,對語音形式的查詢詞進行語音識別,識別為文本形式的查詢詞;或者,
[0075]當(dāng)所述查詢詞是圖像形式的查詢詞時,對圖像形式的查詢詞進行圖像識別,識別為文本形式的查詢詞。
[0076]在獲取到文本形式的查詢詞后,可以將其轉(zhuǎn)換為格式化文本請求,以方便后續(xù)處理。根據(jù)實際需要的不同,可以設(shè)置不同的規(guī)則進行格式化以得到格式化文本請求。例如,格式化時采用的規(guī)則是去除文本形式的查詢詞中的冗余信息,冗余信息例如包括為什么”,“請問”,“標(biāo)點符號”這些字符,另外,在格式化時例如還可以進行繁簡體字轉(zhuǎn)化等。
[0077]自然語言理解模塊52,用于對所述格式化文本請求進行自然語言理解,獲取對所述格式化文本請求的標(biāo)注結(jié)果;
[0078]—些實施例中,所述自然語言理解模塊52具體用于:
[0079]對格式化文本請求進行切詞,得到格式化文本請求中的分詞;
[0080]例如,用戶輸入的查詢詞是“璇的五筆”,則在上述的格式化轉(zhuǎn)換時,例如可以去掉其中的“的”,得到格式化文本請求“璇五筆”,對該格式化文本請求進行分詞后可以得到“璇”、“五筆”這兩個分詞。
[0081]又例如,用戶輸入的查詢詞是“一丘之貉的最后一個字的五筆”,則類似上述的格式化和分詞處理后,可以得到“一丘之貉”、“最后一個字”、“五筆”這三個分詞。
[0082]根據(jù)預(yù)先建立的標(biāo)注詞典,對分詞進行標(biāo)注,得到分詞對應(yīng)的標(biāo)注結(jié)果。
[0083]例如,標(biāo)注結(jié)果包括:分詞被識別為實體信息或?qū)傩孕畔?,屬性信息例如包??實體間關(guān)系信息或其余的屬性信息,進一步的,當(dāng)分詞被識別為實體信息時還可以細(xì)分為實體類型是字、詞、成語等。另外,當(dāng)分詞被識別為實體信息時,標(biāo)注結(jié)果中還可以包含分詞對應(yīng)的身份標(biāo)識(ID)信息,或者,當(dāng)分詞被識別為屬性信息時,標(biāo)注結(jié)果中還可以包含屬性信息的名稱。
[0084]假設(shè)一個分詞是A,實體信息例如A是一個字、詞或成語等;實體間關(guān)系信息是指字詞實體之間的語義關(guān)系,如A是同義詞、反義詞等,也可以稱為邊;其余的屬性信息例如A
是:拼首、五筆、筆畫?目息等。
[0085]在標(biāo)注時,例如可以預(yù)先建立不同類別的詞典,如實體詞典、屬性詞典等,對應(yīng)每個分詞,通過在不同詞典內(nèi)查詢可以確定分詞被識別為實體信息或?qū)傩孕畔?,例如,對?yīng)分詞“璇”,經(jīng)過查詢,其在實體詞典中查詢到,則確定“璇”被識別為實體信息。當(dāng)然,可以理解的是,實體詞典可以進一步分為字的詞典、詞組的詞典、成語的詞典等,從而可以實現(xiàn)更細(xì)的標(biāo)注。
[0086]另外,為了更好地唯一表述字詞實體以及實體間的語義關(guān)系,詞典內(nèi)實體有唯一的身份標(biāo)識(ID)信息,因此還可以在標(biāo)注結(jié)果中標(biāo)注ID信息。
[0087]例如,對應(yīng)分詞“璇”,可以在字的詞典中查詢到,并且如果“璇”在字的詞典中的ID信息是“id_123”,那么還可以確定“璇”被識別為實體信息,且實體類型是字,且ID信息是id_123o
[0088]其余分詞也可以類似處理。因此,經(jīng)過標(biāo)注詞典的標(biāo)注后,可以獲取分詞與對應(yīng)的標(biāo)識結(jié)果。
[0089]例如,對應(yīng)“璇的五筆”這一查詢詞,得到的標(biāo)注結(jié)果包括:[(璇、id_123、word),(五筆、wubi, attribute)]。其中,“璇”和“五筆”是分詞,以及,“璇”被識別為實體信息,且實體類型是是“字(word) ”,ID信息是id_123 ;“五筆”被識別是屬性信息(attribute),且屬性名稱是wubi。
[0090]又例如,對應(yīng)“一丘之貉的最后一個字的五筆”這一查詢詞,得到的標(biāo)識結(jié)果包括:[(一丘之絡(luò),id_133,id1m),(最后一個字,last_word, tie),(五筆,wub1、attribute)]。其中,“一丘之貉”、“最后一個字”、“五筆”是分詞,以及,“一丘之貉”被識別為實體信息,且實體類型是“成語(id1m)”,ID信息是id_133 ; “最后一個字”被識別為屬性信息,具體是實體間關(guān)系信息,實體間關(guān)系信息也可以稱為關(guān)系詞(tie),且屬性名稱(具體為關(guān)系詞的名稱)是 last_word0
[0091]數(shù)據(jù)檢索模塊53,用于根據(jù)所述標(biāo)注結(jié)果進行數(shù)據(jù)檢索,得到檢索結(jié)果,以將檢索結(jié)果展示給用戶。
[0092]其中,可以預(yù)先建立關(guān)系檢索引擎和實體檢索數(shù)據(jù)庫,關(guān)系檢索引擎用于根據(jù)標(biāo)注結(jié)果中的實體間關(guān)系信息確定要檢索的實體信息;實體檢索數(shù)據(jù)庫用于根據(jù)標(biāo)注結(jié)果中的實體信息和/或?qū)傩孕畔ⅲ_定檢索結(jié)果。如果標(biāo)注結(jié)果中沒有實體間關(guān)系信息,則可以直接根據(jù)實體檢索數(shù)據(jù)庫獲取檢索結(jié)果;如果標(biāo)注結(jié)果中存在實體間關(guān)系信息,可以先根據(jù)關(guān)系檢索引擎確定出要檢索的實體,再從實體檢索數(shù)據(jù)庫中獲取相應(yīng)的檢索結(jié)果。
[0093]一些實施例中,所述數(shù)據(jù)檢索模塊53具體用于:
[0094]如果所述標(biāo)注結(jié)果中存在實體間關(guān)系信息,在預(yù)先建立的關(guān)系檢索引擎中,根據(jù)實體信息和實體間關(guān)系信息檢索到要檢索的實體信息,以及,在預(yù)先建立的實體檢索數(shù)據(jù)庫中,根據(jù)檢索到的要檢索的實體信息和標(biāo)注結(jié)果中的屬性信息,獲取對應(yīng)的檢索結(jié)果;或者,
[0095]如果所述標(biāo)注結(jié)果中不存在實體間關(guān)系信息,在預(yù)先建立的實體檢索數(shù)據(jù)庫中,根據(jù)標(biāo)注結(jié)果中的實體信息和/或?qū)傩孕畔?,獲取對應(yīng)的檢索結(jié)果。
[0096]例如,如果標(biāo)注結(jié)果中存在一個或一些分詞對應(yīng)的類別是“tie”時,表明存在實體間關(guān)系信息,否則不存在。
[0097]例如,對應(yīng)“璇的五筆”的標(biāo)注結(jié)果中不存在實體間關(guān)系信息,對應(yīng)“一丘之貉的最后一個字的五筆”的標(biāo)注結(jié)果中存在實體間關(guān)系信息。
[0098]例如,關(guān)系檢索引擎中記錄不同實體間的關(guān)系索引(也可以稱為圖索引),通過該關(guān)系索引可以獲取相應(yīng)的要檢索的實體。例如,標(biāo)注結(jié)果中的實體信息是“一丘之貉”,實體間關(guān)系信息是“最后一個字”,則通過關(guān)系索引,可以確定要檢索的實體是“貉”。
[0099]例如,對應(yīng)“璇的五筆”,在標(biāo)注結(jié)果中獲取的實體信息是“璇”,屬性信息是“五筆”,則可以在實體檢索數(shù)據(jù)庫中檢索,得到“璇”的“五筆”的具體內(nèi)容作為檢索結(jié)果。
[0100]又例如,對應(yīng)“一丘之貉的最后一個字的五筆”,通過關(guān)系檢索引擎可以確定要檢索的實體是“貉”,在標(biāo)注結(jié)果中獲取的屬性信息是“五筆”,則可以在實體檢索數(shù)據(jù)庫中檢索,得到“貉”的“五筆”的具體內(nèi)容作為檢索結(jié)果。
[0101]需要說明是,通過上述的自然語言理解及檢索,不僅可以獲取到滿足用戶不同需求的檢索結(jié)果,還可以解決語音輸入歧義問題。
[0102]在手機和穿戴設(shè)備場景中,語音輸入存在許多讀音不準(zhǔn),識別不清,多音字混淆的問題。比如用戶語音輸入“χιι?η”,由于同音字太多,語音識別裝置無法判斷用戶的意圖,在智能手表等穿戴設(shè)備中用戶無法快速選擇候選結(jié)果。語音識別裝置一般只會提供最高頻的單字,如“旋”字作為結(jié)果。
[0103]而應(yīng)用本實施例的方法時,如圖4所示,用戶可以以語音輸入“王字旁的χ?!?η”,語音裝置在獲取到該輸入后,可以根據(jù)上述流程進行自然語言理解和數(shù)據(jù)檢索,找到相應(yīng)的檢索結(jié)果返回給用戶。
[0104]另外,本實施例的方法可以應(yīng)用在多種應(yīng)用場景,例如,移動版應(yīng)用程序