本發(fā)明涉及人工智能技術(shù)領(lǐng)域,尤其涉及一種基于人工智能的口語(yǔ)查詢識(shí)別方法及裝置。
背景技術(shù):
人工智能(Artificial Intelligence),英文縮寫(xiě)為AI。它是研究、開(kāi)發(fā)用于模擬、延伸和擴(kuò)展人的智能的理論、方法、技術(shù)及應(yīng)用系統(tǒng)的一門(mén)新的技術(shù)科學(xué)。人工智能是計(jì)算機(jī)科學(xué)的一個(gè)分支,它企圖了解智能的實(shí)質(zhì),并生產(chǎn)出一種新的能以人類(lèi)智能相似的方式做出反應(yīng)的智能機(jī)器,該領(lǐng)域的研究包括機(jī)器人、語(yǔ)音識(shí)別、圖像識(shí)別、自然語(yǔ)言處理和專(zhuān)家系統(tǒng)等。
隨著人工智能的發(fā)展,計(jì)算機(jī)與人的自然交互已經(jīng)是人工智能的核心問(wèn)題。如何讓機(jī)器準(zhǔn)確地獲取用戶口語(yǔ)查詢意圖及其對(duì)應(yīng)的參數(shù)信息是一個(gè)非常重要的技術(shù)問(wèn)題。
傳統(tǒng)的模板匹配方法是通過(guò)人工總結(jié)一些案例,找出該類(lèi)案例的固定模式存入詞典,在接收到一個(gè)查詢的口語(yǔ)時(shí),與已有模板進(jìn)行匹配,從而分析出查詢的意圖及其對(duì)應(yīng)的參數(shù)信息。
然而,口語(yǔ)表達(dá)方式復(fù)雜多樣,模板是有限的,依靠模板匹配并不能完全覆蓋所有的表達(dá)形式,以及模板匹配方法無(wú)法利用跨領(lǐng)域信息,各個(gè)領(lǐng)域之間是相互獨(dú)立的,不能相互遷移。例如,總結(jié)好訂票相關(guān)的查詢模板,當(dāng)需要處理打車(chē)的查詢時(shí),訂票的模板不能完全適用,這時(shí)需要人工去總結(jié)新的類(lèi)別上的模板。另外,模板匹配需要人工參與總結(jié),自動(dòng)化程度不高。
技術(shù)實(shí)現(xiàn)要素:
本發(fā)明的目的旨在至少在一定程度上解決上述的技術(shù)問(wèn)題之一。
為此,本發(fā)明的第一個(gè)目的在于提出一種基于人工智能的口語(yǔ)查詢識(shí)別方法,該方法通過(guò)訓(xùn)練生成高適用性和高自動(dòng)化的檢索領(lǐng)域識(shí)別模型和檢索意圖識(shí)別模型,能夠準(zhǔn)確獲取用戶口語(yǔ)查詢的意圖及其對(duì)應(yīng)的參數(shù)信息,提高了口語(yǔ)查詢識(shí)別的效率和準(zhǔn)確度。
本發(fā)明的第二個(gè)目的在于提出了一種基于人工智能的口語(yǔ)查詢識(shí)別裝置。
為達(dá)上述目的,根據(jù)本發(fā)明第一方面實(shí)施例提出的一種基于人工智能的口語(yǔ)查詢識(shí)別方法,包括以下步驟:
根據(jù)口語(yǔ)檢索語(yǔ)料標(biāo)注的查詢領(lǐng)域?qū)矸e神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練生成檢索領(lǐng)域識(shí)別模型;
根據(jù)所述口語(yǔ)檢索語(yǔ)料標(biāo)注的與所述查詢領(lǐng)域?qū)?yīng)的查詢意圖和參數(shù)信息,對(duì)循環(huán)神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練生成與所述查詢領(lǐng)域?qū)?yīng)的檢索意圖識(shí)別模型。
本發(fā)明實(shí)施例的基于人工智能的口語(yǔ)查詢識(shí)別方法,首先根據(jù)口語(yǔ)檢索語(yǔ)料標(biāo)注的查詢領(lǐng)域?qū)矸e神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練生成檢索領(lǐng)域識(shí)別模型,接著根據(jù)口語(yǔ)檢索語(yǔ)料標(biāo)注的與查詢領(lǐng)域?qū)?yīng)的查詢意圖和參數(shù)信息,對(duì)循環(huán)神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練生成與查詢領(lǐng)域?qū)?yīng)的檢索意圖識(shí)別模型。由此,通過(guò)訓(xùn)練生成高適用性和高自動(dòng)化的檢索領(lǐng)域識(shí)別模型和檢索意圖識(shí)別模型,能夠準(zhǔn)確獲取用戶口語(yǔ)查詢的意圖及其對(duì)應(yīng)的參數(shù)信息,提高了口語(yǔ)查詢識(shí)別的效率和準(zhǔn)確度。
為達(dá)上述目的,根據(jù)本發(fā)明的第二方面實(shí)施例提出的一種基于人工智能的口語(yǔ)查詢識(shí)別裝置,包括:第一生成模塊,用于根據(jù)口語(yǔ)檢索語(yǔ)料標(biāo)注的查詢領(lǐng)域?qū)矸e神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練生成檢索領(lǐng)域識(shí)別模型;
第二生成模塊,用于根據(jù)所述口語(yǔ)檢索語(yǔ)料標(biāo)注的與所述查詢領(lǐng)域?qū)?yīng)的查詢意圖和參數(shù)信息,對(duì)循環(huán)神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練生成與所述查詢領(lǐng)域?qū)?yīng)的檢索意圖識(shí)別模型。
本發(fā)明實(shí)施例的基于人工智能的口語(yǔ)查詢識(shí)別裝置,首先根據(jù)口語(yǔ)檢索語(yǔ)料標(biāo)注的查詢領(lǐng)域?qū)矸e神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練生成檢索領(lǐng)域識(shí)別模型,接著根據(jù)口語(yǔ)檢索語(yǔ)料標(biāo)注的與查詢領(lǐng)域?qū)?yīng)的查詢意圖和參數(shù)信息,對(duì)循環(huán)神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練生成與查詢領(lǐng)域?qū)?yīng)的檢索意圖識(shí)別模型。由此,通過(guò)訓(xùn)練生成高適用性和高自動(dòng)化的檢索領(lǐng)域識(shí)別模型和檢索意圖識(shí)別模型,能夠準(zhǔn)確獲取用戶口語(yǔ)查詢的意圖及其對(duì)應(yīng)的參數(shù)信息,提高了口語(yǔ)查詢識(shí)別的效率和準(zhǔn)確度。
本發(fā)明附加的方面和優(yōu)點(diǎn)將在下面的描述中部分給出,部分將從下面的描述中變得明顯,或通過(guò)本發(fā)明的實(shí)踐了解到。
附圖說(shuō)明
本發(fā)明的上述和/或附加的方面和優(yōu)點(diǎn)從結(jié)合下面附圖對(duì)實(shí)施例的描述中將變得明顯和容易理解,其中:
圖1是根據(jù)本發(fā)明一個(gè)實(shí)施例的基于人工智能的口語(yǔ)查詢識(shí)別方法的流程圖;
圖2是根據(jù)本發(fā)明另一個(gè)實(shí)施例的基于人工智能的口語(yǔ)查詢識(shí)別方法的流程圖;
圖3是根據(jù)本發(fā)明一個(gè)實(shí)施例的檢索領(lǐng)域識(shí)別模型的結(jié)構(gòu)示意圖;
圖4是根據(jù)本發(fā)明又一個(gè)實(shí)施例的基于人工智能的口語(yǔ)查詢識(shí)別方法的流程圖;
圖5是根據(jù)本發(fā)明一個(gè)實(shí)施例的檢索意圖識(shí)別模型的結(jié)構(gòu)示意圖;
圖6是根據(jù)本發(fā)明再一個(gè)實(shí)施例的基于人工智能的口語(yǔ)查詢識(shí)別方法的流程圖;
圖7是根據(jù)本發(fā)明一個(gè)實(shí)施例的基于人工智能的口語(yǔ)查詢識(shí)別裝置的結(jié)構(gòu)示意圖;
圖8是根據(jù)本發(fā)明另一個(gè)實(shí)施例的基于人工智能的口語(yǔ)查詢識(shí)別裝置的結(jié)構(gòu)示意圖;
圖9是根據(jù)本發(fā)明再一個(gè)實(shí)施例的基于人工智能的口語(yǔ)查詢識(shí)別裝置的結(jié)構(gòu)示意圖;以及
圖10是根據(jù)本發(fā)明又一個(gè)實(shí)施例的基于人工智能的口語(yǔ)查詢識(shí)別裝置的結(jié)構(gòu)示意圖。
具體實(shí)施方式
下面詳細(xì)描述本發(fā)明的實(shí)施例,所述實(shí)施例的示例在附圖中示出,其中自始至終相同或類(lèi)似的標(biāo)號(hào)表示相同或類(lèi)似的元件或具有相同或類(lèi)似功能的元件。下面通過(guò)參考附圖描述的實(shí)施例是示例性的,旨在用于解釋本發(fā)明,而不能理解為對(duì)本發(fā)明的限制。
下面參考附圖描述本發(fā)明實(shí)施例的基于人工智能的口語(yǔ)查詢識(shí)別方法及裝置。
圖1是根據(jù)本發(fā)明一個(gè)實(shí)施例的基于人工智能的口語(yǔ)查詢識(shí)別方法的流程圖。
如圖1所示,本發(fā)明實(shí)施例的基于人工智能的口語(yǔ)查詢識(shí)別方法包括以下步驟:
步驟101,根據(jù)口語(yǔ)檢索語(yǔ)料標(biāo)注的查詢領(lǐng)域?qū)矸e神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練生成檢索領(lǐng)域識(shí)別模型。
通常,在人機(jī)對(duì)話的查詢過(guò)程中,為了符合人類(lèi)的自然表達(dá)以口語(yǔ)形式出現(xiàn),但是口語(yǔ)表達(dá)具有多樣性和復(fù)雜性。舉例說(shuō)明如下:
查詢=“幫我訂張從北京到天津的火車(chē)票”,查詢=“我想坐火車(chē)從北京到天津”,這兩個(gè)查詢都表達(dá)了用戶想“訂火車(chē)票”,起始地是“北京”,目的地是“天津”。如何讓計(jì)算機(jī)準(zhǔn)確理解這類(lèi)口語(yǔ)的查詢意圖以及該意圖所需要的參數(shù)信息是人機(jī)對(duì)話中需要解決的問(wèn)題。
因此,本發(fā)明實(shí)施例提出一種基于人工智能的口語(yǔ)查詢識(shí)別方法,能夠準(zhǔn)確獲取用戶口語(yǔ)查詢的意圖及其對(duì)應(yīng)的參數(shù)信息,提高了口語(yǔ)查詢識(shí)別的效率和準(zhǔn)確度。
首先,根據(jù)口語(yǔ)檢索語(yǔ)料標(biāo)注的查詢領(lǐng)域?qū)矸e神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練生成檢索領(lǐng)域識(shí)別模型,生成的檢索領(lǐng)域識(shí)別模型能夠確定輸入的口語(yǔ)查詢屬于哪個(gè)領(lǐng)域。
需要說(shuō)明的是,卷積神經(jīng)網(wǎng)絡(luò)本質(zhì)上是一種輸入到輸出的映射,能夠?qū)W習(xí)大量的輸入與輸出之間的映射關(guān)系,而不需要任何輸入和輸出之間的精確的數(shù)學(xué)表達(dá)式。進(jìn)而,只要根據(jù)口語(yǔ)檢索語(yǔ)料標(biāo)注的查詢領(lǐng)域?qū)矸e神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練,生成的檢索領(lǐng)域識(shí)別模型具有輸入輸出對(duì)之間的映射能力。
其中,口語(yǔ)檢索語(yǔ)料有很多種,可以通過(guò)預(yù)設(shè)規(guī)則對(duì)口語(yǔ)檢索語(yǔ)料進(jìn)行處理得到標(biāo)注檢索領(lǐng)域的口語(yǔ)檢索語(yǔ)料作為訓(xùn)練樣本,從而可自動(dòng)地獲取樣本數(shù)據(jù),當(dāng)然也可通過(guò)例如人工標(biāo)注檢索領(lǐng)域的方式獲取訓(xùn)練樣本,標(biāo)注完畢的多個(gè)口語(yǔ)檢索語(yǔ)料存入訓(xùn)練樣本集合。
為了本領(lǐng)域人員更加清楚如何生成檢索領(lǐng)域識(shí)別模型,輸入已標(biāo)注查詢領(lǐng)域的口語(yǔ)檢索語(yǔ)料,訓(xùn)練卷積神經(jīng)網(wǎng)絡(luò),具體得訓(xùn)練過(guò)程如下:
第一步,向前傳播階段,從訓(xùn)練樣本集合中取一個(gè)樣本,將樣本輸入卷積神經(jīng)網(wǎng)絡(luò)計(jì)算相應(yīng)的實(shí)際輸出,在此階段,信息從輸入層經(jīng)過(guò)逐級(jí)的變換,傳送到輸出層;
第二步,向后傳播階段,計(jì)算實(shí)際輸出與樣本對(duì)應(yīng)的理想輸出的差,按極小化誤差的方法,反向傳播調(diào)整權(quán)矩陣;
第三步,重復(fù)第一步和第二步的操作,直到卷積神經(jīng)網(wǎng)絡(luò)分類(lèi)層Softmax之后的輸出的目標(biāo)函數(shù)J(θ)≤0.0001為止,得到檢索領(lǐng)域識(shí)別模型。
其中,J(θ)表示目標(biāo)函數(shù),m表示樣本數(shù)量,θ表示訓(xùn)練參數(shù),x表示隱層向量。
進(jìn)一步地,在獲取檢索領(lǐng)域識(shí)別模型之后,檢索領(lǐng)域識(shí)別模型能夠處理輸入的口語(yǔ)查詢屬于哪一個(gè)領(lǐng)域,例如,將查詢1=“我要坐火車(chē)從北京到廣州”,查詢2=“北京到廣州的火車(chē)最晚幾點(diǎn)發(fā)車(chē)”輸入到檢索領(lǐng)域識(shí)別模型,得到以上兩個(gè)查詢均屬于“交通”領(lǐng)域。
步驟102,根據(jù)口語(yǔ)檢索語(yǔ)料標(biāo)注的與查詢領(lǐng)域?qū)?yīng)的查詢意圖和參數(shù)信息,對(duì)循環(huán)神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練生成與查詢領(lǐng)域?qū)?yīng)的檢索意圖識(shí)別模型。
具體地,檢索意圖識(shí)別模型可以識(shí)別查詢領(lǐng)域下的查詢意圖和參數(shù)信息,檢索意圖識(shí)別模型在學(xué)習(xí)參數(shù)信息標(biāo)注的時(shí)候同時(shí)兼顧查詢意圖識(shí)別,兩種信息相互融合補(bǔ)充,以提高其識(shí)別的精度。舉例說(shuō)明如下:
查詢=“我要坐火車(chē)去廣州”時(shí),識(shí)別到廣州為一個(gè)地名參數(shù)信息,查詢意圖可能是與交通意圖相關(guān),同樣,當(dāng)我們識(shí)別到查詢意圖為坐火車(chē)的時(shí)候,需要識(shí)別出發(fā)地參數(shù)信息和目的地參數(shù)信息,而非天氣類(lèi)型參數(shù)信息。
為了本領(lǐng)域人員更加清楚如何生成檢索意圖識(shí)別模型,輸入已標(biāo)注查詢領(lǐng)域?qū)?yīng)的查詢意圖和參數(shù)信息的口語(yǔ)檢索語(yǔ)料,訓(xùn)練循環(huán)神經(jīng)網(wǎng)絡(luò),具體得訓(xùn)練過(guò)程如下:
第一步,訓(xùn)練樣本中口語(yǔ)檢索語(yǔ)料的分詞生成循環(huán)神經(jīng)網(wǎng)絡(luò)的輸入層,從預(yù)先定義的詞表中查找輸入層中每個(gè)分詞對(duì)應(yīng)的實(shí)數(shù)向量。
第二步,由實(shí)數(shù)向量生成循環(huán)神經(jīng)網(wǎng)絡(luò)的實(shí)數(shù)向量層,對(duì)實(shí)數(shù)向量進(jìn)行矩陣映射,得到循環(huán)神經(jīng)網(wǎng)絡(luò)的隱層。
第三步,以每個(gè)分詞的實(shí)數(shù)向量作為條件,在條件下分別計(jì)算與每個(gè)分詞對(duì)應(yīng)的類(lèi)別的概率,作為循環(huán)神經(jīng)網(wǎng)絡(luò)的輸出層。
其中,計(jì)算類(lèi)別i的概率公式為:θ表示訓(xùn)練參數(shù),x表示隱層向量,T表示總類(lèi)別,k為常數(shù)。
第四步,利用多個(gè)查詢領(lǐng)域的口語(yǔ)檢索語(yǔ)料對(duì)循環(huán)神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練,得到檢索意圖識(shí)別模型。
進(jìn)一步地,在獲取檢索意圖識(shí)別模型后,能夠識(shí)別口語(yǔ)查詢?cè)谠摬樵冾I(lǐng)域下的查詢意圖以及對(duì)應(yīng)參數(shù)信息。繼續(xù)以上述例子為例進(jìn)行說(shuō)明:在得到以上兩個(gè)查詢均屬于“交通”領(lǐng)域。檢索意圖識(shí)別模型識(shí)別出兩個(gè)查詢的查詢意圖是不同的,查詢1的意圖為用戶需要“訂一張飛機(jī)票”,查詢2的意圖為“火車(chē)時(shí)刻查詢”,查詢1和查詢2的參數(shù)信息都為起始地=“北京”,目的地=“廣州”。
綜上所述,本發(fā)明實(shí)施例的基于人工智能的口語(yǔ)查詢識(shí)別方法,首先根據(jù)口語(yǔ)檢索語(yǔ)料標(biāo)注的查詢領(lǐng)域?qū)矸e神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練生成檢索領(lǐng)域識(shí)別模型,接著根據(jù)口語(yǔ)檢索語(yǔ)料標(biāo)注的與查詢領(lǐng)域?qū)?yīng)的查詢意圖和參數(shù)信息,對(duì)循環(huán)神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練生成與查詢領(lǐng)域?qū)?yīng)的檢索意圖識(shí)別模型。由此,通過(guò)訓(xùn)練生成高適用性和高自動(dòng)化的檢索領(lǐng)域識(shí)別模型和檢索意圖識(shí)別模型,能夠準(zhǔn)確獲取用戶口語(yǔ)查詢的意圖及其對(duì)應(yīng)的參數(shù)信息,提高了口語(yǔ)查詢識(shí)別的效率和準(zhǔn)確度。
圖2是根據(jù)本發(fā)明另一個(gè)實(shí)施例的基于人工智能的口語(yǔ)查詢識(shí)別方法的流程圖。
參見(jiàn)圖2,基于圖1實(shí)施例,在步驟102之后,還包括:
步驟201,對(duì)用戶輸入的口語(yǔ)檢索語(yǔ)句進(jìn)行分詞處理并進(jìn)行詞性標(biāo)注,并將分詞結(jié)果以向量形式依序輸入檢索領(lǐng)域識(shí)別模型的輸入層。
具體地,在訓(xùn)練好檢索領(lǐng)域識(shí)別模型和檢索意圖識(shí)別模型后,在獲取用戶輸入的口語(yǔ)檢索語(yǔ)句時(shí),首先對(duì)口語(yǔ)檢索語(yǔ)句進(jìn)行分詞處理并進(jìn)行詞性標(biāo)注,其中,詞性標(biāo)注表示確定每個(gè)詞是名詞、動(dòng)詞、形容詞或其他詞性的過(guò)程。進(jìn)而,并將分詞結(jié)果以向量形式依序輸入檢索領(lǐng)域識(shí)別模型的輸入層。
為了更加清楚描述如何口語(yǔ)檢測(cè)語(yǔ)句的查詢領(lǐng)域,結(jié)合圖3詳細(xì)說(shuō)明如下:
如圖3所示,獲取用戶輸入的口語(yǔ)檢索語(yǔ)句為“北京今天天氣怎么樣”,對(duì)其進(jìn)行分詞處理并進(jìn)行詞性標(biāo)注為“北京”名詞、“今天”時(shí)間狀語(yǔ)、“天氣”名詞和“怎么樣”疑問(wèn)詞,并將分詞結(jié)果以向量形式依序輸入檢索領(lǐng)域識(shí)別模型的輸入層。
步驟202,通過(guò)檢索領(lǐng)域識(shí)別模型的隱層將當(dāng)前輸入的詞語(yǔ)與歷史輸入的詞語(yǔ)融合,根據(jù)所有詞語(yǔ)的融合結(jié)果獲取口語(yǔ)檢索語(yǔ)句的實(shí)數(shù)向量。
步驟203,通過(guò)檢索領(lǐng)域識(shí)別模型的輸出層對(duì)實(shí)數(shù)向量進(jìn)行概率分析,獲取口語(yǔ)檢測(cè)語(yǔ)句的查詢領(lǐng)域。
具體地,檢索領(lǐng)域識(shí)別模型具有輸入輸出對(duì)之間的映射能力,通過(guò)其隱層將當(dāng)前輸入的詞語(yǔ)與歷史輸入的詞語(yǔ)融合,根據(jù)所有詞語(yǔ)的融合結(jié)果獲取口語(yǔ)檢索語(yǔ)句的實(shí)數(shù)向量,可以通過(guò)檢索領(lǐng)域識(shí)別模型的輸出層對(duì)實(shí)數(shù)向量進(jìn)行概率分析,即使用softmax進(jìn)行分類(lèi),確定實(shí)數(shù)向量對(duì)應(yīng)的查詢領(lǐng)域類(lèi)別,最后獲取口語(yǔ)檢測(cè)語(yǔ)句的查詢領(lǐng)域。
需要說(shuō)明的是,該檢索領(lǐng)域識(shí)別模型輸入層,隱層和輸出層即Softmax分類(lèi)層,其中,Softmax函數(shù)是用于對(duì)結(jié)果進(jìn)行分類(lèi)的函數(shù)。
繼續(xù)以上述例子進(jìn)行說(shuō)明,檢索領(lǐng)域識(shí)別模型的隱層將輸入的“北京”、“今天”、“天氣”和“怎么樣”與歷史輸入的詞語(yǔ)融合,根據(jù)所有詞語(yǔ)的融合結(jié)果獲取口語(yǔ)檢索語(yǔ)句的實(shí)數(shù)向量,通過(guò)公式(2)對(duì)實(shí)數(shù)向量進(jìn)行概率分析。例如,“北京”概率為0.2,“今天”概率為0.05、“天氣”概率為0.7和“怎么樣”概率為0.05。由此確定口語(yǔ)檢索語(yǔ)句為“北京今天天氣怎么樣”屬于天氣領(lǐng)域。
綜上所述,本發(fā)明實(shí)施例的基于人工智能的口語(yǔ)查詢識(shí)別方法,首先用戶輸入的口語(yǔ)檢索語(yǔ)句進(jìn)行分詞處理并進(jìn)行詞性標(biāo)注,并將分詞結(jié)果以向量形式依序輸入檢索領(lǐng)域識(shí)別模型的輸入層,接著通過(guò)檢索領(lǐng)域識(shí)別模型的隱層將當(dāng)前輸入的詞語(yǔ)與歷史輸入的詞語(yǔ)融合,根據(jù)所有詞語(yǔ)的融合結(jié)果獲取口語(yǔ)檢索語(yǔ)句的實(shí)數(shù)向量,最后通過(guò)檢索領(lǐng)域識(shí)別模型的輸出層對(duì)實(shí)數(shù)向量進(jìn)行概率分析,獲取口語(yǔ)檢測(cè)語(yǔ)句的查詢領(lǐng)域。由此,通過(guò)訓(xùn)練生成高適用性和高自動(dòng)化的檢索領(lǐng)域識(shí)別模型,能夠準(zhǔn)確獲取用戶口語(yǔ)查詢的查詢領(lǐng)域,提高了口語(yǔ)查詢識(shí)別的效率和準(zhǔn)確度。
圖4是根據(jù)本發(fā)明又一個(gè)實(shí)施例的基于人工智能的口語(yǔ)查詢識(shí)別方法的流程圖。
參見(jiàn)圖4,基于圖2實(shí)施例,在步驟203之后,還包括:
步驟401,將分詞結(jié)果以向量形式依序輸入與查詢領(lǐng)域?qū)?yīng)的檢索意圖識(shí)別模型。
具體地,在獲取查詢領(lǐng)域后,以及上述過(guò)程中得到的分詞結(jié)果以向量形式依序輸入檢索領(lǐng)域識(shí)別模型的輸入層。
為了更加清楚描述如何獲取口語(yǔ)檢測(cè)語(yǔ)句的查詢意圖及其對(duì)應(yīng)的參數(shù)信息,結(jié)合圖5詳細(xì)說(shuō)明如下:
如圖5所示,將口語(yǔ)檢索語(yǔ)句為“北京今天天氣怎么樣”的分詞結(jié)果以向量形式依序輸入檢索領(lǐng)域識(shí)別模型的輸入層。
步驟402,通過(guò)檢索意圖識(shí)別模型的隱層將當(dāng)前輸入的詞語(yǔ)與歷史輸入的詞語(yǔ)融合,根據(jù)所有詞語(yǔ)的融合結(jié)果獲取口語(yǔ)檢索語(yǔ)句的實(shí)數(shù)向量。
步驟403,通過(guò)檢索意圖識(shí)別模型的意圖分類(lèi)輸出層對(duì)實(shí)數(shù)向量進(jìn)行概率計(jì)算,獲取口語(yǔ)檢測(cè)語(yǔ)句的查詢意圖。
具體地,檢索意圖識(shí)別模型具有輸入輸出對(duì)之間的映射能力,通過(guò)其隱層將當(dāng)前輸入的詞語(yǔ)與歷史輸入的詞語(yǔ)融合,根據(jù)所有詞語(yǔ)的融合結(jié)果獲取口語(yǔ)檢索語(yǔ)句的實(shí)數(shù)向量,可以通過(guò)檢索意圖識(shí)別模型的輸出層對(duì)實(shí)數(shù)向量進(jìn)行概率分析,即使用softmax進(jìn)行分類(lèi),確定實(shí)數(shù)向量對(duì)應(yīng)的查詢意圖類(lèi)別,最后獲取口語(yǔ)檢測(cè)語(yǔ)句的查詢意圖。
繼續(xù)以上述例子進(jìn)行說(shuō)明,檢索意圖識(shí)別模型的隱層將輸入的“北京”、“今天”、“天氣”和“怎么樣”與歷史輸入的詞語(yǔ)融合,根據(jù)所有詞語(yǔ)的融合結(jié)果獲取口語(yǔ)檢索語(yǔ)句的實(shí)數(shù)向量,通過(guò)公式(2)對(duì)實(shí)數(shù)向量進(jìn)行概率分析。例如,“北京”概率為0.1,“今天”概率為0.1、“天氣”概率為0.3和“怎么樣”概率為0.5。由此確定口語(yǔ)檢索語(yǔ)句為“北京今天天氣怎么樣”的查詢意圖為天氣如何。
步驟404,通過(guò)檢索意圖識(shí)別模型的序列化分類(lèi)輸出層對(duì)實(shí)數(shù)向量進(jìn)行概率計(jì)算,獲取與查詢意圖對(duì)應(yīng)的參數(shù)信息。
繼續(xù)以上述例子進(jìn)行說(shuō)明,通過(guò)公式(2)對(duì)實(shí)數(shù)向量進(jìn)行概率分析。例如,“北京”概率為0.1,“今天”概率為0.1、“天氣”概率為0.2和“怎么樣”概率為0.6。由此確定口語(yǔ)檢索語(yǔ)句為“北京今天天氣怎么樣”的查詢意圖對(duì)應(yīng)的參數(shù)信息為“北京”和“今天”。
綜上所述,本發(fā)明實(shí)施例的基于人工智能的口語(yǔ)查詢識(shí)別方法,首先將分詞結(jié)果以向量形式依序輸入與查詢領(lǐng)域?qū)?yīng)的檢索意圖識(shí)別模型,接著通過(guò)檢索意圖識(shí)別模型的隱層將當(dāng)前輸入的詞語(yǔ)與歷史輸入的詞語(yǔ)融合,根據(jù)所有詞語(yǔ)的融合結(jié)果獲取口語(yǔ)檢索語(yǔ)句的實(shí)數(shù)向量,最后通過(guò)檢索意圖識(shí)別模型的意圖分類(lèi)輸出層對(duì)實(shí)數(shù)向量進(jìn)行概率計(jì)算,獲取口語(yǔ)檢測(cè)語(yǔ)句的查詢意圖和通過(guò)檢索意圖識(shí)別模型的序列化分類(lèi)輸出層對(duì)實(shí)數(shù)向量進(jìn)行概率計(jì)算,獲取與查詢意圖對(duì)應(yīng)的參數(shù)信息。由此,通過(guò)訓(xùn)練生成高適用性和高自動(dòng)化的檢索意圖識(shí)別模型,能夠準(zhǔn)確獲取用戶口語(yǔ)查詢的查詢意圖以及對(duì)應(yīng)的參數(shù)信息,提高了口語(yǔ)查詢識(shí)別的效率和準(zhǔn)確度。
圖6是根據(jù)本發(fā)明再一個(gè)實(shí)施例的基于人工智能的口語(yǔ)查詢識(shí)別方法的流程圖。
參見(jiàn)圖6,基于上述實(shí)施例,為了進(jìn)一步提高口語(yǔ)查詢識(shí)別的效率和準(zhǔn)確度,需要檢測(cè)查詢領(lǐng)域的置信度和查詢意圖和參數(shù)信息的置信度,并在置信度低于一定閾值時(shí),重新訓(xùn)練檢索領(lǐng)域識(shí)別模型和檢索意圖識(shí)別模型,詳細(xì)過(guò)程描述如下:
步驟601,將檢索領(lǐng)域識(shí)別模型標(biāo)注的查詢領(lǐng)域的置信度低于預(yù)設(shè)閾值的口語(yǔ)檢索語(yǔ)句重新由人工標(biāo)注,并作為口語(yǔ)檢索語(yǔ)料重新訓(xùn)練。
步驟602,將檢索意圖識(shí)別模型標(biāo)注的查詢意圖和參數(shù)信息的置信度低于預(yù)設(shè)閾值的口語(yǔ)檢索語(yǔ)句重新由人工標(biāo)注,并作為口語(yǔ)檢索語(yǔ)料重新訓(xùn)練。
具體地,檢索領(lǐng)域識(shí)別模型標(biāo)注的查詢領(lǐng)域的置信度表示其準(zhǔn)確性的程度,為了提高口語(yǔ)查詢識(shí)別的效率和準(zhǔn)確度,通過(guò)設(shè)置預(yù)設(shè)閾值保證檢索領(lǐng)域識(shí)別模型標(biāo)注的查詢領(lǐng)域具有一定的準(zhǔn)確度,同理,通過(guò)設(shè)置預(yù)設(shè)閾值保證檢索意圖識(shí)別模型標(biāo)注的查詢意圖和參數(shù)信息具有一定的準(zhǔn)確度。
進(jìn)一步地,在檢索領(lǐng)域識(shí)別模型標(biāo)注的查詢領(lǐng)域的置信度低于預(yù)設(shè)閾值時(shí),將其對(duì)應(yīng)的口語(yǔ)檢索語(yǔ)句重新由人工標(biāo)注,并作為口語(yǔ)檢索語(yǔ)料重新訓(xùn)練,得到新的檢索領(lǐng)域識(shí)別模型。
進(jìn)一步地,在檢索意圖識(shí)別模型標(biāo)注的查詢意圖和參數(shù)信息的置信度低于預(yù)設(shè)閾值時(shí),將其對(duì)應(yīng)的口語(yǔ)檢索語(yǔ)句重新由人工標(biāo)注,并作為口語(yǔ)檢索語(yǔ)料重新訓(xùn)練,得到新的檢索意圖識(shí)別模型。
需要是說(shuō)明的是,在檢索領(lǐng)域識(shí)別模型標(biāo)注的查詢領(lǐng)域的置信度不低于預(yù)設(shè)閾值時(shí),不進(jìn)行將其對(duì)應(yīng)的口語(yǔ)檢索語(yǔ)句重新由人工標(biāo)注,并作為口語(yǔ)檢索語(yǔ)料重新訓(xùn)練。
需要說(shuō)明的是,在檢索意圖識(shí)別模型標(biāo)注的查詢意圖和參數(shù)信息的置信度不低于預(yù)設(shè)閾值時(shí),不進(jìn)行將其對(duì)應(yīng)的口語(yǔ)檢索語(yǔ)句重新由人工標(biāo)注,并作為口語(yǔ)檢索語(yǔ)料重新訓(xùn)練。
綜上所述,本發(fā)明實(shí)施例的基于人工智能的口語(yǔ)查詢識(shí)別方法,還將檢索領(lǐng)域識(shí)別模型標(biāo)注的查詢領(lǐng)域的置信度低于預(yù)設(shè)閾值的口語(yǔ)檢索語(yǔ)句重新由人工標(biāo)注,并作為口語(yǔ)檢索語(yǔ)料重新訓(xùn)練,以及將檢索意圖識(shí)別模型標(biāo)注的查詢意圖和參數(shù)信息的置信度低于預(yù)設(shè)閾值的口語(yǔ)檢索語(yǔ)句重新由人工標(biāo)注,并作為口語(yǔ)檢索語(yǔ)料重新訓(xùn)練。由此,進(jìn)一步提高了口語(yǔ)查詢識(shí)別的效率和準(zhǔn)確度。
為了實(shí)現(xiàn)上述實(shí)施例,本發(fā)明還提出一種基于人工智能的口語(yǔ)查詢識(shí)別裝置。
圖7是根據(jù)本發(fā)明一個(gè)實(shí)施例的基于人工智能的口語(yǔ)查詢識(shí)別裝置的結(jié)構(gòu)示意圖。
如圖7所示,該基于人工智能的口語(yǔ)查詢識(shí)別裝置包括:第一生成模塊710、第二生成模塊720。
其中,第一生成模塊710用于根據(jù)口語(yǔ)檢索語(yǔ)料標(biāo)注的查詢領(lǐng)域?qū)矸e神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練生成檢索領(lǐng)域識(shí)別模型。
首先,根據(jù)口語(yǔ)檢索語(yǔ)料標(biāo)注的查詢領(lǐng)域?qū)矸e神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練生成檢索領(lǐng)域識(shí)別模型,生成的檢索領(lǐng)域識(shí)別模型能夠確定輸入的口語(yǔ)查詢屬于哪個(gè)領(lǐng)域。
第二生成模塊720用于根據(jù)口語(yǔ)檢索語(yǔ)料標(biāo)注的與查詢領(lǐng)域?qū)?yīng)的查詢意圖和參數(shù)信息,對(duì)循環(huán)神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練生成與查詢領(lǐng)域?qū)?yīng)的檢索意圖識(shí)別模型。
具體地,檢索意圖識(shí)別模型可以識(shí)別查詢領(lǐng)域下的查詢意圖和參數(shù)信息,檢索意圖識(shí)別模型在學(xué)習(xí)參數(shù)信息標(biāo)注的時(shí)候同時(shí)兼顧查詢意圖識(shí)別,兩種信息相互融合補(bǔ)充,以提高其識(shí)別的精度。
進(jìn)一步地,在獲取檢索意圖識(shí)別模型后,能夠識(shí)別口語(yǔ)查詢?cè)谠摬樵冾I(lǐng)域下的查詢意圖以及對(duì)應(yīng)參數(shù)信息。
需要說(shuō)明的是,前述對(duì)基于人工智能的口語(yǔ)查詢識(shí)別方法實(shí)施例的解釋說(shuō)明也適用于該實(shí)施例的基于人工智能的口語(yǔ)查詢識(shí)別裝置,其實(shí)現(xiàn)原理類(lèi)似,此處不再贅述。
綜上所述,本發(fā)明實(shí)施例的基于人工智能的口語(yǔ)查詢識(shí)別裝置,首先根據(jù)口語(yǔ)檢索語(yǔ)料標(biāo)注的查詢領(lǐng)域?qū)矸e神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練生成檢索領(lǐng)域識(shí)別模型,接著根據(jù)口語(yǔ)檢索語(yǔ)料標(biāo)注的與查詢領(lǐng)域?qū)?yīng)的查詢意圖和參數(shù)信息,對(duì)循環(huán)神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練生成與查詢領(lǐng)域?qū)?yīng)的檢索意圖識(shí)別模型。由此,通過(guò)訓(xùn)練生成高適用性和高自動(dòng)化的檢索領(lǐng)域識(shí)別模型和檢索意圖識(shí)別模型,能夠準(zhǔn)確獲取用戶口語(yǔ)查詢的意圖及其對(duì)應(yīng)的參數(shù)信息,提高了口語(yǔ)查詢識(shí)別的效率和準(zhǔn)確度。
圖8是根據(jù)本發(fā)明另一個(gè)實(shí)施例的基于人工智能的口語(yǔ)查詢識(shí)別裝置的結(jié)構(gòu)示意圖。
如圖8所示,在如圖7所示的基礎(chǔ)上,該裝置還包括:處理模塊730、第一獲取模塊740和第二獲取模塊750。
其中,處理模塊730用于對(duì)用戶輸入的口語(yǔ)檢索語(yǔ)句進(jìn)行分詞處理并進(jìn)行詞性標(biāo)注,并將分詞結(jié)果以向量形式依序輸入檢索領(lǐng)域識(shí)別模型的輸入層。
具體地,在訓(xùn)練好檢索領(lǐng)域識(shí)別模型和檢索意圖識(shí)別模型后,在獲取用戶輸入的口語(yǔ)檢索語(yǔ)句時(shí),首先對(duì)口語(yǔ)檢索語(yǔ)句進(jìn)行分詞處理并進(jìn)行詞性標(biāo)注,其中,詞性標(biāo)注表示確定每個(gè)詞是名詞、動(dòng)詞、形容詞或其他詞性的過(guò)程。進(jìn)而,并將分詞結(jié)果以向量形式依序輸入檢索領(lǐng)域識(shí)別模型的輸入層。
第一獲取模塊740用于通過(guò)檢索領(lǐng)域識(shí)別模型的隱層將當(dāng)前輸入的詞語(yǔ)與歷史輸入的詞語(yǔ)融合,根據(jù)所有詞語(yǔ)的融合結(jié)果獲取口語(yǔ)檢索語(yǔ)句的實(shí)數(shù)向量。
第二獲取模塊750用于通過(guò)檢索領(lǐng)域識(shí)別模型的輸出層對(duì)實(shí)數(shù)向量進(jìn)行概率分析,獲取口語(yǔ)檢測(cè)語(yǔ)句的查詢領(lǐng)域。
具體地,檢索領(lǐng)域識(shí)別模型具有輸入輸出對(duì)之間的映射能力,通過(guò)其隱層將當(dāng)前輸入的詞語(yǔ)與歷史輸入的詞語(yǔ)融合,根據(jù)所有詞語(yǔ)的融合結(jié)果獲取口語(yǔ)檢索語(yǔ)句的實(shí)數(shù)向量,可以通過(guò)檢索領(lǐng)域識(shí)別模型的輸出層對(duì)實(shí)數(shù)向量進(jìn)行概率分析,即使用softmax進(jìn)行分類(lèi),確定實(shí)數(shù)向量對(duì)應(yīng)的查詢領(lǐng)域類(lèi)別,最后獲取口語(yǔ)檢測(cè)語(yǔ)句的查詢領(lǐng)域。
需要說(shuō)明的是,該檢索領(lǐng)域識(shí)別模型輸入層,隱層和輸出層即Softmax分類(lèi)層,其中,Softmax函數(shù)是用于對(duì)結(jié)果進(jìn)行分類(lèi)的函數(shù)。
需要說(shuō)明的是,前述對(duì)基于人工智能的口語(yǔ)查詢識(shí)別方法實(shí)施例的解釋說(shuō)明也適用于該實(shí)施例的基于人工智能的口語(yǔ)查詢識(shí)別裝置,其實(shí)現(xiàn)原理類(lèi)似,此處不再贅述。
綜上所述,本發(fā)明實(shí)施例的基于人工智能的口語(yǔ)查詢識(shí)別裝置,首先用戶輸入的口語(yǔ)檢索語(yǔ)句進(jìn)行分詞處理并進(jìn)行詞性標(biāo)注,并將分詞結(jié)果以向量形式依序輸入檢索領(lǐng)域識(shí)別模型的輸入層,接著通過(guò)檢索領(lǐng)域識(shí)別模型的隱層將當(dāng)前輸入的詞語(yǔ)與歷史輸入的詞語(yǔ)融合,根據(jù)所有詞語(yǔ)的融合結(jié)果獲取口語(yǔ)檢索語(yǔ)句的實(shí)數(shù)向量,最后通過(guò)檢索領(lǐng)域識(shí)別模型的輸出層對(duì)實(shí)數(shù)向量進(jìn)行概率分析,獲取口語(yǔ)檢測(cè)語(yǔ)句的查詢領(lǐng)域。由此,通過(guò)訓(xùn)練生成高適用性和高自動(dòng)化的檢索領(lǐng)域識(shí)別模型,能夠準(zhǔn)確獲取用戶口語(yǔ)查詢的查詢領(lǐng)域,提高了口語(yǔ)查詢識(shí)別的效率和準(zhǔn)確度。
圖9是根據(jù)本發(fā)明再一個(gè)實(shí)施例的基于人工智能的口語(yǔ)查詢識(shí)別裝置的結(jié)構(gòu)示意圖。
如圖9所示,在如圖7-8所示的基礎(chǔ)上,該裝置還包括:輸入模塊760、第三獲取模塊770、第四獲取模塊780和第五獲取模塊790。
其中,輸入模塊760用于將分詞結(jié)果以向量形式依序輸入與查詢領(lǐng)域?qū)?yīng)的檢索意圖識(shí)別模型。
具體地,在獲取查詢領(lǐng)域后,以及上述過(guò)程中得到的分詞結(jié)果以向量形式依序輸入檢索領(lǐng)域識(shí)別模型的輸入層。
第三獲取模塊770用于通過(guò)檢索意圖識(shí)別模型的隱層將當(dāng)前輸入的詞語(yǔ)與歷史輸入的詞語(yǔ)融合,根據(jù)所有詞語(yǔ)的融合結(jié)果獲取口語(yǔ)檢索語(yǔ)句的實(shí)數(shù)向量。
第四獲取模塊780用于通過(guò)檢索意圖識(shí)別模型的意圖分類(lèi)輸出層對(duì)實(shí)數(shù)向量進(jìn)行概率計(jì)算,獲取口語(yǔ)檢測(cè)語(yǔ)句的查詢意圖。
具體地,檢索意圖識(shí)別模型具有輸入輸出對(duì)之間的映射能力,通過(guò)其隱層將當(dāng)前輸入的詞語(yǔ)與歷史輸入的詞語(yǔ)融合,根據(jù)所有詞語(yǔ)的融合結(jié)果獲取口語(yǔ)檢索語(yǔ)句的實(shí)數(shù)向量,可以通過(guò)檢索意圖識(shí)別模型的輸出層對(duì)實(shí)數(shù)向量進(jìn)行概率分析,即使用softmax進(jìn)行分類(lèi),確定實(shí)數(shù)向量對(duì)應(yīng)的查詢意圖類(lèi)別,最后獲取口語(yǔ)檢測(cè)語(yǔ)句的查詢意圖。
第五獲取模塊790用于通過(guò)檢索意圖識(shí)別模型的序列化分類(lèi)輸出層對(duì)實(shí)數(shù)向量進(jìn)行概率計(jì)算,獲取與查詢意圖對(duì)應(yīng)的參數(shù)信息。
需要說(shuō)明的是,前述對(duì)基于人工智能的口語(yǔ)查詢識(shí)別方法實(shí)施例的解釋說(shuō)明也適用于該實(shí)施例的基于人工智能的口語(yǔ)查詢識(shí)別裝置,其實(shí)現(xiàn)原理類(lèi)似,此處不再贅述。
綜上所述,本發(fā)明實(shí)施例的基于人工智能的口語(yǔ)查詢識(shí)別裝置,首先將分詞結(jié)果以向量形式依序輸入與查詢領(lǐng)域?qū)?yīng)的檢索意圖識(shí)別模型,接著通過(guò)檢索意圖識(shí)別模型的隱層將當(dāng)前輸入的詞語(yǔ)與歷史輸入的詞語(yǔ)融合,根據(jù)所有詞語(yǔ)的融合結(jié)果獲取口語(yǔ)檢索語(yǔ)句的實(shí)數(shù)向量,最后通過(guò)檢索意圖識(shí)別模型的意圖分類(lèi)輸出層對(duì)實(shí)數(shù)向量進(jìn)行概率計(jì)算,獲取口語(yǔ)檢測(cè)語(yǔ)句的查詢意圖和通過(guò)檢索意圖識(shí)別模型的序列化分類(lèi)輸出層對(duì)實(shí)數(shù)向量進(jìn)行概率計(jì)算,獲取與查詢意圖對(duì)應(yīng)的參數(shù)信息。由此,通過(guò)訓(xùn)練生成高適用性和高自動(dòng)化的檢索意圖識(shí)別模型,能夠準(zhǔn)確獲取用戶口語(yǔ)查詢的查詢意圖以及對(duì)應(yīng)的參數(shù)信息,提高了口語(yǔ)查詢識(shí)別的效率和準(zhǔn)確度。
圖10是根據(jù)本發(fā)明又一個(gè)實(shí)施例的基于人工智能的口語(yǔ)查詢識(shí)別裝置的結(jié)構(gòu)示意圖。
如圖10所示,在如圖7-9所示的基礎(chǔ)上,該裝置還包括:第一訓(xùn)練模塊7100和第二訓(xùn)練模塊7110。
其中,第一訓(xùn)練模塊7100用于將檢索領(lǐng)域識(shí)別模型標(biāo)注的查詢領(lǐng)域的置信度低于預(yù)設(shè)閾值的口語(yǔ)檢索語(yǔ)句重新由人工標(biāo)注,并作為口語(yǔ)檢索語(yǔ)料重新訓(xùn)練。
第二訓(xùn)練模塊7110將檢索意圖識(shí)別模型標(biāo)注的查詢意圖和參數(shù)信息的置信度低于預(yù)設(shè)閾值的口語(yǔ)檢索語(yǔ)句重新由人工標(biāo)注,并作為口語(yǔ)檢索語(yǔ)料重新訓(xùn)練。
具體地,檢索領(lǐng)域識(shí)別模型標(biāo)注的查詢領(lǐng)域的置信度表示其準(zhǔn)確性的程度,為了提高口語(yǔ)查詢識(shí)別的效率和準(zhǔn)確度,通過(guò)設(shè)置預(yù)設(shè)閾值保證檢索領(lǐng)域識(shí)別模型標(biāo)注的查詢領(lǐng)域具有一定的準(zhǔn)確度,同理,通過(guò)設(shè)置預(yù)設(shè)閾值保證檢索意圖識(shí)別模型標(biāo)注的查詢意圖和參數(shù)信息具有一定的準(zhǔn)確度。
進(jìn)一步地,在檢索領(lǐng)域識(shí)別模型標(biāo)注的查詢領(lǐng)域的置信度低于預(yù)設(shè)閾值時(shí),將其對(duì)應(yīng)的口語(yǔ)檢索語(yǔ)句重新由人工標(biāo)注,并作為口語(yǔ)檢索語(yǔ)料重新訓(xùn)練,得到新的檢索領(lǐng)域識(shí)別模型。
進(jìn)一步地,在檢索意圖識(shí)別模型標(biāo)注的查詢意圖和參數(shù)信息的置信度低于預(yù)設(shè)閾值時(shí),將其對(duì)應(yīng)的口語(yǔ)檢索語(yǔ)句重新由人工標(biāo)注,并作為口語(yǔ)檢索語(yǔ)料重新訓(xùn)練,得到新的檢索意圖識(shí)別模型。
需要說(shuō)明的是,前述對(duì)基于人工智能的口語(yǔ)查詢識(shí)別方法實(shí)施例的解釋說(shuō)明也適用于該實(shí)施例的基于人工智能的口語(yǔ)查詢識(shí)別裝置,其實(shí)現(xiàn)原理類(lèi)似,此處不再贅述。
綜上所述,本發(fā)明實(shí)施例的基于人工智能的口語(yǔ)查詢識(shí)別裝置,還將檢索領(lǐng)域識(shí)別模型標(biāo)注的查詢領(lǐng)域的置信度低于預(yù)設(shè)閾值的口語(yǔ)檢索語(yǔ)句重新由人工標(biāo)注,并作為口語(yǔ)檢索語(yǔ)料重新訓(xùn)練,以及將檢索意圖識(shí)別模型標(biāo)注的查詢意圖和參數(shù)信息的置信度低于預(yù)設(shè)閾值的口語(yǔ)檢索語(yǔ)句重新由人工標(biāo)注,并作為口語(yǔ)檢索語(yǔ)料重新訓(xùn)練。由此,進(jìn)一步提高了口語(yǔ)查詢識(shí)別的效率和準(zhǔn)確度。
在本發(fā)明的描述中,需要理解的是,術(shù)語(yǔ)“第一”、“第二”僅用于描述目的,而不能理解為指示或暗示相對(duì)重要性或者隱含指明所指示的技術(shù)特征的數(shù)量。由此,限定有“第一”、“第二”的特征可以明示或者隱含地包括至少一個(gè)該特征。在本發(fā)明的描述中,“多個(gè)”的含義是至少兩個(gè),例如兩個(gè),三個(gè)等,除非另有明確具體的限定。
在本說(shuō)明書(shū)的描述中,參考術(shù)語(yǔ)“一個(gè)實(shí)施例”、“一些實(shí)施例”、“示例”、“具體示例”、或“一些示例”等的描述意指結(jié)合該實(shí)施例或示例描述的具體特征、結(jié)構(gòu)、材料或者特點(diǎn)包含于本發(fā)明的至少一個(gè)實(shí)施例或示例中。在本說(shuō)明書(shū)中,對(duì)上述術(shù)語(yǔ)的示意性表述不必須針對(duì)的是相同的實(shí)施例或示例。而且,描述的具體特征、結(jié)構(gòu)、材料或者特點(diǎn)可以在任一個(gè)或多個(gè)實(shí)施例或示例中以合適的方式結(jié)合。此外,在不相互矛盾的情況下,本領(lǐng)域的技術(shù)人員可以將本說(shuō)明書(shū)中描述的不同實(shí)施例或示例以及不同實(shí)施例或示例的特征進(jìn)行結(jié)合和組合。
盡管上面已經(jīng)示出和描述了本發(fā)明的實(shí)施例,可以理解的是,上述實(shí)施例是示例性的,不能理解為對(duì)本發(fā)明的限制,本領(lǐng)域的普通技術(shù)人員在本發(fā)明的范圍內(nèi)可以對(duì)上述實(shí)施例進(jìn)行變化、修改、替換和變型。