一種語音識(shí)別方法以及電子設(shè)備的制作方法
【專利摘要】本發(fā)明提供一種語音識(shí)別方法以及電子設(shè)備。該方法應(yīng)用于一電子設(shè)備中,所述電子設(shè)備具有語音識(shí)別服務(wù),所述方法包括:獲得第一語音信息;通過第一識(shí)別模型識(shí)別所述第一語音信息,獲得第一識(shí)別結(jié)果;判斷所述第一識(shí)別結(jié)果是否符合第一預(yù)設(shè)條件;在所述第一識(shí)別結(jié)果符合所述第一預(yù)設(shè)條件時(shí),通過與所述第一識(shí)別模型不同的第二識(shí)別模型識(shí)別所述第一語音信息,獲得第二識(shí)別結(jié)果;基于所述第二識(shí)別結(jié)果,控制所述電子設(shè)備執(zhí)行相應(yīng)的控制指令。
【專利說明】一種語音識(shí)別方法以及電子設(shè)備
【技術(shù)領(lǐng)域】
[0001 ] 本發(fā)明涉及電子【技術(shù)領(lǐng)域】,尤其涉及一種語音識(shí)別方法以及電子設(shè)備。
【背景技術(shù)】
[0002]隨著電子技術(shù)的發(fā)展,為了人機(jī)交互的方便,越來越多的電子設(shè)備上集成了語音識(shí)別服務(wù),所以用戶可以方便的通過語音對電子設(shè)備進(jìn)行控制,而不用依賴于物理控制裝置,例如鼠標(biāo)、鍵盤。
[0003]在現(xiàn)有技術(shù)中,利用語音識(shí)別服務(wù)的工作過程一般是:聲音錄入裝置,例如麥克風(fēng)實(shí)時(shí)錄入聲音信息,然后將實(shí)時(shí)錄入的聲音信息同時(shí)也實(shí)時(shí)的傳輸給語音識(shí)別模塊,然后語音識(shí)別模塊對聲音信息進(jìn)行一系列的處理,例如先進(jìn)行預(yù)處理,預(yù)處理包括濾波、采樣和量化、加窗等;然后對預(yù)處理過的語音信號進(jìn)行特征參數(shù)提取,獲得特征矢量,然后將獲取到的特征矢量與模板庫中的每個(gè)模板進(jìn)行相似度比較,將相似度最高者作為識(shí)別結(jié)果輸出。而模板庫中的模板是事先進(jìn)行訓(xùn)練,即將詞匯表中的每一個(gè)詞說一遍,然后將其特征質(zhì)量作為模板存入模板庫中。再接下來就是根據(jù)識(shí)別結(jié)果與操作命令的對應(yīng)關(guān)系,獲取到對應(yīng)的操作命令,然后根據(jù)該操作命令進(jìn)行相應(yīng)的操作。
[0004]然而,本發(fā)明人在實(shí)現(xiàn)本發(fā)明的過程中發(fā)現(xiàn),現(xiàn)有技術(shù)中的方案不管是錄入怎樣的聲音信息,都要進(jìn)行前述的識(shí)別流程,直到識(shí)別出結(jié)果,并且對應(yīng)有操作命令或沒有對應(yīng)到操作命令為止,然而在實(shí)際運(yùn)用中,有時(shí)候通過麥克風(fēng)錄入的聲音信息可能都不是用戶的聲音,甚至都不是人的聲音,如果還按照上述識(shí)別流程處理一遍,那么真正有效的語音命令占總識(shí)別量的比例就比較低,也即語音識(shí)別率比較低,同時(shí)也影響識(shí)別效率降低。
【發(fā)明內(nèi)容】
[0005]本發(fā)明提供一種語音識(shí)別方法以及電子設(shè)備,用以解決現(xiàn)有技術(shù)中存在的對所有聲音信息都進(jìn)行完整的識(shí)別流程導(dǎo)致語音識(shí)別率較低、識(shí)別效率較低的技術(shù)問題。
[0006]本發(fā)明一方面提供了一種語音識(shí)別方法,應(yīng)用于一電子設(shè)備中,所述電子設(shè)備具有語音識(shí)別服務(wù),所述方法包括:獲得第一語音信息;通過第一識(shí)別模型識(shí)別所述第一語音信息,獲得第一識(shí)別結(jié)果;判斷所述第一識(shí)別結(jié)果是否符合第一預(yù)設(shè)條件;在所述第一識(shí)別結(jié)果符合所述第一預(yù)設(shè)條件時(shí),通過與所述第一識(shí)別模型不同的第二識(shí)別模型識(shí)別所述第一語音信息,獲得第二識(shí)別結(jié)果;基于所述第二識(shí)別結(jié)果,控制所述電子設(shè)備執(zhí)行相應(yīng)的控制指令。
[0007]可選的,在所述第一識(shí)別結(jié)果不符合所述第一預(yù)設(shè)條件時(shí),所述方法還包括:丟棄
所述第一語音信息。
[0008]可選的,在所述通過第一識(shí)別模型識(shí)別所述第一語音信息之前,所述方法還包括:判斷所述第一語音信息是否滿足第二預(yù)設(shè)條件;當(dāng)所述第一語音信息不滿足所述第二預(yù)設(shè)條件時(shí),丟棄所述第一語音信息;當(dāng)所述第一語音信息滿足所述第二預(yù)設(shè)條件時(shí),執(zhí)行步驟:通過第一識(shí)別模型識(shí)別所述第一語音信息。[0009]可選的,所述通過第一識(shí)別模型識(shí)別所述第一語音信息,獲得第一識(shí)別結(jié)果,具體為:識(shí)別所述第一語音信息對應(yīng)的用戶是否為預(yù)定用戶,獲得第一識(shí)別結(jié)果;其中,當(dāng)所述第一語音信息對應(yīng)的用戶不是所述預(yù)定用戶時(shí),表示所述第一語音信息不滿足所述第一預(yù)設(shè)條件,當(dāng)所述第一語音信息對應(yīng)的用戶為所述預(yù)定用戶時(shí),表示所述第一語音信息滿足所述第一預(yù)設(shè)條件。
[0010]可選的,所述獲得第一語音信息,具體包括:對所述第一語音信息進(jìn)行端點(diǎn)檢測,獲得檢測后的所述第一語音信息。
[0011]可選的,在所述第一識(shí)別結(jié)果符合所述第一預(yù)設(shè)條件時(shí),所述通過與所述第一識(shí)別模型不同的第二識(shí)別模型識(shí)別所述第一語音信息,獲得第二識(shí)別結(jié)果,具體為:通過第二識(shí)別模型識(shí)別所述第一語音信息,獲得第三識(shí)別結(jié)果;基于所述第一識(shí)別結(jié)果和所述第三識(shí)別結(jié)果,獲得所述第二識(shí)別結(jié)果。
[0012]可選的,所述語音識(shí)別服務(wù)處于關(guān)閉狀態(tài),當(dāng)所述第二識(shí)別結(jié)果對應(yīng)的控制指令為喚醒指令時(shí),所述基于所述第二識(shí)別結(jié)果,控制所述電子設(shè)備執(zhí)行相應(yīng)的控制指令具體為:執(zhí)行所述喚醒指令,喚醒所述語音識(shí)別服務(wù)。
[0013]本發(fā)明另一方面提供一種電子設(shè)備,所述電子設(shè)備具有語音識(shí)別服務(wù),所述電子設(shè)備包括:電路板;聲音獲取單元,連接于所述電路板,用于獲得第一語音信息;處理芯片,設(shè)置在所述電路板上,用于通過第一識(shí)別模型識(shí)別所述第一語音信息,獲得第一識(shí)別結(jié)果;判斷所述第一識(shí)別結(jié)果是否符合第一預(yù)設(shè)條件;在所述第一識(shí)別結(jié)果符合所述第一預(yù)設(shè)條件時(shí),通過與所述第一識(shí)別模型不同的第二識(shí)別模型識(shí)別所述第一語音信息,獲得第二識(shí)別結(jié)果;控制芯片,設(shè)置在所述電路板上,用于基于所述第二識(shí)別結(jié)果,控制所述電子設(shè)備執(zhí)行相應(yīng)的控制指令。
[0014]可選的,所述處理芯片具體還用于在所述第一識(shí)別結(jié)果不符合所述第一預(yù)設(shè)條件時(shí),丟棄所述第一語音信息。
[0015]可選的,所述處理芯片包括第一子處理芯片和第二子處理芯片,所述第一子處理芯片具體用于判斷所述第一語音信息是否滿足第二預(yù)設(shè)條件;當(dāng)所述第一語音信息不滿足所述第二預(yù)設(shè)條件時(shí),丟棄所述第一語音信息;當(dāng)所述第一語音信息滿足所述第二預(yù)設(shè)條件時(shí),所述第二子處理芯片具體用于通過第一識(shí)別模型識(shí)別所述第一語音信息。
[0016]可選的,所述處理芯片具體還包括第三子處理芯片,具體用于識(shí)別所述第一語音信息對應(yīng)的用戶是否為預(yù)定用戶,獲得第一識(shí)別結(jié)果;其中,當(dāng)所述第一語音信息對應(yīng)的用戶不是所述預(yù)定用戶時(shí),表示所述第一語音信息不滿足所述第一預(yù)設(shè)條件,當(dāng)所述第一語音信息對應(yīng)的用戶為所述預(yù)定用戶時(shí),表示所述第一語音信息滿足所述第一預(yù)設(shè)條件。
[0017]可選的,所述聲音獲取單元還包括檢測芯片,用于對所述第一語音信息進(jìn)行端點(diǎn)檢測,獲得檢測后的所述第一語音信息。
[0018]可選的,所述處理芯片還包括第四子處理芯片,用于在所述第一識(shí)別結(jié)果符合所述第一預(yù)設(shè)條件時(shí),通過第二識(shí)別模型識(shí)別所述第一語音信息,獲得第三識(shí)別結(jié)果;基于所述第一識(shí)別結(jié)果和所述第三識(shí)別結(jié)果,獲得所述第二識(shí)別結(jié)果。
[0019]可選的,所述語音識(shí)別服務(wù)處于關(guān)閉狀態(tài),當(dāng)所述第二識(shí)別結(jié)果對應(yīng)的控制指令為喚醒指令時(shí),所述控制芯片具體用于執(zhí)行所述喚醒指令,喚醒所述語音識(shí)別服務(wù)。
[0020]本發(fā)明實(shí)施例中提供的一個(gè)或多個(gè)技術(shù)方案,至少具有如下技術(shù)效果或優(yōu)點(diǎn):[0021]在本發(fā)明一實(shí)施例中,對于語音信息先通過第一識(shí)別模型進(jìn)行第一步識(shí)別,然后根據(jù)第一步識(shí)別的結(jié)果判斷該結(jié)果是否符合第一預(yù)設(shè)條件,即判斷是否還要繼續(xù)識(shí)別下去,只有在滿足該預(yù)設(shè)條件時(shí),才通過第二識(shí)別模型進(jìn)行下一步的識(shí)別,進(jìn)而獲得識(shí)別結(jié)果,根據(jù)識(shí)別結(jié)果,執(zhí)行相應(yīng)的控制指令。如此一來,因?yàn)橄韧ㄟ^第一步的篩選,只有符合條件的才能被繼續(xù)識(shí)別,所以使得最后獲得的識(shí)別結(jié)果為有效識(shí)別結(jié)果的比例變高,也即提高了識(shí)別率,而那些被第一步攔截掉的語音信息,就不用進(jìn)行繼續(xù)識(shí)別的工作,所以提高了識(shí)別的效率。
[0022]進(jìn)一步,本發(fā)明一實(shí)施例中將不符合預(yù)設(shè)條件的語音信息直接丟棄,而不用對其做后續(xù)的處理,所以大大降低了不需要的計(jì)算量,而第二識(shí)別模型不用計(jì)算,也節(jié)約了電量。
[0023]再進(jìn)一步,本發(fā)明一實(shí)施例中還在利用第一識(shí)別模型進(jìn)行識(shí)別之前,再設(shè)置一個(gè)判斷條件,直接判斷語音信息本身是否符合第二預(yù)設(shè)條件,當(dāng)不符合第二預(yù)設(shè)條件時(shí),就直接丟棄第一語音信息,而不用經(jīng)過第一識(shí)別模型進(jìn)行識(shí)別,所以進(jìn)一步節(jié)約了電量和降低
了計(jì)算量。
[0024]更進(jìn)一步,本發(fā)明一實(shí)施例中通過第一識(shí)別模型和第二識(shí)別模型最后獲得第二識(shí)別結(jié)果,只是為確定第二識(shí)別結(jié)果對應(yīng)的控制指令是否為喚醒指令,當(dāng)是喚醒指令時(shí),才去喚醒語音識(shí)別服務(wù),讓語音識(shí)別服務(wù)進(jìn)行后續(xù)語音命令進(jìn)行識(shí)別,而如果不是喚醒指令的話,就繼續(xù)監(jiān)聽,直到監(jiān)聽到喚醒指令,所以這時(shí)真正的語音識(shí)別服務(wù)一直處于未工作的狀態(tài),所以大大的節(jié)約了電量和計(jì)算量。
【專利附圖】
【附圖說明】
[0025]圖1為本發(fā)明一實(shí)施例中的語音識(shí)別方法的流程圖;
[0026]圖2為本發(fā)明一實(shí)施例中的電子設(shè)備的架構(gòu)圖。
【具體實(shí)施方式】
[0027]本發(fā)明實(shí)施例提供一種語音識(shí)別方法以及電子設(shè)備,解決現(xiàn)有技術(shù)中存在的對所有聲音信息都進(jìn)行完整的識(shí)別流程導(dǎo)致語音識(shí)別率較低、識(shí)別效率較低的技術(shù)問題。
[0028]本發(fā)明實(shí)施例中的技術(shù)方案為解決上述的技術(shù)問題,總體思路如下:
[0029]對于語音信息先通過第一識(shí)別模型進(jìn)行第一步識(shí)別,然后根據(jù)第一步識(shí)別的結(jié)果判斷該結(jié)果是否符合第一預(yù)設(shè)條件,即判斷是否還要繼續(xù)識(shí)別下去,只有在滿足該預(yù)設(shè)條件時(shí),才通過第二識(shí)別模型進(jìn)行下一步的識(shí)別,進(jìn)而獲得識(shí)別結(jié)果,根據(jù)識(shí)別結(jié)果,執(zhí)行相應(yīng)的控制指令。如此一來,因?yàn)橄韧ㄟ^第一步的篩選,只有符合條件的才能被繼續(xù)識(shí)別,所以使得最后獲得的識(shí)別結(jié)果為有效識(shí)別結(jié)果的比例變高,也即提高了識(shí)別率,而那些被第一步攔截掉的語音信息,就不用進(jìn)行繼續(xù)識(shí)別的工作,所以提高了識(shí)別的效率。
[0030]為了更好的理解上述技術(shù)方案,下面將結(jié)合說明書附圖以及具體的實(shí)施方式對上述技術(shù)方案進(jìn)行詳細(xì)的說明。
[0031]本發(fā)明一實(shí)施例提供一種語音識(shí)別方法,應(yīng)用于一電子設(shè)備中,該電子設(shè)備例如是手機(jī)、PDA (個(gè)人數(shù)字助理)、平板電腦或筆記本電腦。該電子設(shè)備具有語音識(shí)別服務(wù)。
[0032]接下來,請參考圖1,圖1為本實(shí)施例中的語音識(shí)別方法的流程圖,該方法包括:[0033]步驟101:獲得第一語音信息;
[0034]步驟102:通過第一識(shí)別模型識(shí)別所述第一語音信息,獲得第一識(shí)別結(jié)果;
[0035]步驟103:判斷所述第一識(shí)別結(jié)果是否符合第一預(yù)設(shè)條件;
[0036]步驟104:在所述第一識(shí)別結(jié)果符合所述第一預(yù)設(shè)條件時(shí),通過與所述第一識(shí)別模型不同的第二識(shí)別模型識(shí)別所述第一語音信息,獲得第二識(shí)別結(jié)果;
[0037]步驟105:基于所述第二識(shí)別結(jié)果,控制所述電子設(shè)備執(zhí)行相應(yīng)的控制指令。
[0038]以下將根據(jù)不同的應(yīng)用場景詳細(xì)說明本實(shí)施例中語音識(shí)別方法的實(shí)施過程。
[0039]在第一實(shí)施例中,假設(shè)語音識(shí)別服務(wù)已經(jīng)開啟。在步驟101中,例如可以是通過麥克風(fēng)實(shí)時(shí)的錄入語音信息,獲得第一語音信息,在具體實(shí)施過程中,還可以對第一語音信息進(jìn)行端點(diǎn)檢測,例如基于短時(shí)能量和短時(shí)平均過零量率進(jìn)行端點(diǎn)檢測,以從獲取的聲音信號中準(zhǔn)確的確定語音的起始點(diǎn)和終止點(diǎn),區(qū)分語音信號和非語音信號,如此可以減少第一語音信息的采集量,節(jié)約后續(xù)步驟的工作量,排除無聲段或噪聲段的干擾,提高語音識(shí)別服務(wù)的性能。在以下各實(shí)施例中,第一語音信息既可以是進(jìn)行端點(diǎn)檢測后的語音信息,也可以是未經(jīng)端點(diǎn)檢測過的語音信息,后續(xù)步驟的實(shí)施均類似。
[0040]然后執(zhí)行步驟102,即將獲取的第一語音信息通過第一識(shí)別模型識(shí)別該第一語音信息,獲得第一識(shí)別結(jié)果,在具體實(shí)施過程中,第一識(shí)別模型可以有多種實(shí)施方式,以下分別舉例進(jìn)行說明。
[0041]第一種,第一識(shí)別模型例如是特定用戶的聲音識(shí)別模型,當(dāng)在步驟101獲取到第一語音信息時(shí),就通過第一識(shí)別模型識(shí)別該第一語音信息對應(yīng)的用戶是否為預(yù)定用戶,也即識(shí)別該第一語音信息是否是該預(yù)定用戶發(fā)出的,具體例如是通過聲紋對比,看聲紋的相似度是否超過一預(yù)設(shè)條件,在本實(shí)施例中,第一預(yù)設(shè)條件例如是相似度值大于等于98% ;假設(shè)第一語音信息識(shí)別的結(jié)果是相似度值為99%,那么就將99%與第一預(yù)設(shè)條件98%進(jìn)行對t匕,結(jié)果是大于,那么就表示第一語音信息是該預(yù)定用戶發(fā)出的;假設(shè)第一語音信息識(shí)別的結(jié)果是相似度值為97%,那么就將97%與第一預(yù)設(shè)條件98%進(jìn)行對比,結(jié)果是小于,那么就表示第一語音信息不是該預(yù)定用戶發(fā)出的。
[0042]第二種,第一識(shí)別模型為簡單識(shí)別模型,即只識(shí)別該第一語音信息的其中一個(gè)或兩個(gè)特征,然后獲得該一個(gè)特征與兩個(gè)特征的識(shí)別結(jié)果,在本實(shí)施例中,第一預(yù)設(shè)條件例如是對該一個(gè)或兩個(gè)特征的匹配度的分?jǐn)?shù)要達(dá)到一定閾值,當(dāng)?shù)谝蛔R(shí)別結(jié)果中的匹配度的分?jǐn)?shù)大于等于閾值時(shí),確定第一識(shí)別結(jié)果符合第一預(yù)設(shè)條件。因?yàn)橹蛔R(shí)別一兩個(gè)特征,所以計(jì)算量比較小。
[0043]第三種,第一識(shí)別模型為簡單識(shí)別模型,與第二種不同的是,本實(shí)施例中的簡單識(shí)別模型是識(shí)別全部聲音特征,但是采用的是模糊算法,即算法比較簡單,進(jìn)行模糊匹配,所以計(jì)算量相較于精確計(jì)算和精確匹配要小很多。然后在本實(shí)施例中,經(jīng)過這樣的簡單識(shí)別模型識(shí)別獲得第一識(shí)別結(jié)果,然后可以判斷該第一語音信息為語音命令的可能性是否超過一閾值,即第一預(yù)設(shè)條件,如果大于等于該閾值,則說明第一識(shí)別結(jié)果符合第一預(yù)設(shè)條件。
[0044]以上舉例說明了第一識(shí)別模型的三種情況,然而在實(shí)際運(yùn)用中,第一識(shí)別模型還可以是別的模型,只要計(jì)算量比現(xiàn)有技術(shù)中整個(gè)識(shí)別過程中只進(jìn)行一次識(shí)別的計(jì)算量小即可,本申請不作限制。
[0045]當(dāng)通過上述的第一識(shí)別模型經(jīng)過識(shí)別,并判斷第一識(shí)別結(jié)果符合第一預(yù)設(shè)條件時(shí),就執(zhí)行步驟104,即通過第二識(shí)別模型對第一語音信息進(jìn)行進(jìn)一步的識(shí)別,以下將對應(yīng)前述三種第一識(shí)別模型舉例說明第二識(shí)別模型。
[0046]第一種,當(dāng)確定第一語音信息為該預(yù)定用戶發(fā)出的,那么就表示該第一語音信息是授權(quán)用戶發(fā)出的,可以進(jìn)一步識(shí)別第一語音信息了,這時(shí),就啟用第二識(shí)別模型識(shí)別第一語音信息,具體流程例如先是提取特征參數(shù),獲得特征矢量,然后將獲取到的特征矢量與模板庫中的每個(gè)模板進(jìn)行相似度比較,將相似度最高者作為識(shí)別結(jié)果輸出,即與現(xiàn)有技術(shù)中的識(shí)別流程相同,經(jīng)過這樣識(shí)別之后,可以獲得第二識(shí)別結(jié)果。
[0047]第二種,第二識(shí)別模型為復(fù)雜識(shí)別模型,即識(shí)別經(jīng)第一識(shí)別模型識(shí)別過的其他特征,例如三個(gè)、五個(gè),甚至更多個(gè)特征,也可以將全部特征都再識(shí)別一遍,最后識(shí)別獲得一個(gè)識(shí)別結(jié)果,即第二識(shí)別結(jié)果。具體的,如果采用的是只分析剩余特征的話,那么可以將第一識(shí)別結(jié)果和利用第二識(shí)別模型獲得的識(shí)別結(jié)果綜合考慮,例如考慮每個(gè)特征的得分和權(quán)重,最后獲得第二識(shí)別結(jié)果。
[0048]第三種,第二識(shí)別模型為復(fù)雜識(shí)別模型,相應(yīng)的,與第二種的復(fù)雜識(shí)別模型不同的是,本實(shí)施例中的復(fù)雜識(shí)別模型是采用精確的算法進(jìn)行精確匹配,所以能獲得更精確的識(shí)別結(jié)果,即第二識(shí)別結(jié)果。當(dāng)然,也可以考慮第一識(shí)別結(jié)果,例如賦予兩次識(shí)別結(jié)果不同的權(quán)重,最后確定出與第一語音信息對應(yīng)的第二識(shí)別結(jié)果。
[0049]同樣,上述第二識(shí)別模型的三種方式也只是用于舉例,并非用于限制本發(fā)明,只要能夠經(jīng)過第二識(shí)別模型識(shí)別獲得可以根據(jù)識(shí)別結(jié)果確定語音命令的識(shí)別結(jié)果的模型即可。
[0050]當(dāng)通過上述方法或其他方法獲得第二識(shí)別結(jié)果后,就執(zhí)行步驟105,即基于第二識(shí)別結(jié)果,控制電子設(shè)備執(zhí)行相應(yīng)的控制指令。在具體實(shí)施過程中,例如是根據(jù)第二識(shí)別結(jié)果先確定對應(yīng)的語音命令,然后根據(jù)語音命令執(zhí)行相應(yīng)的控制指令。而第二識(shí)別結(jié)果對應(yīng)的語音命令例如是打電話的命令、編輯短信的命令,在實(shí)際運(yùn)用中,還可以是其他命令,本申請不作限制。
[0051]由上述描述可知,因?yàn)橄韧ㄟ^第一步的篩選,只有符合條件的才能被繼續(xù)識(shí)別,所以使得最后獲得的識(shí)別結(jié)果為有效識(shí)別結(jié)果的比例變高,也即提高了識(shí)別率,而那些被第一步攔截掉的語音信息,就不用進(jìn)行繼續(xù)識(shí)別的工作,所以提高了識(shí)別的效率。
[0052]在進(jìn)一步的實(shí)施例中,當(dāng)在步驟103中,判斷的結(jié)果是第一識(shí)別結(jié)果不符合第一預(yù)設(shè)條件時(shí),就直接丟棄第一語音信息,而不會(huì)進(jìn)行后續(xù)識(shí)別,所以大大降低了不需要的計(jì)算量,而第二識(shí)別模型不用計(jì)算,也節(jié)約了電量。
[0053]為了進(jìn)一步的節(jié)約電量和降低計(jì)算量,本實(shí)施例中還在執(zhí)行步驟102之前,直接判斷第一語音信息是否滿足第二預(yù)設(shè)條件,當(dāng)?shù)谝徽Z音信息不滿足第二預(yù)設(shè)條件時(shí),就丟棄第一語音信息;當(dāng)?shù)谝徽Z音信息滿足第二預(yù)設(shè)條件時(shí),才執(zhí)行步驟102。
[0054]具體來說,可以判斷第一語音信息是否是人聲,而不是噪聲,例如風(fēng)聲、建筑工地的金屬聲,或者動(dòng)物的聲音,例如狗叫聲、貓叫聲,如果第一語音信息是人的聲音時(shí),才執(zhí)行步驟102,如果不是,就可以直接丟棄第一語音信息,所以節(jié)約了第一識(shí)別模型和第二識(shí)別模型的計(jì)算量,同時(shí)也因?yàn)榈谝蛔R(shí)別模型和第二識(shí)別模型不用計(jì)算,所以減少了耗電量。
[0055]在另一實(shí)施例中,第二預(yù)設(shè)條件,也可以是如前述的第一語音信息對應(yīng)的用戶為預(yù)定用戶,如果判斷的結(jié)果表示第一語音信息對應(yīng)的用戶不是該預(yù)定用戶,那么說明該第一語音信息對應(yīng)的用戶對該電子設(shè)備沒有控制權(quán)限,所以就不用執(zhí)行步驟102及后續(xù)的各步驟,而是直接丟棄即可。
[0056]在第二實(shí)施例中,假設(shè)語音識(shí)別服務(wù)此時(shí)未被開啟,因?yàn)槿绻Z音識(shí)別服務(wù)一直處于啟動(dòng)狀態(tài),就會(huì)一直進(jìn)行語音識(shí)別流程,所以就會(huì)造成大耗電量和計(jì)算量,所以本實(shí)施例在電子設(shè)備的操作系統(tǒng)后臺(tái)駐留一個(gè)喚醒小程序,通過喚醒小程序識(shí)別用戶的指令是否是喚醒指令,如果是的話就啟動(dòng)語音識(shí)別服務(wù),以下將通過具體的例子來說明本實(shí)施例中的語音識(shí)別方法的實(shí)施過程。
[0057]喚醒小程序一直監(jiān)聽聲音錄入裝置錄入的聲音,即步驟101,獲得第一語音信息,然后執(zhí)行步驟102,在本實(shí)施例中,第一識(shí)別模型例如可以采用第一實(shí)施例中所描述的三種模型,當(dāng)然也可以是判斷該第一語音信息是否是人聲,如果是人聲,才進(jìn)行步驟104 ;當(dāng)步驟103的判斷結(jié)果符合第一預(yù)設(shè)條件,那么就利用第二識(shí)別模型進(jìn)行識(shí)別,獲得第二識(shí)別結(jié)果。然后比對第二識(shí)別結(jié)果是否是喚醒指令,在本實(shí)施例中可以設(shè)置喚醒小程序中只包括兩個(gè)語音命令,一個(gè)是開啟語音識(shí)別服務(wù),一個(gè)是關(guān)閉語音識(shí)別服務(wù),所以將第二識(shí)別結(jié)果進(jìn)行比對,就只要比對兩次即可,即可確定第二識(shí)別結(jié)果對應(yīng)的是否是喚醒指令,所以比對速度快,計(jì)算量小,可以節(jié)約電量。
[0058]當(dāng)?shù)诙R(shí)別結(jié)果對應(yīng)的是喚醒指令,那么步驟105具體為執(zhí)行喚醒指令,喚醒語音識(shí)別服務(wù),這樣語音識(shí)別服務(wù)啟動(dòng),用戶就可以通過語音與電子設(shè)備進(jìn)行交互。同樣,也可以通過這樣的方式將語音識(shí)別服務(wù)關(guān)閉,以節(jié)約電量,然后喚醒小程序繼續(xù)監(jiān)聽,直到監(jiān)聽到喚醒指令,才喚醒語音識(shí)別服務(wù)。
[0059]例如,當(dāng)前語音識(shí)別服務(wù)已經(jīng)處于關(guān)閉狀態(tài),用戶這時(shí)對電子設(shè)備說了一句“小秘書”,那么喚醒小程序就會(huì)監(jiān)聽到,可以先進(jìn)行前述第二預(yù)設(shè)條件的判斷,判斷發(fā)現(xiàn)是人的聲音,那么就可以接著執(zhí)行步驟102,即通過第一識(shí)別模型進(jìn)行識(shí)別,獲得一個(gè)識(shí)別結(jié)果,例如利用模糊識(shí)別了一下,發(fā)現(xiàn)可能是喚醒指令,所以就繼續(xù)利用第二識(shí)別模型進(jìn)行精確識(shí)另O,獲得第二識(shí)別結(jié)果,發(fā)現(xiàn)確實(shí)是喚醒指令,那么就執(zhí)行步驟105,即執(zhí)行喚醒指令,控制電子設(shè)備開啟語音識(shí)別服務(wù)。
[0060]而例如用戶還未說話,只是房間里的小貓叫了一聲,這時(shí)喚醒小程序監(jiān)聽到后,就判斷發(fā)現(xiàn)不是人聲,那么就直接丟棄該語音信息,然后繼續(xù)監(jiān)聽。
[0061]再例如,初步判斷通過了,即是人聲,那么就可以通過步驟101進(jìn)行判斷,例如發(fā)現(xiàn)該語音信息并不是該用戶發(fā)出的,所以這時(shí)依然會(huì)丟棄該語音信息,然后繼續(xù)監(jiān)聽。
[0062]再例如,在步驟104執(zhí)行完畢后,經(jīng)對比,第二識(shí)別結(jié)果并不是喚醒指令,那么這時(shí)喚醒小程序就繼續(xù)監(jiān)聽從聲音錄入裝置錄入的聲音信息,直到監(jiān)聽到“小秘書”,才會(huì)喚醒語音識(shí)別服務(wù)。
[0063]以上各實(shí)施例可以單獨(dú)實(shí)施,也可以結(jié)合實(shí)施,本領(lǐng)域技術(shù)人員可以根據(jù)實(shí)際情況進(jìn)行選擇。
[0064]第三實(shí)施例,在本實(shí)施例中,第一實(shí)施例中的第二識(shí)別模型即為第二實(shí)施例中的語音識(shí)別服務(wù),而第一實(shí)施例中的第一識(shí)別模型即為第二實(shí)施例中的喚醒小程序,所以在喚醒小程序判斷第一識(shí)別結(jié)果符合第一預(yù)設(shè)條件時(shí),例如判斷第一語音信息的用戶與即為該預(yù)定用戶,也即確實(shí)是該預(yù)定用戶發(fā)出的語音命令,所以就喚醒第二識(shí)別模型,使得第二識(shí)別模型能夠進(jìn)入工作狀態(tài),進(jìn)一步識(shí)別第一語音信息對應(yīng)的語音命令是什么,例如是打電話的命令。如果不是該預(yù)定用戶,那么就不喚醒第二識(shí)別模型,所以在本實(shí)施例中,在步驟103之后,步驟104之前,還包括步驟:在第一識(shí)別結(jié)果符合第一預(yù)設(shè)條件時(shí),喚醒第二識(shí)別豐吳型。
[0065]基于同一發(fā)明構(gòu)思,以下將介紹本發(fā)明實(shí)施例中實(shí)現(xiàn)上述語音識(shí)別方法的電子設(shè)備的具體架構(gòu),請參考圖2,電子設(shè)備包括:電路板201 ;聲音獲取單元202,連接于電路板201,用于獲得第一語音信息;處理芯片203,設(shè)置在電路板201上,用于通過第一識(shí)別模型識(shí)別第一語音信息,獲得第一識(shí)別結(jié)果;判斷第一識(shí)別結(jié)果是否符合第一預(yù)設(shè)條件;在第一識(shí)別結(jié)果符合所述第一預(yù)設(shè)條件時(shí),通過與第一識(shí)別模型不同的第二識(shí)別模型識(shí)別所述第一語音信息,獲得第二識(shí)別結(jié)果;控制芯片204,設(shè)置在電路板201上,用于基于第二識(shí)別結(jié)果,控制電子設(shè)備執(zhí)行相應(yīng)的控制指令。
[0066]進(jìn)一步,處理芯片203具體還用于在第一識(shí)別結(jié)果不符合第一預(yù)設(shè)條件時(shí),丟棄
第一語音信息。
[0067]在一實(shí)施例中,處理芯片203包括第一子處理芯片和第二子處理芯片,第一子處理芯片具體用于判斷第一語音信息是否滿足第二預(yù)設(shè)條件;當(dāng)?shù)谝徽Z音信息不滿足第二預(yù)設(shè)條件時(shí),丟棄第一語音信息;當(dāng)?shù)谝徽Z音信息滿足第二預(yù)設(shè)條件時(shí),第二子處理芯片具體用于通過第一識(shí)別模型識(shí)別第一語音信息。
[0068]進(jìn)一步,處理芯片203具體還包括第三子處理芯片,具體用于識(shí)別第一語音信息對應(yīng)的用戶是否為預(yù)定用戶,獲得第一識(shí)別結(jié)果;其中,當(dāng)?shù)谝徽Z音信息對應(yīng)的用戶不是預(yù)定用戶時(shí),表示第一語音信息不滿足第一預(yù)設(shè)條件,當(dāng)?shù)谝徽Z音信息對應(yīng)的用戶為預(yù)定用戶時(shí),表不第一語音信息滿足第一預(yù)設(shè)條件。
[0069]進(jìn)一步,處理芯片203還包括第四子處理芯片,用于在第一識(shí)別結(jié)果符合第一預(yù)設(shè)條件時(shí),通過第二識(shí)別模型識(shí)別第一語音信息,獲得第三識(shí)別結(jié)果;基于第一識(shí)別結(jié)果和第三識(shí)別結(jié)果,獲得第二識(shí)別結(jié)果。
[0070]在另一實(shí)施例中,聲音獲取單元201還包括檢測芯片,用于對第一語音信息進(jìn)行端點(diǎn)檢測,獲得檢測后的第一語音信息。其中,檢測芯片也可以設(shè)置在電路板201上。
[0071]在另一實(shí)施例中,語音識(shí)別服務(wù)處于關(guān)閉狀態(tài),當(dāng)?shù)诙R(shí)別結(jié)果對應(yīng)的控制指令為喚醒指令時(shí),控制芯片204具體用于執(zhí)行喚醒指令,喚醒語音識(shí)別服務(wù)。
[0072]其中,聲音獲取單元例如為麥克風(fēng),可以是一個(gè)麥克風(fēng),也可以是麥克風(fēng)陣列。
[0073]另外,處理芯片203和控制芯片204可以是兩個(gè)單獨(dú)的芯片,也可以集成在同一個(gè)芯片上。
[0074]而處理芯片203的第一子處理芯片、第二子處理芯片、第三子處理芯片和第四子處理芯片也可以是四個(gè)獨(dú)立的芯片,也可以集成在同一個(gè)芯片上。
[0075]前述實(shí)施例中的語音識(shí)別方法中的各種變化方式和具體實(shí)例同樣適用于本實(shí)施例的電子設(shè)備,通過前述對語音識(shí)別方法的詳細(xì)描述,本領(lǐng)域技術(shù)人員可以清楚的知道本實(shí)施例中電子設(shè)備的實(shí)施方法,所以為了說明書的簡潔,在此不再詳述。
[0076]本發(fā)明實(shí)施例中提供的一個(gè)或多個(gè)技術(shù)方案,至少具有如下技術(shù)效果或優(yōu)點(diǎn):
[0077]在本發(fā)明一實(shí)施例中,對于語音信息先通過第一識(shí)別模型進(jìn)行第一步識(shí)別,然后根據(jù)第一步識(shí)別的結(jié)果判斷該結(jié)果是否符合第一預(yù)設(shè)條件,即判斷是否還要繼續(xù)識(shí)別下去,只有在滿足該預(yù)設(shè)條件時(shí),才通過第二識(shí)別模型進(jìn)行下一步的識(shí)別,進(jìn)而獲得識(shí)別結(jié)果,根據(jù)識(shí)別結(jié)果,執(zhí)行相應(yīng)的控制指令。如此一來,因?yàn)橄韧ㄟ^第一步的篩選,只有符合條件的才能被繼續(xù)識(shí)別,所以使得最后獲得的識(shí)別結(jié)果為有效識(shí)別結(jié)果的比例變高,也即提高了識(shí)別率,而那些被第一步攔截掉的語音信息,就不用進(jìn)行繼續(xù)識(shí)別的工作,所以提高了識(shí)別的效率。
[0078]進(jìn)一步,本發(fā)明一實(shí)施例中將不符合預(yù)設(shè)條件的語音信息直接丟棄,而不用對其做后續(xù)的處理,所以大大降低了不需要的計(jì)算量,而第二識(shí)別模型不用計(jì)算,也節(jié)約了電量。
[0079]再進(jìn)一步,本發(fā)明一實(shí)施例中還在利用第一識(shí)別模型進(jìn)行識(shí)別之前,再設(shè)置一個(gè)判斷條件,直接判斷語音信息本身是否符合第二預(yù)設(shè)條件,當(dāng)不符合第二預(yù)設(shè)條件時(shí),就直接丟棄第一語音信息,而不用經(jīng)過第一識(shí)別模型進(jìn)行識(shí)別,所以進(jìn)一步節(jié)約了電量和降低
了計(jì)算量。
[0080]更進(jìn)一步,本發(fā)明一實(shí)施例中通過第一識(shí)別模型和第二識(shí)別模型最后獲得第二識(shí)別結(jié)果,只是為確定第二識(shí)別結(jié)果對應(yīng)的控制指令是否為喚醒指令,當(dāng)是喚醒指令時(shí),才去喚醒語音識(shí)別服務(wù),讓語音識(shí)別服務(wù)進(jìn)行后續(xù)語音命令進(jìn)行識(shí)別,而如果不是喚醒指令的話,就繼續(xù)監(jiān)聽,直到監(jiān)聽到喚醒指令,所以這時(shí)真正的語音識(shí)別服務(wù)一直處于未工作的狀態(tài),所以大大的節(jié)約了電量和計(jì)算量。
[0081]本領(lǐng)域內(nèi)的技術(shù)人員應(yīng)明白,本發(fā)明的實(shí)施例可提供為方法、系統(tǒng)、或計(jì)算機(jī)程序產(chǎn)品。因此,本發(fā)明可采用完全硬件實(shí)施例、完全軟件實(shí)施例、或結(jié)合軟件和硬件方面的實(shí)施例的形式。而且,本發(fā)明可采用在一個(gè)或多個(gè)其中包含有計(jì)算機(jī)可用程序代碼的計(jì)算機(jī)可用存儲(chǔ)介質(zhì)(包括但不限于磁盤存儲(chǔ)器和光學(xué)存儲(chǔ)器等)上實(shí)施的計(jì)算機(jī)程序產(chǎn)品的形式。
[0082]本發(fā)明是參照根據(jù)本發(fā)明實(shí)施例的方法、設(shè)備(系統(tǒng))、和計(jì)算機(jī)程序產(chǎn)品的流程圖和/或方框圖來描述的。應(yīng)理解可由計(jì)算機(jī)程序指令實(shí)現(xiàn)流程圖和/或方框圖中的每一流程和/或方框、以及流程圖和/或方框圖中的流程和/或方框的結(jié)合??商峁┻@些計(jì)算機(jī)程序指令到通用計(jì)算機(jī)、專用計(jì)算機(jī)、嵌入式處理機(jī)或其他可編程數(shù)據(jù)處理設(shè)備的處理器以產(chǎn)生一個(gè)機(jī)器,使得通過計(jì)算機(jī)或其他可編程數(shù)據(jù)處理設(shè)備的處理器執(zhí)行的指令產(chǎn)生用于實(shí)現(xiàn)在流程圖一個(gè)流程或多個(gè)流程和/或方框圖一個(gè)方框或多個(gè)方框中指定的功能的裝置。
[0083]這些計(jì)算機(jī)程序指令也可存儲(chǔ)在能引導(dǎo)計(jì)算機(jī)或其他可編程數(shù)據(jù)處理設(shè)備以特定方式工作的計(jì)算機(jī)可讀存儲(chǔ)器中,使得存儲(chǔ)在該計(jì)算機(jī)可讀存儲(chǔ)器中的指令產(chǎn)生包括指令裝置的制造品,該指令裝置實(shí)現(xiàn)在流程圖一個(gè)流程或多個(gè)流程和/或方框圖一個(gè)方框或多個(gè)方框中指定的功能。
[0084]這些計(jì)算機(jī)程序指令也可裝載到計(jì)算機(jī)或其他可編程數(shù)據(jù)處理設(shè)備上,使得在計(jì)算機(jī)或其他可編程設(shè)備上執(zhí)行一系列操作步驟以產(chǎn)生計(jì)算機(jī)實(shí)現(xiàn)的處理,從而在計(jì)算機(jī)或其他可編程設(shè)備上執(zhí)行的指令提供用于實(shí)現(xiàn)在流程圖一個(gè)流程或多個(gè)流程和/或方框圖一個(gè)方框或多個(gè)方框中指定的功能的步驟。
[0085]顯然,本領(lǐng)域的技術(shù)人員可以對本發(fā)明進(jìn)行各種改動(dòng)和變型而不脫離本發(fā)明的精神和范圍。這樣,倘若本發(fā)明的這些修改和變型屬于本發(fā)明權(quán)利要求及其等同技術(shù)的范圍之內(nèi),則本發(fā)明也意圖包含這些改動(dòng)和變型在內(nèi)。
【權(quán)利要求】
1.一種語音識(shí)別方法,應(yīng)用于一電子設(shè)備中,所述電子設(shè)備具有語音識(shí)別服務(wù),其特征在于,所述方法包括: 獲得第一語首?目息; 通過第一識(shí)別模型識(shí)別所述第一語音信息,獲得第一識(shí)別結(jié)果; 判斷所述第一識(shí)別結(jié)果是否符合第一預(yù)設(shè)條件; 在所述第一識(shí)別結(jié)果符合所述第一預(yù)設(shè)條件時(shí),通過與所述第一識(shí)別模型不同的第二識(shí)別模型識(shí)別所述第一語音信息,獲得第二識(shí)別結(jié)果; 基于所述第二識(shí)別結(jié)果,控制所述電子設(shè)備執(zhí)行相應(yīng)的控制指令。
2.如權(quán)利要求1所述的方法,其特征在于,在所述第一識(shí)別結(jié)果不符合所述第一預(yù)設(shè)條件時(shí),所述方法還包括: 丟棄所述第一語音信息。
3.如權(quán)利要求1所述的方法,其特征在于,在所述通過第一識(shí)別模型識(shí)別所述第一語音信息之前,所述方法還包括: 判斷所述第一語音信息是否滿足第二預(yù)設(shè)條件; 當(dāng)所述第一語音信息不 滿足所述第二預(yù)設(shè)條件時(shí),丟棄所述第一語音信息; 當(dāng)所述第一語音信息滿足所述第二預(yù)設(shè)條件時(shí),執(zhí)行步驟:通過第一識(shí)別模型識(shí)別所述第一語音信息。
4.如權(quán)利要求1所述的方法,其特征在于,所述通過第一識(shí)別模型識(shí)別所述第一語音信息,獲得第一識(shí)別結(jié)果,具體為: 識(shí)別所述第一語音信息對應(yīng)的用戶是否為預(yù)定用戶,獲得第一識(shí)別結(jié)果;其中,當(dāng)所述第一語音信息對應(yīng)的用戶不是所述預(yù)定用戶時(shí),表示所述第一語音信息不滿足所述第一預(yù)設(shè)條件,當(dāng)所述第一語音信息對應(yīng)的用戶為所述預(yù)定用戶時(shí),表示所述第一語音信息滿足所述第一預(yù)設(shè)條件。
5.如權(quán)利要求1所述的方法,其特征在于,所述獲得第一語音信息,具體包括: 對所述第一語音信息進(jìn)行端點(diǎn)檢測,獲得檢測后的所述第一語音信息。
6.如權(quán)利要求1所述的方法,其特征在于,在所述第一識(shí)別結(jié)果符合所述第一預(yù)設(shè)條件時(shí),所述通過與所述第一識(shí)別模型不同的第二識(shí)別模型識(shí)別所述第一語音信息,獲得第二識(shí)別結(jié)果,具體為: 通過第二識(shí)別模型識(shí)別所述第一語音信息,獲得第三識(shí)別結(jié)果; 基于所述第一識(shí)別結(jié)果和所述第三識(shí)別結(jié)果,獲得所述第二識(shí)別結(jié)果。
7.如權(quán)利要求1所述的方法,其特征在于,所述語音識(shí)別服務(wù)處于關(guān)閉狀態(tài),當(dāng)所述第二識(shí)別結(jié)果對應(yīng)的控制指令為喚醒指令時(shí),所述基于所述第二識(shí)別結(jié)果,控制所述電子設(shè)備執(zhí)行相應(yīng)的控制指令具體為: 執(zhí)行所述喚醒指令,喚醒所述語音識(shí)別服務(wù)。
8.一種電子設(shè)備,所述電子設(shè)備具有語音識(shí)別服務(wù),其特征在于,所述電子設(shè)備包括: 電路板; 聲音獲取單元,連接于所述電路板,用于獲得第一語音信息; 處理芯片,設(shè)置在所述電路板上,用于通過第一識(shí)別模型識(shí)別所述第一語音信息,獲得第一識(shí)別結(jié)果;判斷所述第一識(shí)別結(jié)果是否符合第一預(yù)設(shè)條件;在所述第一識(shí)別結(jié)果符合所述第一預(yù)設(shè)條件時(shí),通過與所述第一識(shí)別模型不同的第二識(shí)別模型識(shí)別所述第一語音信息,獲得第二識(shí)別結(jié)果; 控制芯片,設(shè)置在所述電路板上,用于基于所述第二識(shí)別結(jié)果,控制所述電子設(shè)備執(zhí)行相應(yīng)的控制指令。
9.如權(quán)利要求8所述的電子設(shè)備,其特征在于,所述處理芯片具體還用于在所述第一識(shí)別結(jié)果不符合所述第一預(yù)設(shè)條件時(shí),丟棄所述第一語音信息。
10.如權(quán)利要求8所述的電子設(shè)備,其特征在于,所述處理芯片包括第一子處理芯片和第二子處理芯片,所述第一子處理芯片具體用于判斷所述第一語音信息是否滿足第二預(yù)設(shè)條件;當(dāng)所述第一語音信息不滿足所述第二預(yù)設(shè)條件時(shí),丟棄所述第一語音信息;當(dāng)所述第一語音信息滿足所述第二預(yù)設(shè)條件時(shí),所述第二子處理芯片具體用于通過第一識(shí)別模型識(shí)別所述第一語音信息。
11.如權(quán)利要求10所述的電子設(shè)備,其特征在于,所述處理芯片具體還包括第三子處理芯片,具體用于識(shí)別所述第一語音信息對應(yīng)的用戶是否為預(yù)定用戶,獲得第一識(shí)別結(jié)果;其中,當(dāng)所述第一語音信息對應(yīng)的用戶不是所述預(yù)定用戶時(shí),表示所述第一語音信息不滿足所述第一預(yù)設(shè)條件,當(dāng)所述第一語音信息對應(yīng)的用戶為所述預(yù)定用戶時(shí),表示所述第一語音信息滿足所述第一預(yù)設(shè)條件。
12.如權(quán)利要求8所述的電子設(shè)備,其特征在于,所述聲音獲取單元還包括檢測芯片,用于對所述第一語音信息進(jìn)行端點(diǎn)檢測,獲得檢測后的所述第一語音信息。
13.如權(quán)利要求8所述的電子設(shè)備,其特征在于,所述處理芯片還包括第四子處理芯片,用于在所述第一識(shí)別結(jié)果符合所述第一預(yù)設(shè)條件時(shí),通過第二識(shí)別模型識(shí)別所述第一語音信息,獲得第三識(shí)別結(jié)果;基于所述第一識(shí)別結(jié)果和所述第三識(shí)別結(jié)果,獲得所述第二識(shí)別結(jié)果。
14.如權(quán)利要求8所述的電子設(shè)備,其特征在于,所述語音識(shí)別服務(wù)處于關(guān)閉狀態(tài),當(dāng)所述第二識(shí)別結(jié)果對應(yīng)的控制指令為喚 醒指令時(shí),所述控制芯片具體用于執(zhí)行所述喚醒指令,喚醒所述語音識(shí)別服務(wù)。
【文檔編號】G10L15/22GK103811003SQ201210454965
【公開日】2014年5月21日 申請日期:2012年11月13日 優(yōu)先權(quán)日:2012年11月13日
【發(fā)明者】戴海生, 王茜鶯, 汪浩 申請人:聯(lián)想(北京)有限公司