一種對用戶語音識別結(jié)果反饋的命令詞識別自適應優(yōu)化方法
【專利摘要】一種對用戶語音識別結(jié)果反饋的命令詞識別自適應優(yōu)化方法,將全部支持的命令詞分為兩組,用戶常用命令詞和用戶不常用命令詞;將兩組命令詞分別構(gòu)建常用命令詞網(wǎng)絡和非常用詞識別網(wǎng)絡;將輸入的語音信號送入常用命令詞網(wǎng)絡進行識別,同時將識別過程中提取出的語音特征數(shù)據(jù)送入緩存;如果識別結(jié)果達到設定的置信度門限,則直接輸出識別結(jié)果,并反饋識別結(jié)果以調(diào)整該命令詞權(quán)重;否則直接從緩存中將數(shù)據(jù)取出送入非常用詞識別網(wǎng)絡進行識別;如果進入非常用詞識別網(wǎng)絡進行識別,則若識別結(jié)果達到設定的置信度門限,否則拒識;并反饋識別結(jié)果以調(diào)整該命令詞權(quán)重。本發(fā)明能夠根據(jù)不同用戶的使用習慣自動優(yōu)化命令詞識別網(wǎng)絡,提升了識別效果和拒識效果。
【專利說明】一種對用戶語音識別結(jié)果反饋的命令詞識別自適應優(yōu)化方法
【技術(shù)領域】
[0001]本發(fā)明涉及一種語音識別方法,特別是一種對用戶語音識別結(jié)果反饋的命令詞識別自適應優(yōu)化方法。
【背景技術(shù)】
[0002]命令詞語音識別系統(tǒng)主要是完成對預先定義的命令詞集合進行自動語音識別的功能。用戶在使用該系統(tǒng)時,需要先把定義的命令詞集合送入識別系統(tǒng),然后識別系統(tǒng)會將該命令詞集合中的每個命令詞轉(zhuǎn)化成相應的聲學音素序列,再將這些音素序列組合成一個圖網(wǎng)絡,我們稱之為識別網(wǎng)絡。
[0003]有了構(gòu)建好的命令詞識別網(wǎng)絡后,用戶在使用識別系統(tǒng)時只需要說出命令詞集合中的語音命令,并送入識別系統(tǒng),識別系統(tǒng)就會根據(jù)語音數(shù)據(jù)的聲學音素去識別網(wǎng)絡中匹配出最優(yōu)的路徑,從而再根據(jù)網(wǎng)絡路徑中的聲學音素序列反推出具體的命令詞文本信息,從而給出識別結(jié)果。
[0004]現(xiàn)有的命令詞語音識別技術(shù)都是事先定義全部能夠支持的命令詞,然后構(gòu)建整個語音識別網(wǎng)絡。這種方式下識別網(wǎng)絡是固定的,不能根據(jù)不同用戶的使用習慣給出更加精確的網(wǎng)絡。特別是當命令詞數(shù)目過大時,識別效果和拒識效果都會明顯下降。
【發(fā)明內(nèi)容】
[0005]本發(fā)明技術(shù)解決問題:克服現(xiàn)有技術(shù)的不足,提供一種對用戶語音識別結(jié)果反饋的命令詞識別自適應優(yōu)化方法,能夠根據(jù)不同用戶的使用習慣自動優(yōu)化命令詞識別網(wǎng)絡,提升了識別效果和拒識效果。
[0006]本發(fā)明技術(shù)解決方案:一種對用戶語音識別結(jié)果反饋的命令詞識別自適應優(yōu)化方法,本發(fā)明首先將全部支持的命令詞分為兩組,一組詞為用戶常用命令詞,另一組為不常用命令詞;然后將兩組命令詞分別構(gòu)建語音識別網(wǎng)絡;用戶在使用語音識別系統(tǒng)時,首先會在常用命令詞網(wǎng)絡中進行匹配,如果識別結(jié)果達到一個定義的得分門限,則直接返回識別結(jié)果;否則會轉(zhuǎn)到不常用的識別網(wǎng)絡中繼續(xù)進行匹配,直到獲得結(jié)果。在用戶使用語音識別系統(tǒng)的過程中對每次識別結(jié)果的正確性給出確認,稱用戶接受一次識別結(jié)果為正向反饋,拒絕為反向反饋;隨后語音識別系統(tǒng)會記錄每次用戶給出正向反饋的識別結(jié)果和其出現(xiàn)的頻度;最后,通過統(tǒng)計用戶使用的反饋信息,重新構(gòu)建識別網(wǎng)絡和調(diào)整網(wǎng)絡路徑權(quán)重。
[0007]具體實現(xiàn)如下:
[0008](I)首先給支持的所有命令詞進行權(quán)重評分(該評分為根據(jù)經(jīng)驗得來),每個命令詞都會有一個權(quán)重分,然后根據(jù)評分將全部命令詞分為兩組,一組詞為用戶常用命令詞,另一組為用戶不常用命令詞;
[0009](2)然后將兩組命令詞分別構(gòu)建語音識別網(wǎng)絡,即常用命令詞網(wǎng)絡和非常用詞識別網(wǎng)絡:先把常用命令詞集合送入識別系統(tǒng),然后識別系統(tǒng)會將該命令詞集合中的每個命令詞轉(zhuǎn)化成相應的聲學音素序列,再將這些音素序列組合成一個圖網(wǎng)絡,即為常用詞識別網(wǎng)絡;再把非常用詞命令詞集合送入識別系統(tǒng),然后識別系統(tǒng)會將該命令詞集合中的每個命令詞轉(zhuǎn)化成相應的聲學音素序列,再將這些音素序列組合成一個圖網(wǎng)絡,即為非常用詞識別網(wǎng)絡。
[0010](3)將輸入的語音信號送入常用命令詞網(wǎng)絡進行識別,同時將識別過程中提取出的語音特征數(shù)據(jù)送入緩存;
[0011](4)如果識別結(jié)果達到設定的置信度門限,則直接輸出識別結(jié)果,并反饋識別結(jié)果以調(diào)整該命令詞權(quán)重;否則,則直接從緩存中將數(shù)據(jù)取出送入非常用詞識別網(wǎng)絡進行識別;
[0012](5)如果進入非常用詞識別網(wǎng)絡進行識別,則若識別結(jié)果達到設定的置信度門限,輸出識別結(jié)果,否則拒識;并反饋識別結(jié)果以調(diào)整該命令詞權(quán)重;
[0013]所述調(diào)整該命令詞權(quán)重過程為:接收識別結(jié)果反饋,對識別結(jié)果命令詞進行權(quán)重調(diào)整;如果為正向反饋,則權(quán)重增加,如果為反向反饋則權(quán)重減小;根據(jù)調(diào)整后的權(quán)重重新進行命令詞分組;所述正向反饋是指對每次識別結(jié)果的正確性給出確認,即用戶接受一次識別結(jié)果為正向反饋,拒絕則為反向反饋。
[0014]本發(fā)明與現(xiàn)有技術(shù)相比的優(yōu)點在于:現(xiàn)有的命令詞語音識別技術(shù)都是事先定義全部能夠支持的命令詞,然后構(gòu)建整個語音識別網(wǎng)絡。這種方式下識別網(wǎng)絡是固定的,不能根據(jù)不同用戶的使用習慣給出更加精確的網(wǎng)絡。特別是當命令詞數(shù)目過大時,識別效果和拒識效果都會明顯下降。本發(fā)明事先將命令詞分為常用命令詞和非常用命令詞,并分別構(gòu)建識別網(wǎng)絡,通過識別結(jié)果的反饋,對每個命令詞的權(quán)重進行調(diào)整,可以根據(jù)用戶習慣進行命令詞識別網(wǎng)絡的優(yōu)化,提升識別和拒識效果,提高了識別效率。
【專利附圖】
【附圖說明】
[0015]圖1為本發(fā)明中語音識別過程流程圖;
[0016]圖2為本發(fā)明中詞匯網(wǎng)絡權(quán)重調(diào)整流程圖。
【具體實施方式】
[0017]下面結(jié)合流程圖詳細說明識別過程和詞匯分組自優(yōu)化調(diào)整過程。
[0018]如圖1所示,本發(fā)明具體實現(xiàn)步驟如下:
[0019](I)首先給支持的所有命令詞進行權(quán)重評分(該評分為根據(jù)經(jīng)驗得來),每個命令詞都會有一個權(quán)重分,然后根據(jù)評分將全部命令詞分為兩組,一組詞為用戶常用命令詞,另一組為用戶不常用命令詞;
[0020](2)然后將兩組命令詞分別構(gòu)建語音識別網(wǎng)絡,即常用命令詞網(wǎng)絡和非常用詞識別網(wǎng)絡:先把常用命令詞集合送入識別系統(tǒng),然后識別系統(tǒng)會將該命令詞集合中的每個命令詞轉(zhuǎn)化成相應的聲學音素序列,再將這些音素序列組合成一個圖網(wǎng)絡,即為常用詞識別網(wǎng)絡;再把非常用詞命令詞集合送入識別系統(tǒng),然后識別系統(tǒng)會將該命令詞集合中的每個命令詞轉(zhuǎn)化成相應的聲學音素序列,再將這些音素序列組合成一個圖網(wǎng)絡,即為非常用詞識別網(wǎng)絡。
[0021]例如,對于一個經(jīng)常使用語音識別系統(tǒng)撥打電話的用戶來說,“打電話給”就是一個使用頻率比較高的命令詞,那么這個命令詞在初始的權(quán)重分就會比較高,被分入常用命令詞;而“查天氣”可能使用的頻率沒那么高,初始的權(quán)重分也比較低,會被分入非常用命令詞。
[0022](3)將輸入的語音信號送入常用命令詞網(wǎng)絡進行識別,同時將識別過程中提取出的語音特征數(shù)據(jù)送入緩存;
[0023](4)如果識別結(jié)果達到設定的置信度門限,則直接輸出識別結(jié)果,并反饋識別結(jié)果以調(diào)整該命令詞權(quán)重;否則,則直接從緩存中將數(shù)據(jù)取出送入非常用詞識別網(wǎng)絡進行識別;
[0024](5)如果進入非常用詞識別網(wǎng)絡進行識別,則若識別結(jié)果達到設定的置信度門限,輸出識別結(jié)果,否則拒識;并反饋識別結(jié)果以調(diào)整該命令詞權(quán)重。
[0025]結(jié)合圖2,所述詞匯分組自優(yōu)化調(diào)整過程為:接收識別結(jié)果反饋,對識別結(jié)果命令詞進行權(quán)重調(diào)整;如果為正向反饋,則權(quán)重增加,如果為反向反饋則權(quán)重減??;根據(jù)調(diào)整后的權(quán)重重新進行命令詞分組;所述正向反饋是指對每次識別結(jié)果的正確性給出確認,即用戶接受一次識別結(jié)果為正向反饋,拒絕則為反向反饋。
[0026]上述過程存在于步驟(4)、(5)中,在接收到識別反饋結(jié)果后即開始自動調(diào)整命令詞權(quán)重分并重新構(gòu)建常用詞和非常用詞識別網(wǎng)絡。
[0027]例如:用戶對語音識別系統(tǒng)說“查天氣”,識別系統(tǒng)會進行錄音并提取其中的語音特征數(shù)據(jù)。先將特征數(shù)據(jù)送入常用命令詞網(wǎng)絡與命令詞進行比對和匹配,而置信度門限就是匹配相似度的一種度量。這時,如果常用命令詞網(wǎng)絡中有達到置信度門限的命令詞,那么輸出識別結(jié)果,這時用戶可以判斷此輸出結(jié)果是否自己想要得到的結(jié)果,如果是,則接受識別結(jié)果,同時系統(tǒng)會給這個識別結(jié)果命令詞一個正向反饋,即增加權(quán)重分;如果不是用戶想要的結(jié)果,則拒絕接受識別結(jié)果,系統(tǒng)會給這個識別結(jié)果命令詞一個負向反饋,即減小這個命令詞的權(quán)重分。
[0028]但是,如果常用命令詞網(wǎng)絡中沒有匹配程度達到置信度門限的命令詞,則將“查天氣”這個命令詞的語音特征數(shù)據(jù)送入非常用詞網(wǎng)絡進行識別。同樣的,如果有達到置信度門限的命令詞,則輸出識別結(jié)果由用戶判斷是否接受結(jié)果,同樣會根據(jù)用戶的接受與否對識別出的這個命令詞進行權(quán)重分數(shù)的調(diào)整,接受則為正向反饋,不接受則為負向反饋。
[0029]如果非常用詞網(wǎng)絡中也沒有達到置信度門限的命令詞,則系統(tǒng)對“查天氣”這個命令詞進行拒識,即不輸出結(jié)果,同時提示無法識別。
[0030]在完成一次識別的過程后,命令詞識別網(wǎng)絡中的命令詞權(quán)重分發(fā)生了變化。這時會根據(jù)現(xiàn)在的權(quán)重分重新生成常用詞識別網(wǎng)絡和非常用詞識別網(wǎng)絡,等待下一次識別。
[0031]本發(fā)明未詳細闡述部分屬于本領域公知技術(shù)。
[0032]以上所述,僅為本發(fā)明部分【具體實施方式】,但本發(fā)明的保護范圍并不局限于此,任何熟悉本領域的人員在本發(fā)明揭露的技術(shù)范圍內(nèi),可輕易想到的變化或替換,都應涵蓋在本發(fā)明的保護范圍之內(nèi)。
【權(quán)利要求】
1.一種對用戶語音識別結(jié)果反饋的命令詞識別自適應優(yōu)化方法,其特征在于實現(xiàn)如下: (1)將全部支持的命令詞分為兩組,一組詞為用戶常用命令詞,另一組為用戶不常用命令詞; (2)將兩組命令詞分別構(gòu)建語音識別網(wǎng)絡,即常用命令詞網(wǎng)絡和非常用詞識別網(wǎng)絡; (3)將輸入的語音信號送入常用命令詞網(wǎng)絡進行識別,同時將識別過程中提取出的語音特征數(shù)據(jù)送入緩存; (4)如果識別結(jié)果達到設定的置信度門限,則直接輸出識別結(jié)果,并反饋識別結(jié)果以調(diào)整該命令詞權(quán)重;否則,則直接從緩存中將數(shù)據(jù)取出送入非常用詞識別網(wǎng)絡進行識別; (5)如果進入非常用詞識別網(wǎng)絡進行識別,則若識別結(jié)果達到設定的置信度門限,輸出識別結(jié)果,否則拒識;并反饋識別結(jié)果以調(diào)整該命令詞權(quán)重。
2.根據(jù)權(quán)利要求1所述一種對用戶語音識別結(jié)果反饋的命令詞識別自適應優(yōu)化方法,其特征在于:所述步驟(I)中的對支持的所有命令詞進行權(quán)重評分,根據(jù)權(quán)重評分將全部命令詞分為用戶常用命令詞和用戶非常用命令詞。
3.根據(jù)權(quán)利要求1所述一種對用戶語音識別結(jié)果反饋的命令詞識別自適應優(yōu)化方法,其特征在于:所述步驟(2)中的非常用詞識別網(wǎng)絡構(gòu)建為:把定義好的非常用詞命令詞集合送入識別系統(tǒng),然后識別系統(tǒng)會將該命令詞集合中的每個命令詞轉(zhuǎn)化成相應的聲學音素序列,再將這些音素序列組合成一個圖網(wǎng)絡,即為非常用詞識別網(wǎng)絡。
4.根據(jù)權(quán)利要求1所述一種對用戶語音識別結(jié)果反饋的命令詞識別自適應優(yōu)化方法,其特征在于:所述步驟(4)、(5)中的調(diào)整該命令詞權(quán)重的過程為:接收識別結(jié)果反饋,對識別結(jié)果命令詞進行權(quán)重調(diào)整;如果為正向反饋,則權(quán)重增加,如果為反向反饋則權(quán)重減小;根據(jù)調(diào)整后的權(quán)重重新進行命令詞分組;所述正向反饋是指對每次識別結(jié)果的正確性給出確認,即用戶接受一次識別結(jié)果為正向反饋,拒絕則為反向反饋。
【文檔編號】G10L15/00GK103531197SQ201310473360
【公開日】2014年1月22日 申請日期:2013年10月11日 優(yōu)先權(quán)日:2013年10月11日
【發(fā)明者】張偉, 梅珂, 陳盛, 鹿曉亮, 單言豐 申請人:安徽科大訊飛信息科技股份有限公司