一種對用戶語音識別結(jié)果反饋的命令詞識別自適應優(yōu)化方法

文檔序號：2826324閱讀：281來源：國知局

一種對用戶語音識別結(jié)果反饋的命令詞識別自適應優(yōu)化方法
【專利摘要】一種對用戶語音識別結(jié)果反饋的命令詞識別自適應優(yōu)化方法，將全部支持的命令詞分為兩組，用戶常用命令詞和用戶不常用命令詞；將兩組命令詞分別構(gòu)建常用命令詞網(wǎng)絡和非常用詞識別網(wǎng)絡；將輸入的語音信號送入常用命令詞網(wǎng)絡進行識別，同時將識別過程中提取出的語音特征數(shù)據(jù)送入緩存；如果識別結(jié)果達到設定的置信度門限，則直接輸出識別結(jié)果，并反饋識別結(jié)果以調(diào)整該命令詞權(quán)重；否則直接從緩存中將數(shù)據(jù)取出送入非常用詞識別網(wǎng)絡進行識別；如果進入非常用詞識別網(wǎng)絡進行識別，則若識別結(jié)果達到設定的置信度門限，否則拒識；并反饋識別結(jié)果以調(diào)整該命令詞權(quán)重。本發(fā)明能夠根據(jù)不同用戶的使用習慣自動優(yōu)化命令詞識別網(wǎng)絡，提升了識別效果和拒識效果。
【專利說明】一種對用戶語音識別結(jié)果反饋的命令詞識別自適應優(yōu)化方法
【技術(shù)領域】
[0001]本發(fā)明涉及一種語音識別方法，特別是一種對用戶語音識別結(jié)果反饋的命令詞識別自適應優(yōu)化方法。
【背景技術(shù)】
[0002]命令詞語音識別系統(tǒng)主要是完成對預先定義的命令詞集合進行自動語音識別的功能。用戶在使用該系統(tǒng)時，需要先把定義的命令詞集合送入識別系統(tǒng)，然后識別系統(tǒng)會將該命令詞集合中的每個命令詞轉(zhuǎn)化成相應的聲學音素序列，再將這些音素序列組合成一個圖網(wǎng)絡，我們稱之為識別網(wǎng)絡。
[0003]有了構(gòu)建好的命令詞識別網(wǎng)絡后，用戶在使用識別系統(tǒng)時只需要說出命令詞集合中的語音命令，并送入識別系統(tǒng)，識別系統(tǒng)就會根據(jù)語音數(shù)據(jù)的聲學音素去識別網(wǎng)絡中匹配出最優(yōu)的路徑，從而再根據(jù)網(wǎng)絡路徑中的聲學音素序列反推出具體的命令詞文本信息，從而給出識別結(jié)果。
[0004]現(xiàn)有的命令詞語音識別技術(shù)都是事先定義全部能夠支持的命令詞，然后構(gòu)建整個語音識別網(wǎng)絡。這種方式下識別網(wǎng)絡是固定的，不能根據(jù)不同用戶的使用習慣給出更加精確的網(wǎng)絡。特別是當命令詞數(shù)目過大時，識別效果和拒識效果都會明顯下降。

【發(fā)明內(nèi)容】

[0005]本發(fā)明技術(shù)解決問題:克服現(xiàn)有技術(shù)的不足，提供一種對用戶語音識別結(jié)果反饋的命令詞識別自適應優(yōu)化方法，能夠根據(jù)不同用戶的使用習慣自動優(yōu)化命令詞識別網(wǎng)絡，提升了識別效果和拒識效果。
[0006]本發(fā)明技術(shù)解決方案:一種對用戶語音識別結(jié)果反饋的命令詞識別自適應優(yōu)化方法，本發(fā)明首先將全部支持的命令詞分為兩組，一組詞為用戶常用命令詞，另一組為不常用命令詞；然后將兩組命令詞分別構(gòu)建語音識別網(wǎng)絡；用戶在使用語音識別系統(tǒng)時，首先會在常用命令詞網(wǎng)絡中進行匹配，如果識別結(jié)果達到一個定義的得分門限，則直接返回識別結(jié)果；否則會轉(zhuǎn)到不常用的識別網(wǎng)絡中繼續(xù)進行匹配，直到獲得結(jié)果。在用戶使用語音識別系統(tǒng)的過程中對每次識別結(jié)果的正確性給出確認，稱用戶接受一次識別結(jié)果為正向反饋，拒絕為反向反饋；隨后語音識別系統(tǒng)會記錄每次用戶給出正向反饋的識別結(jié)果和其出現(xiàn)的頻度；最后，通過統(tǒng)計用戶使用的反饋信息，重新構(gòu)建識別網(wǎng)絡和調(diào)整網(wǎng)絡路徑權(quán)重。
[0007]具體實現(xiàn)如下:
[0008](I)首先給支持的所有命令詞進行權(quán)重評分(該評分為根據(jù)經(jīng)驗得來)，每個命令詞都會有一個權(quán)重分，然后根據(jù)評分將全部命令詞分為兩組，一組詞為用戶常用命令詞，另一組為用戶不常用命令詞；
[0009](2)然后將兩組命令詞分別構(gòu)建語音識別網(wǎng)絡，即常用命令詞網(wǎng)絡和非常用詞識別網(wǎng)絡:先把常用命令詞集合送入識別系統(tǒng)，然后識別系統(tǒng)會將該命令詞集合中的每個命令詞轉(zhuǎn)化成相應的聲學音素序列，再將這些音素序列組合成一個圖網(wǎng)絡，即為常用詞識別網(wǎng)絡；再把非常用詞命令詞集合送入識別系統(tǒng)，然后識別系統(tǒng)會將該命令詞集合中的每個命令詞轉(zhuǎn)化成相應的聲學音素序列，再將這些音素序列組合成一個圖網(wǎng)絡，即為非常用詞識別網(wǎng)絡。
[0010](3)將輸入的語音信號送入常用命令詞網(wǎng)絡進行識別，同時將識別過程中提取出的語音特征數(shù)據(jù)送入緩存；
[0011](4)如果識別結(jié)果達到設定的置信度門限，則直接輸出識別結(jié)果，并反饋識別結(jié)果以調(diào)整該命令詞權(quán)重；否則，則直接從緩存中將數(shù)據(jù)取出送入非常用詞識別網(wǎng)絡進行識別；
[0012](5)如果進入非常用詞識別網(wǎng)絡進行識別，則若識別結(jié)果達到設定的置信度門限，輸出識別結(jié)果，否則拒識；并反饋識別結(jié)果以調(diào)整該命令詞權(quán)重；
[0013]所述調(diào)整該命令詞權(quán)重過程為:接收識別結(jié)果反饋，對識別結(jié)果命令詞進行權(quán)重調(diào)整；如果為正向反饋，則權(quán)重增加，如果為反向反饋則權(quán)重減小；根據(jù)調(diào)整后的權(quán)重重新進行命令詞分組；所述正向反饋是指對每次識別結(jié)果的正確性給出確認，即用戶接受一次識別結(jié)果為正向反饋，拒絕則為反向反饋。
[0014]本發(fā)明與現(xiàn)有技術(shù)相比的優(yōu)點在于:現(xiàn)有的命令詞語音識別技術(shù)都是事先定義全部能夠支持的命令詞，然后構(gòu)建整個語音識別網(wǎng)絡。這種方式下識別網(wǎng)絡是固定的，不能根據(jù)不同用戶的使用習慣給出更加精確的網(wǎng)絡。特別是當命令詞數(shù)目過大時，識別效果和拒識效果都會明顯下降。本發(fā)明事先將命令詞分為常用命令詞和非常用命令詞，并分別構(gòu)建識別網(wǎng)絡，通過識別結(jié)果的反饋，對每個命令詞的權(quán)重進行調(diào)整，可以根據(jù)用戶習慣進行命令詞識別網(wǎng)絡的優(yōu)化，提升識別和拒識效果，提高了識別效率。
【專利附圖】

【附圖說明】
[0015]圖1為本發(fā)明中語音識別過程流程圖；
[0016]圖2為本發(fā)明中詞匯網(wǎng)絡權(quán)重調(diào)整流程圖。
【具體實施方式】
[0017]下面結(jié)合流程圖詳細說明識別過程和詞匯分組自優(yōu)化調(diào)整過程。
[0018]如圖1所示，本發(fā)明具體實現(xiàn)步驟如下:
[0019](I)首先給支持的所有命令詞進行權(quán)重評分(該評分為根據(jù)經(jīng)驗得來)，每個命令詞都會有一個權(quán)重分，然后根據(jù)評分將全部命令詞分為兩組，一組詞為用戶常用命令詞，另一組為用戶不常用命令詞；
[0020](2)然后將兩組命令詞分別構(gòu)建語音識別網(wǎng)絡，即常用命令詞網(wǎng)絡和非常用詞識別網(wǎng)絡:先把常用命令詞集合送入識別系統(tǒng)，然后識別系統(tǒng)會將該命令詞集合中的每個命令詞轉(zhuǎn)化成相應的聲學音素序列，再將這些音素序列組合成一個圖網(wǎng)絡，即為常用詞識別網(wǎng)絡；再把非常用詞命令詞集合送入識別系統(tǒng)，然后識別系統(tǒng)會將該命令詞集合中的每個命令詞轉(zhuǎn)化成相應的聲學音素序列，再將這些音素序列組合成一個圖網(wǎng)絡，即為非常用詞識別網(wǎng)絡。
[0021]例如，對于一個經(jīng)常使用語音識別系統(tǒng)撥打電話的用戶來說，“打電話給”就是一個使用頻率比較高的命令詞，那么這個命令詞在初始的權(quán)重分就會比較高，被分入常用命令詞；而“查天氣”可能使用的頻率沒那么高，初始的權(quán)重分也比較低，會被分入非常用命令詞。
[0022](3)將輸入的語音信號送入常用命令詞網(wǎng)絡進行識別，同時將識別過程中提取出的語音特征數(shù)據(jù)送入緩存；
[0023](4)如果識別結(jié)果達到設定的置信度門限，則直接輸出識別結(jié)果，并反饋識別結(jié)果以調(diào)整該命令詞權(quán)重；否則，則直接從緩存中將數(shù)據(jù)取出送入非常用詞識別網(wǎng)絡進行識別；
[0024](5)如果進入非常用詞識別網(wǎng)絡進行識別，則若識別結(jié)果達到設定的置信度門限，輸出識別結(jié)果，否則拒識；并反饋識別結(jié)果以調(diào)整該命令詞權(quán)重。
[0025]結(jié)合圖2，所述詞匯分組自優(yōu)化調(diào)整過程為:接收識別結(jié)果反饋，對識別結(jié)果命令詞進行權(quán)重調(diào)整；如果為正向反饋，則權(quán)重增加，如果為反向反饋則權(quán)重減??；根據(jù)調(diào)整后的權(quán)重重新進行命令詞分組；所述正向反饋是指對每次識別結(jié)果的正確性給出確認，即用戶接受一次識別結(jié)果為正向反饋，拒絕則為反向反饋。
[0026]上述過程存在于步驟(4)、(5)中，在接收到識別反饋結(jié)果后即開始自動調(diào)整命令詞權(quán)重分并重新構(gòu)建常用詞和非常用詞識別網(wǎng)絡。
[0027]例如:用戶對語音識別系統(tǒng)說“查天氣”，識別系統(tǒng)會進行錄音并提取其中的語音特征數(shù)據(jù)。先將特征數(shù)據(jù)送入常用命令詞網(wǎng)絡與命令詞進行比對和匹配，而置信度門限就是匹配相似度的一種度量。這時，如果常用命令詞網(wǎng)絡中有達到置信度門限的命令詞，那么輸出識別結(jié)果，這時用戶可以判斷此輸出結(jié)果是否自己想要得到的結(jié)果，如果是，則接受識別結(jié)果，同時系統(tǒng)會給這個識別結(jié)果命令詞一個正向反饋，即增加權(quán)重分；如果不是用戶想要的結(jié)果，則拒絕接受識別結(jié)果，系統(tǒng)會給這個識別結(jié)果命令詞一個負向反饋，即減小這個命令詞的權(quán)重分。
[0028]但是，如果常用命令詞網(wǎng)絡中沒有匹配程度達到置信度門限的命令詞，則將“查天氣”這個命令詞的語音特征數(shù)據(jù)送入非常用詞網(wǎng)絡進行識別。同樣的，如果有達到置信度門限的命令詞，則輸出識別結(jié)果由用戶判斷是否接受結(jié)果，同樣會根據(jù)用戶的接受與否對識別出的這個命令詞進行權(quán)重分數(shù)的調(diào)整，接受則為正向反饋，不接受則為負向反饋。
[0029]如果非常用詞網(wǎng)絡中也沒有達到置信度門限的命令詞，則系統(tǒng)對“查天氣”這個命令詞進行拒識，即不輸出結(jié)果，同時提示無法識別。
[0030]在完成一次識別的過程后，命令詞識別網(wǎng)絡中的命令詞權(quán)重分發(fā)生了變化。這時會根據(jù)現(xiàn)在的權(quán)重分重新生成常用詞識別網(wǎng)絡和非常用詞識別網(wǎng)絡，等待下一次識別。
[0031]本發(fā)明未詳細闡述部分屬于本領域公知技術(shù)。
[0032]以上所述，僅為本發(fā)明部分【具體實施方式】，但本發(fā)明的保護范圍并不局限于此，任何熟悉本領域的人員在本發(fā)明揭露的技術(shù)范圍內(nèi)，可輕易想到的變化或替換，都應涵蓋在本發(fā)明的保護范圍之內(nèi)。
【權(quán)利要求】
1.一種對用戶語音識別結(jié)果反饋的命令詞識別自適應優(yōu)化方法，其特征在于實現(xiàn)如下: (1)將全部支持的命令詞分為兩組，一組詞為用戶常用命令詞，另一組為用戶不常用命令詞； (2)將兩組命令詞分別構(gòu)建語音識別網(wǎng)絡，即常用命令詞網(wǎng)絡和非常用詞識別網(wǎng)絡； (3)將輸入的語音信號送入常用命令詞網(wǎng)絡進行識別，同時將識別過程中提取出的語音特征數(shù)據(jù)送入緩存； (4)如果識別結(jié)果達到設定的置信度門限，則直接輸出識別結(jié)果，并反饋識別結(jié)果以調(diào)整該命令詞權(quán)重；否則，則直接從緩存中將數(shù)據(jù)取出送入非常用詞識別網(wǎng)絡進行識別； (5)如果進入非常用詞識別網(wǎng)絡進行識別，則若識別結(jié)果達到設定的置信度門限，輸出識別結(jié)果，否則拒識；并反饋識別結(jié)果以調(diào)整該命令詞權(quán)重。
2.根據(jù)權(quán)利要求1所述一種對用戶語音識別結(jié)果反饋的命令詞識別自適應優(yōu)化方法，其特征在于:所述步驟(I)中的對支持的所有命令詞進行權(quán)重評分，根據(jù)權(quán)重評分將全部命令詞分為用戶常用命令詞和用戶非常用命令詞。
3.根據(jù)權(quán)利要求1所述一種對用戶語音識別結(jié)果反饋的命令詞識別自適應優(yōu)化方法，其特征在于:所述步驟(2)中的非常用詞識別網(wǎng)絡構(gòu)建為:把定義好的非常用詞命令詞集合送入識別系統(tǒng)，然后識別系統(tǒng)會將該命令詞集合中的每個命令詞轉(zhuǎn)化成相應的聲學音素序列，再將這些音素序列組合成一個圖網(wǎng)絡，即為非常用詞識別網(wǎng)絡。
4.根據(jù)權(quán)利要求1所述一種對用戶語音識別結(jié)果反饋的命令詞識別自適應優(yōu)化方法，其特征在于:所述步驟(4)、(5)中的調(diào)整該命令詞權(quán)重的過程為:接收識別結(jié)果反饋，對識別結(jié)果命令詞進行權(quán)重調(diào)整；如果為正向反饋，則權(quán)重增加，如果為反向反饋則權(quán)重減小；根據(jù)調(diào)整后的權(quán)重重新進行命令詞分組；所述正向反饋是指對每次識別結(jié)果的正確性給出確認，即用戶接受一次識別結(jié)果為正向反饋，拒絕則為反向反饋。
【文檔編號】G10L15/00GK103531197SQ201310473360
【公開日】2014年1月22日申請日期:2013年10月11日優(yōu)先權(quán)日:2013年10月11日
【發(fā)明者】張偉, 梅珂, 陳盛, 鹿曉亮, 單言豐申請人:安徽科大訊飛信息科技股份有限公司

完整全部詳細技術(shù)資料下載

該技術(shù)已申請專利。僅供學習研究，如用于商業(yè)用途，請聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：張偉;梅珂;陳盛;鹿曉亮;單言豐
技術(shù)所有人：安徽科大訊飛信息科技股份有限公司
我是此專利的發(fā)明人

上一篇：語音增強方法
上一篇：利用紋理特征與隨機森林的快速抗噪鳥鳴聲識別方法

相關技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評論。精彩留言會獲得點贊！

精彩留言，會給你點贊！

孤立詞語音識別相關技術(shù)

大詞匯量連續(xù)語音識別相關技術(shù)

国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

一種對用戶語音識別結(jié)果反饋的命令詞識別自適應優(yōu)化方法