的準(zhǔn)確率。同時(shí),由于回歸神經(jīng)網(wǎng)絡(luò)具有較強(qiáng)的魯棒性,對(duì)于未加入訓(xùn)練的場(chǎng)景噪聲,同樣能夠很好的建立起噪聲環(huán)境下的語(yǔ)音信號(hào)至安靜環(huán)境下的語(yǔ)音信號(hào)的映射,從而準(zhǔn)確識(shí)別出未加入訓(xùn)練的場(chǎng)景噪聲下的語(yǔ)音信號(hào),提高了語(yǔ)音識(shí)別的準(zhǔn)確率。
[0036]本發(fā)明實(shí)施例的語(yǔ)音信號(hào)的處理方法,根據(jù)不同場(chǎng)景的噪聲樣本和純凈語(yǔ)音樣本生成噪聲語(yǔ)音樣本,并根據(jù)噪聲語(yǔ)音樣本和純凈語(yǔ)音樣本訓(xùn)練語(yǔ)音模型,從而能夠通過(guò)該語(yǔ)音模型將各種噪聲環(huán)境下的語(yǔ)音信號(hào)轉(zhuǎn)換成安靜環(huán)境下的語(yǔ)音信號(hào),從而大大提高了在噪聲環(huán)境下的語(yǔ)音識(shí)別的準(zhǔn)確性,提升語(yǔ)音識(shí)別服務(wù)的魯棒性和語(yǔ)音識(shí)別服務(wù)的體驗(yàn)。
[0037]圖2是本發(fā)明一個(gè)具體實(shí)施例的語(yǔ)音信號(hào)的處理方法的流程圖。
[0038]如圖2所示,語(yǔ)音信號(hào)的處理方法包括以下步驟:
[0039]S201,采集噪聲樣本信號(hào)。
[0040]具體地,采集在語(yǔ)音識(shí)別過(guò)程中可能出現(xiàn)的場(chǎng)景噪聲以作為噪聲樣本信號(hào),其中,場(chǎng)景噪聲可以是在多個(gè)不同場(chǎng)景下采集得到,例如,采集汽車(chē)行駛過(guò)程中的車(chē)載噪聲、采集在餐廳產(chǎn)生的人群噪聲、或者采集其他人群密集的地方產(chǎn)生的人群噪聲等作為噪聲樣本信號(hào)。進(jìn)而,采集的噪聲樣本信號(hào)越多,在不同環(huán)境下對(duì)采集的語(yǔ)音信號(hào)進(jìn)行處理的精確度就越高,語(yǔ)音識(shí)別的準(zhǔn)確率就越高。
[0041]S202,根據(jù)噪聲樣本信號(hào)對(duì)預(yù)存的純凈語(yǔ)音樣本信號(hào)進(jìn)行處理,得到具有噪聲的噪聲語(yǔ)音樣本信號(hào)。
[0042]其中,純凈語(yǔ)音樣本信號(hào)為安靜環(huán)境下的語(yǔ)音樣本信號(hào),即不包含噪聲信號(hào)的語(yǔ)音信號(hào)。也就是說(shuō),通過(guò)采集的噪聲樣本信號(hào)對(duì)安靜環(huán)境下的語(yǔ)音樣本信號(hào)進(jìn)行加噪處理,以得到噪聲環(huán)境下的語(yǔ)音樣本信號(hào),即噪聲語(yǔ)音樣本信號(hào)。
[0043]應(yīng)當(dāng)理解的是,對(duì)純凈語(yǔ)音樣本信號(hào)進(jìn)行加噪處理可以采用現(xiàn)有的處理方法,為了避免冗余,此處不再?gòu)?fù)贅。
[0044]S203,根據(jù)噪聲語(yǔ)音樣本信號(hào)和純凈語(yǔ)音樣本信號(hào)訓(xùn)練語(yǔ)音模型。
[0045]在本發(fā)明的一個(gè)實(shí)施例中,根據(jù)噪聲語(yǔ)音樣本信號(hào)和純凈語(yǔ)音信號(hào)訓(xùn)練語(yǔ)音模型還包括:提取噪聲語(yǔ)音樣本信號(hào)和純凈語(yǔ)音樣本信號(hào)的聲學(xué)特征,并建立噪聲語(yǔ)音樣本信號(hào)的聲學(xué)特征與純凈語(yǔ)音樣本信號(hào)的聲學(xué)特征的映射關(guān)系。
[0046]具體地,可以通過(guò)提取噪聲語(yǔ)音樣本信號(hào)和純凈語(yǔ)音樣本信號(hào)的聲學(xué)特征,并通過(guò)回歸神經(jīng)網(wǎng)絡(luò)建立噪聲語(yǔ)音樣本信號(hào)的聲學(xué)特征到純凈語(yǔ)音樣本信號(hào)的聲學(xué)特征的映射,以得到語(yǔ)音模型。
[0047]在語(yǔ)音識(shí)別過(guò)程中,由于語(yǔ)音模型是基于噪聲語(yǔ)音樣本信號(hào)獲得,因此能夠?qū)⒃肼暛h(huán)境下的語(yǔ)音信號(hào)映射成安靜環(huán)境下的語(yǔ)音信號(hào),從而準(zhǔn)確識(shí)別出噪聲環(huán)境下的語(yǔ)音信號(hào),提高了語(yǔ)音識(shí)別的準(zhǔn)確率。同時(shí),由于回歸神經(jīng)網(wǎng)絡(luò)具有較強(qiáng)的魯棒性,對(duì)于未加入訓(xùn)練的場(chǎng)景噪聲,同樣能夠很好的建立起噪聲環(huán)境下的語(yǔ)音信號(hào)至安靜環(huán)境下的語(yǔ)音信號(hào)的映射,從而準(zhǔn)確識(shí)別出未加入訓(xùn)練的場(chǎng)景噪聲下的語(yǔ)音信號(hào),提高了語(yǔ)音識(shí)別的準(zhǔn)確率。
[0048]S204,采集用戶(hù)錄入的語(yǔ)音信號(hào)。
[0049]具體地,可以通過(guò)語(yǔ)音輸入設(shè)備如麥克風(fēng)等采集用戶(hù)的語(yǔ)音信號(hào),然后將采集的語(yǔ)音信號(hào)發(fā)送至服務(wù)端進(jìn)行語(yǔ)音識(shí)別。其中,可以將訓(xùn)練的語(yǔ)音模型存儲(chǔ)到語(yǔ)音識(shí)別云端,將采集的語(yǔ)音信號(hào)發(fā)送至云端進(jìn)行語(yǔ)音識(shí)別。
[0050]S205,判斷語(yǔ)音信號(hào)是否包含噪聲。
[0051]具體地,服務(wù)端在接收到用戶(hù)錄入的語(yǔ)音信號(hào)后,對(duì)用戶(hù)錄入的語(yǔ)音信號(hào)進(jìn)行信噪比估計(jì),以對(duì)用戶(hù)錄入的語(yǔ)音信號(hào)進(jìn)行分類(lèi)。例如,當(dāng)用戶(hù)錄入的語(yǔ)音信號(hào)的信噪比小于一定值時(shí),則判斷語(yǔ)音信號(hào)包含噪聲;當(dāng)用戶(hù)錄入的語(yǔ)音信號(hào)的信噪比大于一定值時(shí),則判斷語(yǔ)音信號(hào)未包含噪聲。
[0052]S206,如果語(yǔ)音信號(hào)包含噪聲,則根據(jù)語(yǔ)音模型對(duì)語(yǔ)音信號(hào)進(jìn)行去噪處理。
[0053]具體地,如果判斷語(yǔ)音信號(hào)包含噪聲,則可以確定語(yǔ)音信號(hào)是在噪聲環(huán)境下錄入,此時(shí)需要根據(jù)預(yù)先存儲(chǔ)在服務(wù)端中的語(yǔ)音模型對(duì)語(yǔ)音信號(hào)進(jìn)行去噪處理,即通過(guò)回歸神經(jīng)網(wǎng)絡(luò)將用戶(hù)錄入的語(yǔ)音信號(hào)轉(zhuǎn)換成安靜環(huán)境下的語(yǔ)音信號(hào)。
[0054]在本發(fā)明的一個(gè)實(shí)施例中,根據(jù)語(yǔ)音模型中保存的該噪聲環(huán)境中噪聲語(yǔ)音樣本和純凈語(yǔ)音樣本的映射關(guān)系,將采集的包含噪聲的語(yǔ)音信號(hào)轉(zhuǎn)換為不包含噪聲的語(yǔ)音信號(hào)。
[0055]S207,根據(jù)聲學(xué)模型對(duì)去噪處理后的語(yǔ)音信號(hào)進(jìn)行語(yǔ)音識(shí)別。
[0056]具體地,在對(duì)用戶(hù)輸入的語(yǔ)音信號(hào)進(jìn)行去噪處理后,通過(guò)服務(wù)端的解碼器進(jìn)行語(yǔ)音識(shí)別,即解碼器根據(jù)服務(wù)端預(yù)存的聲學(xué)模型對(duì)去噪處理后的語(yǔ)音信號(hào)進(jìn)行解碼,將語(yǔ)音信號(hào)轉(zhuǎn)換為文本信息,然后將識(shí)別結(jié)果反饋給用戶(hù)。其中,聲學(xué)模型是通過(guò)對(duì)大量純凈語(yǔ)音樣本訓(xùn)練獲得的。
[0057]S208,如果語(yǔ)音信號(hào)未包含噪聲,則根據(jù)聲學(xué)模型對(duì)語(yǔ)音信號(hào)進(jìn)行語(yǔ)音識(shí)別。
[0058]具體地,如果判斷語(yǔ)音信號(hào)未包含噪聲,則可以確定語(yǔ)音信號(hào)是在安靜環(huán)境下錄入,此時(shí)無(wú)需通過(guò)語(yǔ)音模型對(duì)語(yǔ)音信號(hào)進(jìn)行去噪處理,而是直接通過(guò)服務(wù)端的解碼器根據(jù)聲學(xué)模型對(duì)語(yǔ)音信號(hào)進(jìn)行解碼,將語(yǔ)音信號(hào)轉(zhuǎn)換為文本信息,然后將識(shí)別結(jié)果反饋給用戶(hù)。
[0059]本發(fā)明實(shí)施例的語(yǔ)音信號(hào)的處理方法,在語(yǔ)音識(shí)別過(guò)程中,對(duì)噪聲環(huán)境下錄入的語(yǔ)音信號(hào)進(jìn)行預(yù)處理,將語(yǔ)音信號(hào)轉(zhuǎn)換為安靜環(huán)境下的語(yǔ)音信號(hào)再進(jìn)行語(yǔ)音識(shí)別,而對(duì)安靜壞境下錄入的語(yǔ)音信號(hào)直接進(jìn)行語(yǔ)音識(shí)別,由此,不僅能夠保證安靜環(huán)境下語(yǔ)音識(shí)別的準(zhǔn)確率,而且能夠大大提高噪音環(huán)境下語(yǔ)音識(shí)別的準(zhǔn)確率,從而提高語(yǔ)音識(shí)別服務(wù)的準(zhǔn)確率和魯棒性和服務(wù)體驗(yàn)。
[0060]圖3是本發(fā)明另一個(gè)具體實(shí)施例的語(yǔ)音信號(hào)的處理方法的流程圖。
[0061]如圖3所示,語(yǔ)音信號(hào)的處理方法包括以下步驟:
[0062]S301,采集噪聲樣本信號(hào)。
[0063]具體地,采集在語(yǔ)音識(shí)別過(guò)程中可能出現(xiàn)的場(chǎng)景噪聲以作為噪聲樣本信號(hào),其中,場(chǎng)景噪聲可以是在多個(gè)不同場(chǎng)景下采集得到,例如,采集汽車(chē)行駛過(guò)程中的車(chē)載噪聲、采集在餐廳產(chǎn)生的人群噪聲、或者采集其他人群密集的地方產(chǎn)生的人群噪聲等作為噪聲樣本信號(hào)。進(jìn)而,采集的噪聲樣本信號(hào)越多,在不同環(huán)境下對(duì)采集的語(yǔ)音信號(hào)進(jìn)行處理的精確度就越高,語(yǔ)音識(shí)別的準(zhǔn)確率就越高。
[0064]S302,根據(jù)噪聲樣本信號(hào)對(duì)預(yù)存的純凈語(yǔ)音樣本信號(hào)進(jìn)行處理,得到具有噪聲的噪聲語(yǔ)音樣本信號(hào)。
[0065]其中,純凈語(yǔ)音樣本信號(hào)為安靜環(huán)境下的語(yǔ)音樣本信號(hào),即不包含噪聲信號(hào)的語(yǔ)音信號(hào)。也就是說(shuō),通過(guò)采集的噪聲樣本信號(hào)對(duì)安靜環(huán)境下的語(yǔ)音樣本信號(hào)進(jìn)行加噪處理,以得到噪聲環(huán)境下的語(yǔ)音樣本信號(hào),即噪聲語(yǔ)音樣本信號(hào)。
[0066]應(yīng)當(dāng)理解的是,對(duì)純凈語(yǔ)音樣本信號(hào)進(jìn)行加噪處理可以采用現(xiàn)有的處理方法,為了避免冗余,此處不再?gòu)?fù)贅。
[0067]S303,根據(jù)噪聲語(yǔ)音樣本信號(hào)和純凈語(yǔ)音樣本信號(hào)訓(xùn)練語(yǔ)音模型。
[0068]在本發(fā)明的一個(gè)實(shí)施例中,根據(jù)噪聲語(yǔ)音樣本信號(hào)和純凈語(yǔ)音信號(hào)訓(xùn)練語(yǔ)音模型還包括:提取噪聲語(yǔ)音樣本信號(hào)和純凈語(yǔ)音樣本信號(hào)的聲學(xué)特征,并建立噪聲語(yǔ)音樣本信號(hào)的聲學(xué)特征與純凈語(yǔ)音樣本信號(hào)的聲學(xué)特征的映射關(guān)系。
[0069]具體地,可以通過(guò)提取噪聲語(yǔ)音樣本信號(hào)和純凈語(yǔ)音樣本信號(hào)的聲學(xué)特征,并通過(guò)回歸神經(jīng)網(wǎng)絡(luò)建立噪聲語(yǔ)音樣本信號(hào)的聲學(xué)特征到純凈語(yǔ)音樣本信號(hào)的聲學(xué)特征的映射,以得到語(yǔ)音模型。
[0070]在語(yǔ)音識(shí)別過(guò)程中,由于語(yǔ)音模型是基于噪聲語(yǔ)音樣本信號(hào)獲得,因此能夠?qū)⒃肼暛h(huán)境下的語(yǔ)音信號(hào)