国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      用于音頻信號(hào)分類的方法和裝置的制作方法

      文檔序號(hào):2823297閱讀:224來源:國(guó)知局
      專利名稱:用于音頻信號(hào)分類的方法和裝置的制作方法
      技術(shù)領(lǐng)域
      本發(fā)明涉及用于音頻信號(hào)分類的裝置。本發(fā)明進(jìn)一步涉及但不限于用于移動(dòng)設(shè)備的裝置。
      背景技術(shù)
      在許多應(yīng)用中,存在對(duì)識(shí)別和分類音頻信號(hào)的強(qiáng)烈興趣。一個(gè)這樣的分類是自動(dòng)識(shí)別音頻信號(hào)何時(shí)是話音音頻信號(hào)、音樂音頻信號(hào)、或靜默。盡管人類耳朵可以例如通過聆聽短片段數(shù)秒而容易地在話音和音樂音頻信號(hào)之間進(jìn)行區(qū)分,但已發(fā)現(xiàn)自動(dòng)識(shí)別或區(qū)分是技術(shù)上困難的問題。在無線通信系統(tǒng)裝置中,對(duì)音頻信號(hào)是音樂還是話音的這樣的識(shí)別尤其有益。無線通信系統(tǒng)中的裝置內(nèi)的音頻信號(hào)處理可以取決于信號(hào)是話音、音樂還是靜默而對(duì)信號(hào)實(shí)施不同的編碼和解碼算法。所使用的算法的類型可以更優(yōu)化地處理所考慮的音頻信號(hào)的特性,從而優(yōu)化地處理音頻信號(hào)以使得不丟失話音音頻信號(hào)中的可懂度、不顯著劣化音樂音頻信號(hào)的保真度、并且不在通信靜默時(shí)使用顯著的網(wǎng)絡(luò)資源。先前已經(jīng)多次處理了話音和音樂音頻信號(hào)的自動(dòng)音頻信號(hào)分類。這些方法經(jīng)常需要使用諸如神經(jīng)網(wǎng)之類的模式識(shí)別裝置的復(fù)雜的分析來嘗試對(duì)信號(hào)是話音還是音樂進(jìn)行分類。然而,這樣的高處理強(qiáng)度方法不適合于通信設(shè)備、尤其是其中處理能力帶來功率消耗和成本損失的便攜式設(shè)備。例如,在用戶設(shè)備處在蜂窩無線通信中從基站接收的下行鏈路編碼音頻信號(hào)的自動(dòng)分類將不適合于諸如神經(jīng)網(wǎng)處理之類的高處理強(qiáng)度技術(shù)。此外,在這樣的環(huán)境中,存在要克服的三個(gè)具體障礙。首先,音頻信號(hào)通常使用自適應(yīng)多速率(AMR)壓縮方案來編碼和解碼。使用諸如算術(shù)碼激發(fā)線性預(yù)測(cè)(ACELP)之類的技術(shù)的AMR編碼選擇編解碼器模式以滿足本地?zé)o線電信道能力要求。AMR編碼的該編解碼器的選擇顯著影響音頻信號(hào)。其次,如上所述的識(shí)別器或分類器需要盡可能高效以使得它可以在用戶設(shè)備中實(shí)施而不需要顯著的處理或功率要求并且影響用戶設(shè)備的通信能力。第三,識(shí)別器或分類器應(yīng)當(dāng)生成低概率的音樂的誤報(bào)識(shí)別。換言之,算法將話音識(shí)別為音樂的概率必須非常低。因?yàn)橛脩粼O(shè)備的角色是提供話音通信,所以音頻信號(hào)實(shí)際是話音的情況下的音樂的誤報(bào)將導(dǎo)致話音音頻信號(hào)的劣化,因?yàn)橐魳肪幗獯a器或音樂編解碼器設(shè)置被選擇為解碼話音音頻信號(hào)。

      發(fā)明內(nèi)容
      本發(fā)明的至少一些實(shí)施例的目標(biāo)在于解決這些問題中的一個(gè)或多介。根據(jù)本發(fā)明,存在一種方法,其包括確定音頻信號(hào)的信號(hào)識(shí)別值;確定所述音頻信號(hào)的至少一個(gè)噪聲水平值;將所述信號(hào)識(shí)別值與信號(hào)識(shí)別閾值比較,并且將所述至少一個(gè)噪聲水平值中的每個(gè)與相關(guān)聯(lián)的噪聲水平閾值比較;以及取決于所述比較來識(shí)別所述音頻信號(hào)。識(shí)別所述音頻信號(hào)可以包括當(dāng)所述信號(hào)識(shí)別值小于所述信號(hào)識(shí)別閾值、并且所述至少一個(gè)噪聲水平值中的至少一個(gè)小于所述相關(guān)聯(lián)的噪聲水平閾值時(shí),將所述音頻信號(hào)識(shí)別為音樂音頻信號(hào)。識(shí)別所述音頻信號(hào)可以進(jìn)一步包括當(dāng)所述信號(hào)識(shí)別值等于或大于所述信號(hào)識(shí)別閾值,和/或所述至少一個(gè)噪聲水平值全部等于或大于所述相關(guān)聯(lián)的噪聲水平閾值時(shí),將所述音頻信號(hào)識(shí)別為話音音頻信號(hào)。確定所述信號(hào)識(shí)別值可以包括對(duì)所述音頻信號(hào)采樣值進(jìn)行低通濾波;確定經(jīng)低通濾波的音頻信號(hào)值的至少兩個(gè)均方根值;從所述均方根值中選擇最大均方根值和最小均方根值;確定所述最大均方根值和所述最小均方根值的比率;以及對(duì)所述最大均方根值和所述最小均方根值的比率進(jìn)行低通濾波。該方法可以進(jìn)一步包括確定所述最小均方根值小于信號(hào)水平閾值;以及取決于確定所述最小均方根值小于信號(hào)水平閾值而丟棄所述最大均方根值和所述最小均方根值的所確定的比率。確定所述音頻信號(hào)的所述至少一個(gè)噪聲水平值中的一個(gè)可以包括對(duì)所述音頻信號(hào)采樣值進(jìn)行高通濾波;確定經(jīng)高通濾波的音頻信號(hào)值的至少兩個(gè)均方根值;從所述均方根值中選擇最小均方根值;以及對(duì)來自所述均方根值的最小均方根值進(jìn)行低通濾波以確定所述音頻信號(hào)的所述至少一個(gè)噪聲水平中的一個(gè)。確定所述音頻信號(hào)的所述至少一個(gè)噪聲水平值中的第二個(gè)可以包括對(duì)所述音頻信號(hào)采樣值進(jìn)行高通濾波;確定經(jīng)高通濾波的音頻信號(hào)值的至少兩個(gè)均方根值;從經(jīng)所述高通濾波的音頻信號(hào)值的均方根值中選擇最小均方根值;對(duì)來自經(jīng)所述高通濾波的音頻信號(hào)值的均方根值的最小均方根值進(jìn)行低通濾波;對(duì)所述音頻信號(hào)采樣值進(jìn)行低通濾波;確定經(jīng)所述低通濾波的音頻信號(hào)值的至少兩個(gè)均方根值;從經(jīng)所述低通濾波的音頻信號(hào)值的均方根值中選擇最小均方根值;對(duì)來自經(jīng)所述低通濾波的音頻信號(hào)值的最小均方根值進(jìn)行低通濾波;確定經(jīng)所述低通濾波的來自經(jīng)所述低通濾波和經(jīng)高通濾波音頻信號(hào)的最小均方根值的比率;以及將所述音頻信號(hào)的所述至少一個(gè)噪聲水平值中的第二個(gè)確定為經(jīng)低通濾波的來自經(jīng)所述低通濾波和經(jīng)高通濾波的音頻信號(hào)的最小均方根值的比率或經(jīng)低通濾波的最小均方根值的先前的比率。該方法可以進(jìn)一步包括緩沖經(jīng)所述低通濾波的音頻信號(hào)值的所述至少兩個(gè)均方根值。該方法可以進(jìn)一步包括重置緩沖的值。該方法可以進(jìn)一步包括緩沖經(jīng)所述高通濾波的音頻信號(hào)值的所述至少兩個(gè)均方根值。該方法可以進(jìn)一步包括重置緩沖的值。該方法可以進(jìn)一步包括取決于所述識(shí)別而解碼所述音頻信號(hào)。該方法可以進(jìn)一步包括取決于所述識(shí)別而從音樂庫中選擇要播放的音樂。該方法可以進(jìn)一步包括取決于所述識(shí)別而實(shí)施話音到文本應(yīng)用。根據(jù)本發(fā)明的第二方面,提供了一種裝置,其包括至少一個(gè)處理器和包括計(jì)算機(jī)程序代碼的至少一個(gè)存儲(chǔ)器,所述至少一個(gè)存儲(chǔ)器和所述計(jì)算機(jī)程序代碼被配置為與所述至少一個(gè)處理器一同使得所述裝置至少執(zhí)行確定音頻信號(hào)的信號(hào)識(shí)別值;確定所述音頻信號(hào)的至少一個(gè)噪聲水平值;將所述信號(hào)識(shí)別值與信號(hào)識(shí)別閾值比較,并且將所述至少一個(gè)噪聲水平值中的每個(gè)與相關(guān)聯(lián)的噪聲水平閾值比較;以及取決于所述比較來識(shí)別所述音頻信號(hào)。識(shí)別所述音頻信號(hào)可以使得所述裝置至少執(zhí)行當(dāng)所述信號(hào)識(shí)別值小于所述信號(hào)識(shí)別閾值、并且所述至少一個(gè)噪聲水平值中的至少一個(gè)小于所述相關(guān)聯(lián)的噪聲水平閾值時(shí),將所述音頻信號(hào)識(shí)別為音樂音頻信號(hào)。識(shí)別所述音頻信號(hào)可以進(jìn)一步使得所述裝置至少執(zhí)行當(dāng)所述信號(hào)識(shí)別值等于或大于所述信號(hào)識(shí)別閾值,和/或所述至少一個(gè)噪聲水平值全部等于或大于所述相關(guān)聯(lián)的噪聲水平閾值時(shí),將所述音頻信號(hào)識(shí)別為話音音頻信號(hào)。確定所述信號(hào)識(shí)別值可以使得所述裝置至少執(zhí)行對(duì)所述音頻信號(hào)采樣值進(jìn)行低通濾波;確定經(jīng)低通濾波的音頻信號(hào)值的至少兩個(gè)均方根值;從所述均方根值中選擇最大均方根值和最小均方根值;確定所述最大均方根值和所述最小均方根值的比率;以及對(duì)所述最大均方根值和所述最小均方根值的比率進(jìn)行低通濾波。所述至少一個(gè)處理器和至少一個(gè)存儲(chǔ)器可以進(jìn)一步使得所述裝置至少執(zhí)行確定所述最小均方根值小于信號(hào)水平閾值;以及取決于確定所述最小均方根值小于信號(hào)水平閾值而丟棄所述最大均方根值和所述最小均方根值的所確定的比率。確定所述音頻信號(hào)的所述至少一個(gè)噪聲水平值中的一個(gè)可以使得所述裝置至少執(zhí)行對(duì)所述音頻信號(hào)采樣值進(jìn)行高通濾波;確定經(jīng)高通濾波的音頻信號(hào)值的至少兩個(gè)均方根值;從所述均方根值中選擇最小均方根值;以及對(duì)來自所述均方根值的最小均方根值進(jìn)行低通濾波以確定所述音頻信號(hào)的所述至少一個(gè)噪聲水平中的一個(gè)。確定所述音頻信號(hào)的所述至少一個(gè)噪聲水平值中的第二個(gè)可以使得該裝置至少執(zhí)行對(duì)所述音頻信號(hào)采樣值進(jìn)行高通濾波;確定經(jīng)高通濾波的音頻信號(hào)值的至少兩個(gè)均方根值;從經(jīng)所述高通濾波的音頻信號(hào)值的均方根值中選擇最小均方根值;對(duì)來自經(jīng)所述高通濾波的音頻信號(hào)值的均方根值的最小均方根值進(jìn)行低通濾波;對(duì)所述音頻信號(hào)采樣值進(jìn)行低通濾波;確定經(jīng)所述低通濾波的音頻信號(hào)值的至少兩個(gè)均方根值;從經(jīng)所述低通濾波的音頻信號(hào)值的均方根值中選擇最小均方根值;對(duì)來自經(jīng)所述低通濾波的音頻信號(hào)值的最小均方根值進(jìn)行低通濾波;確定經(jīng)所述低通濾波的來自經(jīng)所述低通濾波和經(jīng)高通濾波的音頻信號(hào)的最小均方根值的比率;以及將所述音頻信號(hào)的所述至少一個(gè)噪聲水平值中的第二個(gè)確定為經(jīng)所述低通濾波的來自經(jīng)所述低通濾波和經(jīng)高通濾波的音頻信號(hào)的最小均方根值的比率或經(jīng)低通濾波的最小均方根值的先前的比率。所述至少一個(gè)處理器和至少一個(gè)存儲(chǔ)器可以進(jìn)一步使得所述裝置至少執(zhí)行緩沖經(jīng)所述低通濾波的音頻信號(hào)值的所述至少兩個(gè)均方根值。所述至少一個(gè)處理器和至少一個(gè)存儲(chǔ)器可以進(jìn)一步使得所述裝置至少執(zhí)行重置緩沖的值。所述至少一個(gè)處理器和至少一個(gè)存儲(chǔ)器可以進(jìn)一步使得所述裝置至少執(zhí)行緩沖經(jīng)所述高通濾波的音頻信號(hào)值的所述至少兩個(gè)均方根值。所述至少一個(gè)處理器和至少一個(gè)存儲(chǔ)器可以進(jìn)一步使得所述裝置至少執(zhí)行重置緩沖的值。
      所述至少一個(gè)處理器和至少一個(gè)存儲(chǔ)器可以進(jìn)一步使得所述裝置至少執(zhí)行取決于所述識(shí)別而解碼所述音頻信號(hào)。所述至少一個(gè)處理器和至少一個(gè)存儲(chǔ)器可以進(jìn)一步使得所述裝置至少執(zhí)行取決于所述識(shí)別而從音樂庫中選擇要播放的音樂。所述至少一個(gè)處理器和至少一個(gè)存儲(chǔ)器可以進(jìn)一步使得所述裝置至少執(zhí)行取決于所述識(shí)別而實(shí)施話音到文本應(yīng)用。根據(jù)本發(fā)明的第三方面,提供了一種裝置,其包括信號(hào)參數(shù)估計(jì)器,被配置為確定音頻信號(hào)的信號(hào)識(shí)別值;噪聲水平估計(jì)器,被配置為確定所述音頻信號(hào)的至少一個(gè)噪聲水平值;以及信號(hào)分類器,被配置為取決于將所述信號(hào)識(shí)別值與信號(hào)識(shí)別閾值比較以及將所述至少一個(gè)噪聲水平值中的每個(gè)與相關(guān)聯(lián)的噪聲水平閾值比較來識(shí)別所述音頻信號(hào)。所述信號(hào)分類器優(yōu)選地被配置為當(dāng)所述信號(hào)識(shí)別值小于所述信號(hào)識(shí)別閾值、并且所述至少一個(gè)噪聲水平值中的至少一個(gè)小于所述相關(guān)聯(lián)的噪聲水平閾值時(shí),將所述音頻信號(hào)識(shí)別為音樂音頻信號(hào)。所述信號(hào)分類器優(yōu)選地進(jìn)一步被配置為當(dāng)所述信號(hào)識(shí)別值等于或大于所述信號(hào)識(shí)別閾值和/或所述至少一個(gè)噪聲水平值全部等于或大于所述相關(guān)聯(lián)的噪聲水平閾值時(shí), 將所述音頻信號(hào)識(shí)別為話音音頻信號(hào)。所述信號(hào)參數(shù)估計(jì)器可以包括低通濾波器,被配置為對(duì)所述音頻信號(hào)采樣值進(jìn)行低通濾波;信號(hào)處理器,被配置為確定經(jīng)低通濾波的音頻信號(hào)值的至少兩個(gè)均方根值; 至少一個(gè)選擇器,被配置為從所述均方根值中選擇最大均方根值和最小均方根值;比率計(jì)算器,被配置為確定所述最大均方根值和所述最小均方根值的比率;以及進(jìn)一步的低通濾波器,被配置為對(duì)所述最大均方根值和所述最小均方根值的比率進(jìn)行低通濾波。所述信號(hào)參數(shù)估計(jì)器可以進(jìn)一步包括開關(guān),被配置為取決于確定所述最小均方根值小于信號(hào)水平閾值而丟棄所述最大均方根值和所述最小均方根值的所確定的比率。所述噪聲水平估計(jì)器可以包括高通濾波器,被配置為對(duì)所述音頻信號(hào)采樣值進(jìn)行高通濾波;信號(hào)處理器,被配置為確定經(jīng)高通濾波的音頻信號(hào)值的至少兩個(gè)均方根值; 選擇器,被配置為從所述均方根值選擇最小均方根值;以及低通濾波器,被配置為對(duì)來自所述均方根值的最小均方根值進(jìn)行低通濾波以確定所述音頻信號(hào)的所述至少一個(gè)噪聲水平中的一個(gè)。所述噪聲水平估計(jì)器可以進(jìn)一步包括低通濾波器,被配置為對(duì)來自所述信號(hào)參數(shù)估計(jì)器至少一個(gè)選擇器的最小均方根值進(jìn)行低通濾波;比率估計(jì)器,被配置為確定經(jīng)低通濾波的來自所述信號(hào)參數(shù)估計(jì)器至少一個(gè)選擇器以及來自所述噪聲水平估計(jì)器選擇器的最小均方根值的比率;以及開關(guān),被配置為作為所述至少一個(gè)噪聲水平值中的第二個(gè)而輸出由所述比率估計(jì)器所確定的比率或歷史比率值。所述開關(guān)優(yōu)選地被配置為當(dāng)由所述比率確定器所確定的比率大于所述歷史比率值并且所述音頻信號(hào)的所述至少一個(gè)噪聲水平值中的所述一個(gè)大于相關(guān)聯(lián)的閾值時(shí),在所述至少一個(gè)噪聲水平值中的第二個(gè)輸出由所述比率值所確定的比率。所述噪聲水平估計(jì)器可以進(jìn)一步包括緩沖器,被配置為接收所述開關(guān)的輸出; 以及增益,被配置為向所述緩沖器的輸出應(yīng)用增益以生成所述歷史比率值。所述信號(hào)參數(shù)估計(jì)器可以進(jìn)一步包括至少一個(gè)緩沖器,被配置為緩沖經(jīng)所述低通濾波的音頻信號(hào)值的所述至少兩個(gè)均方根值。該裝置可以進(jìn)一步包括緩沖控制器,其被配置為重置緩沖的值。所述噪聲水平估計(jì)器可以進(jìn)一步包括至少一個(gè)緩沖器,其被配置為緩沖經(jīng)所述高通濾波的音頻信號(hào)值的所述至少兩個(gè)均方根值。該裝置可以進(jìn)一步包括進(jìn)一步的緩沖控制器,其被配置為重置所述噪聲水平估計(jì)器緩沖器緩沖的值。該裝置可以進(jìn)一步包括解碼器,其被配置為取決于所述信號(hào)分類器而解碼所述音頻信號(hào)。該裝置可以進(jìn)一步包括處理器,其被配置為取決于所述信號(hào)分類器而從音樂庫中選擇要播放的音樂。該裝置可以進(jìn)一步包括處理器,其被配置為取決于所述信號(hào)分類器而實(shí)施話音到文本應(yīng)用。根據(jù)本發(fā)明的第四方面,提供了一種用指令編碼的計(jì)算機(jī)可讀介質(zhì),所述指令當(dāng)被計(jì)算機(jī)執(zhí)行時(shí),執(zhí)行確定音頻信號(hào)的信號(hào)識(shí)別值;確定所述音頻信號(hào)的至少一個(gè)噪聲水平值;將所述信號(hào)識(shí)別值與信號(hào)識(shí)別閾值比較,并且將所述至少一個(gè)噪聲水平值中的每個(gè)與相關(guān)聯(lián)的噪聲水平閾值比較;以及取決于所述比較來識(shí)別所述音頻信號(hào)。根據(jù)本發(fā)明的第五方面,提供了一種設(shè)備,其包括用于確定音頻信號(hào)的信號(hào)識(shí)別值的裝置;用于確定所述音頻信號(hào)的至少一個(gè)噪聲水平值的裝置;用于將所述信號(hào)識(shí)別值與信號(hào)識(shí)別閾值比較并且將所述至少一個(gè)噪聲水平值中的每個(gè)與相關(guān)聯(lián)的噪聲水平閾值比較的裝置;以及用于取決于所述比較來識(shí)別所述音頻信號(hào)的裝置。一種電子設(shè)備可以包括如上所述的裝置。一種芯片組可以包括如上所述的裝置。


      為了更好地理解本發(fā)明,現(xiàn)在以示例的方式參考以下附圖圖1示意性地示出了采用本申請(qǐng)的一些實(shí)施例的電子設(shè)備;圖2示意性地示出了根據(jù)本申請(qǐng)的一些實(shí)施例的合適的裝置;以及圖3示出了圖2中所示的識(shí)別和噪聲水平估計(jì)裝置的操作的流程圖。
      具體實(shí)施例方式以下更詳細(xì)地描述了用于提供識(shí)別或分類所接收的下行鏈路音頻信號(hào)為包含話音還是音樂的合適的裝置和可能的機(jī)制。就此而言,首先參考圖1,其示出了示例性裝置或電子設(shè)備10的示意框圖,該示例性裝置或電子設(shè)備10從經(jīng)低通濾波的信號(hào)識(shí)別若干幀內(nèi)的最大和最小均方根(RMS)值。在這樣的裝置中,為了改進(jìn)噪聲方面的魯棒性,實(shí)施用于檢測(cè)噪聲導(dǎo)致識(shí)別不可能的情況的背景噪聲估計(jì)器。這樣描述的裝置可以具有三個(gè)主要優(yōu)點(diǎn)。首先,該裝置可以將目標(biāo)定在使話音優(yōu)先從而產(chǎn)生低誤報(bào)音樂檢測(cè)。其次,可以操作該裝置以考慮到噪聲水平。第三,由于該方案和實(shí)施該方案所需的裝置的相對(duì)的簡(jiǎn)單性和低復(fù)雜度,可以將該裝置實(shí)施到用戶設(shè)備中。在一些實(shí)施例中,電子設(shè)備10可以是無線通信系統(tǒng)的移動(dòng)終端或用戶設(shè)備。
      在一些實(shí)施例中,電子設(shè)備10包括麥克風(fēng)11,該麥克風(fēng)11經(jīng)由模數(shù)轉(zhuǎn)換器 (ADC) 14鏈接到處理器21。在一些實(shí)施例中,處理器21進(jìn)一步經(jīng)由數(shù)模(DAC)轉(zhuǎn)換器32 鏈接到揚(yáng)聲器33。在一些實(shí)施例中,處理器21進(jìn)一步鏈接到收發(fā)器(TX/RX)13、鏈接到用戶接口(UI) 15、以及鏈接到存儲(chǔ)器22。在一些實(shí)施例中,處理器21可以被配置為執(zhí)行多種程序代碼。在一些實(shí)施例中, 所實(shí)施的程序代碼可以包括編碼代碼例程。在一些實(shí)施例中,所實(shí)施的程序代碼23可以進(jìn)一步包括音頻解碼代碼。此外,在一些實(shí)施例中,所實(shí)施的程序代碼可以包括分類代碼例程。所實(shí)施的程序代碼23例如可以存儲(chǔ)在存儲(chǔ)器22中以供處理器21在需要時(shí)獲取。存儲(chǔ)器22可以進(jìn)一步提供部分M以供存儲(chǔ)數(shù)據(jù)。在一些實(shí)施例中,用戶接口 15可以使得用戶能夠例如經(jīng)由鍵盤向電子設(shè)備10輸入命令,和/或例如經(jīng)由顯示器從電子設(shè)備10獲得信息。在一些實(shí)施例中,收發(fā)器13使得能夠進(jìn)行例如經(jīng)由無線通信網(wǎng)絡(luò)的與其他電子設(shè)備的通信。在一些實(shí)施例中,收發(fā)器13可以被配置為通過有線連接與其他電子設(shè)備通信。再次將理解,電子設(shè)備10的結(jié)構(gòu)可以以許多方式補(bǔ)充和改變。在一些實(shí)施例中,電子設(shè)備10的用戶可以使用麥克風(fēng)11以輸入要發(fā)送到一些其他電子設(shè)備、或要存儲(chǔ)在存儲(chǔ)器22的數(shù)據(jù)部分M中的話音或其他聲音信號(hào)。在一些實(shí)施例中,可以由用戶經(jīng)由用戶接口 15為此激活對(duì)應(yīng)的應(yīng)用。可以由處理器21運(yùn)行的該應(yīng)用使得處理器21執(zhí)行存儲(chǔ)在存儲(chǔ)器22中的編碼代碼。在一些實(shí)施例中,模數(shù)轉(zhuǎn)換器14可以將輸入模擬音頻信號(hào)轉(zhuǎn)換為數(shù)字音頻信號(hào), 并且向處理器21提供該數(shù)字音頻信號(hào)。在一些實(shí)施例中,收發(fā)器13可以接收比特流以供發(fā)送到另一電子設(shè)備。備選地, 經(jīng)編碼數(shù)據(jù)可以存儲(chǔ)在存儲(chǔ)器22的數(shù)據(jù)部分M中,例如供隨后的發(fā)送或供由相同的電子設(shè)備10進(jìn)行的隨后的展示。在一些實(shí)施例中,處理器21也可以被配置為使用存儲(chǔ)在存儲(chǔ)器22中的分類代碼, 根據(jù)話音/音樂音頻分類來分類或識(shí)別數(shù)字音頻信號(hào)。在一些實(shí)施例中,電子設(shè)備10還可以經(jīng)由收發(fā)器13從諸如基站之類的另一電子設(shè)備接收具有對(duì)應(yīng)經(jīng)編碼數(shù)據(jù)的比特流。在該情況下,在一些實(shí)施例中,處理器21可以執(zhí)行存儲(chǔ)在存儲(chǔ)器22中的解碼程序代碼以解碼所接收的數(shù)據(jù),并且向本申請(qǐng)后面將更詳細(xì)描述的話音/音樂音頻分類過程提供經(jīng)解碼的數(shù)據(jù)。在一些實(shí)施例中,處理器可以在執(zhí)行解碼過程之前應(yīng)用話音/音樂音頻分類過程,其中解碼過程至少部分取決于分類過程的結(jié)果來確定。此外,在一些實(shí)施例中,處理器可以向數(shù)模轉(zhuǎn)換器32提供經(jīng)解碼的數(shù)據(jù)。在一些實(shí)施例中,數(shù)模轉(zhuǎn)換器32可以將數(shù)字的經(jīng)解碼的數(shù)據(jù)轉(zhuǎn)換為模擬音頻數(shù)據(jù),并且向揚(yáng)聲器 33輸出模擬信號(hào)。解碼程序代碼的執(zhí)行也可以由已經(jīng)由用戶經(jīng)由用戶接口 15調(diào)用的應(yīng)用觸發(fā)。在一些實(shí)施例中,揚(yáng)聲器33可以由頭戴式耳機(jī)組件補(bǔ)充或替換,該頭戴式耳機(jī)組件可以例如通過經(jīng)由收發(fā)器13通信的藍(lán)牙簡(jiǎn)檔與電子設(shè)備10或裝置無線地通信,或使用傳統(tǒng)有線連接通信。將理解,圖2中所描述的示意性結(jié)構(gòu)和圖3中的方法步驟僅僅表示示例性地示出為實(shí)施在圖1所示的電子設(shè)備中的用戶設(shè)備的操作的一部分。參考圖2,示出了適合于執(zhí)行本發(fā)明的一些實(shí)施例的操作的裝置。該裝置包括在一些實(shí)施例中被配置為接收音頻信號(hào)并且產(chǎn)生信號(hào)識(shí)別值的識(shí)別器201、在一些實(shí)施例中被配置為還接收音頻信號(hào)并且產(chǎn)生噪聲水平的估計(jì)的噪聲水平估計(jì)器203、以及在一些實(shí)施例中被配置為接收識(shí)別器201和噪聲水平估計(jì)器203的輸出并且確定就音頻信號(hào)是音樂還是話音而言的音頻信號(hào)的分類的話音/音樂檢測(cè)器。在一些實(shí)施例中,識(shí)別器201、噪聲水平估計(jì)器203和話音/音樂檢測(cè)器207表示位于相同或不同的芯片組中的、被配置為執(zhí)行如下所述的過程的處理器。備選地,處理器21被配置為執(zhí)行全部過程,并且圖2例示了根據(jù)本申請(qǐng)的一些實(shí)施例的音頻信號(hào)的分析和分類。在一些實(shí)施例中,識(shí)別器201可以包括第一低通濾波器(LPF1)211,其被配置為接收音頻信號(hào)的采樣。在圖3中由步驟301示出了在識(shí)別器處接收信號(hào)采樣的操作。第一低通濾波器211可以取決于實(shí)施例利用合適的滾降頻率和滾降梯度來配置, 以通過去除音頻信號(hào)的高頻成分來改進(jìn)識(shí)別器201的噪聲容限。低通濾波器211的輸出被傳遞到幀均方根(RMS)計(jì)算器213。在圖3中由步驟303示出了向信號(hào)采樣應(yīng)用低通濾波的操作。在一些實(shí)施例中,識(shí)別器201還包括幀均方根計(jì)算器213。幀均方根(RMS)計(jì)算器 213接收經(jīng)低通濾波音頻信號(hào)采樣并且對(duì)于幀計(jì)算均方根值。在一些實(shí)施例中,RMS計(jì)算器可以使用以下方程計(jì)算幀采樣值的RMS值
      權(quán)利要求
      1.一種方法,包括 確定音頻信號(hào)的信號(hào)識(shí)別值;確定所述音頻信號(hào)的至少一個(gè)噪聲水平值;將所述信號(hào)識(shí)別值與信號(hào)識(shí)別閾值比較,并且將所述至少一個(gè)噪聲水平值中的每個(gè)與相關(guān)聯(lián)的噪聲水平閾值比較;以及取決于所述比較來識(shí)別所述音頻信號(hào)。
      2.如權(quán)利要求1所述的方法,其中識(shí)別所述音頻信號(hào)包括當(dāng)所述信號(hào)識(shí)別值小于所述信號(hào)識(shí)別閾值、并且所述至少一個(gè)噪聲水平值中的至少一個(gè)小于所述相關(guān)聯(lián)的噪聲水平閾值時(shí),將所述音頻信號(hào)識(shí)別為音樂音頻信號(hào)。
      3.如權(quán)利要求2所述的方法,其中識(shí)別所述音頻信號(hào)進(jìn)一步包括當(dāng)所述信號(hào)識(shí)別值等于或大于所述信號(hào)識(shí)別閾值,和/或所述至少一個(gè)噪聲水平值全部等于或大于所述相關(guān)聯(lián)的噪聲水平閾值時(shí),將所述音頻信號(hào)識(shí)別為話音音頻信號(hào)。
      4.如權(quán)利要求1至3所述的方法,其中確定所述信號(hào)識(shí)別值包括 對(duì)所述音頻信號(hào)采樣值進(jìn)行低通濾波;確定經(jīng)所述低通濾波的音頻信號(hào)值的至少兩個(gè)均方根值; 從所述均方根值中選擇最大均方根值和最小均方根值; 確定所述最大均方根值和所述最小均方根值的比率;以及對(duì)所述最大均方根值和所述最小均方根值的比率進(jìn)行低通濾波。
      5.如權(quán)利要求4所述的方法,進(jìn)一步包括 確定所述最小均方根值小于信號(hào)水平閾值;以及取決于確定所述最小均方根值小于信號(hào)水平閾值而丟棄所述最大均方根值和所述最小均方根值的所確定的比率。
      6.如權(quán)利要求4和5所述的方法,其中確定所述音頻信號(hào)的所述至少一個(gè)噪聲水平值中的一個(gè)包括對(duì)所述音頻信號(hào)采樣值進(jìn)行高通濾波; 確定經(jīng)高通濾波的音頻信號(hào)值的至少兩個(gè)均方根值; 從所述均方根值中選擇最小均方根值;以及對(duì)來自所述均方根值的所述最小均方根值進(jìn)行低通濾波以確定所述音頻信號(hào)的所述至少一個(gè)噪聲水平中的一個(gè)。
      7.如權(quán)利要求6所述的方法,其中確定所述音頻信號(hào)的所述至少一個(gè)噪聲水平值中的第二個(gè)包括對(duì)所述音頻信號(hào)采樣值進(jìn)行高通濾波;確定經(jīng)高通濾波的音頻信號(hào)值的至少兩個(gè)均方根值;從經(jīng)所述高通濾波的音頻信號(hào)值的均方根值中選擇最小均方根值;對(duì)來自經(jīng)所述高通濾波的音頻信號(hào)值的均方根值的所述最小均方根值進(jìn)行低通濾波;對(duì)所述音頻信號(hào)采樣值進(jìn)行低通濾波; 確定經(jīng)所述低通濾波的音頻信號(hào)值的至少兩個(gè)均方根值; 從經(jīng)所述低通濾波的音頻信號(hào)值的均方根值中選擇最小均方根值;對(duì)來自經(jīng)所述低通濾波的音頻信號(hào)值的所述最小均方根值進(jìn)行低通濾波; 確定經(jīng)所述低通濾波的來自經(jīng)所述低通濾波和經(jīng)所述高通濾波的音頻信號(hào)的最小均方根值的比率;以及將所述音頻信號(hào)的所述至少一個(gè)噪聲水平值中的第二個(gè)確定為經(jīng)所述低通濾波的來自經(jīng)所述低通濾波和經(jīng)高通濾波的音頻信號(hào)的最小均方根值的比率或經(jīng)所述低通濾波的最小均方根值的先前的比率。
      8.如權(quán)利要求4至7所述的方法,進(jìn)一步包括緩沖經(jīng)所述低通濾波的音頻信號(hào)值的所述至少兩個(gè)均方根值。
      9.如權(quán)利要求7所述的方法,進(jìn)一步包括緩沖經(jīng)所述高通濾波的音頻信號(hào)值的所述至少兩個(gè)均方根值。
      10.一種裝置,其包括至少一個(gè)處理器和包括計(jì)算機(jī)程序代碼的至少一個(gè)存儲(chǔ)器,所述至少一個(gè)存儲(chǔ)器和所述計(jì)算機(jī)程序代碼被配置為與所述至少一個(gè)處理器一同使得所述裝置至少執(zhí)行確定音頻信號(hào)的信號(hào)識(shí)別值;確定所述音頻信號(hào)的至少一個(gè)噪聲水平值;將所述信號(hào)識(shí)別值與信號(hào)識(shí)別閾值比較,并且將所述至少一個(gè)噪聲水平值中的每個(gè)與相關(guān)聯(lián)的噪聲水平閾值比較;以及取決于所述比較來識(shí)別所述音頻信號(hào)。
      11.如權(quán)利要求10所述的裝置,其中識(shí)別所述音頻信號(hào)使得所述裝置至少執(zhí)行當(dāng)所述信號(hào)識(shí)別值小于所述信號(hào)識(shí)別閾值、并且所述至少一個(gè)噪聲水平值中的至少一個(gè)小于所述相關(guān)聯(lián)的噪聲水平閾值時(shí),將所述音頻信號(hào)識(shí)別為音樂音頻信號(hào)。
      12.如權(quán)利要求11所述的裝置,其中識(shí)別所述音頻信號(hào)進(jìn)一步使得所述裝置至少執(zhí)行當(dāng)所述信號(hào)識(shí)別值等于或大于所述信號(hào)識(shí)別閾值,和/或所述至少一個(gè)噪聲水平值全部等于或大于所述相關(guān)聯(lián)的噪聲水平閾值時(shí),將所述音頻信號(hào)識(shí)別為話音音頻信號(hào)。
      13.如權(quán)利要求10至12所述的裝置,其中確定所述信號(hào)識(shí)別值使得所述裝置至少執(zhí)行對(duì)所述音頻信號(hào)采樣值進(jìn)行低通濾波; 確定經(jīng)所述低通濾波的音頻信號(hào)值的至少兩個(gè)均方根值; 從所述均方根值中選擇最大均方根值和最小均方根值; 確定所述最大均方根值和所述最小均方根值的比率;以及對(duì)所述最大均方根值和所述最小均方根值的比率進(jìn)行低通濾波。
      14.如權(quán)利要求13所述的裝置,所述至少一個(gè)處理器和至少一個(gè)存儲(chǔ)器進(jìn)一步使得所述裝置至少執(zhí)行確定所述最小均方根值小于信號(hào)水平閾值;以及取決于確定所述最小均方根值小于信號(hào)水平閾值而丟棄所述最大均方根值和所述最小均方根值的所確定的比率。
      15.如權(quán)利要求13所述的裝置,其中確定所述音頻信號(hào)的所述至少一個(gè)噪聲水平值中的一個(gè)使得所述裝置至少執(zhí)行對(duì)所述音頻信號(hào)采樣值進(jìn)行高通濾波;確定經(jīng)高通濾波的音頻信號(hào)值的至少兩個(gè)均方根值; 從所述均方根值中選擇最小均方根值;以及對(duì)來自所述均方根值的所述最小均方根值進(jìn)行低通濾波以確定所述音頻信號(hào)的所述至少一個(gè)噪聲水平中的一個(gè)。
      16.如權(quán)利要求15所述的裝置,其中確定所述音頻信號(hào)的所述至少一個(gè)噪聲水平值中的第二個(gè)使得該裝置至少執(zhí)行對(duì)所述音頻信號(hào)采樣值進(jìn)行高通濾波;確定經(jīng)高通濾波的音頻信號(hào)值的至少兩個(gè)均方根值;從經(jīng)所述高通濾波的音頻信號(hào)值的均方根值中選擇最小均方根值;對(duì)來自經(jīng)所述高通濾波的音頻信號(hào)值的均方根值的所述最小均方根值進(jìn)行低通濾波;對(duì)所述音頻信號(hào)采樣值進(jìn)行低通濾波; 確定經(jīng)所述低通濾波的音頻信號(hào)值的至少兩個(gè)均方根值; 從經(jīng)所述低通濾波的音頻信號(hào)值的均方根值中選擇最小均方根值; 對(duì)來自經(jīng)所述低通濾波的音頻信號(hào)值的所述最小均方根值進(jìn)行低通濾波; 確定經(jīng)所述低通濾波的來自經(jīng)所述低通濾波和經(jīng)所述高通濾波的音頻信號(hào)的最小均方根值的比率;以及將所述音頻信號(hào)的所述至少一個(gè)噪聲水平值中的第二個(gè)確定為經(jīng)所述低通濾波的來自經(jīng)所述低通濾波和經(jīng)高通濾波音頻信號(hào)的最小均方根值的比率或經(jīng)所述低通濾波的最小均方根值的先前的比率。
      17.如權(quán)利要求13至16所述的裝置,所述至少一個(gè)處理器和至少一個(gè)存儲(chǔ)器進(jìn)一步使得所述裝置至少執(zhí)行緩沖經(jīng)所述低通濾波的音頻信號(hào)值的所述至少兩個(gè)均方根值。
      18.如權(quán)利要求16所述的裝置,所述至少一個(gè)處理器和至少一個(gè)存儲(chǔ)器進(jìn)一步使得該裝置至少執(zhí)行緩沖經(jīng)所述高通濾波的音頻信號(hào)值的所述至少兩個(gè)均方根值。
      19.一種裝置,包括信號(hào)參數(shù)估計(jì)器,被配置為確定音頻信號(hào)的信號(hào)識(shí)別值; 噪聲水平估計(jì)器,被配置為確定所述音頻信號(hào)的至少一個(gè)噪聲水平值;以及信號(hào)分類器,被配置為取決于將所述信號(hào)識(shí)別值與信號(hào)識(shí)別閾值比較以及將所述至少一個(gè)噪聲水平值中的每個(gè)與相關(guān)聯(lián)的噪聲水平閾值比較來識(shí)別所述音頻信號(hào)。
      20.如權(quán)利要求19所述的裝置,其中所述信號(hào)分類器被配置為當(dāng)所述信號(hào)識(shí)別值小于所述信號(hào)識(shí)別閾值、并且所述至少一個(gè)噪聲水平值中的至少一個(gè)小于所述相關(guān)聯(lián)的噪聲水平閾值時(shí),將所述音頻信號(hào)識(shí)別為音樂音頻信號(hào)。
      21.如權(quán)利要求20所述的裝置,其中所述信號(hào)分類器進(jìn)一步被配置為當(dāng)所述信號(hào)識(shí)別值等于或大于所述信號(hào)識(shí)別閾值,和/或所述至少一個(gè)噪聲水平值全部等于或大于所述相關(guān)聯(lián)的噪聲水平閾值時(shí),將所述音頻信號(hào)識(shí)別為話音音頻信號(hào)。
      22.如權(quán)利要求19至21所述的裝置,其中所述信號(hào)參數(shù)估計(jì)器包括 低通濾波器,被配置為對(duì)所述音頻信號(hào)采樣值進(jìn)行低通濾波;信號(hào)處理器,被配置為確定經(jīng)低通濾波的音頻信號(hào)值的至少兩個(gè)均方根值; 至少一個(gè)選擇器,被配置為從所述均方根值中選擇最大均方根值和最小均方根值;比率計(jì)算器,被配置為確定所述最大均方根值和所述最小均方根值的比率;以及進(jìn)一步的低通濾波器,其被配置為對(duì)所述最大均方根值和所述最小均方根值的比率進(jìn)行低通濾波。
      23.如權(quán)利要求22所述的裝置,其中所述信號(hào)參數(shù)估計(jì)器進(jìn)一步包括開關(guān),被配置為取決于確定所述最小均方根值小于信號(hào)水平閾值而丟棄所述最大均方根值和所述最小均方根值的所確定的比率。
      24.如權(quán)利要求22所述的裝置,其中所述噪聲水平估計(jì)器包括高通濾波器,被配置為對(duì)所述音頻信號(hào)采樣值進(jìn)行高通濾波;信號(hào)處理器,被配置為確定經(jīng)高通濾波的音頻信號(hào)值的至少兩個(gè)均方根值;選擇器,被配置為從所述均方根值中選擇最小均方根值;以及低通濾波器,對(duì)來自所述均方根值的所述最小均方根值進(jìn)行低通濾波以確定所述音頻信號(hào)的所述至少一個(gè)噪聲水平中的一個(gè)。
      25.如權(quán)利要求M所述的裝置,其中所述噪聲水平估計(jì)器進(jìn)一步包括低通濾波器,被配置為對(duì)來自所述信號(hào)參數(shù)估計(jì)器至少一個(gè)選擇器的最小均方根值進(jìn)行低通濾波;比率估計(jì)器,被配置為確定經(jīng)低通濾波的來自所述信號(hào)參數(shù)估計(jì)器至少一個(gè)選擇器以及來自所述噪聲水平估計(jì)器選擇器的最小均方根值的比率;以及開關(guān),被配置為作為所述至少一個(gè)噪聲水平值中的第二個(gè)而輸出由所述比率估計(jì)器所確定的比率或歷史比率值。
      26.如權(quán)利要求25所述的裝置,其中所述開關(guān)被配置為當(dāng)由所述比率確定器所確定的比率大于所述歷史比率值并且所述音頻信號(hào)的所述至少一個(gè)噪聲水平值中的所述一個(gè)大于相關(guān)聯(lián)的閾值時(shí),在所述至少一個(gè)噪聲水平值中的第二個(gè)輸出由所述比率值所確定的比率。
      27.如權(quán)利要求25和沈所述的裝置,其中所述噪聲水平估計(jì)器進(jìn)一步包括緩沖器, 被配置為接收所述開關(guān)的輸出;以及增益,其被配置為向所述緩沖器的輸出應(yīng)用增益以生成所述歷史比率值。
      28.如權(quán)利要求22至27所述的裝置,其中所述信號(hào)參數(shù)估計(jì)器進(jìn)一步包括至少一個(gè)緩沖器,其被配置為緩沖經(jīng)所述低通濾波的音頻信號(hào)值的所述至少兩個(gè)均方根值。
      29.如權(quán)利要求M至27所述的裝置,其中所述噪聲水平估計(jì)器進(jìn)一步包括至少一個(gè)緩沖器,其被配置為緩沖經(jīng)所述高通濾波的音頻信號(hào)值的所述至少兩個(gè)均方根值。
      全文摘要
      一種裝置,其包括至少一個(gè)處理器和包括計(jì)算機(jī)程序代碼的至少一個(gè)存儲(chǔ)器,所述至少一個(gè)存儲(chǔ)器和所述計(jì)算機(jī)程序代碼被配置為與所述至少一個(gè)處理器一同使得該裝置至少執(zhí)行確定音頻信號(hào)的信號(hào)識(shí)別值;確定所述音頻信號(hào)的至少一個(gè)噪聲水平值;將所述信號(hào)識(shí)別值與信號(hào)識(shí)別閾值比較,并且將所述至少一個(gè)噪聲水平值中的每個(gè)與相關(guān)聯(lián)的噪聲水平閾值比較;以及取決于所述比較來識(shí)別所述音頻信號(hào)。
      文檔編號(hào)G10L25/78GK102498514SQ200980161483
      公開日2012年6月13日 申請(qǐng)日期2009年8月4日 優(yōu)先權(quán)日2009年8月4日
      發(fā)明者J·V·T·勞哈拉 申請(qǐng)人:諾基亞公司
      網(wǎng)友詢問留言 已有0條留言
      • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
      1