国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      音調(diào)頻率估計裝置以及音調(diào)頻率估計方法

      文檔序號:2829172閱讀:340來源:國知局
      專利名稱:音調(diào)頻率估計裝置以及音調(diào)頻率估計方法
      技術(shù)領(lǐng)域
      本發(fā)明涉及音調(diào)頻率估計裝置以及音調(diào)頻率估計方法,特別涉及在頻域進(jìn)行音調(diào)頻率估計的音調(diào)頻率估計裝置以及音調(diào)頻率估計方法。
      背景技術(shù)
      一般來講,作為在時域或頻域估計語音的音調(diào)頻率的方法,有為眾所知的自相關(guān)法和修正的相關(guān)法(modified correlation)等,所述自相關(guān)法是根據(jù)語音波形的自相關(guān)函數(shù)的方法,而所述修正的相關(guān)法是根據(jù)LPC(LinearPredictive Coding,線性預(yù)測編碼)分析的殘差信號的自相關(guān)函數(shù)的方法。
      另外,在頻域進(jìn)行噪聲抑制和語音編碼等語音處理的情況下,有時通過在頻域估計音調(diào)頻率,匹配性(consistency)會得到改善。作為在頻域的音調(diào)頻率估計方法,有通過對頻譜的自相關(guān)函數(shù)最大化來計算音調(diào)頻率的方法,其一般式如下式(1)所示。該式中,將使自相關(guān)函數(shù)R(i)最大的音調(diào)頻率候補(bǔ)(candidate)i作為估計音調(diào)頻率。
      式1R(i)=&Sigma;kP(k)&CenterDot;P(k+i)pMIN&le;i&le;pMAX...(1)]]>其中,k為離散頻率分量,P(k)為音調(diào)諧波頻譜的功率,PMIN和PMAX分別為音調(diào)頻率候補(bǔ)i的最小值和最大值。
      可是,頻域中的使用自相關(guān)函數(shù)的音調(diào)頻率估計方法,由于語音信號的共振峰(formant)的影響,有時會錯誤地計算音調(diào)頻率的倍數(shù)(倍音調(diào)頻率誤差)。
      作為降低共振峰的影響而進(jìn)行音調(diào)頻率估計的以往的方法,有例如非專利文獻(xiàn)1所公開的方法。該方法中,所用的頻譜為使用頻譜包絡(luò)的信息對頻譜進(jìn)行平滑之后的頻譜。
      非專利文獻(xiàn)1″A spectral autocorrelation method for measurement of thefundamental frequency of noise-corrupted speech″,M.Lahat,IEEE Trans.onAcoustics,Speech,and Signal Processing,vol.ASSP-35,no.6,pp.741-750,1987發(fā)明內(nèi)容發(fā)明要解決的問題然而,由于上述以往的音調(diào)頻率估計方法中進(jìn)行頻譜的平滑處理,所以,存在音調(diào)頻率估計所需的運(yùn)算量會增加的問題。
      本發(fā)明旨在提供一種音調(diào)頻率估計裝置以及音調(diào)頻率估計方法,能夠降低音調(diào)頻率估計所需的運(yùn)算量,并能準(zhǔn)確估計音調(diào)頻率。
      解決問題的方案本發(fā)明的音調(diào)頻率估計裝置的結(jié)構(gòu)包括提取單元,用于從語音調(diào)譜中提取音調(diào)諧波頻譜;平均值計算單元,用于相對于多個音調(diào)頻率候補(bǔ)的每一個,計算所述音調(diào)諧波頻譜的功率的平均值;以及估計單元,用于使用所述平均值估計音調(diào)頻率。
      本發(fā)明的音調(diào)頻率估計方法包括提取步驟,用于從語音調(diào)譜中提取音調(diào)諧波頻譜;平均值計算步驟,用于相對于多個音調(diào)頻率候補(bǔ)的每一個,計算所述音調(diào)諧波頻譜的功率的平均值;以及估計步驟,用于使用所述平均值估計音調(diào)頻率。
      本發(fā)明的音調(diào)頻率估計程序使計算機(jī)實現(xiàn)提取步驟,用于從語音調(diào)譜中提取音調(diào)諧波頻譜;平均值計算步驟,用于相對于多個音調(diào)頻率候補(bǔ)的每一個,計算所述音調(diào)諧波頻譜的功率的平均值;以及估計步驟,用于使用所述平均值估計音調(diào)頻率。
      發(fā)明效果根據(jù)本發(fā)明,能夠降低音調(diào)頻率估計所需的運(yùn)算量,并能準(zhǔn)確地估計音調(diào)頻率。


      圖1是表示本發(fā)明的一個實施例所涉及的音調(diào)頻率估計裝置的結(jié)構(gòu)的方框圖;圖2A是表示在本發(fā)明的一個實施例中所提取的語音功率譜的例子的圖;圖2B是在本發(fā)明的一個實施例中,在將乘數(shù)設(shè)為某個值的條件下將平均值與總和值相乘的結(jié)果的圖;以及圖2C是在本發(fā)明的一個實施例中,在將乘數(shù)設(shè)為另外的值的條件下將平均值與總和值相乘的結(jié)果的圖。
      具體實施例方式
      以下,參照附圖詳細(xì)說明本發(fā)明的實施例。
      圖1是表示本發(fā)明的一個實施例所涉及的音調(diào)頻率估計裝置的結(jié)構(gòu)的方框圖。音調(diào)頻率估計裝置100包括海寧窗(hann window)單元101、FFT(FastFourier Transform)單元102、有聲性判定單元103、頻譜提取單元104、頻譜振幅限制單元105、頻譜平均值計算單元106、頻譜加法單元107、乘冪運(yùn)算單元108、乘法單元109以及最大值提取單元110。
      海寧窗單元101,對分割為規(guī)定時間單位的、即幀單位的輸入語音信號,進(jìn)行使用海寧窗口等的窗處理,并將結(jié)果輸出到FFT單元102。
      FFT單元102,對由海寧窗單元101輸入的幀,也就是分割為幀單位的語音信號進(jìn)行FFT,將語音信號變換至頻域。由此得到語音功率譜。于是,幀單位的語音信號就成為具有規(guī)定頻帶的語音功率譜。將如此生成的語音功率譜,輸出到有聲性判定單元103、頻譜提取單元104和頻譜振幅限制單元105。
      有聲性判定單元103判定來自FFT單元102的語音功率譜的有聲性,也就是判定原來的語音信號是有聲還是無聲。判定結(jié)果輸出到頻譜提取單元104。
      在由有聲性判定單元103判定為語音功率譜沒有有聲性時,頻譜提取單元104不進(jìn)行音調(diào)諧波頻譜的提取。由此能夠降低頻譜提取單元104的運(yùn)算量,進(jìn)而能夠降低音調(diào)頻率估計裝置100整體的運(yùn)算量。
      相對于此,在判定為語音功率譜有有聲性時,頻譜提取單元104進(jìn)行音調(diào)諧波頻譜的提取。更具體來講,通過提取語音功率譜中的峰值,進(jìn)行音調(diào)諧波頻譜的提取。
      另外,由頻譜振幅限制單元105進(jìn)行語音功率譜的振幅限制時,頻譜提取單元104將該振幅限制的結(jié)果反映到所提取的音調(diào)諧波頻譜,由此限制音調(diào)諧波頻譜的振幅。這樣,能夠降低共振峰對音調(diào)頻率估計的精確度的影響。音調(diào)諧波頻譜輸出到頻譜平均值計算單元106和頻譜加法單元107。
      頻譜振幅限制單元105對由FFT單元102得到的語音功率譜的振幅進(jìn)行限制,以使其不超過規(guī)定的閾值。語音功率譜的振幅限制的結(jié)果輸出到頻譜提取單元104。
      頻譜平均值計算單元106,相對于多個音調(diào)頻率候補(bǔ)的每一個,計算來自頻譜提取單元104的音調(diào)諧波頻譜的功率平均值。也就是說,在音調(diào)諧波頻譜中,一邊將音調(diào)頻率候補(bǔ)從規(guī)定的最小值漸漸移動到規(guī)定的最大值,一邊對相當(dāng)于音調(diào)頻率候補(bǔ)的整數(shù)倍的頻率分量的功率,進(jìn)行平均值計算。計算出的平均值輸出到乘法單元109。
      另外,頻譜平均值計算單元106在計算平均值時,將與功率的最大值相對應(yīng)的頻率分量,作為在平均值計算的對象頻帶中的基準(zhǔn)頻率。
      具體來講,使用從基準(zhǔn)頻率減去相當(dāng)于音調(diào)頻率候補(bǔ)的整數(shù)倍的頻率而得到的頻率處的功率,以及,對基準(zhǔn)頻率加上相當(dāng)于音調(diào)頻率候補(bǔ)的整數(shù)倍的頻率而得到的頻率處的功率,計算平均值。由此,能夠降低因語音的準(zhǔn)周期特性和噪聲的影響以及音調(diào)頻率估計誤差而產(chǎn)生的音調(diào)諧波中的誤差累積,能夠進(jìn)行更準(zhǔn)確的音調(diào)頻率的估計。
      另外,音調(diào)諧波頻譜的功率平均值為將后述的音調(diào)諧波頻譜的功率的總和值除以特定的值而得到的值。因此,頻譜平均值計算單元106也可以得到由頻譜加法單元107計算的總和值,并使用該總和值進(jìn)行平均值的計算。
      頻譜加法單元107,相對于多個音調(diào)頻率候補(bǔ)的每一個,計算來自頻譜提取單元104的音調(diào)諧波頻譜的功率的總和值。也就是說,在音調(diào)諧波頻譜中,一邊將音調(diào)頻率候補(bǔ)從規(guī)定的最小值漸漸移動到規(guī)定的最大值,一邊對相當(dāng)于音調(diào)頻率候補(bǔ)的整數(shù)倍的頻率分量的功率進(jìn)行相加。接著,將通過功率相加獲得的總和值輸出到乘冪運(yùn)算單元108。
      另外,頻譜加法單元107在進(jìn)行功率的相加時,將與功率的最大值相對應(yīng)的頻率分量,作為在總和值計算的對象頻帶中的基準(zhǔn)頻率。
      具體來講,使用從基準(zhǔn)頻率減去相當(dāng)于音調(diào)頻率候補(bǔ)的整數(shù)倍的頻率而得到的頻率處的功率,以及,對基準(zhǔn)頻率加上相當(dāng)于音調(diào)頻率候補(bǔ)的整數(shù)倍的頻率而得到的頻率處的功率,計算總和值。由此,能夠降低因語音的準(zhǔn)周期特性和噪聲的影響以及音調(diào)頻率估計誤差而產(chǎn)生的音調(diào)諧波中的誤差累積,能夠更準(zhǔn)確地進(jìn)行音調(diào)頻率的估計。
      乘冪運(yùn)算單元108,對由頻譜加法單元107計算出的總和值進(jìn)行乘冪值的計算。計算出的乘冪值輸出到乘法單元109。此外,乘冪運(yùn)算單元108將用于乘冪運(yùn)算的乘數(shù)設(shè)為變量。對于乘數(shù)的變量設(shè)置即乘數(shù)的調(diào)整,將在后面敘述。
      乘法單元109和最大值提取單元110的組合構(gòu)成估計單元,該估計單元使用與多個音調(diào)頻率候補(bǔ)的每一個相對應(yīng)地計算出的平均值估計音調(diào)頻率。
      估計單元中,乘法單元109,相對于多個音調(diào)頻率候補(bǔ)的每一個,將音調(diào)諧波頻譜的功率平均值和音調(diào)諧波頻譜的功率的總和值進(jìn)行乘法運(yùn)算。更具體來講,將平均值乘以總和值的乘冪運(yùn)算結(jié)果。將乘法結(jié)果輸出到最大值提取單元110。
      最大值提取單元110提取由乘法單元109計算出的乘法結(jié)果的最大值。此外,在從預(yù)定的最小值到預(yù)定的最大值的多個音調(diào)頻率候補(bǔ)中,將乘法結(jié)果為最大時的音調(diào)頻率候補(bǔ)確定為所估計的音調(diào)頻率,并輸出到未圖示的后級的處理單元。
      接下來,對具有上述結(jié)構(gòu)的音調(diào)頻率估計裝置100中的音調(diào)頻率估計動作進(jìn)行說明。
      首先,通過FFT單元102,獲得由下式(2)表示的語音功率譜SF2(k)。其中,k代表離散頻率分量。HF為用于音調(diào)頻率估計的上限頻率分量,例如HF=1[kHz]。Re{DF(k)}和Im{DF(k)}分別代表經(jīng)FFT變換后的輸入語音頻譜DF(k)的實部和虛部。
      式2SF2(k)=Re{DF(k)}2+Im{DF(k)}20&le;k&le;HF...(2)]]>另外,雖然在式(2)中使用了頻譜的功率值,也可以使用求取了平方根的頻譜振幅值代替功率值。
      另外,有聲性判定單元103判定語音功率譜SF2(k)的有聲性。
      更具體來講,第一,使用下式(3)和(4),分別計算幀m的語音功率譜SF2(k)的總和值S2(m),以及估計噪聲頻譜功率的移動平均值N2(m)。其中,α為移動平均系數(shù),而ΘN為用于判定是語音還是噪聲的閾值。
      式3S2(m)=&Sigma;k=1HFSF2(k)...(3)]]>式4N2(m)=N2(m-1)S2(m)>&Theta;N&CenterDot;N2(m-1)(1-&alpha;)&CenterDot;N2(m-1)+&alpha;&CenterDot;S2(m)S2(m)&le;&Theta;N&CenterDot;N2(m-1)...(4)]]>
      然后,第二,使用式(5)計算語音和噪聲的比率SNR,并根據(jù)該計算結(jié)果進(jìn)行有聲性的判定。例如,如式(6)所示,比率SNR大于閾值ΘN時判定為有有聲性,而比率SNR為閾值ΘN以下時判定為沒有有聲性。此外,在此以判定為有有聲性的情況為例,進(jìn)行音調(diào)頻率估計動作的說明。
      式5SNR=(S2(m)-N2(m))/N2(m) ...(5)式6
      然后,頻譜提取單元104,使用式(7)提取語音功率譜SF2(k)的峰值,由此提取音調(diào)諧波頻譜PF(k)。
      式7
      此時,考慮因語音的準(zhǔn)周期特性和噪聲的影響而產(chǎn)生的音調(diào)諧波頻譜的位置偏差(displacement),將位于所提取的峰值附近的語音功率譜SF2(k-1)和SF2(k+1),作為音調(diào)諧波頻譜PF(k-1)和PF(k+1)一并提取,并將在其它頻率分量上的語音功率譜看作0。
      另外,當(dāng)由頻譜振幅限制單元105對語音功率譜進(jìn)行振幅限制時,頻譜提取單元104將該振幅限制的結(jié)果反映到音調(diào)諧波頻譜PF(k),由此限制音調(diào)諧波頻譜PF(k)的振幅。
      也就是說,將所提取的音調(diào)諧波頻譜PF(k)與預(yù)定值比較。預(yù)定值為在頻帶HF上的語音功率譜SF2(k)的平均值和乘法系數(shù)δ的乘積,由式(8)得到。然后,當(dāng)音調(diào)諧波頻譜PF(k)超過預(yù)定值時,使用式(9)將音調(diào)諧波頻譜PF(k)的振幅乘以衰減系數(shù),由此限制音調(diào)諧波頻譜PF(k)的振幅。衰減系數(shù)由式(10)得到。
      式8SF2&OverBar;=&Sigma;k=1HFSF2(k)/HF...(8)]]>式9PF(k)&DoubleLeftArrow;&gamma;&CenterDot;PF(k)PF(k)>&delta;&CenterDot;SF2&OverBar;...(9)]]>式10&gamma;=&delta;&CenterDot;SF2&OverBar;/PF(k)...(10)]]>
      另外,對所提取的音調(diào)諧波頻譜PF(k-1)和PF(k+1),同樣使用式(11)和式(12)進(jìn)行振幅的限制。
      式11PF(k-1)&DoubleLeftArrow;&gamma;&CenterDot;PF(k-1)...(11)]]>式12PF(k+1)&DoubleLeftArrow;&gamma;&CenterDot;PF(k+1)...(12)]]>然后,由頻譜平均值計算單元106,使用式(13)計算音調(diào)諧波頻譜PF(k)的功率的平均值PA(i)。
      式13PA(i)=1N(i)(&Sigma;n=1NL(i)PF(j-i&CenterDot;n)+&Sigma;n=1NH(i)PF(j+i&CenterDot;n))pMIN&le;i&le;pMAX...(13)]]>其中,N(i)=NF/i、NL(i)=j(luò)/i且NH(i)=(HF-j)/i。此外,i為音調(diào)頻率候補(bǔ),PMIN和PMAX分別為音調(diào)頻率候補(bǔ)的最小值和最大值。此外,j為與頻帶HF中的語音功率譜SF2(k)的最大值相對應(yīng)的頻率分量,n為音調(diào)頻率的整數(shù)倍的系數(shù)。
      然后,由頻譜加法單元107,使用式(14)計算音調(diào)諧波頻譜PF(k)的功率的總和值PB(i)。
      式14PB(i)=&Sigma;n=1NL(i)PF(j-i&CenterDot;n)+&Sigma;n=1NH(i)PF(j+i&CenterDot;n)pMIN&le;i&le;pMAX...(14)]]>在此,比較式(13)和式(14)可知,平均值PA(i)與總和值PB(i)之間存在式(15)所示的關(guān)系。因此,由頻譜加法單元107使用式(14)計算總和值PB(i)之后,再由頻譜平均值計算單元106使用式(15)代替式(13)來計算平均值PA(i)時,能夠進(jìn)一步降低音調(diào)頻率估計中的運(yùn)算量。
      式15PA(i)=1N(i)PB(i)...(15)]]>然后,由乘冪運(yùn)算單元108,例如使用式(16)計算總和值PB(i)的乘冪。
      式16PC(i)=(PB(i))β...(16)然后,由乘法單元109,使用式(17)將乘冪運(yùn)算結(jié)果PC(i)乘以平均值PA(i)。
      式17

      PD(i)=PA(i)&CenterDot;PC(i)=1N(i)(PB(i))&beta;+1...(17)]]>然后,由最大值提取單元110,提取乘法結(jié)果PD(i)的最大值PD_max,并將此時的音調(diào)頻率候補(bǔ)p確定為所估計的音調(diào)頻率。這樣進(jìn)行音調(diào)頻率估計操作。
      接下來,對用于防止半音調(diào)頻率誤差及倍音調(diào)頻率誤差的條件(以下稱為“防止條件”)進(jìn)行說明。在此以如下兩個情形為例進(jìn)行說明僅使用音調(diào)諧波頻譜的功率的平均值進(jìn)行音調(diào)頻率估計的情形(以下稱為“第一種情形”);以及使用音調(diào)諧波頻譜的功率的平均值與總和值進(jìn)行音調(diào)頻率估計的情形(以下稱為“第二種情形”)。
      首先,定量求取第一種情形中的防止條件。
      使用式(18)表示對于正確估計出的音調(diào)頻率p的平均值PA(p),則由式(19)得到相對半音調(diào)頻率p/2的平均值PA(p/2)。
      式18PA(p)=1N(p)PB(p)...(18)]]>式19PA(p/2)=12N(p)PB(p/2)=12N(p)(PB(p)+x&CenterDot;PB(p))=12N(p)(1+x)&CenterDot;PB(p)...(19)]]>其中,x為表示估計半音調(diào)頻率p/2時的、相對音調(diào)頻率p的總和值PB(p)的增加倍率的系數(shù)。在僅由平均值PA的最大化估計音調(diào)頻率的情況下,比較式(18)和式(19)可知,在滿足條件PA(p)>PA(p/2)也就是x<1時,能夠防止半音調(diào)頻率差錯的發(fā)生。也就是說,當(dāng)總和值PB的增加量不足PB(p)時,能夠防止半音調(diào)頻率差錯的發(fā)生。
      另外,由式(20)得到對倍音調(diào)頻率2p的平均值PA(2p)。
      式20PA(2p)=1N(p)/2PB(2p)=1N(p)/2(PB(p)-y&CenterDot;PB(p))=1N(p)/2(1-y)&CenterDot;PB(p)...(20)]]>其中,y為表示估計倍音調(diào)頻率2p時的、對于音調(diào)頻率p的總和值PB(p)的減小倍率的系數(shù)。僅由平均值PA的最大化估計音調(diào)頻率的情況下,比較式(18)和式(20)可知,在滿足條件PA(p)>PA(2p)也就是y>0.5時,能夠防止倍音調(diào)頻率差錯的發(fā)生。也就是說,總和值PB的減少量大于0.5PB(p)時,能夠防止倍音調(diào)頻率差錯的發(fā)生。
      接下來,定量求取第二種情形中的防止條件。
      對半音調(diào)頻率p/2和倍音調(diào)頻率2p分別求取上述式(17)所示的乘法結(jié)果PD(i),則如式(21)和式(22)所示。
      式21PD(p/2)=12N(p)(PB(p/2))&beta;+1=12N(p)(PB(p)+x&CenterDot;PB(p))&beta;+1=22N(p)(1+x)&beta;+1&CenterDot;(PB(p))&beta;+1...(21)]]>式22PD(2p)=1N(p)/2(PB(2p))&beta;+1=1N(p)/2(PB(p)-y&CenterDot;PB(p))&beta;+1=1N(p)/2(1-y)&beta;+1&CenterDot;(PB(p))&beta;+1...(22)]]>通過上述式(17)所示的乘法結(jié)果PD(i)的最大化估計音調(diào)頻率時,在滿足條件PD(p)>PD(p/2)時,能夠防止半音調(diào)頻率差錯的發(fā)生。此外,在滿足條件PD(p)>PD(2p)時,能夠防止倍音調(diào)頻率差錯的發(fā)生。
      在此,圖2A中表示由頻譜提取單元104提取的語音功率譜SF2(k)的例子。該例子中,假設(shè)由P2、P4、P5和P6表示的峰值構(gòu)成音調(diào)諧波頻譜。
      另外,圖2B中表示,在將總和值PB(i)的乘冪的乘數(shù)設(shè)為1的條件下,平均值PA(i)與總和值PB(i)的相乘結(jié)果的例子,而圖2C中表示,在將總和值PB(i)的乘冪的乘數(shù)設(shè)為3的條件下,平均值PA(i)與總和值PB(i)的相乘結(jié)果的例子。
      然后,使用式(21)變換半音調(diào)頻率差錯的防止條件PD(p)>PD(p/2)的話,乘數(shù)為1時則x<0.414,而乘數(shù)則為3時x<0.189。此外,使用式(22)變換倍音調(diào)頻率差錯的防止條件PD(p)>PD(2p)的話,乘數(shù)為1時y>0.293,而乘數(shù)為3時y>0.159。也就是說,在乘數(shù)為1的情況下總和值PB的增加量不足0.414PB(p)時,或者在乘數(shù)為3的情況下總和值PB的增加量不足0.189PB(p)時,能夠防止半音調(diào)頻率差錯的發(fā)生。而且,在乘數(shù)為1的情況下總和值PB的減小量大于0.293PB(p)時,或者在乘數(shù)為3的情況下總和值PB的減小量大于0.159PB(p)時,能夠防止倍音調(diào)頻率差錯的發(fā)生。
      進(jìn)一步比較第一種情形中的防止條件和第二種情形中的防止條件。作為該比較的結(jié)果,可知對于倍音調(diào)頻率差錯的防止條件,第一種情形嚴(yán)于第二種情形。也就是說,發(fā)生倍音調(diào)頻率差錯的主要原因為因共振峰而產(chǎn)生的音調(diào)諧波頻譜振幅值的變動,而關(guān)于由該變動不再滿足倍音調(diào)頻率差錯的防止條件的概率,第二種情形低于第一種情形。因此,通過使用音調(diào)諧波頻譜的功率的平均值與總和值進(jìn)行音調(diào)頻率估計,能夠降低共振峰的影響,從而能夠提高音調(diào)頻率估計的精確度。
      再者,通過調(diào)整乘冪的乘數(shù),能夠自由地調(diào)整半音調(diào)頻率差錯的發(fā)生概率或倍音調(diào)頻率差錯的發(fā)生概率。例如,如上所述,與乘數(shù)為1時相比,乘數(shù)為3時雖然更容易發(fā)生半音調(diào)頻率差錯,但更不容易發(fā)生倍音調(diào)頻率差錯。反過來說,與乘數(shù)為3時相比,乘數(shù)為1時雖然更容易發(fā)生倍音調(diào)頻率差錯,但更不容易發(fā)生半音調(diào)頻率差錯。因此,在實際情況下,通過根據(jù)語音或噪聲的狀態(tài)選擇乘數(shù),能夠更正確地估計音調(diào)頻率。例如,在噪聲較多的環(huán)境下進(jìn)行音調(diào)頻率估計時,通過將乘數(shù)設(shè)為相對較小的值,能夠降低半音調(diào)頻率差錯的發(fā)生概率。相對于此,通過將乘數(shù)設(shè)定為相對較大的值,能夠降低因共振峰的影響而產(chǎn)生的倍音調(diào)頻率差錯的發(fā)生。
      在此,通過在相同的條件下且使用相同的音調(diào)諧波頻譜進(jìn)行仿真,分別計算基于式(1)所示的自相關(guān)法的音調(diào)頻率估計和本實施例所涉及的音調(diào)頻率估計的估計差錯率。仿真的諸條件如下。海寧窗長度為320、FFT變換長度為512、移動平均系數(shù)α為0.02、閾值ΘV為2、乘法系數(shù)δ為6、音調(diào)頻率候補(bǔ)的最小值PMIN為62.5Hz、而音調(diào)頻率候補(bǔ)的最大值PMAX為390Hz。此外,設(shè)乘數(shù)β為3。以下為計算出的估計差錯率的表格。從該表格可知,通過選擇適當(dāng)?shù)某藬?shù),與基于自相關(guān)法的估計相比,本實施例所涉及的音調(diào)頻率估計能夠降低估計差錯率。
      表1


      如上所述,根據(jù)本實施例,由于使用與多個音調(diào)頻率候補(bǔ)的每一個相對應(yīng)地計算出的、音調(diào)諧波頻譜的功率的平均值估計音調(diào)頻率,也就是不使用頻率頻譜上的自相關(guān)而進(jìn)行音調(diào)頻率的估計,所以,不需要用于降低共振峰的影響的頻譜平滑處理,而且,例如在滿足有關(guān)音調(diào)諧波頻譜的功率的預(yù)定的定量條件時,能夠防止半音調(diào)頻率差錯和倍音調(diào)頻率差錯的發(fā)生,由此能夠降低音調(diào)頻率估計所需的運(yùn)算量并能夠準(zhǔn)確估計音調(diào)頻率。
      另外,根據(jù)本實施例,通過將音調(diào)諧波頻譜的功率的平均值與總和值相乘,所述平均值與總和值相對于多個音調(diào)頻率候補(bǔ)的每一個計算,并將與乘法結(jié)果的最大值相對應(yīng)的音調(diào)頻率候補(bǔ)確定為估計音調(diào)頻率。也就是將平均值與總和值的乘法值作為函數(shù)進(jìn)行音調(diào)頻率的估計,所以,無需進(jìn)行頻譜平滑處理即能夠降低共振峰的影響,從而能夠提高音調(diào)頻率估計的精確度。
      另外,本實施例的音調(diào)頻率估計裝置及音調(diào)頻率估計方法,可以適用于進(jìn)行語音編碼或語音增強(qiáng)等語音信號處理的語音信號處理裝置及語音信號處理方法。
      另外,本發(fā)明可以采用各種各樣的實施例,而并不限于本實施例中說明的方式。例如,也可以將上述音調(diào)頻率估計方法作為軟件,讓計算機(jī)執(zhí)行。也就是說,通過將執(zhí)行上述實施例中所說明的音調(diào)頻率估計方法的程序預(yù)先記錄在例如ROM(Read Only Memory)等記錄介質(zhì),而使CPU(Central ProcessorUnit)操作該程序,能夠執(zhí)行本發(fā)明的音調(diào)頻率估計方法。
      另外,用于上述各實施例的說明中的各功能模塊,典型的由集成電路LSI來實現(xiàn)。這些模塊既可以分別作成一個芯片,也可以在一個芯片上包括其中一部分或者全部。
      雖然每個功能塊在此作為LSI描述,但根據(jù)集成度的不同也可以稱為IC、系統(tǒng)LSI、超LSI以及極大LSI。
      另外,集成電路的技術(shù)并不限于LSI,也可以使用專用電路或通用處理器來實現(xiàn)。制造LSI后,也可以利用LSI制造后能夠編程的FPGA(FieldProgrammable Gate Array,現(xiàn)場可編程門陣列),或利用可以將LSI內(nèi)部的電路塊連接或設(shè)置重新配置的可重配置處理器(Reconfigurable Processor)。
      而且,如果隨著半導(dǎo)體技術(shù)或者衍生的其他技術(shù)的的進(jìn)步,出現(xiàn)了替換LSI的集成電路技術(shù),當(dāng)然,也可以利用該技術(shù)來實現(xiàn)功能模塊的集成。也有應(yīng)用生物工程學(xué)技術(shù)等的可能性。
      本說明書根據(jù)2004年7月13日提交的日本專利特愿2004-206387號。其內(nèi)容全部包括在此作為參考。
      工業(yè)實用性本發(fā)明的音調(diào)頻率估計裝置及音調(diào)頻率估計方法,可以適用于進(jìn)行語音編碼或語音增強(qiáng)等語音信號處理的裝置及方法。
      權(quán)利要求
      1.一種音調(diào)頻率估計裝置,包括提取單元,用于從語音調(diào)譜中提取音調(diào)諧波頻譜;平均值計算單元,用于相對于多個音調(diào)頻率候補(bǔ)的每一個,計算所述音調(diào)諧波頻譜的功率的平均值;以及估計單元,用于使用所述平均值估計音調(diào)頻率。
      2.如權(quán)利要求1所述的音調(diào)頻率估計裝置,還包括總和值計算單元,用于相對于所述多個音調(diào)頻率候補(bǔ)的每一個,計算所述音調(diào)諧波頻譜的功率的總和值;其中,所述估計單元,使用所述總和值估計音調(diào)頻率。
      3.如權(quán)利要求2所述的音調(diào)頻率估計裝置,其中,所述估計單元還包括乘法單元,用于相對于所述多個音調(diào)頻率候補(bǔ)的每一個,將所述平均值與所述總和值相乘;以及確定單元,用于在所述多個音調(diào)頻率候補(bǔ)中,將與所述乘法單元的乘法結(jié)果的最大值相對應(yīng)的音調(diào)頻率候補(bǔ)確定為所估計的音調(diào)頻率。
      4.如權(quán)利要求2所述的音調(diào)頻率估計裝置,其中,所述平均值計算單元,使用與所述語音調(diào)譜中的功率的最大值相對應(yīng)的頻率分量作為基準(zhǔn)頻率,而計算所述平均值。
      5.如權(quán)利要求2所述的音調(diào)頻率估計裝置,其中,所述總和值計算單元,使用與所述語音調(diào)譜中的功率的最大值相對應(yīng)的頻率分量作為基準(zhǔn)頻率,而計算所述總和值。
      6.如權(quán)利要求3所述的音調(diào)頻率估計裝置,還包括乘冪運(yùn)算單元,用于計算所述總和值的乘冪;其中,所述乘法單元將由所述乘冪運(yùn)算單元的計算結(jié)果與所述平均值相乘;所述乘冪運(yùn)算單元將用于所述乘冪運(yùn)算的乘數(shù)設(shè)為變量。
      7.如權(quán)利要求2所述的音調(diào)頻率估計裝置,其中,所述平均值計算單元使用所述總和值計算所述平均值。
      8.如權(quán)利要求2所述的音調(diào)頻率估計裝置,還包括振幅限制單元,用于限制所述音調(diào)諧波頻譜的振幅。
      9.如權(quán)利要求2所述的音調(diào)頻率估計裝置,還包括判定單元,用于判定所述語音調(diào)譜的有聲性;其中,所述提取單元,在根據(jù)所述判定單元的判定結(jié)果,所述語音調(diào)譜的有聲性為預(yù)定水平以下時,不進(jìn)行所述音調(diào)諧波頻譜的提取。
      10.一種音調(diào)頻率估計方法,包括提取步驟,用于從語音調(diào)譜中提取音調(diào)諧波頻譜;平均值計算步驟,用于相對于多個音調(diào)頻率候補(bǔ)的每一個,計算所述音調(diào)諧波頻譜的功率的平均值;以及估計步驟,用于使用所述平均值估計音調(diào)頻率。
      11.一種音調(diào)頻率估計程序,用于使計算機(jī)實現(xiàn)提取步驟,用于從語音調(diào)譜中提取音調(diào)諧波頻譜;平均值計算步驟,用于相對于多個音調(diào)頻率候補(bǔ)的每一個,計算所述音調(diào)諧波頻譜的功率的平均值;以及估計步驟,用于使用所述平均值估計音調(diào)頻率。
      全文摘要
      提供一種音調(diào)頻率估計裝置,其能夠降低音調(diào)頻率估計所需的運(yùn)算量,并能準(zhǔn)確地估計音調(diào)頻率。在該裝置中,頻譜提取單元(104)從語音調(diào)譜中提取音調(diào)諧波頻譜。頻譜平均值計算單元(106),與多個音調(diào)頻率候補(bǔ)的每一個分別相對應(yīng)地計算由頻譜提取單元(104)提取的音調(diào)諧波頻譜的功率平均值。估計單元使用由頻譜平均值計算單元(106)計算出的平均值估計音調(diào)頻率。
      文檔編號G10L25/90GK1998045SQ200580023748
      公開日2007年7月11日 申請日期2005年6月23日 優(yōu)先權(quán)日2004年7月13日
      發(fā)明者王幼華, 吉田幸司 申請人:松下電器產(chǎn)業(yè)株式會社
      網(wǎng)友詢問留言 已有0條留言
      • 還沒有人留言評論。精彩留言會獲得點贊!
      1