專利名稱:語(yǔ)言活動(dòng)性檢測(cè)器的制作方法
語(yǔ)音活動(dòng)性檢測(cè)器是一種通過(guò)向其提供信號(hào)輸入以達(dá)到檢測(cè)語(yǔ)音時(shí)間段或僅包含噪聲的時(shí)間段的目的的裝置。雖然本發(fā)明不局限于此,但這種檢測(cè)器特別感興趣的一種應(yīng)用是在移動(dòng)無(wú)線電電話系統(tǒng)中,在這種移動(dòng)無(wú)線電電話系統(tǒng)中可以利用有關(guān)語(yǔ)音存在與否的知識(shí)在寂靜期間關(guān)閉發(fā)射機(jī)來(lái)減小功率消耗和干擾。在這種移動(dòng)無(wú)線電電話系統(tǒng)中,(車載單元的)噪聲電平通常是較高的。在無(wú)線電系統(tǒng)中的另一種可能的應(yīng)用是改善無(wú)線電頻譜的有效利用。
圖1表示在國(guó)際專利申請(qǐng)WO89/08910中描述的語(yǔ)音活動(dòng)性檢測(cè)器。
在噪聲的語(yǔ)音信號(hào)在輸入端1被接收。存儲(chǔ)器2中存儲(chǔ)有確定噪聲頻譜的估算或模型的數(shù)據(jù);將這一數(shù)據(jù)與當(dāng)前信號(hào)的頻譜進(jìn)行比較(3)來(lái)獲得與閾值進(jìn)行比較(4)的相似性度量。為了跟蹤噪聲分量的變化,僅當(dāng)無(wú)語(yǔ)音時(shí)才根據(jù)輸入更新噪聲模型。并且,還可以調(diào)整閾值(適配器6)。
為了保證僅在只存在噪聲的期間內(nèi)進(jìn)行調(diào)整,以免出現(xiàn)因錯(cuò)誤判斷造成的累積的錯(cuò)誤調(diào)整的危險(xiǎn),在輔助檢測(cè)器7的控制下進(jìn)行調(diào)整,該輔助檢測(cè)器7包括非發(fā)聲語(yǔ)音檢測(cè)器(unvoicedspeech detector)8和發(fā)聲語(yǔ)音檢測(cè)器(Voiced speech detector)9如果這兩個(gè)檢測(cè)器中的任何一個(gè)識(shí)別了語(yǔ)音,檢測(cè)器7就認(rèn)為存在語(yǔ)音,并且禁止主檢測(cè)器的更新和閾值調(diào)整。一般來(lái)說(shuō),非發(fā)聲語(yǔ)音檢測(cè)器8獲得信號(hào)的一組LPC系數(shù)并在連續(xù)的幀周期之間比較這些系數(shù)的自相關(guān)函數(shù),發(fā)聲語(yǔ)音檢測(cè)器9檢測(cè)LPC殘留信號(hào)的自相關(guān)的變化。
這一裝置在區(qū)分語(yǔ)音期間和只接收有噪聲的期間方面非常有效。但是,產(chǎn)生了這樣的問(wèn)題,即信號(hào)音(signalling tones)經(jīng)常被輔助檢測(cè)器認(rèn)為只是噪聲(即不將它們識(shí)別為語(yǔ)音),因此主檢測(cè)器就當(dāng)這些信號(hào)音為噪聲而去適應(yīng)它們,這些信號(hào)音的傳輸被阻止,或者至少過(guò)早地將其加以終止。
這一問(wèn)題可以通過(guò)提供一些分別被調(diào)諧到某個(gè)特定信號(hào)音頻率的檢音器(tone detector)來(lái)克服;但是,不可忽視世界上的不同信號(hào)音的多種多樣性,因此,為了例如使正在打國(guó)際電話的移動(dòng)電話用戶能夠可靠地聽(tīng)到“占線”音而不管其來(lái)自哪一個(gè)國(guó)家,就需要大量的不同的檢測(cè)器。
根據(jù)本發(fā)明,提供了一種用于檢測(cè)輸入信號(hào)中語(yǔ)音的存在的語(yǔ)音活動(dòng)性檢測(cè)器,它包括(a)存儲(chǔ)輸入信號(hào)噪聲分量的估算值的裝置;(b)識(shí)別輸入信號(hào)和被存儲(chǔ)的估算值的頻譜相似性以便產(chǎn)生一個(gè)輸出判定信號(hào)的裝置;(c)更新被存儲(chǔ)的估算值的裝置;(d)輔助檢測(cè)器,用于控制更新裝置,以便僅當(dāng)輔助檢測(cè)器指出在輸入信號(hào)中無(wú)語(yǔ)音時(shí)才進(jìn)行更新;其特征在于,用于計(jì)算輸入信號(hào)的預(yù)測(cè)增益參數(shù)的裝置,以及用于在預(yù)測(cè)增益超過(guò)閾值時(shí)禁止更新的修正裝置。
現(xiàn)在參看附圖舉例描述本發(fā)明的某些實(shí)施例,附圖中圖2是根據(jù)本發(fā)明一個(gè)方面的具有語(yǔ)音活動(dòng)性檢測(cè)器的語(yǔ)音編碼器的方框圖;圖3和4用圖形表示各種輸入信號(hào)的預(yù)測(cè)增益值;圖5、6和7是本發(fā)明其它實(shí)施例的方框圖。
在圖2中,傳統(tǒng)語(yǔ)音編碼器100具有語(yǔ)音輸入端101,語(yǔ)音信號(hào)被模數(shù)變換器102以8KHz的頻率進(jìn)行取樣和變換為數(shù)字形式。開窗口單元(Windowing unit)103將語(yǔ)音樣值劃分成為(例如)160個(gè)樣值的幀(即20ms的幀)、并將其乘以一個(gè)可減小在幀的開始和結(jié)束處的樣值的貢獻(xiàn)的漢明(Hamming)窗口或其它函數(shù)。相關(guān)器104接收數(shù)字化語(yǔ)音樣值并產(chǎn)生每一幀的自相關(guān)系數(shù)Pi。LPC分析單元105計(jì)算具有相應(yīng)于輸入語(yǔ)音信號(hào)頻譜的頻率響應(yīng)的濾波器(它有時(shí)稱為綜合濾波器)的系數(shù)ai,這里,采用例如列文森-德賓(Levinson-Durbin)或肖思(schurr)算法的已知方法。
數(shù)字化輸入信號(hào)還通過(guò)被這些系數(shù)控制的反濾波器(或分析濾波器)106,以便產(chǎn)生出被長(zhǎng)期預(yù)測(cè)器分析單元107進(jìn)一步分析的殘留信號(hào),該長(zhǎng)期預(yù)測(cè)器分析單元107計(jì)算根據(jù)其先前值來(lái)預(yù)測(cè)LPC殘留信號(hào)的最佳延遲以及該預(yù)測(cè)值的相應(yīng)增益值。分析單元106還產(chǎn)生第二殘留信號(hào)(即當(dāng)前LPC殘留信號(hào)和被所獲得的參數(shù)延遲和定標(biāo)的LPC殘留信號(hào)之間的差值)。激勵(lì)單元108通過(guò)僅對(duì)LTP殘留信號(hào)進(jìn)行量化或利用其它普通的方法來(lái)獲得用以傳送給譯碼器的激勵(lì)參數(shù)。
LPC系數(shù)ai、長(zhǎng)期預(yù)測(cè)器延遲d和增益g、以及激勵(lì)參數(shù)e都傳送給譯碼器。
申請(qǐng)人先前的專利申請(qǐng)中的主語(yǔ)音活動(dòng)性檢測(cè)器利用平均器110來(lái)對(duì)自相關(guān)系數(shù)Ri求平均,該平均器110產(chǎn)生當(dāng)前系數(shù)和被存儲(chǔ)在緩沖器111中的先前幀的系數(shù)的加權(quán)和R′i。另一自相關(guān)器112產(chǎn)生用以傳送給緩沖器113的LPC系數(shù)ai的自相關(guān)系數(shù)Bi。緩沖器的內(nèi)容只在被輔助檢測(cè)器(以下將描述)認(rèn)為只包含噪聲的期間內(nèi)才被更新,因此緩沖器113的內(nèi)容B′i代表了輸入信號(hào)噪聲頻譜的估算值。乘法/加法單元114產(chǎn)生被如下定義的、輸入信號(hào)和噪聲模型之間頻譜相似性的度量MM=B′o+2Σi=1nR′iB′iR′o]]>這里的零下標(biāo)表示零階自相關(guān)系數(shù),n是語(yǔ)音幀中樣值的數(shù)目。
度量M在比較器115中與閾值電平進(jìn)行比較,并在輸出端116產(chǎn)生表示語(yǔ)音的存在或不存在的信號(hào)。閾值可以根據(jù)當(dāng)前噪聲功率電平自適應(yīng)地進(jìn)行調(diào)整(117)。
由于不能識(shí)別語(yǔ)音將導(dǎo)致對(duì)具有語(yǔ)音信息的緩沖器的更新和隨后的其它識(shí)別錯(cuò)誤—“鎖定”狀態(tài),所以在緩沖存儲(chǔ)器113中的噪聲估算值的更新不被上述檢測(cè)器的輸出端116進(jìn)行控制。因此更新由輔助檢測(cè)器200進(jìn)行控制。為了區(qū)分噪聲和非發(fā)聲的語(yǔ)音,這就產(chǎn)生出(201)輸入信號(hào)的(未平均的)自相關(guān)系數(shù)Ri和LPC系數(shù)的(未緩沖的)自相關(guān)系數(shù)Bi的乘積和。減法器202將這個(gè)和與在緩沖器203中被延遲的先前語(yǔ)音幀的相應(yīng)的和進(jìn)行比較。表示輸入信號(hào)的連續(xù)幀之間頻譜相似性的這一差值與閾值進(jìn)行比較(204)從而產(chǎn)生判決信號(hào)。
為了識(shí)別發(fā)聲的語(yǔ)音,長(zhǎng)期預(yù)測(cè)器延遲d被音調(diào)分析單元205所測(cè)量。其輸出在“或”門206中與閾值級(jí)204的輸出合并—即如果單元204或205中的任何一個(gè)(或兩者)產(chǎn)生表示語(yǔ)音存在的輸出,輔助檢測(cè)器200就認(rèn)為存在語(yǔ)音。正如在引言中所論述的那樣,如果系統(tǒng)傳送信號(hào)音,則這些信號(hào)音必須被識(shí)別為語(yǔ)音而不是噪聲,而剛剛所述的輔助檢測(cè)器在這方面并不是非常有效。雖然它識(shí)別某些信號(hào)音,但另一些信號(hào)音(通常是具有相對(duì)純凈的頻譜內(nèi)容的信號(hào)音)不能被識(shí)別。由于在緩沖器113中的噪聲估算值此時(shí)根據(jù)信號(hào)音來(lái)進(jìn)行“訓(xùn)練”,所以一旦輔助檢測(cè)器200已失效,則主檢測(cè)器也失效。
因此,提供另一輔助檢測(cè)器來(lái)檢測(cè)信號(hào)音。最好注意到人為產(chǎn)生的信號(hào)音包含少量的頻率分量(它可能是被調(diào)制的)這一事實(shí)。對(duì)于這樣的信號(hào),LPC預(yù)測(cè)器的性能極其優(yōu)異,利用這一特性來(lái)區(qū)分基于信號(hào)音的信號(hào)(包括多信號(hào)音信號(hào))和背景或環(huán)境噪聲信號(hào)。
LPC預(yù)測(cè)增益Gp被定義為一語(yǔ)音幀的輸入信號(hào)功率與輸出信號(hào)功率之比,即Gp=Σi=0n-ix2(i)Σi=0n-1y2(i)]]>這里的x是濾波器輸入而y是反濾波器輸出y(t)=x(t)+Σi=1ny(t-i)ai]]>(這里的m是濾波系數(shù)的個(gè)數(shù),一般為8或10)。信號(hào)x(i)和y(i)可分別從LPC編碼器100內(nèi)的變換器102和濾波器106的輸出端獲得。這些值被求平方(301,302),預(yù)測(cè)增益利用按照上述公式計(jì)算Gp的算術(shù)單元303來(lái)獲得。其輸出被比較器304用來(lái)與固定的閾值T作比較,如果增益超過(guò)該閾值(通常T=63或18分貝),就認(rèn)為識(shí)別了信號(hào)音。對(duì)于信號(hào)音識(shí)別有幾種可能的響應(yīng)(a)利用“或”門303來(lái)替換主檢測(cè)器的輸出;(b)利用“或”門206的第三輸入來(lái)替換輔助檢測(cè)器;(c)以上兩者(如所示)。當(dāng)然,可以不計(jì)算商而將∑x2項(xiàng)與被乘以閾值的∑y2進(jìn)行比較。圖3以分貝為單位表示從背景環(huán)境噪聲、語(yǔ)音、信號(hào)音中的背景噪聲中獲得的預(yù)測(cè)增益和信號(hào)音本身的頻率分布圖,圖4表示對(duì)于不同的UK信號(hào)音,即“用戶占線”音、撥號(hào)音、振鈴音、“空號(hào)”音、“設(shè)備占用”音的預(yù)測(cè)增益相對(duì)于時(shí)間的曲線圖。實(shí)際上,用戶占線音、撥號(hào)音和“空號(hào)”音因確實(shí)是(例如來(lái)自鍵盤的)多頻音,所以被另一檢測(cè)器成功地識(shí)別。振鈴音和“設(shè)備占用”音被音調(diào)分析單元205識(shí)別。
該另一檢測(cè)器300可被認(rèn)為是對(duì)于某些類型信號(hào)音的檢測(cè)器;或者(在圖2的實(shí)施例中)它可被看作是檢測(cè)殘留信號(hào)Yi為較小的狀態(tài),所以長(zhǎng)期預(yù)測(cè)器107(以及由此音調(diào)分析205)的操作就不是強(qiáng)有力的。
檢測(cè)發(fā)聲的語(yǔ)音的另一種選擇是用類似于301、302、303和304的部件來(lái)代替音調(diào)檢測(cè)器205,以便產(chǎn)生基于長(zhǎng)期預(yù)測(cè)器分析107的預(yù)測(cè)增益(并將其與閾值作比較)。
現(xiàn)在參看圖5描述對(duì)圖2裝置的另外兩種改進(jìn)。首先,在圖2所示的實(shí)施例中,所計(jì)算的預(yù)測(cè)增益是語(yǔ)音編碼器100的LPC分析單元的預(yù)測(cè)增益,它一般可以采用第8或者甚至第10階預(yù)測(cè)器。但是,應(yīng)注意到這一分析單元部件的基礎(chǔ)是信息音比環(huán)境噪聲具有更高的預(yù)測(cè)增益,并且分析單元的階次越高,則預(yù)測(cè)器模擬噪聲環(huán)境的能力就越大,已經(jīng)得知通過(guò)將增益計(jì)算限制為第4階分析,則由一個(gè)或兩個(gè)信號(hào)音組成的信息信號(hào)給出高的預(yù)測(cè)增益,同時(shí)可以減小環(huán)境噪聲的預(yù)測(cè)增益。
這在原理上可以通過(guò)與第8階單元105,106并列地提供第4階分析單元和濾波器來(lái)向輔助檢測(cè)器輸入信號(hào)從而得到實(shí)現(xiàn)。但是,根據(jù)反射系數(shù)(有時(shí)稱為Parcor相關(guān)系數(shù))計(jì)算預(yù)測(cè)增益較為簡(jiǎn)單。在圖5中,這些反射系數(shù)是由單元400按照已知的方法根據(jù)自相關(guān)系數(shù)Ri進(jìn)行計(jì)算的(雖然根據(jù)語(yǔ)音編碼器設(shè)計(jì)的不同,可以利用LPC分析單元105從中間點(diǎn)將它們?nèi)〕?。預(yù)測(cè)增益的度量、即預(yù)測(cè)誤差Pe可以如下地根據(jù)前4個(gè)反射系數(shù)Rci進(jìn)行計(jì)算來(lái)獲得Pe=Πi=14(1-R2ci)]]>這一計(jì)算在401中進(jìn)行。大的預(yù)測(cè)誤差相應(yīng)于小的預(yù)測(cè)增益,反之亦然,所以,如果Pe小于閾值Pth,就認(rèn)為存在信號(hào)音。這一比較403代替了圖2的比較304。
其次,移動(dòng)無(wú)線電環(huán)境中的噪聲包含非常強(qiáng)的低頻諧振,進(jìn)行進(jìn)一步的測(cè)試來(lái)確定“信號(hào)音”是否低于閾頻率。閾頻率的選擇涉及到一定程度的折衷,但由于大多數(shù)信號(hào)音都高于400Hz,所以建議閾頻率為385Hz。
該進(jìn)一步的測(cè)試是確定LPC濾波器的極點(diǎn)頻率。為降低分析單元的復(fù)雜性,最好用低階濾波器。還可以進(jìn)行進(jìn)一步的LPC分析,但如圖5那樣通過(guò)根據(jù)反射系數(shù)計(jì)算LPC系數(shù)就能夠容易地進(jìn)行該進(jìn)一步的LPC分析。假定只利用單元400的前兩個(gè)反射系數(shù),則LPC系數(shù)ai被單元404按照通常的方式進(jìn)行計(jì)算,使得綜合濾波器的響應(yīng)是H(z)=l/{a0-a1z-1-a2z-2}然后極點(diǎn)在Z平面上的位置由二次方程的解來(lái)確定a0z2-a1z+a2=0a0=1即z=-a12=j4a2-a124]]>如果平方根內(nèi)的項(xiàng)是負(fù)的,則極點(diǎn)位于實(shí)軸上,于是該信號(hào)不是信號(hào)音。如果它是正的,但極點(diǎn)位置的實(shí)數(shù)部分是負(fù)的(即a1<0),則極點(diǎn)在Z平面的左半側(cè)。這就必然意味著該頻率比取樣速率高了25%—即對(duì)于8KHz的取樣頻率fs在2000Hz以上,這時(shí)該頻率計(jì)算是不必要的了,可以立即產(chǎn)生“>385”信號(hào)。極點(diǎn)頻率為f=arcran{-4a2-a12a1}×fs2π]]>f<385Hz的條件可表述為(取消平方根)(4a2-a12)/a12<tan2{2π×385fs}]]>或者(4a2-a12)/a12<0.0973]]>atfs=8kHz這一計(jì)算由單元405來(lái)進(jìn)行。它的輸出在與門406中與比較器403的輸出進(jìn)行合并,以便只有當(dāng)預(yù)測(cè)增益是高的并且極點(diǎn)頻率是大于385Hz時(shí)才作出“信號(hào)音”判定。
如果需要的話,還可以俘獲2000Hz以上的極點(diǎn)頻率(或者某些其它上限頻率),以便高于預(yù)期信號(hào)音范圍的高頻不會(huì)被識(shí)別為信號(hào)音。
如果求解二次方程的額外計(jì)算可被容許,就還可以利用第三和第四反射系數(shù),在這種情況下,有可能區(qū)分具有兩個(gè)相關(guān)頻率的兩個(gè)復(fù)共軛極點(diǎn)對(duì),可以看出,如果這兩個(gè)頻率都低于閾頻率,就不會(huì)認(rèn)為存在信號(hào)音。
已經(jīng)指出圖2和5的實(shí)施例在自相關(guān)計(jì)算103之前采用漢明窗口(對(duì)于基于自相關(guān)的LPC分析通常如此)。如果在語(yǔ)音編碼器中不需要進(jìn)行這種開窗口,則另一種可能的選擇就是在圖5的情形中省去開窗口103和通過(guò)將自相關(guān)值變換為協(xié)方差值來(lái)取代反射系數(shù)計(jì)算400,并修改單元401、404來(lái)使用協(xié)方差值而不是反射系數(shù)?;蛘撸鐖D6所示(它只表示相對(duì)于圖5已被改變的那些部件),開頭的處理可以由協(xié)方差分析109來(lái)完成,它的輸出提供給反射系數(shù)計(jì)算裝置400′和改進(jìn)的自相關(guān)系數(shù)單元104′。LPC分析單元105可以象以上那樣與自相關(guān)單元104′連接或者如所示那樣直接與協(xié)方差分析單元109連接。
上述“信號(hào)音檢測(cè)”實(shí)施例產(chǎn)生了良好的結(jié)果;但是,它們可能對(duì)于在某些范圍內(nèi)使用的、用機(jī)械方式產(chǎn)生的信號(hào)音無(wú)效,這是由于這些信號(hào)音往往具有導(dǎo)致產(chǎn)生小的預(yù)測(cè)增益的高次諧波分量的緣故。由于濾波器的插入勢(shì)必增大所有信號(hào)的自相關(guān),并由此也使其它信號(hào)的預(yù)測(cè)增益增大,所以僅濾除高次諧濾不是一個(gè)解決方案。已發(fā)現(xiàn)預(yù)測(cè)器往往模擬濾波器的極點(diǎn)而不是輸入信號(hào)的特性。但是已發(fā)現(xiàn)如果能夠?qū)㈩A(yù)測(cè)增益分析局限于對(duì)只處在相應(yīng)于諧波濾波器通帶的頻率范圍內(nèi)的信號(hào)的可預(yù)測(cè)性進(jìn)行評(píng)估,則利用濾波就能夠獲得良好的結(jié)果。這可以通過(guò)在預(yù)測(cè)增益分析之前以濾波器帶寬兩倍的頻率對(duì)信號(hào)進(jìn)行二次取樣來(lái)實(shí)現(xiàn)。
因此在其它方面與圖5類似的圖7實(shí)施例采用了濾波器450,這是低通等波紋FIR濾波器,其零點(diǎn)位于單位圓上,通帶高達(dá)600(3dB點(diǎn)),20dB的阻帶衰減位于1200Hz。阻帶衰減不是太大將被認(rèn)為是有利的。濾波器輸出在二次取樣單元451中被以1200Hz的頻率進(jìn)行二次取樣。
由于使用這種濾波,信號(hào)音檢測(cè)與語(yǔ)音編碼器100共用元件的可能性當(dāng)然被大大減少;因此濾波器450由模數(shù)變換器102直接提供數(shù)字化輸入信號(hào),并如上所述地給反射系數(shù)分析單元400″或者協(xié)方差或自相關(guān)分析單元提供信號(hào)。自相關(guān)方案將如上所述地需要開窗口。
另一實(shí)施例減輕了“諧波”問(wèn)題,且不會(huì)不適當(dāng)?shù)叵拗祁A(yù)測(cè)增益分析的頻率范圍;這是通過(guò)利用濾波器將信號(hào)分成兩個(gè)或多個(gè)頻帶來(lái)實(shí)現(xiàn)的,這每一個(gè)頻帶足夠窄,以至于無(wú)法包含信號(hào)音的基波和三次諧波。各個(gè)頻帶然后被二次取樣并對(duì)其進(jìn)行單獨(dú)的預(yù)測(cè)增益分析。
因此,在圖8中,信號(hào)被濾波器450a、450b分成頻帶400-1200Hz和1200Hz-2000Hz,并被以1.6KHz的頻率進(jìn)行二次取樣(451a、451b)。對(duì)這兩個(gè)頻帶分別進(jìn)行反射系數(shù)計(jì)算400″a、b、預(yù)測(cè)誤差分析401a、b、和取閾值403a、b。比較器403a、403b的兩個(gè)輸出被傳送給“或”門206的分開的輸入端,所以在這兩個(gè)頻道的任一個(gè)之內(nèi)的高的預(yù)測(cè)增益都被認(rèn)為表示了信號(hào)音的存在。圖7的其它部件100-303沒(méi)有改變,所以不在圖8中表示。
權(quán)利要求
1.一種用于檢測(cè)輸入信號(hào)中語(yǔ)音的存在的語(yǔ)音活動(dòng)性檢測(cè)器,包括(a)存儲(chǔ)輸入信號(hào)噪聲分量的估算值的裝置;(b)識(shí)別輸入信號(hào)和被存儲(chǔ)的估算值的頻譜相似性以便產(chǎn)生輸出判定信號(hào)的裝置;(c)更新被存儲(chǔ)的估算值的裝置;(d)輔助檢測(cè)器,用于控制更新裝置,以便僅當(dāng)輔助檢測(cè)器指出在輸入信號(hào)中無(wú)語(yǔ)音時(shí)才進(jìn)行更新;其特征在于,用于計(jì)算輸入信號(hào)的預(yù)測(cè)增益參數(shù)的裝置,以及用于在預(yù)測(cè)增益超過(guò)閾值時(shí)禁止更新的修正裝置。
2.權(quán)利要求1的語(yǔ)音活動(dòng)性檢測(cè)器,其特征在于,在該語(yǔ)音活動(dòng)性檢測(cè)器中,輔助檢測(cè)器包括對(duì)從LPC殘留信號(hào)中獲得的信號(hào)作出響應(yīng)的發(fā)聲的語(yǔ)音檢測(cè)器。
3.權(quán)利要求1或2的語(yǔ)音活動(dòng)性檢測(cè)器,其特征在于,在該語(yǔ)音活動(dòng)性檢測(cè)器中,增益參數(shù)表示第6階或低于第6階的LPC預(yù)測(cè)的預(yù)測(cè)增益。
4.權(quán)利要求3的語(yǔ)音活動(dòng)性檢測(cè)器,在該語(yǔ)音活動(dòng)性檢測(cè)器中,增益參數(shù)表示第4階或低于第4階的LPC預(yù)測(cè)的預(yù)測(cè)增益。
5.以上任一權(quán)利要求的語(yǔ)音活動(dòng)性檢測(cè)器,其特征在于,還包括用于檢測(cè)輸入信號(hào)的一個(gè)或多個(gè)主頻率分量的裝置,以及用于將這些頻率與預(yù)定閾頻率作比較并僅當(dāng)所述主分量超過(guò)閾頻率時(shí)才允許禁止更新的裝置。
6.以上任一權(quán)利要求的語(yǔ)音活動(dòng)性檢測(cè)器,其特征在于,在該語(yǔ)音活動(dòng)性檢測(cè)器中,在增益計(jì)算裝置前面設(shè)有用于濾除輸入信號(hào)頻率范圍的高頻部分的濾波器,僅對(duì)位于該濾波器通帶內(nèi)的頻率分量進(jìn)行增益計(jì)算。
7.權(quán)利要求6的語(yǔ)音活動(dòng)性檢測(cè)器,其特征在于,具有兩個(gè)濾波器,這兩個(gè)濾波器有各自的通帶和用于計(jì)算各自通帶的增益參數(shù)的增益計(jì)算裝置,該語(yǔ)音活動(dòng)性檢測(cè)器還具有用于當(dāng)在任一通帶內(nèi)的預(yù)測(cè)增益超過(guò)閾值時(shí)禁止進(jìn)行更新的修正裝置。
8.權(quán)利要求6或7的語(yǔ)音活動(dòng)性檢測(cè)器,其特征在于,包括用于對(duì)被濾波信號(hào)進(jìn)行二次取樣的裝置。
全文摘要
通過(guò)對(duì)輸入信號(hào)和存儲(chǔ)的噪聲估算值(113)的頻譜進(jìn)行比較(114、115)來(lái)將語(yǔ)音與噪聲區(qū)分開來(lái)。在輔助檢測(cè)器(200)的控制下在無(wú)語(yǔ)音期間內(nèi)更新噪聲估算值(在緩沖器(113)中)。為了改善具有強(qiáng)諧波分量的信號(hào)(例如信號(hào)音)存在時(shí)的操作,根據(jù)輸入(x(i))和從在被具有與輸入的頻譜互補(bǔ)的響應(yīng)的濾波器(105)濾波后的輸入獲得的殘留信號(hào)(y(i))計(jì)算LPC預(yù)測(cè)增益,如果該增益超過(guò)閾值,緩沖器更新就被禁止。
文檔編號(hào)G10L25/78GK1130952SQ9419338
公開日1996年9月11日 申請(qǐng)日期1994年9月14日 優(yōu)先權(quán)日1993年9月14日
發(fā)明者P·A·巴列特 申請(qǐng)人:英國(guó)電訊公司