語音解碼裝置及補(bǔ)償幀生成方法

文檔序號：2829176閱讀：344來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>樂器;聲學(xué)設(shè)備的制造及制作,分析技術(shù)

專利名稱：語音解碼裝置及補(bǔ)償幀生成方法
技術(shù)領(lǐng)域：
本發(fā)明涉及語音解碼裝置及補(bǔ)償幀(repaired frame)生成方法。
背景技術(shù)：
在互聯(lián)網(wǎng)等中進(jìn)行的分組通信中，由于在傳輸路徑中丟失分組等原因而沒能在解碼裝置接收到編碼信息時，一般進(jìn)行該分組的丟失補(bǔ)償(屏蔽)處理。
例如在語音編碼領(lǐng)域，在ITU-T建議G.729中規(guī)定了如下幀丟失屏蔽處理(frame erasure concealment processing)(1)重復(fù)使用合成濾波器系數(shù)；(2)使音調(diào)增益和固定碼本增益(FCB增益)漸漸衰減；(3)使FCB增益預(yù)測器的內(nèi)部狀態(tài)漸漸衰減；(4)基于前一正常幀中的有聲模式/無聲模式的判定結(jié)果，使用在自適應(yīng)碼本或固定碼本中的任一個生成音源信號(例如，參見專利文獻(xiàn)1)。
上述方式中，使用由后置濾波器進(jìn)行的音調(diào)分析結(jié)果，根據(jù)音調(diào)預(yù)測增益的大小判定有聲模式/無聲模式，并且，例如，在前一正常幀為有聲模式時，使用自適應(yīng)碼本生成合成濾波器的音源矢量?；跒榱藥瑏G失補(bǔ)償處理而生成的音調(diào)滯后，利用自適應(yīng)碼本生成ACB(自適應(yīng)碼本)矢量，并將其乘以為了幀丟失補(bǔ)償處理而生成的音調(diào)增益，由此得到音源矢量。將在剛剛使用過的解碼音調(diào)滯后進(jìn)行增量后，用作為幀丟失補(bǔ)償處理的音調(diào)滯后。將剛剛使用過的解碼音調(diào)增益衰減一定倍數(shù)以后，用作為幀丟失補(bǔ)償處理的音調(diào)增益。
專利文獻(xiàn)1日本專利特開平9-120298號公報發(fā)明內(nèi)容發(fā)明要解決的問題然而，以往的語音解碼裝置基于過去的音調(diào)增益決定用于幀丟失補(bǔ)償處理的音調(diào)增益。但是，音調(diào)增益并不一定是反映了信號的能量變化的參數(shù)。于是，所生成的用于幀丟失補(bǔ)償處理的音調(diào)增益并沒有考慮到過去信號的能量變化的音調(diào)增益。而且，由于以一定比率使音調(diào)增益衰減，所以用于幀丟失補(bǔ)償處理的音調(diào)增益會與過去的信號的能量變化無關(guān)地衰減。也就是說，由于沒有考慮到過去信號的能量變化，而且以一定比率使音調(diào)增益衰減，所以經(jīng)補(bǔ)償?shù)膸c過去的信號之間難以保持能量的連續(xù)性，從而容易產(chǎn)生斷音感。由此，解碼信號的音質(zhì)惡化。
因此，本發(fā)明旨在提供一種語音解碼裝置及補(bǔ)償幀生成方法，在丟失補(bǔ)償處理中考慮過去信號的能量變化，從而能夠提高解碼信號的音質(zhì)。
解決問題的方案本發(fā)明的語音解碼裝置的結(jié)構(gòu)包括自適應(yīng)碼本，生成音源信號；計算單元，計算所述音源信號的子幀之間的能量變化；決定單元，基于所述能量變化決定所述自適應(yīng)碼本的增益；以及生成單元，使用所述自適應(yīng)碼本的增益生成對于丟失幀的補(bǔ)償幀。
發(fā)明效果根據(jù)本發(fā)明，在丟失補(bǔ)償處理中能夠考慮過去信號的能量變化，從而能夠提高解碼信號的音質(zhì)。

圖1是表示實施方式1所涉及的補(bǔ)償幀生成單元的主要結(jié)構(gòu)的方框圖；圖2是表示實施方式1所涉及的噪聲性附加單元內(nèi)部的主要結(jié)構(gòu)的方框圖；圖3是表示實施方式2所涉及的語音解碼裝置的主要結(jié)構(gòu)的方框圖；圖4表示使用自適應(yīng)碼本和固定碼本兩者而生成補(bǔ)償幀的例子；圖5表示以由固定碼本生成的噪聲性信號置換由自適應(yīng)碼本生成的音源中的一部分頻帶的例子；圖6是表示實施方式3所涉及的補(bǔ)償幀生成單元的主要結(jié)構(gòu)的方框圖；圖7是表示實施方式3所涉及的噪聲性附加單元內(nèi)部的主要結(jié)構(gòu)的方框圖；圖8是表示實施方式3所涉及的ACB分量生成單元內(nèi)部的主要結(jié)構(gòu)的方框圖；
圖9是表示實施方式3所涉及的FCB分量生成單元內(nèi)部的主要結(jié)構(gòu)的方框圖；圖10是表示實施方式3所涉及的丟失幀屏蔽處理單元的主要結(jié)構(gòu)的方框圖；圖11是表示實施方式3所涉及的模式判定單元內(nèi)部的主要結(jié)構(gòu)的方框圖；以及圖12是表示實施方式4所涉及的無線發(fā)送裝置和無線接收裝置的主要結(jié)構(gòu)的方框圖。
具體實施例方式
以下，參照附圖詳細(xì)說明本發(fā)明的實施方式。
(實施方式1)本發(fā)明的實施方式1所涉及的語音解碼裝置對緩沖在自適應(yīng)碼本中的、過去生成的音源信號的能量變化進(jìn)行分析，并生成自適應(yīng)碼本的音調(diào)增益(即自適應(yīng)碼本增益(ACB增益))，以便保持能量的連續(xù)性。由此，能夠改善作為丟失幀的補(bǔ)償幀而生成的音源矢量與過去信號之間的能量連續(xù)性，并能夠保持存儲在自適應(yīng)碼本中的信號的能量連續(xù)性。
圖1是表示本發(fā)明的實施方式1所涉及的語音解碼裝置內(nèi)部的補(bǔ)償幀生成單元100的主要結(jié)構(gòu)的方框圖。
該補(bǔ)償幀生成單元100包括自適應(yīng)碼本106；矢量生成單元115；噪聲性附加單元116；乘法器132；ACB增益生成單元135；以及能量變化計算單元143。
能量變化計算單元143計算由自適應(yīng)碼本106輸出的ACB(自適應(yīng)碼本)矢量的最后一個音調(diào)周期長度的音源信號的平均能量。另一方面，在能量變化計算單元143的內(nèi)部存儲器中，存儲著在前一子幀中同樣地計算出的1個音調(diào)周期長度的音源信號的平均能量。于是，能量變化計算單元143計算當(dāng)前子幀與前一子幀的一個周期長度的音源信號的平均能量之比。此外，該平均能量也可以是音源信號的能量的平方根或?qū)?shù)。能量變化計算單元143還對計算出的比值在子幀之間進(jìn)行平滑處理，并將經(jīng)平滑處理的比值輸出給ACB增益生成單元135。
能量變化計算單元143使用在當(dāng)前子幀計算出的一個音調(diào)周期長度的音源信號的能量，更新在前一子幀計算出的一個音調(diào)周期長度的音源信號的能量。例如，根據(jù)以下(式1)計算Ec。
Ec＝√((∑(ACB[Lacb-i])2)/P c) ...(式1)(在此，ACB自適應(yīng)碼本緩沖、Lacb自適應(yīng)碼本緩沖長度、Pc在當(dāng)前子幀的音調(diào)周期、Ec在當(dāng)前子幀的過去一個音調(diào)周期的音源信號的平均振幅(能量的平方根)、i＝1，2，...，Pc)然后，能量變化計算單元143將在前一子幀計算出的Ec作為Ep存儲起來，以Re＝Ec/Ep計算能量變化率Re。接著，能量變化計算單元143以0.98對Re進(jìn)行削波，使用譬如Sre＝0.7×Sre+0.3×Re這樣的算式進(jìn)行平滑處理，并將平滑能量變化率Sre輸出給ACB增益生成單元135。能量變化計算單元143最后使Ep＝Ec，由此更新Ep。
通過如上計算能量變化而決定ACB增益，由此能夠保持能量連續(xù)性。然后，使用所決定的ACB增益僅根據(jù)自適應(yīng)碼本生成音源，就能夠生成保持了能量連續(xù)性的音源矢量。
ACB增益生成單元135在使用過去解碼出的ACB增益而定義的用于屏蔽處理的ACB增益、和由能量變化計算單元143輸出的能量變化率信息所定義的用于屏蔽處理的ACB增益中任意選擇一個，并將最終的用于屏蔽處理的ACB增益輸出給乘法器132。
在此，能量變化率信息為對由前一子幀的最后一個音調(diào)周期得到的平均振幅A(-1)和由向前兩個子幀的最后1個音調(diào)周期得到的平均振幅A(-2)之比(即A(-1)/A(-2))、在子幀間進(jìn)行平滑處理而得到的信息，其表示過去的解碼信號的功率變化，基本上將其作為ACB增益。只是，在使用過去解碼出的ACB增益所定義的用于屏蔽處理的ACB增益大于上述能量變化率信息的情況下，也可以選擇使用過去解碼出的ACB增益所定義的用于屏蔽處理的ACB增益作為最終的用于屏蔽處理的ACB增益。此外，在上述A(-1)/A(-2)的比值超過上限值時，以上限值進(jìn)行削波。作為上限值，例如使用0.98。
矢量生成單元115根據(jù)自適應(yīng)碼本106生成相應(yīng)的ACB矢量。
可是，上述補(bǔ)償幀生成單元100不管有聲性的強(qiáng)弱，僅根據(jù)過去的信號的能量變化來決定ACB增益。于是，雖然能夠消除斷音感，但有時有聲性雖弱但ACB增益反而增高，此時會產(chǎn)生較強(qiáng)的蜂鳴聲。
因此，本實施方式中為了得到自然的音質(zhì)，具有與返回自適應(yīng)碼本106的反饋環(huán)路為不同系統(tǒng)的噪聲性附加單元116，用于對由自適應(yīng)碼本106生成的矢量附加噪聲性。
通過對由自適應(yīng)碼本106生成的音源矢量的特定頻帶分量進(jìn)行噪聲化處理，來進(jìn)行噪聲性附加單元116處的音源矢量的噪聲化處理。更具體來講，對由自適應(yīng)碼本106生成的音源矢量使用低通濾波器而去除高頻分量，并加上具有與所去除的高頻分量相同的信號能量的噪聲信號。對由固定碼本生成的音源矢量使用高通濾波器去除低頻分量，而生成該噪聲信號。低通濾波器和高通濾波器使用其阻帶和通帶彼此相反的完全重構(gòu)濾波器組(perfectreconfiguration filter bank)或與其相應(yīng)的濾波器。
根據(jù)上述結(jié)構(gòu)，在將最后正常接收到的音源波形的特征存儲在自適應(yīng)碼本106中的同時能夠任意附加噪聲性，從而任意加工所生成的音源矢量的特征。此外，即使對音源矢量附加噪聲性，由于對附加噪聲性之前的音源矢量的能量進(jìn)行存儲，所以不會影響到能量的連續(xù)性。
圖2是表示噪聲性附加單元116內(nèi)部的主要結(jié)構(gòu)的方框圖。
該噪聲性附加單元116包括乘法器110、111；ACB分量生成單元134；FCB增益生成單元139；FCB分量生成單元141；固定碼本145；矢量生成單元146以及加法器147。
ACB分量生成單元134使由矢量生成單元115輸出的ACB矢量通過低通濾波器，由此生成在由矢量生成單元115輸出的ACB矢量中不附加噪聲的頻帶分量，并將該分量作為ACB分量輸出。通過低通濾波器之后的ACB矢量A輸出到乘法器110和FCB增益生成單元139。
FCB分量生成單元141使由矢量生成單元146輸出的FCB(固定碼本)矢量通過高通濾波器，由此生成在由矢量生成單元146輸出的FCB矢量中要附加噪聲的頻帶分量，并將該分量作為FCB分量輸出。通過高通濾波器之后的FCB矢量F輸出到乘法器111和FCB增益生成單元139。
另外，上述低通濾波器和高通濾波器為線性相位FIR濾波器。
FCB增益生成單元139根據(jù)由ACB增益生成單元135輸出的用于屏蔽處理的ACB增益、由ACB分量生成單元134輸出的用于屏蔽處理的ACB矢量A、輸入到ACB分量生成單元134的、經(jīng)ACB分量生成單元134處理前的ACB矢量、以及由FCB分量生成單元141輸出的FCB矢量F，如下計算用于屏蔽處理的FCB增益。
FCB增益生成單元139對經(jīng)ACB分量生成單元134進(jìn)行處理前和處理后的ACB矢量的差矢量D，計算能量Ed(矢量D的各個要素的平方和)。然后，F(xiàn)CB增益生成單元139計算FCB矢量F的能量Ef(矢量F的各個要素的平方和)。其次，F(xiàn)CB增益生成單元139對由ACB分量生成單元134輸入的ACB矢量A和由FCB分量生成單元141輸入的FCB矢量F，計算互相關(guān)Raf(矢量A和矢量F的內(nèi)積)。接著，F(xiàn)CB增益生成單元139對由ACB分量生成單元134輸入的ACB矢量A和上述差矢量D，計算互相關(guān)Rad(矢量A和D的內(nèi)積)。然后，F(xiàn)CB增益生成單元139根據(jù)以下(式2)計算增益。(-Raf+√(Raf×Raf+Ef×Ed+2×Ef×Rad))/Ef...(式2)在此，所得的解為虛數(shù)或負(fù)數(shù)時，將√(Ed/Ef)作為增益。最后，F(xiàn)CB增益生成單元139將由上述(式2)得到的增益乘以由ACB增益生成單元135生成的用于屏蔽處理的ACB增益，由此得到用于屏蔽處理的FCB增益。
以上的記載為計算用于屏蔽處理的FCB增益以便使以下兩個矢量的能量相等的一個例子。在此所謂的兩個矢量，其中一個為將輸入到ACB分量生成單元134的原來的ACB矢量乘以用于屏蔽處理的ACB增益而得到的矢量，而另一個為將ACB矢量A乘以用于屏蔽處理的ACB增益而得到的矢量，和將FCB矢量F乘以用于屏蔽處理的FCB增益(此為未知的、在此要計算的對象)而得到的矢量的和矢量。
加法器147，將由ACB增益生成單元135決定的ACB增益乘以由ACB分量生成單元134生成的ACB矢量A(音源矢量的ACB分量)而得到的矢量、和將由FCB增益生成單元139決定的FCB增益乘以由FCB分量生成單元141生成的FCB矢量F(音源矢量的FCB分量)而得到的矢量的和矢量，作為最終的音源矢量輸出給合成濾波器。此外，將輸入到ACB分量生成單元134的(經(jīng)低通濾波器處理前的)ACB矢量乘以用于屏蔽處理的ACB增益的矢量反饋給自適應(yīng)碼本106，由此僅使用ACB矢量更新自適應(yīng)碼本106，并將由加法器147得到的矢量作為合成濾波器的激勵音源。
另外，對于合成濾波器的驅(qū)動音源，也可以施加相位擴(kuò)散處理(phasedispersion processing)或?qū)崿F(xiàn)音調(diào)周期性增強(qiáng)的處理。
如上所述，根據(jù)本實施方式，由于根據(jù)過去的解碼語音信號的能量變化率決定ACB增益，并生成與由使用該增益生成的ACB矢量的能量相等的音源矢量，所以解碼語音的能量變化在丟失幀的前后變得平滑，因此難以發(fā)生斷音感。
另外，由于在上述結(jié)構(gòu)中僅使用自適應(yīng)碼矢量進(jìn)行自適應(yīng)碼本106的更新，所以能夠抑制例如使用經(jīng)隨機(jī)噪聲化的音源矢量更新自適應(yīng)碼本106時發(fā)生的后續(xù)幀的噪聲感。
另外，在上述結(jié)構(gòu)中，由于在語音信號的有聲恒定單元中的屏蔽處理主要僅對高頻(例如，3kHz以上)附加噪聲，所以與以往的對所有頻域附加噪聲的方式相比，不容易發(fā)生噪聲感。
(實施方式2)在實施方式1中，作為本發(fā)明所涉及的補(bǔ)償幀生成單元的結(jié)構(gòu)的一例，將補(bǔ)償幀生成單元單獨提出來進(jìn)行了說明。在本發(fā)明的實施方式2中，示出了將本發(fā)明所涉及的補(bǔ)償幀生成單元安裝在語音解碼裝置時的語音解碼裝置的結(jié)構(gòu)的一例。此外，對于與實施方式1相同的結(jié)構(gòu)單元附上相同的標(biāo)記，并省略其說明。
圖3是表示本發(fā)明的實施方式2所涉及的語音解碼裝置的主要結(jié)構(gòu)的方框圖。
本實施方式所涉及的語音解碼裝置在輸入幀是正常幀時進(jìn)行通常的解碼處理，而在輸入幀不是正常幀(丟失了幀)時，進(jìn)行對該丟失幀的屏蔽處理。切換開關(guān)121至127根據(jù)表示輸入幀是否為正常幀的壞幀指示(BFI)進(jìn)行切換，由此實現(xiàn)上述兩種處理。
首先對本實施方式所涉及的語音解碼裝置在通常的解碼處理中的動作進(jìn)行說明。圖3所示的開關(guān)的狀態(tài)表示在通常的解碼處理中的開關(guān)的位置。
復(fù)用分離單元101將編碼比特流分離為各個參數(shù)(LPC代碼、音調(diào)代碼、音調(diào)增益代碼、FCB代碼以及FCB增益代碼)，并分別供給給相應(yīng)的解碼單元。LPC解碼單元102基于由復(fù)用分離單元101供給的LPC代碼解碼出LPC參數(shù)。音調(diào)周期解碼單元103基于由復(fù)用分離單元101供給的音調(diào)代碼解碼出音調(diào)周期。ACB增益解碼單元104基于由復(fù)用分離單元101供給的ACB代碼解碼出ACB增益。FCB增益解碼單元105基于由復(fù)用分離單元101供給的FCB增益代碼解碼出FCB增益。
自適應(yīng)碼本106使用由音調(diào)周期解碼單元103輸出的音調(diào)周期生成ACB矢量，并輸出給乘法器110。乘法器110將由ACB增益解碼單元104輸出的ACB增益乘以由自適應(yīng)碼本106輸出的ACB矢量，并將增益調(diào)整后的ACB矢量供給給音源生成單元108。另一方面，固定碼本107基于由復(fù)用分離單元101輸出的固定碼本代碼生成FCB矢量，并輸出給乘法器111。乘法器111將由FCB增益解碼單元105輸出的FCB增益乘以由固定碼本107輸出的FCB矢量，并將增益調(diào)整后的FCB矢量供給給音源生成單元108。音源生成單元108將由乘法器110、111輸出的兩個矢量相加而生成音源矢量，將其反饋給自適應(yīng)碼本106，并輸出給合成濾波器109。
音源生成單元108從乘法器110得到已乘上了用于屏蔽處理的ACB增益后的ACB矢量，而從乘法器111得到已乘上了用于屏蔽處理的FCB增益后的FCB矢量，并將兩者相加而得到音源矢量。沒有差錯時，音源生成單元108將該所相加的矢量作為音源信號反饋給自適應(yīng)碼本106，并輸出給合成濾波器109。
合成濾波器109為基于經(jīng)由開關(guān)124輸入的線性預(yù)測系數(shù)(LPC)構(gòu)成的線性預(yù)測濾波器，通過輸入由音源生成單元108輸出的激勵音源矢量而進(jìn)行濾波處理，由此輸出解碼語音信號。
所輸出的解碼語音信號在經(jīng)過后置濾波器等的后處理之后，成為語音解碼裝置的最終輸出。此外，該信號也輸出到丟失幀屏蔽處理單元112內(nèi)部的零交叉率計算單元(未圖示)。
下面，對本實施方式所涉及的語音解碼裝置在屏蔽處理中的動作進(jìn)行說明。該處理主要由丟失幀屏蔽處理單元112執(zhí)行。
在通常的解碼處理中，也將由LPC解碼單元102、音調(diào)周期解碼單元103、ACB增益解碼單元104以及FCB增益解碼單元105得到的各個解碼參數(shù)(LPC參數(shù)、音調(diào)周期、ACB增益以及FCB增益)供給給丟失幀屏蔽處理單元112。這四種解碼參數(shù)、前幀的解碼語音(合成濾波器109的輸出)、存儲于自適應(yīng)碼本106中的過去生成的音源信號、為用于當(dāng)前幀(丟失幀)而生成的ACB矢量以及為用于當(dāng)前幀(丟失幀)而生成的FCB矢量輸入到丟失幀屏蔽處理單元112。丟失幀屏蔽處理單元112使用這些參數(shù)進(jìn)行后述的丟失幀的屏蔽處理，并輸出所得到的LPC參數(shù)、音調(diào)周期、ACB增益、固定碼本代碼、FCB增益、ACB矢量以及FCB矢量。
在所生成的用于屏蔽處理的ACB矢量、用于屏蔽處理的ACB增益、用于屏蔽處理的FCB矢量以及用于屏蔽處理的FCB增益中，用于屏蔽處理的ACB矢量輸出到乘法器110，用于屏蔽處理的ACB增益輸出到乘法器110，用于屏蔽處理的FCB矢量經(jīng)由切換開關(guān)125輸出到乘法器111，而用于屏蔽處理的FCB增益經(jīng)由切換開關(guān)126輸出到乘法器111。
音源生成單元108在屏蔽處理中，將輸入給ACB分量生成單元134的(經(jīng)LPF處理前的)ACB矢量乘以用于屏蔽處理的ACB增益，并將所得到的矢量反饋給自適應(yīng)碼本106(自適應(yīng)碼本106僅使用ACB矢量進(jìn)行更新)，將由上述加法處理得到的矢量作為合成濾波器的激勵音源。此外，也可以像沒有差錯時那樣對合成濾波器的激勵音源施加相位擴(kuò)散處理和實現(xiàn)音調(diào)周期增強(qiáng)的處理等。
另外，在上述說明中，丟失幀屏蔽處理單元112和音源生成單元108相當(dāng)于實施方式1中的補(bǔ)償幀生成單元。此外，用語音解碼裝置的固定碼本107來代替用于噪聲性附加處理中的固定碼本(實施方式1中的固定碼本145)。
如上所述，根據(jù)本實施方式，能夠?qū)⒈景l(fā)明所涉及的補(bǔ)償幀生成單元安裝在語音解碼裝置中。
另外，在AMR方式中，通過在開始一個幀的解碼處理之前隨機(jī)生成一個幀長度的比特流來進(jìn)行相當(dāng)于后述的FCB代碼生成單元140的處理，所以并不一定需要配置專門生成FCB代碼的單元。
另外，輸出給合成濾波器109的音源信號和反饋給自適應(yīng)碼本106的音源信號并非必需為相同信號。例如，在生成輸出給合成濾波器109的音源信號時，也可以如AMR方式那樣對FCB矢量適用相位擴(kuò)散處理，或施加增強(qiáng)音調(diào)周期的處理。此時，使輸出給自適應(yīng)碼本106的信號的生成方法與編碼端的結(jié)構(gòu)一致。由此，有時能進(jìn)一步改善主觀質(zhì)量。
另外，雖然在本實施方式中由FCB增益解碼單元105將FCB增益輸入給丟失幀屏蔽處理單元112，但這并不一定是必需的。在上述方法中在計算用于屏蔽處理的FCB增益之前需要求出臨時的用于屏蔽處理的FCB增益時，需要FCB增益。或者，在有限字長的固定小數(shù)點計算中，為了通過使動態(tài)范圍變窄而防止運算精確度的惡化，將上述FCB矢量F預(yù)先乘以該臨時的用于屏蔽處理的FCB增益時，也需要FCB增益。
(實施方式3)對于具有有聲和無聲的中間性質(zhì)的丟失幀，優(yōu)選方式為如圖4所示使用自適應(yīng)碼本和固定碼本兩者，通過混合由這些碼本生成的音源矢量而生成補(bǔ)償幀。然而，這種中間性質(zhì)的信號存在各種情形，例如，由于具有噪聲性而使其有聲性降低，或由于功率變化而使其有聲性降低，或由于是過渡部分、上升部分、字尾部分的附近而使其有聲性降低等，所以，如果采用以固定方式使用隨機(jī)生成的固定碼本生成音源信號的結(jié)構(gòu)的話，則解碼語音中會發(fā)生噪聲感，導(dǎo)致主觀質(zhì)量的惡化。
另一方面，CELP方式的語音解碼將過去生成的音源信號存儲在自適應(yīng)碼本中，并基于使用該音源信號表示對于當(dāng)前輸入信號的音源信號的模型。也就是說，遞歸使用存儲在自適應(yīng)碼本中的音源信號。于是，一旦音源信號成為噪聲性信號，由于其影響的傳播，在后續(xù)的幀中也成為噪聲性的信號，這成為一個問題。
因此，在本實施方式中，如圖5所示僅將由自適應(yīng)碼本生成的音源中的一部分頻帶置換為由固定碼本生成的噪聲性信號，由此盡可能地減少噪聲對主觀質(zhì)量的影響。更具體來講，僅將由自適應(yīng)碼本生成的音源的高頻帶置換為由固定碼本生成的噪聲性信號。其原因在于，高頻分量具有噪聲性是在實際的語音信號中能觀察到的現(xiàn)象，所以，與將全部頻帶均一地噪聲化處理相比，更容易得到自然的主觀質(zhì)量。
另外，本實施方式中，為附加噪聲性還配置了模式判定單元，以根據(jù)所判定的語音模式在噪聲性附加單元中切換要附加噪聲的信號頻帶，來控制所附加的噪聲性的強(qiáng)弱。
另外，使用經(jīng)頻帶限制的自適應(yīng)碼本和經(jīng)頻帶限制的固定碼本生成的音源矢量合成音源信號，意味著無法原封不動地使用針對作為正常幀的前幀得到的ACB增益和FCB增益。因為基于未經(jīng)頻帶限制的自適應(yīng)碼本和未經(jīng)頻帶限制的固定碼本生成的音源矢量的合成矢量的增益，與基于經(jīng)頻帶限制的自適應(yīng)碼本和經(jīng)頻帶限制的固定碼本生成的音源矢量的增益不同。于是，為了防止發(fā)生幀間的能量的不連續(xù)，就需要實施方式1中所示的補(bǔ)償幀生成單元。
另外，在將由固定碼本生成的音源矢量混合時，可以挪用實施方式1中所示的噪聲性附加單元。
由此，能夠根據(jù)語音信號的特征(語音模式)切換解碼音源信號的要進(jìn)行噪聲化處理的信號頻帶。例如，在周期性較低而噪聲性較高的模式中，將附加噪聲的信號頻帶加寬，而在周期性較強(qiáng)而有聲性較高的模式中，將附加噪聲的信號頻帶縮小，由此能夠使解碼合成語音信號的主觀質(zhì)量更為自然。
圖6是表示本發(fā)明實施方式3所涉及的補(bǔ)償幀生成單元100a的主要結(jié)構(gòu)的方框圖。此外，該補(bǔ)償幀生成單元100a具有與實施方式1所示的補(bǔ)償幀生成單元100同樣的基本結(jié)構(gòu)，對相同的結(jié)構(gòu)單元附上相同的標(biāo)記，并省略其說明。
模式判定單元138使用過去的解碼音調(diào)周期的歷史記錄、過去的解碼合成語音信號的零交叉率、過去的平滑ACB增益、過去的解碼音源信號的能量變化率以及連續(xù)丟失幀數(shù)量，進(jìn)行解碼語音信號的模式判定。噪聲性附加單元116a基于由模式判定單元138判定的模式，切換附加噪聲的信號頻帶。
圖7是表示噪聲性附加單元116a內(nèi)部的主要結(jié)構(gòu)的方框圖。此外，該噪聲性附加單元116a具有與實施方式1所示的噪聲性附加單元116同樣的基本結(jié)構(gòu)，對相同的結(jié)構(gòu)單元附上相同的標(biāo)記，并省略其說明。
濾波器截止頻率切換單元137根據(jù)由模式判定單元138輸出的模式判定結(jié)果決定濾波器截止頻率，并輸出對應(yīng)于ACB分量生成單元134和FCB分量生成單元141的濾波器系數(shù)。
圖8是表示上述ACB分量生成單元134內(nèi)部的主要結(jié)構(gòu)的方框圖。
ACB分量生成單元134在BFI指示丟失幀時，使由矢量生成單元115輸出的ACB矢量通過LPF(低通濾波器)161，由此作為ACB分量生成不附加噪聲的頻帶分量。該LPF 161為基于從濾波器截止頻率切換單元137輸出的濾波器系數(shù)構(gòu)成的線性相位FIR濾波器。濾波器截止頻率切換單元137存儲有與多種截止頻率相對應(yīng)的濾波器系數(shù)組合，選擇與由模式判定單元138輸出的模式判定結(jié)果相對應(yīng)的濾波器系數(shù)并輸出給LPF 161。
濾波器的截止頻率與語音模式之間的對應(yīng)關(guān)系例如為如下。在此表示電話頻帶語音中語音模式為三種模式結(jié)構(gòu)的例子。
有聲模式截止頻率＝3kHz噪聲模式截止頻率＝0Hz(全頻帶截止＝ACB矢量為零矢量)
其它模式截止頻率＝1kHz圖9是表示上述FCB分量生成單元141內(nèi)部的主要結(jié)構(gòu)的方框圖。
由矢量生成單元146輸出的FCB矢量在BFI指示丟失幀時輸入到高通濾波器(HPF)171。HPF 171為基于從濾波器截止頻率切換單元137輸出的濾波器系數(shù)構(gòu)成的線性相位FIR濾波器。濾波器截止頻率切換單元137存儲著與多種截止頻率相對應(yīng)的濾波器系數(shù)組合，選擇與由模式判定單元138輸出的模式判定結(jié)果相對應(yīng)的濾波器系數(shù)組合并輸出給HPF 171。
濾波器的截止頻率與語音模式之間的關(guān)系例如為如下。在此也表示電話頻帶語音中語音模式為三種模式結(jié)構(gòu)的例子。
有聲模式截止頻率＝3kHz噪聲模式截止頻率＝0Hz(全頻帶帶通＝將輸入的FCB矢量原封不動地輸出)其它模式截止頻率＝1kHz此時，如果通過如下(式3)所示的音調(diào)周期化處理將最終的FCB矢量的周期性增強(qiáng)的話，則該FCB矢量對于生成具有周期性的信號的情況有效。
c(n)＝c(n)+βc(n-T)[n＝T，T+1，...，L-1]...(式3)(其中，c(n)為FCB矢量，β為音調(diào)周期化增益系數(shù)，T為音調(diào)周期，L為子幀長度)將本實施方式所涉及的補(bǔ)償幀生成單元安裝在實施方式2所示的語音編碼裝置中，則如下。圖10是表示本實施方式所涉及的語音解碼裝置內(nèi)部的丟失幀屏蔽處理單元112的主要結(jié)構(gòu)的方框圖。此外，對于已經(jīng)說明的方框附上相同的標(biāo)記，并基本上省略其說明。
LPC生成單元136基于過去輸入的解碼LPC信息生成用于屏蔽處理的LPC參數(shù)、并將其經(jīng)由切換開關(guān)124輸出給合成濾波器109。作為用于屏蔽處理的LPC參數(shù)的生成方法，例如在AMR方式中使剛剛之前的LSP參數(shù)近似于平均的LSP參數(shù)后將其作為用于屏蔽處理的LSP參數(shù)，并將其變換為LPC參數(shù)作為用于屏蔽處理的LPC參數(shù)。此外，在幀的丟失持續(xù)較長時間(例如，3個或3個以上20ms的幀)時，也可以對LPC參數(shù)進(jìn)行加權(quán)處理，由此擴(kuò)展合成濾波器的帶寬而進(jìn)行白色化處理。假設(shè)LPC合成濾波器的傳遞系數(shù)為1/A(z)時，該加權(quán)表現(xiàn)為1/A(z/y)，其中y的取值約為0.99至0.97，或者將該值作為初始值漸漸降低。此外，1/A(z)基于以下(式4)。
1/A(z)＝1/(1+∑a(i)z-i) ...(式4)(其中，i＝1，...，p(p為LPC分析階數(shù)))音調(diào)周期生成單元131在由模式判定單元138的模式判定之后，生成音調(diào)周期。具體來講，在AMR方式的12.2kbps模式時，將前一的正常子幀的解碼音調(diào)周期(整數(shù)精確度)輸出，作為丟失幀中的音調(diào)周期。也就是說，音調(diào)周期生成單元131具有存儲解碼音調(diào)的存儲器，對每個子幀更新其值，在有差錯時將該存儲的值輸出，作為屏蔽處理時的音調(diào)周期。此外，自適應(yīng)碼本106根據(jù)由音調(diào)周期生成單元131輸出的該音調(diào)周期，生成相對應(yīng)的ACB矢量。
FCB代碼生成單元140將所生成的FCB代碼經(jīng)由切換開關(guān)127輸出給固定碼本107。
固定碼本107將與FCB代碼相對應(yīng)的FCB矢量輸出給FCB分量生成單元141。
零交叉率計算單元142得到由合成濾波器輸出的合成信號，計算零交叉率并輸出給模式判定單元138。在此，為了提取前一個音調(diào)周期的信號的特征(為了反映在時間上最接近的部分的特征)，優(yōu)選使用前一個音調(diào)周期計算零交叉率。
如上生成的各個參數(shù)分別被輸出，具體來講，用于屏蔽處理的ACB矢量經(jīng)由切換開關(guān)123輸出給乘法器110，用于屏蔽處理的ACB增益經(jīng)由切換開關(guān)122輸出給乘法器110，用于屏蔽處理的FCB矢量經(jīng)由切換開關(guān)125輸出給乘法器111，用于屏蔽處理的FCB增益經(jīng)由切換開關(guān)126輸出給乘法器111。
圖11是表示模式判定單元138內(nèi)部的主要結(jié)構(gòu)的方框圖。
模式判定單元138使用音調(diào)歷史記錄的分析結(jié)果、平滑音調(diào)增益、能量變化信息、零交叉率信息以及丟失幀的連續(xù)數(shù)目，進(jìn)行模式判定。由于本發(fā)明的模式判定為用于屏蔽處理的判定，所以，在幀中進(jìn)行一次(在從結(jié)束正常幀的解碼處理之后到第一次進(jìn)行使用模式信息的屏蔽處理為止的時間)即可，在本實施方式中為在第一子幀的音源解碼處理的開頭部分進(jìn)行。
音調(diào)歷史記錄分析單元182在緩沖器中存儲著有關(guān)過去的多個子幀的解碼音調(diào)周期信息，根據(jù)過去的音調(diào)周期的變動的大小判定有聲恒定性(voicedstationarity)。更具體來講，在存儲在緩沖器內(nèi)的最大音調(diào)周期與最小音調(diào)周期之間的差在規(guī)定閾值(例如，最大音調(diào)周期的15％或10個采樣(8kHz采樣處理時))以內(nèi)時，判定為有聲恒定性較高。作為音調(diào)周期的緩沖器更新，如果存儲著1個幀份的音調(diào)周期信息的話，則在一幀中進(jìn)行一次(通常在幀處理的最后)即可，否則在每個子幀中進(jìn)行一次(通常在子幀處理的最后)即可。所存儲的音調(diào)周期的數(shù)目為之前4個子幀(20ms)左右。由于僅根據(jù)音調(diào)變化的大小進(jìn)行判定，在倍音調(diào)錯誤(將音調(diào)誤認(rèn)為二分之一)或半音調(diào)錯誤(將音調(diào)誤認(rèn)為兩倍)時不會判定為有聲恒定，所以，不會出現(xiàn)因使用倍音調(diào)或半音調(diào)的信息進(jìn)行屏蔽處理而發(fā)生的“語音變?yōu)榧俾暋钡默F(xiàn)象。
平滑ACB增益計算單元183進(jìn)行子幀間平滑處理，以便將解碼ACB增益在子幀間的變動抑制到一定程度。例如，進(jìn)行由下式所示的程度的平滑處理。
(平滑ACB增益)＝0.7×(平滑ACB增益)+0.3×(解碼ACB增益)在計算出的平滑ACB增益超過閾值(例如為0.7)時判定為有聲性較高。
判定單元184除了上述參數(shù)之外，還使用能量變化信息和零交叉率信息進(jìn)行模式判定。具體來講，在音調(diào)歷史記錄分析結(jié)果表示有聲恒定性較高、且平滑ACB增益的閾值處理的結(jié)果表示有聲性較高、且能量變化為閾值以下(例如，小于2)、且零交叉率為閾值以下(例如，小于0.7)的情況下，判定為有聲(有聲恒定)模式，在零交叉率為閾值以上(例如，0.7或0.7以上)的情況下，判定為噪聲(噪聲性信號)模式，而在其它情況下判定為其它(上升、過渡)模式。
模式判定單元138在進(jìn)行模式判定之后，根據(jù)當(dāng)前幀為連續(xù)第幾個丟失幀決定最終模式判定結(jié)果。具體來講，到連續(xù)第二幀為止將上述模式判定結(jié)果作為最終模式判定結(jié)果，在為連續(xù)第三幀時，如果上述模式判定結(jié)果為有聲模式的話，則改變?yōu)槠渌Ｊ讲⑶易鳛樽罱K模式判定結(jié)果，而在連續(xù)第四幀以后則作為噪聲模式。通過如上的最終模式判定結(jié)果，能夠防止在突發(fā)幀丟失時(幀丟失連續(xù)了3幀或3幀以上時)發(fā)生蜂鳴聲，并使解碼信號隨著時間得到自然的噪聲化，由此能夠緩和主觀上的不適感。如果配置連續(xù)丟失幀數(shù)目計數(shù)器，以便在當(dāng)前幀為正常幀時將計數(shù)值復(fù)位為0，否則每次將計數(shù)值加1的話，通過參照該計數(shù)器的值就能夠判斷為連續(xù)第幾個丟失幀。此外，在AMR方式中具有狀態(tài)機(jī)，所以參照狀態(tài)機(jī)的狀態(tài)即可。
如上所述，根據(jù)本實施方式，在有聲部分的屏蔽處理時能夠防止噪聲感的發(fā)生，即使在剛剛之前的子幀的增益偶然成為較小值的情況下，也能夠防止在屏蔽處理時發(fā)生斷音。
另外，在上述結(jié)構(gòu)中，由于模式判定單元138在解碼端無需進(jìn)行音調(diào)分析即可進(jìn)行模式判定，所以在適用于不進(jìn)行解碼端的音調(diào)分析的編碼解碼器時，能夠壓縮運算量。
另外，在上述結(jié)構(gòu)中，由于根據(jù)丟失幀的連續(xù)數(shù)目改變所附加的噪聲的頻帶，所以能夠抑制因屏蔽處理而發(fā)生的蜂鳴聲。
(實施方式4)圖12是表示將本發(fā)明所涉及的語音解碼裝置適用于無線通信系統(tǒng)時的無線發(fā)送裝置300和與其相對應(yīng)的無線接收裝置310的主要結(jié)構(gòu)的方框圖。
無線發(fā)送裝置300包括輸入裝置301、A/D變換裝置302、語音編碼裝置303、信號處理裝置304、RF調(diào)制裝置305、發(fā)送裝置306以及天線307。
A/D變換裝置302的輸入端子連接到輸入裝置301的輸出端子。語音編碼裝置303的輸入端子連接到A/D變換裝置302的輸出端子。信號處理裝置304的輸入端子連接到語音編碼裝置303的輸出端子。RF調(diào)制裝置305的輸入端子連接到信號處理裝置304的輸出端子。發(fā)送裝置306的輸入端子連接到RF調(diào)制裝置305的輸出端子。天線307連接到發(fā)送裝置306的輸出端子。
輸入裝置301接收語音信號，將其變換成作為電信號的模擬語音信號，并將其提供給A/D變換裝置302。A/D變換裝置302將來自輸入裝置301的模擬語音信號變換成數(shù)字語音信號，并將其提供給語音編碼裝置303。語音編碼裝置303對來自A/D變換裝置302的數(shù)字語音信號進(jìn)行編碼而生成語音編碼比特流，并將其提供給信號處理裝置304。信號處理裝置304對來自語音編碼裝置303的語音編碼比特流進(jìn)行信道編碼處理、分組化處理和發(fā)送緩沖處理等之后，將該語音編碼比特流提供給RF調(diào)制裝置305。RF調(diào)制裝置305對來自信號處理裝置304的經(jīng)信道編碼處理等的語音編碼比特串的信號進(jìn)行調(diào)制，并將其提供給發(fā)送裝置306。發(fā)送裝置306經(jīng)由天線307，將來自RF調(diào)制裝置305的經(jīng)調(diào)制的語音編碼信號作為電波(RF信號)發(fā)送出去。
在無線發(fā)送裝置300中，對經(jīng)由A/D變換裝置302得到的數(shù)字語音信號，以幾十ms的幀為單位進(jìn)行處理。在構(gòu)成系統(tǒng)的網(wǎng)絡(luò)為分組網(wǎng)的情況下，將1個幀或幾個幀的編碼數(shù)據(jù)包裝在1個分組中并將該分組發(fā)送給分組網(wǎng)。此外，上述網(wǎng)絡(luò)為線路交換網(wǎng)的情況下，不需進(jìn)行分組化處理和發(fā)送緩沖處理等。
無線接收裝置310包括天線311、接收裝置312、RF解調(diào)裝置313、信號處理裝置314、語音解碼裝置315、D/A變換裝置316以及輸出裝置317。此外，作為語音解碼裝置315使用本實施方式所涉及的語音解碼裝置。
接收裝置312的輸入端子連接到天線311。RF解調(diào)裝置313的輸入端子連接到接收裝置312的輸出端子。信號處理裝置314的輸入端子連接到RF解調(diào)裝置313的輸出端子。語音解碼裝置315的輸入端子連接到信號處理裝置314的輸出端子。D/A變換裝置316的輸入端子連接到語音解碼裝置315的輸出端子。輸出裝置317的輸入端子連接到D/A變換裝置316的輸出端子。
接收裝置312經(jīng)由天線311，接收包含語音編碼信息的電波(RF信號)而生成作為模擬的電信號的接收語音編碼信號，并將其提供給RF解調(diào)裝置313。如果經(jīng)由天線311接收到的電波(RF信號)在傳播路徑?jīng)]有發(fā)生信號的衰減或噪聲的重疊的話，則將為與從無線發(fā)送裝置300發(fā)送的電波(RF信號)完全相同的信號。RF解調(diào)裝置313對來自接收裝置312的接收語音編碼信號進(jìn)行解調(diào)，并將其提供給信號處理裝置314。信號處理裝置314對來自RF解調(diào)裝置313的接收語音編碼信號進(jìn)行抖動吸收緩沖處理、分組組合處理以及信道解碼處理等，并將接收語音編碼比特流提供給語音解碼裝置315。語音解碼裝置315對來自信號處理裝置314的接收語音編碼比特流進(jìn)行解碼處理而生成解碼語音信號，并將其提供給D/A變換裝置316。D/A變換裝置316將來自語音解碼裝置315的數(shù)字解碼語音信號變換成模擬解碼語音信號，并將其提供給輸出裝置317。輸出裝置317將來自D/A變換裝置316的模擬解碼語音信號變換成空氣的振動，并作為音波輸出以便讓人聽到。
如上所述，根據(jù)本實施方式的語音解碼裝置可適用于無線通信系統(tǒng)中。此外，根據(jù)本實施方式的語音解碼裝置并不限用于無線通信系統(tǒng)中，例如，不言而喻也可以適用于有線通信系統(tǒng)中。
以上對本發(fā)明的各個實施方式進(jìn)行了說明。
本發(fā)明所涉及的語音解碼裝置及補(bǔ)償幀生成方法并不限于上述實施方式1至4，也可以進(jìn)行各種各樣的變形后實施之。
另外，本發(fā)明所涉及的語音解碼裝置、無線發(fā)送裝置、無線接收裝置以及補(bǔ)償幀生成方法可以安裝在移動通信系統(tǒng)中的通信終端裝置以及基站裝置，由此能夠提供具有與以上說明同樣的作用效果的通信終端裝置、基站裝置以及移動通信系統(tǒng)。
另外，本發(fā)明所涉及的語音解碼裝置也可以適用于有線通信系統(tǒng)中，由此能夠提供具有與以上的說明同樣的作用效果的有線通信系統(tǒng)。
另外，雖然在此以由硬件構(gòu)成本發(fā)明的情況為例進(jìn)行了說明，但本發(fā)明也可以由軟件實現(xiàn)。例如，將本發(fā)明所涉及的補(bǔ)償幀生成方法的算法使用編程語言記述，將該程序存儲于存儲器并讓信息處理單元實行，由此能夠?qū)崿F(xiàn)與本發(fā)明所涉及的語音解碼裝置同樣的功能。
另外，用于上述各實施方式的說明中的各功能模塊，典型地由集成電路LSI來實現(xiàn)。這些即可以分別作成一個芯片，也可以包括其中一部分或者是全部而作成一個芯片。
另外，雖然在此稱作LSI，但根據(jù)集成度的不同也可以稱為IC、系統(tǒng)LSI、超LSI以及極大LSI等。
另外，集成電路化的技術(shù)并不限于LSI，也可以使用專用電路或通用處理器來實現(xiàn)。也可以利用制造LSI后可編程的現(xiàn)場可編程門陣列(FPGA)，也可以利用可將LSI內(nèi)部的電路塊連接或設(shè)定重新配置的可重配置處理器(Reconfigurable Processor)。
再有，如果隨著半導(dǎo)體技術(shù)的進(jìn)步或者其他技術(shù)的派生，出現(xiàn)了替換LSI的集成電路技術(shù)，當(dāng)然，也可以利用該技術(shù)來實現(xiàn)功能模塊的集成化。也有應(yīng)用生物工程學(xué)技術(shù)等的可能性。
本說明書基于2004年7月20日申請的日本專利申請?zhí)卦?004-212180號。其內(nèi)容全部包括在此作為參考。
工業(yè)實用性本發(fā)明所涉及的語音解碼裝置及補(bǔ)償幀生成方法，可以適用于移動通信系統(tǒng)等用途。
權(quán)利要求
1.一種語音解碼裝置，包括自適應(yīng)碼本，生成音源信號；計算單元，計算所述音源信號的子幀間的能量變化；決定單元，基于所述能量變化決定所述自適應(yīng)碼本的增益；以及生成單元，使用所述自適應(yīng)碼本的增益生成對于丟失幀的補(bǔ)償幀。
2.如權(quán)利要求1所述的語音解碼裝置，還包括噪聲化單元，對所述補(bǔ)償幀的一部分頻帶進(jìn)行噪聲化處理。
3.如權(quán)利要求2所述的語音解碼裝置，其中，所述噪聲化單元對所述補(bǔ)償幀的高頻帶進(jìn)行噪聲化處理。
4.如權(quán)利要求2所述的語音解碼裝置，其中，所述噪聲化單元根據(jù)所述丟失幀以前的幀的語音模式，決定進(jìn)行噪聲化處理的所述一部分頻帶。
5.如權(quán)利要求2所述的語音解碼裝置，其中，所述噪聲化單元根據(jù)丟失幀的連續(xù)數(shù)目，將進(jìn)行噪聲化處理的所述一部分頻帶加寬。
6.一種通信終端裝置，包括權(quán)利要求1所述的語音解碼裝置。
7.一種基站裝置，包括權(quán)利要求1所述的語音解碼裝置。
8.一種補(bǔ)償幀生成方法，包括計算步驟，計算由自適應(yīng)碼本生成的音源信號的子幀間的能量變化；決定步驟，根據(jù)所述能量變化決定所述自適應(yīng)碼本的增益；以及生成步驟，使用所述自適應(yīng)碼本的增益生成對于丟失幀的補(bǔ)償幀。
全文摘要
提供一種語音解碼裝置，在丟失補(bǔ)償處理中考慮過去信號的能量變化，從而能夠提高解碼信號的音質(zhì)。在該裝置中，能量變化計算單元(143)，計算由自適應(yīng)碼本(106)輸出的ACB矢量的最后一個音調(diào)周期長度的音源信號的平均能量。此外，能量變化計算單元(143)計算當(dāng)前子幀與前一子幀的平均能量之比，并輸出給ACB增益生成單元(135)。ACB增益生成單元(135)由過去解碼出的ACB增益或由能量變化計算單元(143)輸出的能量變化率信息中的任一個所定義的用于屏蔽處理的ACB增益輸出給乘法器(132)。
文檔編號G10L19/00GK1989548SQ20058002448
公開日2007年6月27日申請日期2005年7月14日優(yōu)先權(quán)日2004年7月20日
發(fā)明者江原宏幸申請人:松下電器產(chǎn)業(yè)株式會社

完整全部詳細(xì)技術(shù)資料下載