專利名稱:語音頻信號的丟幀補償方法和裝置的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及語音頻編解碼領(lǐng)域,具體涉及一種MDCT(Modified Discrete CosineTransform,改進(jìn)的離散余弦變換)域語音頻信號的丟幀補償方法和裝置。
背景技術(shù):
在網(wǎng)絡(luò)通信中,分組技術(shù)應(yīng)用十分廣泛,各種形式的信息如語音或者音頻等數(shù)據(jù)通過編碼后采用分組技術(shù)在網(wǎng)絡(luò)上傳輸,如VoIP(網(wǎng)絡(luò)電話)等。由于信息發(fā)送端發(fā)送容量的限制,或在指定延遲時間內(nèi)分組信息幀沒有到達(dá)接收端緩沖區(qū),或是網(wǎng)絡(luò)擁擠堵塞等造成幀信息的丟失,引起解碼端合成音質(zhì)的急劇下降,因此需要采用補償技術(shù)對丟失幀的數(shù)據(jù)進(jìn)行補償。丟幀補償技術(shù)就是一種減輕這種由于丟幀導(dǎo)致的音質(zhì)下降的技術(shù)?,F(xiàn)有的變換域語音頻丟幀補償方法最為簡單的是采用重復(fù)前一幀的變換域信號或者使用靜音替代的方法。該方法雖然實現(xiàn)簡單且沒有延遲,但是補償效果一般;其他的補償方式如GAPES(缺口數(shù)據(jù)幅值相位估計技術(shù))需要先將MDCT系數(shù)轉(zhuǎn)化成DSTFT(離散短時傅里葉變換)系數(shù)再進(jìn)行補償,該方法運算復(fù)雜度高,消耗內(nèi)存多;另一種方法采用整形噪聲插入技術(shù)進(jìn)行語音頻丟幀補償,該方法對類噪聲信號的補償效果較好,對多諧波音頻信號的補償效果甚差。綜上所述,已公開的變換域丟幀補償技術(shù)多數(shù)效果不明顯,運算復(fù)雜度高和延遲時間過長,或是對某些信號補償效果較差。
發(fā)明內(nèi)容
本發(fā)明要解決的技術(shù)問題是提供一種語音頻信號的丟幀補償方法和裝置,以獲得更好的補償效果,同時保證無延時和低復(fù)雜度。為了解決上述問題,本發(fā)明提供了一種語音頻信號的丟幀補償方法,包括當(dāng)正確接收幀后緊隨的第一幀丟失時,判斷該第一丟失幀的幀類型,當(dāng)?shù)谝粊G失幀為非多諧波幀時,使用第一丟失幀的前一個或若干個幀的MDCT系數(shù)計算得到該第一丟失幀的MDCT系數(shù);根據(jù)第一丟失幀的MDCT系數(shù)得到第一丟失幀的初始補償信號;對第一丟失幀的初始補償信號進(jìn)行第一類波形調(diào)整,將調(diào)整后得到的時域信號作為該第一丟失幀的時域信號。優(yōu)選地,所述判斷第一丟失幀的幀類型,包括根據(jù)碼流中由編碼端設(shè)置的幀類型標(biāo)識位判斷該第一丟失幀的幀類型。 優(yōu)選地,所述編碼端采用以下方式設(shè)置幀類型標(biāo)識位,包括對編碼后有剩余比特的幀,計算該幀的譜平坦度,判斷譜平坦度的值是否小于第一閾值K,如果小于K則認(rèn)為該幀為多諧波信號幀,設(shè)置幀類型標(biāo)識位為多諧波類型,如果不小于K則認(rèn)為該幀為非多諧波信號幀,設(shè)置幀類型標(biāo)識位為非多諧波類型,將該幀類型標(biāo)識位放入碼流發(fā)送到解碼端;對編碼后無剩余比特的幀,不設(shè)置幀類型標(biāo)識位。
優(yōu)選地,所述根據(jù)碼流中由編碼端設(shè)置的幀類型標(biāo)識位判斷該第一丟失幀的幀類型,包括獲取該第一丟失幀的前η幀中每一幀的幀類型標(biāo)識,如果前η幀中多諧波信號幀的數(shù)目大于第二閾值IV O < Iitl < η,η > 1,則認(rèn)為該第一丟失幀為多諧波幀,設(shè)置幀類型標(biāo)識為多諧波類型;如果不大于第二閾值,則認(rèn)為該第一丟失幀為非多諧波幀,設(shè)置幀類型標(biāo)識為非多諧波類型。優(yōu)選地,所述第一丟失幀的前η幀中每一幀的幀類型標(biāo)識采用以下方式設(shè)置對于未丟失幀,判斷解碼后碼流中是否有剩余比特,如果有剩余比特,則從碼流中讀取幀類型標(biāo)識位中的幀類型標(biāo)識作為該幀的幀類型標(biāo)識,如果沒有剩余比特,則復(fù)制前一幀的幀類型標(biāo)識位中的幀類型標(biāo)識作為該幀的幀類型標(biāo)識;對于丟失幀,獲取當(dāng)前丟失幀的前η幀中每一幀的幀類型標(biāo)識,如果前η幀中多諧波信號幀的數(shù)目大于第二閾值IV O彡Iitl彡η,η > 1,則認(rèn)為當(dāng)前丟失幀為多諧波巾貞,設(shè)置幀類型標(biāo)識為多諧波類型;如果不大于第二閾值,則認(rèn)為當(dāng)前丟失幀為非多諧波幀,設(shè)置幀類型標(biāo)識為非多諧波類型。優(yōu)選地,所述對第一丟失幀的初始補償信號進(jìn)行第一類波形調(diào)整,包括對第一丟失幀進(jìn)行基音周期估計,以及短基音檢測,對有可用基音周期且不存在短基音周期的第一丟失幀的初始補償信號進(jìn)行波形調(diào)整以第一丟失幀前一幀時域信號的最后一個基音周期為基準(zhǔn)波形對第一丟失幀前一幀時域信號進(jìn)行有交疊的周期性延拓,得到大于一幀長度的時域信號,延拓時從前一巾貞時域信號的最后一個基音周期的波形逐漸向第一丟失巾貞初始補償信號的第一個基音周期的波形收斂,將延拓得到的大于一幀長度的時域信號中前一幀長度的時域信號作為補償?shù)玫降牡谝粊G失幀的時域信號,超出一幀長度的部分用于與下一幀時域信號的平滑。優(yōu)選地,所述對第一丟失幀進(jìn)行基音周期估計,包括使用自相關(guān)方法對第一丟失幀的前一幀時域信號進(jìn)行基音搜索,得到前一幀時域信號的基音周期和最大歸一化自相關(guān)系數(shù),將得到的基音周期作為該第一丟失幀的基音周期估計值;采用以下條件判斷該第一丟失幀的基音周期估計值是否 可用滿足以下條件中任意一個則認(rèn)為該第一丟失幀的基音周期估計值不可用第一丟失幀的初始補償信號的過零率大于第三閾值Z1,其中Z1 > O ;第一丟失幀的前一幀時域信號的最大歸一化自相關(guān)系數(shù)小于第四閾值R1或者第一丟失幀的前一幀時域信號第一個基音周期內(nèi)的最大幅值大于最后一個基音周期內(nèi)的最大幅值的λ倍,其中O < R1 < 1,λ彡I第一丟失幀的前一幀時域信號的最大歸一化自相關(guān)系數(shù)小于第五閾值R2并且第一丟失幀的前一幀時域信號的過零率大于第六閾值Z2,其中O < R2 < 1,Z2 > O。優(yōu)選地,所述對第一丟失幀進(jìn)行短基音檢測,包括檢測第一丟失幀的前一幀是否存在短基音周期,如果存在,則認(rèn)為該第一丟失幀也存在短基音周期,如果存在,則認(rèn)為該第一丟失幀也不存在短基音周期;其中,所述檢測第一丟失幀的前一幀是否存在短基音周期,包括檢測第一丟失幀前一幀是否存在Τ, min到Τ, _之間的基音周期,所述T, min和T' max滿足條件T' min<T/ max<基音搜索時的基音周期下限Tmin,檢測時使用自相關(guān)方法對第一丟失幀的前一幀時域信號進(jìn)行基音搜索,當(dāng)最大歸一化自相關(guān)系數(shù)超過第七閾值R3時則認(rèn)為存在短基音周期,其中O < R3 < I。
優(yōu)選地,在對有可用基音周期且不存在短基音周期的第一丟失幀的初始補償信號進(jìn)行波形調(diào)整之前,所述方法還包括如果第一丟失幀的前一幀時域信號不為正確解碼得到的時域信號,則對基音周期估計得到的基音周期估計值進(jìn)行調(diào)整。優(yōu)選地,所述對基音周期估計值進(jìn)行調(diào)整,包括分別搜索得到第一丟失幀的初始補償信號在時間區(qū)間
和[T,2T-1]內(nèi)的最大幅值位置I1和i2,其中T為估計得到的基音周期估計值,如果滿足以下條件qj < I2-11 < q2T并且i2_ii小于幀長的一半,其中O ^ Q1 ^ I ^ q2,則修改基音周期估計值為i2-1i,如果不滿足上述條件,則不對基音周期估計值作修改。優(yōu)選地,所述以第一丟失幀前一幀時域信號的最后一個基音周期為基準(zhǔn)波形進(jìn)行有交疊的周期性延拓,包括對第一丟失幀前一幀時域信號的最后一個基音周期的波形以基音周期為長度向時間上的后方做周期性的復(fù)制,復(fù)制時,每次復(fù)制超過一個基音周期長度的信號,每次復(fù)制的信號與前一次復(fù)制的信號產(chǎn)生交疊區(qū),對交疊區(qū)中的信號進(jìn)行加窗相加處理。優(yōu)選地,在對第一丟失幀進(jìn)行基音周期估計的過程中,在使用自相關(guān)方法對第一丟失幀的前一幀時域信號進(jìn)行基音搜索之前,所述方法還包括先對第一丟失幀的初始補償信號和第一丟失幀的前一幀時域信號做低通濾波或降采樣處理,使用低通濾波或降采樣后的初始補償信號和第一丟失幀的前一幀時域信號代替原有的初始補償信號和第一丟失幀的前一幀時域信號進(jìn)行所述基音周期估計。優(yōu)選地,所述方法還 包括對于第一丟失幀之后緊隨的第二個丟失幀,判斷該第二丟失幀的幀類型,當(dāng)?shù)诙G失幀為非多諧波幀時,使用第二丟失幀的前一個或若干個幀的MDCT系數(shù)計算得到該第二丟失幀的MDCT系數(shù);根據(jù)第二丟失幀的MDCT系數(shù)得到第二丟失幀的初始補償信號;對該第二丟失幀的初始補償信號進(jìn)行第二類波形調(diào)整,將調(diào)整后的時域信號作為所述第二丟失幀的時域信號。優(yōu)選地,所述對第二丟失幀的初始補償信號進(jìn)行第二類波形調(diào)整,包括將補償?shù)谝粊G失幀時得到的時域信號超出一幀長度的部分M1與第二丟失幀的初始補償信號交疊相加得到第二丟失幀的時域信號,其中交疊區(qū)長度為M1,在交疊區(qū)內(nèi),補償?shù)谝粊G失幀時得到的時域信號超出一幀長度的部分采用下降窗,第二丟失幀的初始補償信號的前M1點的數(shù)據(jù)采用與下降窗等長的上升窗,將加窗后相加得到的數(shù)據(jù)作為第二丟失幀時域信號的前M1個樣點的數(shù)據(jù),其余各樣點數(shù)據(jù)使用交疊區(qū)以外的第二丟失幀初始補償信號的樣點數(shù)據(jù)補充。優(yōu)選地,所述方法還包括對于第二丟失幀之后緊隨的第三個丟失幀及第三個丟失幀以后的丟失幀,判斷該丟失幀的幀類型,當(dāng)該丟失幀為非多諧波幀時,使用該丟失幀的前一個或若干個幀的MDCT系數(shù)計算得到該丟失幀的MDCT系數(shù);根據(jù)該丟失幀的MDCT系數(shù)得到該丟失幀的初始補償信號;將該丟失幀的初始補償信號作為該丟失幀的時域信號。優(yōu)選地,所述方法包括當(dāng)正確接收幀后緊隨的第一幀丟失,且該第一丟失幀為非多諧波幀,對第一丟失幀之后緊隨的正確接收幀進(jìn)行以下的處理解碼得到該正確接收幀的時域信號;對補償?shù)谝粊G失幀時使用的基音周期估計值做調(diào)整;以及,以該正確接收幀時域信號的最后一個基音周期為基準(zhǔn)波形進(jìn)行向前的有交疊的周期性延拓得到一幀長的時域信號;對補償?shù)谝粊G失幀時得到的時域信號超出一幀長度的部分與延拓得到的時域信號交疊相加,將得到的信號作為該正確接收幀的時域信號。優(yōu)選地,所述對補償?shù)谝粊G失幀時使用的基音周期估計值做調(diào)整,包括分別搜索得到該正確接收巾貞時域/[目號在時間區(qū)間[L-2T-1, L-T-1]和[L_T, L-1]內(nèi)的最大幅值位置“和i4,其中T為補償?shù)谝粊G失幀時使用的基音周期估計值,L為幀長,如果滿足以下條件=Q1T < i4-13 < q2T并且i4-13小于L/2,其中O彡qi彡I彡q2,則修改基音周期估計值為i4-13,如果不滿足上述條件,則不對基音周期估計值作修改。優(yōu)選地,所述以該正確接收幀時域信號的最后一個基音周期為基準(zhǔn)波形進(jìn)行向前的有交疊的周期性延拓得到一幀長的時域信號,包括對該正確接收幀時域信號的最后一個基音周期的波形以基音周期為長度向時間上的前方做周期性的復(fù)制,直至得到一幀長的時域信號,復(fù)制時,每次復(fù)制超過一個基音周期長度的信號,每次復(fù)制的信號與前一次復(fù)制的信號產(chǎn)生信號交疊區(qū),在交疊區(qū)中的信號進(jìn)行加窗相加處理。為了解決上述問題,本發(fā)明還提供了一種語音頻信號的丟幀補償方法,包括當(dāng)正確接收幀后緊隨的第一幀丟失,且該第一丟失幀為非多諧波幀,對第一丟失幀之后緊隨的正確接收幀進(jìn)行以下的處理解碼得到該正確接收幀的時域信號;對補償?shù)谝粊G失幀時使用的基音周期估計值做調(diào)整;以該正確接收幀時域信號的最后一個基音周期為基準(zhǔn)波形進(jìn)行向前的有交疊的周期性延拓得到一幀長的時域信號;對補償?shù)谝粊G失幀時得到的時域信號超出一幀長度的部分與延拓得到的時域信號交疊相加,將得到的信號作為該正確接收幀的時域信號。優(yōu)選地,所述對補償?shù)谝粊G失幀時使用的基音周期估計值做調(diào)整,包括分別搜索得到該正確接收巾貞時域/[目號在時間區(qū)間[L-2T-1, L-T-1]和[L_T, L-1]內(nèi)的最大幅值位置“和i4,其中T為補償?shù)谝粊G失幀時使用的基音周期估計值,L為幀長,如果滿足以下條件=Q1T < i4-13 < q2T并 且i4-13小于L/2,其中O彡qi彡I彡q2,則修改基音周期估計值為i4-13,如果不滿足上述條件,則不對基音周期估計值作修改。優(yōu)選地,所述以該正確接收幀時域信號的最后一個基音周期為基準(zhǔn)波形進(jìn)行向前的有交疊的周期性延拓得到一幀長的時域信號,包括對該正確接收幀時域信號的最后一個基音周期的波形以基音周期為長度向時間上的前方做周期性的復(fù)制,直至得到一幀長的時域信號,復(fù)制時,每次復(fù)制超過一個基音周期長度的信號,每次復(fù)制的信號與前一次復(fù)制的信號產(chǎn)生信號交疊區(qū),在交疊區(qū)中的信號進(jìn)行加窗相加處理。為了解決上述問題,本發(fā)明還提供了一種語音頻信號的丟幀補償裝置,所述裝置包括幀類型判斷模塊、MDCT系數(shù)獲取模塊、初始補償信號獲取模塊和調(diào)整模塊,其中所述幀類型判斷模塊,用于在正確接收幀后緊隨的第一幀丟失時,判斷該第一丟失幀的幀類型;所述MDCT系數(shù)獲取模塊,用于在所述判斷模塊判斷第一丟失幀為非多諧波幀時,使用第一丟失幀的前一個或若干個幀的MDCT系數(shù)計算得到該第一丟失幀的MDCT系數(shù);所述初始補償信號獲取模塊,用于根據(jù)第一丟失幀的MDCT系數(shù)得到第一丟失幀的初始補償信號;所述調(diào)整模塊,用于對第一丟失幀的初始補償信號進(jìn)行第一類波形調(diào)整,將調(diào)整后得到的時域信號作為該第一丟失幀的時域信號。優(yōu)選地,所述幀類型判斷模塊是用于采用以下方式判斷第一丟失幀的幀類型根據(jù)碼流中由編碼裝置設(shè)置的幀類型標(biāo)識位判斷該第一丟失幀的幀類型。優(yōu)選地,所述幀類型判斷模塊是用于采用以下方式根據(jù)碼流中由編碼端設(shè)置的幀類型標(biāo)識位判斷該第一丟失幀的幀類型所述幀類型判斷模塊獲取該第一丟失幀的前η幀中每一幀的幀類型標(biāo)識,如果前η幀中多諧波信號幀的數(shù)目大于第二閾值%,O ^ n0 ^ η,η ^ 1,則認(rèn)為該第一丟失幀為多諧波幀,設(shè)置幀類型標(biāo)識為多諧波類型;如果不大于第二閾值,則認(rèn)為該第一丟失幀為非多諧波幀,設(shè)置幀類型標(biāo)識為非多諧波類型。優(yōu)選地,所述調(diào)整模塊包括第一類波形調(diào)整單元,其中包括基音周期估計單元、短基音檢測單元、波形延拓單元,其中所述基音周期估計單元,用于對第一丟失幀進(jìn)行基音周期估計;所述短基音檢測單元,用于對第一丟失幀進(jìn)行短基音檢測;所述波形延拓單元,用于對有可用基音周期且不存在短基音周期的第一丟失幀的初始補償信號進(jìn)行波形·調(diào)整以第一丟失幀前一幀時域信號的最后一個基音周期為基準(zhǔn)波形對第一丟失幀前一幀時域信號進(jìn)行有交疊的周期性延拓,得到大于一幀長度的時域信號,延拓時,從前一幀時域信號的最后一個基音周期的波形逐漸向第一丟失幀初始補償信號的第一個基音周期的波形收斂,將延拓得到的大于一幀長度的時域信號中前一幀長度的時域信號作為補償?shù)玫降牡谝粊G失幀的時域信號,超出一幀長度的部分用于與下一幀時域信號的平滑。優(yōu)選地,所述基音周期估計單元是用于采用以下方式對第一丟失幀進(jìn)行基音周期估計所述基音周期估計單元使用自相關(guān)方法對第一丟失幀的前一幀時域信號進(jìn)行基音搜索,得到前一幀時域信號的基音周期和最大歸一化自相關(guān)系數(shù),將得到的基音周期作為該第一丟失幀的基音周期估計值;所述基音周期估計單元采用以下條件判斷該第一丟失幀的基音周期估計值是否可用滿足以下條件中任意一個則認(rèn)為該第一丟失幀的基音周期估計值不可用第一丟失幀的初始補償信號的過零率大于第三閾值Z1,其中Z1 > O ;第一丟失幀的前一幀時域信號的最大歸一化自相關(guān)系數(shù)小于第四閾值R1或者第一丟失幀的前一幀時域信號第一個基音周期內(nèi)的最大幅值大于最后一個基音周期內(nèi)的最大幅值的λ倍,其中O < R1 < 1,λ ^ I ;第一丟失幀的前一幀時域信號的最大歸一化自相關(guān)系數(shù)小于第五閾值R2并且第一丟失幀的前一幀時域信號的過零率大于第六閾值Z2,其中O < R2 < 1,Z2 > O。優(yōu)選地,所述短基音檢測單元是用于采用以下方式對第一丟失幀進(jìn)行短基音檢測所述短基音檢測單元檢測第一丟失幀的前一幀是否存在短基音周期,如果存在,則認(rèn)為該第一丟失幀也存在短基音周期,如果不存在,則認(rèn)為該第一丟失幀也不存在短基音周期;其中,所述短基音檢測單元采用以下方式檢測第一丟失幀的前一幀是否存在短基音周期檢測第一丟失幀前一幀是否存在T, min到Τ, _之間的基音周期,所述T, min和T, _滿足條件min<T, max<基音搜索時的基音周期下限Tmin,檢測時使用自相關(guān)方法對第一丟失幀的前一幀時域信號進(jìn)行基音搜索,當(dāng)最大歸一化自相關(guān)系數(shù)超過第七閾值R3時則認(rèn)為存在短基音周期,其中O < R3 < I。優(yōu)選地,所述第一類波形調(diào)整單元還包括基音周期調(diào)整單元,其用于判斷第一丟失幀的前一幀時域信號不為正確解碼得到的時域信號時,對所述基音周期估計單元估計得到的基音周期估計值進(jìn)行調(diào)整,將調(diào)整后的基音周期估計值送至所述波形延拓單元。優(yōu)選地,所述基音周期調(diào)整單元是用于采用以下方式對基音周期估計值進(jìn)行調(diào)整所述基音周期調(diào)整單元分別搜索得到第一丟失幀的初始補償信號在時間區(qū)間
和[T,2T-1]內(nèi)的最大幅值位置I1和i2,其中T為估計得到的基音周期估計值,如果滿足以下條件qj < I2-11 < q2T并且I2-11小于巾貞長的一半,其中O ^ Q1 ^ I ^ q2,則修改基音周期估計值為i2_i1;如果不滿足上述條件,則不對基音周期估計值作修改。優(yōu)選地,所述波形延拓單元是用于采用以下方式以第一丟失幀前一幀時域信號的最后一個基音周期為基準(zhǔn)波形進(jìn)行有交疊的周期性延拓對第一丟失幀前一幀時域信號的最后一個基音周期的波形以基音周期為長度向時間上的后方做周期性的復(fù)制,復(fù)制時,每次復(fù)制超過一個基音周期長度的信號,每次復(fù)制的信號與前一次復(fù)制的信號產(chǎn)生交疊區(qū),對交疊區(qū)中的信號進(jìn)行加窗相加處理。優(yōu)選地,所述基音周期估計單元還用于在使用自相關(guān)方法對第一丟失幀的前一幀時域信號進(jìn)行基音搜索之前,先對第一丟失幀的初始補償信號和第一丟失幀的前一幀時域信號做低通濾波或降采樣處理,使用低通濾波或降采樣后的初始補償信號和第一丟失幀的前一幀時域信號代替原有的初始補償信號和第一丟失幀的前一幀時域信號進(jìn)行所述基音周期估計。優(yōu)選地,所述幀類型判斷模塊,還用于在第一丟失幀之后緊隨的第二個丟失幀丟失時,判斷該第二丟失幀的幀類型;所述MDCT系數(shù)獲取模塊,還用于在所述幀類型判斷模塊判斷該第二丟失幀為非多諧波幀時,使用第二丟失幀的前一個或若干個幀的MDCT系數(shù)計算得到該第二丟失幀的MDCT系數(shù);所述初始補償信 號獲取模塊,還用于根據(jù)第二丟失幀的MDCT系數(shù)得到第二丟失幀的初始補償信號;所述調(diào)整模塊,還用于對該第二丟失幀的初始補償信號進(jìn)行第二類波形調(diào)整,將調(diào)整后的時域信號作為所述第二丟失幀的時域信號。優(yōu)選地,所述調(diào)整模塊還包括第二類波形調(diào)整單元,其用于采用以下方式對第二丟失幀的初始補償信號進(jìn)行第二類波形調(diào)整將補償?shù)谝粊G失幀時得到的時域信號超出一幀長度的部分M1與第二丟失幀的初始補償信號交疊相加得到第二丟失幀的時域信號,其中交疊區(qū)長度為M1,在交疊區(qū)內(nèi),補償?shù)谝粊G失幀時得到的時域信號超出一幀長度的部分采用下降窗,第二丟失幀的初始補償信號的前M1點的數(shù)據(jù)采用與下降窗等長的上升窗,將加窗后相加得到的數(shù)據(jù)作為第二丟失幀時域信號的前M1個樣點的數(shù)據(jù),其余各樣點數(shù)據(jù)使用交疊區(qū)以外的第二丟失幀初始補償信號的樣點數(shù)據(jù)補充。優(yōu)選地,所述幀類型判斷模塊,還用于在第二丟失幀之后緊隨的第三個丟失幀及第三個丟失幀以后的幀丟失時,判斷該丟失幀的幀類型;所述MDCT系數(shù)獲取模塊,還用于在所述幀類型判斷模塊判斷當(dāng)前丟失幀為非多諧波幀時,使用該當(dāng)前丟失幀的前一個或若干個幀的MDCT系數(shù)計算得到該當(dāng)前丟失幀的MDCT系數(shù);所述初始補償信號獲取模塊,還用于根據(jù)該當(dāng)前丟失幀的MDCT系數(shù)得到該當(dāng)前丟失幀的初始補償信號;
所述調(diào)整模塊,還用于將該當(dāng)前丟失幀的初始補償信號作為該丟失幀的時域信號。優(yōu)選地,所述裝置還包括正常幀補償模塊,其用于在正確接收幀后緊隨的第一幀丟失,且該第一丟失幀為非多諧波幀,對第一丟失幀之后緊隨的正確接收幀進(jìn)行處理,包括解碼單元、時域信號調(diào)整單元,其中所述解碼單元,用于解碼得到該正確接收幀的時域信號;所述時域信號調(diào)整單元,用于對補償?shù)谝粊G失幀時使用的基音周期估計值做調(diào)整;以及,以該正確接收幀時域信號的最后一個基音周期為基準(zhǔn)波形進(jìn)行向前的有交疊的周期性延拓得到一幀長的時域信號;以及,對補償?shù)谝粊G失幀時得到的時域信號超出一幀長度的部分與延拓得到的時域信號交疊相加,將得到的信號作為該正確接收幀的時域信號。優(yōu)選地,所述時域信號調(diào)整單元是用于采用以下方式對補償?shù)谝粊G失幀時使用的基音周期估計值做調(diào)整分別搜索得到該正確接收幀時域信號在時間區(qū)間[L-2T-1,L-T-1]和[L-T,L-1]內(nèi)的最大幅值位置“和i4,其中T為補償?shù)谝粊G失幀時使用的基音周期估計值,L為幀長,如果滿足以下條件qj < i4-13 < q2T并且i4_i3小于L/2,其中O ^ Q1 ^ I ^ q2,則修改基音周期估計值為i4_i3,如果不滿足上述條件,則不對基音周期估計值作修改。優(yōu)選地,所述時域信號調(diào)整單元是用于采用以下方式以該正確接收幀時域信號的最后一個基音周期為基準(zhǔn)波形進(jìn)行向前的有交疊的周期性延拓得到一幀長的時域信號以該正確接收幀時域信號的最后一個基音周期的波形以基音周期為長度向時間上的前方做周期性的復(fù)制,直至得到一幀長的時域信號,復(fù)制時,每次復(fù)制超過一個基音周期長度的信號,每次復(fù)制的信號與前一 次復(fù)制的信號產(chǎn)生信號交疊區(qū),在交疊區(qū)中的信號進(jìn)行加窗相加處理。本發(fā)明提出的語音頻信號的丟幀補償方法和裝置,首先判斷丟失幀類型,然后對于多諧波信號丟失幀,將MDCT域信號轉(zhuǎn)換成MDCT-MDST域信號后采用相位外推,幅值復(fù)制的技術(shù)進(jìn)行補償;對于非多諧波信號丟失幀,首先進(jìn)行初始補償?shù)玫匠跏佳a償信號,再對初始補償信號進(jìn)行波形調(diào)整得到當(dāng)前丟失幀的時域信號。該補償方法不僅保證了音樂等多諧波信號的補償質(zhì)量,還大大提高了語音等非多諧波信號的補償質(zhì)量。相對于現(xiàn)有技術(shù),本發(fā)明具有無延遲、計算量存儲量小、易于實現(xiàn),補償效果好等優(yōu)點。
圖1是本發(fā)明實施例1的流程圖;圖2是本發(fā)明實施例1幀類型判斷流程圖;圖3是本發(fā)明實施例1第一類波形調(diào)整的方法流程圖;圖4a_d是本發(fā)明實施例1交疊的周期性延拓的示意圖;圖5是本發(fā)明實施例1多諧波丟幀補償方法流程圖;圖6是本發(fā)明實施例2流程圖;圖7是本發(fā)明實施例3流程圖;圖8是本發(fā)明實施例4丟幀補償裝置的結(jié)構(gòu)示意圖9是本發(fā)明實施例4丟幀補償裝置中第一類調(diào)整單元的結(jié)構(gòu)示意圖;圖10是本發(fā)明實施例4丟幀補償裝置中正常幀補償模塊結(jié)構(gòu)示意圖。
具體實施例方式首先,由編碼端對原始信號幀做類型判斷,將判斷結(jié)果傳輸給解碼端時不額外占用編碼比特(即使用編碼后的剩余比特傳輸判斷結(jié)果,無剩余比特時不傳輸判斷結(jié)果),在解碼端獲取當(dāng)前丟失幀的前η幀的類型判斷結(jié)果后推斷當(dāng)前丟失幀的類型,根據(jù)丟失幀為多諧波信號幀或非多諧波信號幀,分別采用多諧波丟幀補償方法或非多諧波丟幀補償方法對其進(jìn)行補償。對于多諧波丟失幀,將MDCT域信號轉(zhuǎn)換成MDCT-MDST (改進(jìn)的離散余弦變換-改進(jìn)的離散正弦變換)域信號后采用相位外推,幅值復(fù)制的技術(shù)進(jìn)行補償;對非多諧波丟失幀進(jìn)行補償時首先使用當(dāng)前丟失幀的前若干幀的MDCT系數(shù)計算得到當(dāng)前丟失幀的MDCT系數(shù)值(比如,采用衰減后的前一幀的MDCT系數(shù)值作為當(dāng)前丟失幀的MDCT系數(shù)值),然后根據(jù)當(dāng)前丟失幀的MDCT系數(shù)得到當(dāng)前丟失幀的初始補償信號,再對初始補償信號進(jìn)行波形調(diào)整得到當(dāng)前丟失幀的時域信號。采用該非多諧波補償方法,提高了對語音幀等非多諧波幀的補償質(zhì)量。為使本發(fā)明的目的、技術(shù)方案和優(yōu)點更加清楚明白,下文中將結(jié)合附圖對本發(fā)明的實施例進(jìn)行詳細(xì)說明。需要說明的是,在不沖突的情況下,本申請中的實施例及實施例中的特征可以相互任意組合。實施例1本實施例描述緊隨正確接收幀 的第一幀丟失時的補償方法,如圖1所示,包括以下步驟步驟101 :判斷第一丟失幀類型,當(dāng)?shù)谝粊G失幀為非多諧波幀時執(zhí)行步驟102,否則執(zhí)行步驟104 ;步驟102 :當(dāng)?shù)谝粊G失幀為非多諧波幀時,使用第一丟失幀的前一個或若干個幀的MDCT系數(shù)計算得到該第一丟失幀的MDCT系數(shù),根據(jù)第一丟失幀的MDCT系數(shù)得到第一丟失幀的時域信號,將該時域信號作為第一丟失幀的初始補償信號;計算第一丟失幀的MDCT系數(shù)值可以采用以下方法比如,可以使用前若干幀MDCT系數(shù)的加權(quán)平均并做適當(dāng)衰減后的值作為該第一丟失幀的MDCT系數(shù);或者,也可以復(fù)制上一幀的MDCT系數(shù)并做適當(dāng)衰減后的值作為第一丟失幀的MDCT系數(shù)。根據(jù)MDCT系數(shù)得到時域信號的方法可采用現(xiàn)有技術(shù)實現(xiàn),本文不再贅述。具體MDCT系數(shù)的衰減方式為當(dāng)前丟失幀為第P幀時,cp(m) = a *cp_1 (m), m = O, · · · , M-1 ;其中cp(m)表示第ρ幀在頻點m處的MDCT系數(shù),α為衰減系數(shù),O彡α彡I。步驟103 :對第一丟失幀的初始補償信號進(jìn)行第一類波形調(diào)整,將調(diào)整后的時域信號作為第一丟失幀的時域信號,結(jié)束;步驟104 :當(dāng)?shù)谝粊G失幀為多諧波幀時使用多諧波幀丟幀補償方法補償該幀,結(jié)束。下面結(jié)合圖2,圖3,圖4和圖5分別對步驟101,步驟103和步驟104進(jìn)行具體說明。如圖2所示,步驟IOla-1Olc由編碼端設(shè)備完成,步驟IOld由解碼端設(shè)備完成。判斷丟失幀類型的具體方法包括IOla :在編碼端,對每一幀正常編碼后判斷該幀有無剩余比特,即判斷該幀編碼后是否使用完一幀的所有可用比特,如果有剩余比特則執(zhí)行步驟IOlb ;否則執(zhí)行步驟IOlcl ;IOlb :計算該幀的譜平坦度,判斷譜平坦度的值是否小于第一閾值K,如果小于K則認(rèn)為該幀為多諧波信號幀,設(shè)置幀類型標(biāo)識位為多諧波類型(例如為I);如果不小于K,則認(rèn)為該幀為非多諧波信號幀,設(shè)置幀類型標(biāo)識位為非多諧波類型(例如為O),其中O≤K≤I,執(zhí)行步驟101c2 ;具體譜平坦度的計算方法如下任意第i幀的譜平坦度SFMi定義為第i幀信號的變換域下信號幅值的幾何平均值與算術(shù)平均值之比
權(quán)利要求
1.一種語音頻信號的丟幀補償方法,其特征在于,所述方法包括 當(dāng)正確接收幀后緊隨的第一幀丟失時,判斷該第一丟失幀的幀類型,當(dāng)?shù)谝粊G失幀為非多諧波幀時,使用第一丟失幀的前一個或若干個幀的MDCT系數(shù)計算得到該第一丟失幀的MDCT系數(shù); 根據(jù)第一丟失幀的MDCT系數(shù)得到第一丟失幀的初始補償信號; 對第一丟失幀的初始補償信號進(jìn)行第一類波形調(diào)整,將調(diào)整后得到的時域信號作為該第一丟失幀的時域信號。
2.如權(quán)利要求1所述的方法,其特征在于, 所述判斷第一丟失幀的幀類型,包括 根據(jù)碼流中由編碼端設(shè)置的幀類型標(biāo)識位判斷該第一丟失幀的幀類型。
3.如權(quán)利要求2所述的方法,其特征在于, 所述編碼端采用以下方式設(shè)置幀類型標(biāo)識位,包括 對編碼后有剩余比特的幀,計算該幀的譜平坦度,判斷譜平坦度的值是否小于第一閾值K,如果小于K則認(rèn)為該幀為多諧波信號幀,設(shè)置幀類型標(biāo)識位為多諧波類型,如果不小于K則認(rèn)為該幀為非多諧波信號幀,設(shè)置幀類型標(biāo)識位為非多諧波類型,將該幀類型標(biāo)識位放入碼流發(fā)送到解碼端; 對編碼后無剩余比特的幀,不設(shè)置幀類型標(biāo)識位。
4.如權(quán)利要求2所述的方法,其特征在于, 所述根據(jù)碼流中由編碼端設(shè)置的幀類型標(biāo)識位判斷該第一丟失幀的幀類型,包括 獲取該第一丟失幀的前η幀中每一幀的幀類型標(biāo)識,如果前η幀中多諧波信號幀的數(shù)目大于第二閾值rvO ^ n0 ^ η, n ^ 1,則認(rèn)為該第一丟失幀為多諧波幀,設(shè)置幀類型標(biāo)識為多諧波類型;如果不大于第二閾值,則認(rèn)為該第一丟失幀為非多諧波幀,設(shè)置幀類型標(biāo)識為非多諧波類型。
5.如權(quán)利要求4所述的方法,其特征在于, 所述第一丟失幀的前η幀中每一幀的幀類型標(biāo)識采用以下方式設(shè)置 對于未丟失幀,判斷解碼后碼流中是否有剩余比特,如果有剩余比特,則從碼流中讀取幀類型標(biāo)識位中的幀類型標(biāo)識作為該幀的幀類型標(biāo)識,如果沒有剩余比特,則復(fù)制前一幀的幀類型標(biāo)識位中的幀類型標(biāo)識作為該幀的幀類型標(biāo)識; 對于丟失幀,獲取當(dāng)前丟失幀的前η幀中每一幀的幀類型標(biāo)識,如果前η幀中多諧波信號幀的數(shù)目大于第二閾值rvO ^ n0 ^ η, n ^ 1,則認(rèn)為當(dāng)前丟失幀為多諧波幀,設(shè)置幀類型標(biāo)識為多諧波類型;如果不大于第二閾值,則認(rèn)為當(dāng)前丟失幀為非多諧波幀,設(shè)置幀類型標(biāo)識為非多諧波類型。
6.如權(quán)利要求1所述的方法,其特征在于, 所述對第一丟失幀的初始補償信號進(jìn)行第一類波形調(diào)整,包括 對第一丟失幀進(jìn)行基音周期估計,以及短基音檢測,對有可用基音周期且不存在短基音周期的第一丟失幀的初始補償信號進(jìn)行波形調(diào)整以第一丟失幀前一幀時域信號的最后一個基音周期為基準(zhǔn)波形對第一丟失幀前一幀時域信號進(jìn)行有交疊的周期性延拓,得到大于一巾貞長度的時域信號,延拓時從前一巾貞時域信號的最后一個基音周期的波形逐漸向第一丟失幀初始補償信號的第一個基音周期的波形收斂,將延拓得到的大于一幀長度的時域信號中前一幀長度的時域信號作為補償?shù)玫降牡谝粊G失幀的時域信號,超出一幀長度的部分用于與下一幀時域信號的平滑。
7.如權(quán)利要求6所述的方法,其特征在于, 所述對第一丟失幀進(jìn)行基音周期估計,包括 使用自相關(guān)方法對第一丟失幀的前一幀時域信號進(jìn)行基音搜索,得到前一幀時域信號的基音周期和最大歸一化自相關(guān)系數(shù),將得到的基音周期作為該第一丟失幀的基音周期估計值; 采用以下條件判斷該第一丟失幀的基音周期估計值是否可用滿足以下條件中任意一個則認(rèn)為該第一丟失幀的基音周期估計值不可用 第一丟失幀的初始補償信號的過零率大于第三閾值Z1,其中Z1 > O ; 第一丟失幀的前一幀時域信號的最大歸一化自相關(guān)系數(shù)小于第四閾值R1或者第一丟失幀的前一幀時域信號第一個基音周期內(nèi)的最大幅值大于最后一個基音周期內(nèi)的最大幅值的λ倍,其中O < R1 < 1,λ彡I 第一丟失幀的前一幀時域信號的最大歸一化自相關(guān)系數(shù)小于第五閾值R2并且第一丟失幀的前一幀時域信號的過零率大于第六閾值Z2,其中O < R2 < 1,Z2 > O。
8.如權(quán)利要求6所述的方法,其特征在于, 所述對第一丟失幀進(jìn)行短基音檢測,包括檢測第一丟失幀的前一幀是否存在短基音周期,如果存在,則認(rèn)為該第一丟失幀也存在短基音周期,如果存在,則認(rèn)為該第一丟失幀也不存在短基音周期; 其中,所述檢測第一丟失幀的前一幀是否存在短基音周期,包括 檢測第一丟失幀前一幀是否存在Τ, min到Τ, _之間的基音周期,所述T, min和T, _滿足條件T' min<T, max<基音搜索時的基音周期下限Tmin,檢測時使用自相關(guān)方法對第一丟失幀的前一幀時域信號進(jìn)行基音搜索,當(dāng)最大歸一化自相關(guān)系數(shù)超過第七閾值R3時則認(rèn)為存在短基音周期,其中O < R3 < I。
9.如權(quán)利要求6所述的方法,其特征在于, 在對有可用基音周期且不存在短基音周期的第一丟失幀的初始補償信號進(jìn)行波形調(diào)整之前,所述方法還包括 如果第一丟失幀的前一幀時域信號不為正確解碼得到的時域信號,則對基音周期估計得到的基音周期估計值進(jìn)行調(diào)整。
10.如權(quán)利要求9所述的方法,其特征在于, 所述對基音周期估計值進(jìn)行調(diào)整,包括 分別搜索得到第一丟失幀的初始補償信號在時間區(qū)間
和[T,2T-1]內(nèi)的最大幅值位置I1和i2,其中T為估計得到的基音周期估計值,如果滿足以下條件qj < I2-11<q2T并且i2-1i小于幀長的一半,其中O < qi < I < q2,則修改基音周期估計值為i2-11;如果不滿足上述條件,則不對基音周期估計值作修改。
11.如權(quán)利要求6所述的方法,其特征在于, 所述以第一丟失幀前一幀時域信號的最后一個基音周期為基準(zhǔn)波形進(jìn)行有交疊的周期性延拓,包括 對第一丟失幀前一幀時域信號的最后一個基音周期的波形以基音周期為長度向時間上的后方做周期性的復(fù)制,復(fù)制時,每次復(fù)制超過一個基音周期長度的信號,每次復(fù)制的信號與前一次復(fù)制的信號產(chǎn)生交疊區(qū),對交疊區(qū)中的信號進(jìn)行加窗相加處理。
12.如權(quán)利要求7所述的方法,其特征在于, 在對第一丟失幀進(jìn)行基音周期估計的過程中,在使用自相關(guān)方法對第一丟失幀的前一幀時域信號進(jìn)行基音搜索之前,所述方法還包括 先對第一丟失幀的初始補償信號和第一丟失幀的前一幀時域信號做低通濾波或降采樣處理,使用低通濾波或降采樣后的初始補償信號和第一丟失幀的前一幀時域信號代替原有的初始補償信號和第一丟失幀的前一幀時域信號進(jìn)行所述基音周期估計。
13.如權(quán)利要求1-12中任一權(quán)利要求所述的方法,其特征在于,所述方法還包括 對于第一丟失幀之后緊隨的第二個丟失幀,判斷該第二丟失幀的幀類型,當(dāng)?shù)诙G失幀為非多諧波幀時,使用第二丟失幀的前一個或若干個幀的MDCT系數(shù)計算得到該第二丟失幀的MDCT系數(shù); 根據(jù)第二丟失幀的MDCT系數(shù)得到第二丟失幀的初始補償信號; 對該第二丟失幀的初始補償信號進(jìn)行第二類波形調(diào)整,將調(diào)整后的時域信號作為所述第二丟失幀的時域信號。
14.如權(quán)利要求13所述的方法,其特征在于, 所述對第二丟失幀的初始補償信號進(jìn)行第二類波形調(diào)整,包括 將補償?shù)谝粊G失幀時得到的時域信號超出一幀長度的部分M1與第二丟失幀的初始補償信號交疊相加得到第二丟失幀的時域信號,其中交疊區(qū)長度為M1,在交疊區(qū)內(nèi),補償?shù)谝粊G失幀時得到的時域信號超出一幀長度的部分采用下降窗,第二丟失幀的初始補償信號的前M1點的數(shù)據(jù)采用與下降窗等長的上升窗,將加窗后相加得到的數(shù)據(jù)作為第二丟失幀時域信號的前乂個樣點的數(shù)據(jù),其余各樣點數(shù)據(jù)使用交疊區(qū)以外的第二丟失幀初始補償信號的樣點數(shù)據(jù)補充。
15.如權(quán)利要求13所述的方法,其特征在于,所述方法還包括 對于第二丟失幀之后緊隨的第三個丟失幀及第三個丟失幀以后的丟失幀,判斷該丟失幀的幀類型,當(dāng)該丟失幀為非多諧波幀時,使用該丟失幀的前一個或若干個幀的MDCT系數(shù)計算得到該丟失幀的MDCT系數(shù); 根據(jù)該丟失幀的MDCT系數(shù)得到該丟失幀的初始補償信號; 將該丟失幀的初始補償信號作為該丟失幀的時域信號。
16.如權(quán)利要求1-12中任一權(quán)利要求所述的方法,其特征在于,所述方法包括 當(dāng)正確接收幀后緊隨的第一幀丟失,且該第一丟失幀為非多諧波幀,對第一丟失幀之后緊隨的正確接收幀進(jìn)行以下的處理 解碼得到該正確接收幀的時域信號;對補償?shù)谝粊G失幀時使用的基音周期估計值做調(diào)整;以及,以該正確接收幀時域信號的最后一個基音周期為基準(zhǔn)波形進(jìn)行向前的有交疊的周期性延拓得到一幀長的時域信號;對補償?shù)谝粊G失幀時得到的時域信號超出一幀長度的部分與延拓得到的時域信號交疊相加,將得到的信號作為該正確接收幀的時域信號。
17.如權(quán)利要求16所述的方法,其特征在于,所述對補償?shù)谝粊G失幀時使用的基音周期估計值做調(diào)整,包括 分別搜索得到該正確接收幀時域信號在時間區(qū)間[L-2T-1,L-T-1]和[L-T,-L-l]內(nèi)的最大幅值位置“和i4,其中T為補償?shù)谝粊G失幀時使用的基音周期估計值,L為幀長,如果滿足以下條件=Q1T < i4-13 < q2T并且i4-13小于L/2,其中O ^ Q1 ^ I ^ q2,則修改基音周期估計值為i4_i3,如果不滿足上述條件,則不對基音周期估計值作修改。
18.如權(quán)利要求16所述的方法,其特征在于, 所述以該正確接收幀時域信號的最后一個基音周期為基準(zhǔn)波形進(jìn)行向前的有交疊的周期性延拓得到一幀長的時域信號,包括 對該正確接收幀時域信號的最后一個基音周期的波形以基音周期為長度向時間上的前方做周期性的復(fù)制,直至得到一幀長的時域信號,復(fù)制時,每次復(fù)制超過一個基音周期長度的信號,每次復(fù)制的信號與前一次復(fù)制的信號產(chǎn)生信號交疊區(qū),在交疊區(qū)中的信號進(jìn)行加窗相加處理。
19.一種語音頻信號的丟幀補償方法,其特征在于,所述方法包括 當(dāng)正確接收幀后緊隨的第一幀丟失,且該第一丟失幀為非多諧波幀,對第一丟失幀之后緊隨的正確接收幀進(jìn)行以下的處理 解碼得到該正確接收幀的時域信號;對補償?shù)谝粊G失幀時使用的基音周期估計值做調(diào)整;以該正確接收幀時域信號的最后一個基音周期為基準(zhǔn)波形進(jìn)行向前的有交疊的周期性延拓得到一幀長的時域信號;對補償?shù)谝粊G失幀時得到的時域信號超出一幀長度的部分與延拓得到的時域信號交疊相加,將得到的信號作為該正確接收幀的時域信號。
20.如權(quán)利要求19所述的方法,其特征在于,所述對補償?shù)谝粊G失幀時使用的基音周期估計值做調(diào)整,包括 分別搜索得到該正確接收幀時域信號在時間區(qū)間[L-2T-1,L-T-1]和[L-T,L-1]內(nèi)的最大幅值位置“和i4,其中T為補償?shù)谝粊G失幀時使用的基音周期估計值,L為幀長,如果滿足以下條件=Q1T < i4-13 < q2T并且i4-13小于L/2,其中O ^ Q1 ^ I ^ q2,則修改基音周期估計值為i4_i3,如果不滿足上述條件,則不對基音周期估計值作修改。
21.如權(quán)利要求19所述的方法,其特征在于, 所述以該正確接收幀時域信號的最后一個基音周期為基準(zhǔn)波形進(jìn)行向前的有交疊的周期性延拓得到一幀長的時域信號,包括 對該正確接收幀時域信號的最后一個基音周期的波形以基音周期為長度向時間上的前方做周期性的復(fù)制,直至得到一幀長的時域信號,復(fù)制時,每次復(fù)制超過一個基音周期長度的信號,每次復(fù)制的信號與前一次復(fù)制的信號產(chǎn)生信號交疊區(qū),在交疊區(qū)中的信號進(jìn)行加窗相加處理。
22.—種語音頻信號的丟幀補償裝置,其特征在于,所述裝置包括幀類型判斷模塊、MDCT系數(shù)獲取模塊、初始補償信號獲取模塊和調(diào)整模塊,其中 所述幀類型判斷模塊,用于在正確接收幀后緊隨的第一幀丟失時,判斷該第一丟失幀的幀類型; 所述MDCT系數(shù)獲取模塊,用于在所述判斷模塊判斷第一丟失幀為非多諧波幀時,使用第一丟失幀的前一個或若干個幀的MDCT系數(shù)計算得到該第一丟失幀的MDCT系數(shù); 所述初始補償信號獲取模塊,用于根據(jù)第一丟失幀的MDCT系數(shù)得到第一丟失幀的初始補償信號; 所述調(diào)整模塊,用于對第一丟失幀的初始補償信號進(jìn)行第一類波形調(diào)整,將調(diào)整后得到的時域信號作為該第一丟失幀的時域信號。
23.如權(quán)利要求22所述的裝置,其特征在于, 所述幀類型判斷模塊是用于采用以下方式判斷第一丟失幀的幀類型根據(jù)碼流中由編碼裝置設(shè)置的幀類型標(biāo)識位判斷該第一丟失幀的幀類型。
24.如權(quán)利要求23所述的裝置,其特征在于, 所述幀類型判斷模塊是用于采用以下方式根據(jù)碼流中由編碼端設(shè)置的幀類型標(biāo)識位判斷該第一丟失幀的幀類型 所述幀類型判斷模塊獲取該第一丟失幀的前η幀中每一幀的幀類型標(biāo)識,如果前η幀中多諧波信號幀的數(shù)目大于第二閾值rvO ^n0 ^ η,η ^ 1,則認(rèn)為該第一丟失幀為多諧波幀,設(shè)置幀類型標(biāo)識為多諧波類型;如果不大于第二閾值,則認(rèn)為該第一丟失幀為非多諧波幀,設(shè)置幀類型標(biāo)識為非多諧波類型。
25.如權(quán)利要求22所述的裝置,其特征在于, 所述調(diào)整模塊包括第一類波形調(diào)整單元,其中包括基音周期估計單元、短基音檢測單元、波形延拓單元,其中 所述基音周期估計單元,用于對第一丟失幀進(jìn)行基音周期估計; 所述短基音檢測單元,用于對第一丟失幀進(jìn)行短基音檢測; 所述波形延拓單元,用于對有可用基音周期且不存在短基音周期的第一丟失幀的初始補償信號進(jìn)行波形調(diào)整以第一丟失幀前一幀時域信號的最后一個基音周期為基準(zhǔn)波形對第一丟失幀前一幀時域信號進(jìn)行有交疊的周期性延拓,得到大于一幀長度的時域信號,延拓時,從前一幀時域信號的最后一個基音周期的波形逐漸向第一丟失幀初始補償信號的第一個基音周期的波形收斂,將延拓得到的大于一幀長度的時域信號中前一幀長度的時域信號作為補償?shù)玫降牡谝粊G失幀的時域信號,超出一幀長度的部分用于與下一幀時域信號的平滑。
26.如權(quán)利要求25所述的裝置,其特征在于, 所述基音周期估計單元是用于采用以下方式對第一丟失幀進(jìn)行基音周期估計 所述基音周期估計單元使用自相關(guān)方法對第一丟失幀的前一幀時域信號進(jìn)行基音搜索,得到前一幀時域信號的基音周期和最大歸一化自相關(guān)系數(shù),將得到的基音周期作為該第一丟失幀的基音周期估計值; 所述基音周期估計單元采用以下條件判斷該第一丟失幀的基音周期估計值是否可用滿足以下條件中任意一個則認(rèn)為該第一丟失幀的基音周期估計值不可用 第一丟失幀的初始補償信號的過零率大于第三閾值Z1,其中Z1 > O ; 第一丟失幀的前一幀時域信號的最大歸一化自相關(guān)系數(shù)小于第四閾值R1或者第一丟失幀的前一幀時域信號第一個基音周期內(nèi)的最大幅值大于最后一個基音周期內(nèi)的最大幅值的λ倍,其中O < R1 < 1,λ ^ I ; 第一丟失幀的前一幀時域信號的最大歸一化自相關(guān)系數(shù)小于第五閾值R2并且第一丟失幀的前一幀時域信號的過零率大于第六閾值Z2,其中O < R2 < 1,Z2 > O。
27.如權(quán)利要求25所述的裝置,其特征在于, 所述短基音檢測單元是用于采用以下方式對第一丟失幀進(jìn)行短基音檢測 所述短基音檢測單元檢測第一丟失幀的前一幀是否存在短基音周期,如果存在,則認(rèn)為該第一丟失幀也存在短基音周期,如果不存在,則認(rèn)為該第一丟失幀也不存在短基音周期; 其中,所述短基音檢測單元采用以下方式檢測第一丟失幀的前一幀是否存在短基音周期 檢測第一丟失幀前一幀是否存在T, min到T, _之間的基音周期,所述T, min和T, _滿足條件T' min<T, max<基音搜索時的基音周期下限Tmin,檢測時使用自相關(guān)方法對第一丟失幀的前一幀時域信號進(jìn)行基音搜索,當(dāng)最大歸一化自相關(guān)系數(shù)超過第七閾值R3時則認(rèn)為存在短基音周期,其中O < R3 < I。
28.如權(quán)利要求25所述的裝置,其特征在于, 所述第一類波形調(diào)整單元還包括基音周期調(diào)整單元,其用于判斷第一丟失幀的前一幀時域信號不為正確解碼得到的時域信號時,對所述基音周期估計單元估計得到的基音周期估計值進(jìn)行調(diào)整,將調(diào)整后的基音周期估計值送至所述波形延拓單元。
29.如權(quán)利要求28所述的裝置,其特征在于, 所述基音周期調(diào)整單元是用于采用以下方式對基音周期估計值進(jìn)行調(diào)整 所述基音周期調(diào)整單元分別搜索得到第一丟失幀的初始補償信號在時間區(qū)間
和[Τ,2Τ-1]內(nèi)的最大幅值位置I1和i2,其中T為估計得到的基音周期估計值,如果滿足以下條件qj < I2-11 < q2T并且I2-11小于巾貞長的一半,其中O ^ Q1 ^ I ^ q2,則修改基音周期估計值為i2_i1;如果不滿足上述條件,則不對基音周期估計值作修改。
30.如權(quán)利要求25所述的裝置,其特征在于, 所述波形延拓單元是用于采用以下方式以第一丟失幀前一幀時域信號的最后一個基音周期為基準(zhǔn)波形進(jìn)行有交疊的周期性延拓 對第一丟失幀前一幀時域信號的最后一個基音周期的波形以基音周期為長度向時間上的后方做周期性的復(fù)制,復(fù)制時,每次復(fù)制超過一個基音周期長度的信號,每次復(fù)制的信號與前一次復(fù)制的信號產(chǎn)生交疊區(qū),對交疊區(qū)中的信號進(jìn)行加窗相加處理。
31.如權(quán)利要求26所述的裝置,其特征在于, 所述基音周期估計單元還用于在使用自相關(guān)方法對第一丟失幀的前一幀時域信號進(jìn)行基音搜索之前,先對第一丟失幀的初始補償信號和第一丟失幀的前一幀時域信號做低通濾波或降采樣處理,使用低通濾波或降采樣后的初始補償信號和第一丟失幀的前一幀時域信號代替原有的初始補償信號和第一丟失幀的前一幀時域信號進(jìn)行所述基音周期估計。
32.如權(quán)利要求22-31中任一權(quán)利要求所述的裝置,其特征在于, 所述幀類型判斷模塊,還用于在第一丟失幀之后緊隨的第二個丟失幀丟失時,判斷該第二丟失幀的幀類型; 所述MDCT系數(shù)獲取模塊,還用于在所述幀類型判斷模塊判斷該第二丟失幀為非多諧波幀時,使用第二丟失幀的前一個或若干個幀的MDCT系數(shù)計算得到該第二丟失幀的MDCT系數(shù); 所述初始補償信號獲取模塊,還用于根據(jù)第二丟失幀的MDCT系數(shù)得到第二丟失幀的初始補償信號; 所述調(diào)整模塊,還用于對該第二丟失幀的初始補償信號進(jìn)行第二類波形調(diào)整,將調(diào)整后的時域信號作為所述第二丟失幀的時域信號。
33.如權(quán)利要求32所述的裝置,其特征在于, 所述調(diào)整模塊還包括第二類波形調(diào)整單元,其用于采用以下方式對第二丟失幀的初始補償信號進(jìn)行第二類波形調(diào)整 將補償?shù)谝粊G失幀時得到的時域信號超出一幀長度的部分M1與第二丟失幀的初始補償信號交疊相加得到第二丟失幀的時域信號,其中交疊區(qū)長度為M1,在交疊區(qū)內(nèi),補償?shù)谝粊G失幀時得到的時域信號超出一幀長度的部分采用下降窗,第二丟失幀的初始補償信號的前M1點的數(shù)據(jù)采用與下降窗等長的上升窗,將加窗后相加得到的數(shù)據(jù)作為第二丟失幀時域信號的前乂個樣點的數(shù)據(jù),其余各樣點數(shù)據(jù)使用交疊區(qū)以外的第二丟失幀初始補償信號的樣點數(shù)據(jù)補充。
34.如權(quán)利要求32所述的裝置,其特征在于, 所述幀類型判斷模塊,還用于在第二丟失幀之后緊隨的第三個丟失幀及第三個丟失幀以后的幀丟失時,判斷該丟失幀的幀類型; 所述MDCT系數(shù)獲取模塊,還用于在所述幀類型判斷模塊判斷當(dāng)前丟失幀為非多諧波幀時,使用該當(dāng)前丟失幀的前一個或若干個幀的MDCT系數(shù)計算得到該當(dāng)前丟失幀的MDCT系數(shù); 所述初始補償信號獲取模塊,還用于根據(jù)該當(dāng)前丟失幀的MDCT系數(shù)得到該當(dāng)前丟失幀的初始補償信號; 所述調(diào)整模塊,還用于將該當(dāng)前丟失幀的初始補償信號作為該丟失幀的時域信號。
35.如權(quán)利要求22-31中任一權(quán)利要求所述的裝置,其特征在于, 所述裝置還包括正常幀補償模塊,其用于在正確接收幀后緊隨的第一幀丟失,且該第一丟失幀為非多諧波幀,對第一丟失幀之后緊隨的正確接收幀進(jìn)行處理,包括解碼單元、時域信號調(diào)整單元,其中 所述解碼單元,用于解碼得到該正確接收幀的時域信號; 所述時域信號調(diào)整單元,用于對補償?shù)谝粊G失幀時使用的基音周期估計值做調(diào)整;以及,以該正確接收幀時域信號的最后一個基音周期為基準(zhǔn)波形進(jìn)行向前的有交疊的周期性延拓得到一巾貞長的時域信號;以及,對補償?shù)谝粊G失巾貞時得到的時域信號超出一巾貞長度的部分與延拓得到的時域信號交疊相加,將得到的信號作為該正確接收幀的時域信號。
36.如權(quán)利要求35所述的裝置,其特征在于, 所述時域信號調(diào)整單元是用于采用以下方式對補償?shù)谝粊G失幀時使用的基音周期估計值做調(diào)整 分別搜索得到該正確接收幀時域信號在時間區(qū)間[L-2T-1,L-T-1]和[L-T,L-1]內(nèi)的最大幅值位置“和i4,其中T為補償?shù)谝粊G失幀時使用的基音周期估計值,L為幀長,如果滿足以下條件=Q1T < i4-13 < q2T并且i4-13小于L/2,其中O ^ Q1 ^ I ^ q2,則修改基音周期估計值為i4_i3,如果不滿足上述條件,則不對基音周期估計值作修改。
37.如權(quán)利要求35所述的裝置,其特征在于, 所述時域信號調(diào)整單元是用于采用以下方式以該正確接收幀時域信號的最后一個基音周期為基準(zhǔn)波形進(jìn)行向前的有交疊的周期性延拓得到一幀長的時域信號 以該正確接收幀時域信號的最后一個基音周期的波形以基音周期為長度向時間上的前方做周期性的復(fù)制,直至得到一幀長的時域信號,復(fù)制時,每次復(fù)制超過一個基音周期長度的信號,每次復(fù)制的信號與前一次復(fù)制的信號產(chǎn)生信號交疊區(qū),在交疊區(qū)中的信號進(jìn)行加窗 相加處理。
全文摘要
本發(fā)明公開了一種語音頻信號的丟幀補償方法和裝置,以獲得更好的補償效果,同時保證無延時和低復(fù)雜度。所述方法包括當(dāng)正確接收幀后緊隨的第一幀丟失時,判斷該第一丟失幀的幀類型,當(dāng)?shù)谝粊G失幀為非多諧波幀時,使用第一丟失幀的前一個或若干個幀的MDCT系數(shù)計算得到該第一丟失幀的MDCT系數(shù);根據(jù)第一丟失幀的MDCT系數(shù)得到第一丟失幀的初始補償信號;對第一丟失幀的初始補償信號進(jìn)行第一類波形調(diào)整,將調(diào)整后得到的時域信號作為該第一丟失幀的時域信號。所述裝置包括幀類型判斷模塊、MDCT系數(shù)獲取模塊、初始補償信號獲取模塊和調(diào)整模塊。相對于現(xiàn)有技術(shù),本發(fā)明具有無延遲、計算量存儲量小、易于實現(xiàn),補償效果好等優(yōu)點。
文檔編號G10L19/02GK103065636SQ201110325869
公開日2013年4月24日 申請日期2011年10月24日 優(yōu)先權(quán)日2011年10月24日
發(fā)明者關(guān)旭, 袁浩, 彭科, 黎家力 申請人:中興通訊股份有限公司