專利名稱:調(diào)頻立體聲無線電接收器的間歇單聲道接收的隱藏的制作方法
技術(shù)領(lǐng)域:
本文獻(xiàn)涉及音頻信號處理,尤其涉及ー種用于改善調(diào)頻(FM)立體聲無線電接收器的音頻信號的裝置和相應(yīng)方法。特別地,本文獻(xiàn)涉及ー種用于可靠地隱藏FM立體聲無線電接收器的間歇單聲道接收的方法和系統(tǒng)。
背景技術(shù):
在模擬FM (調(diào)頻)立體聲無線電系統(tǒng)中,用中-側(cè)(M/S)表示(即作為中間聲道(M)和側(cè)邊聲道(S))來傳遞音頻信號的左聲道(L)和右聲道(R)。中間聲道M對應(yīng)于L和R的和信號,例如,M=(L+R)/2,并且側(cè)邊聲道S對應(yīng)于L和R的差信號,例如,S= (L-R)/2。針對傳輸,將側(cè)邊聲道S調(diào)制到38kHz抑制載波,并且添加到基帶中間信號M以形成后向兼容立體聲復(fù)用信號。然后使用該復(fù)用信號調(diào)制FM發(fā)送器的HF(高頻)載波,通常工作在87.5MHz到108MHz的范圍內(nèi)。當(dāng)接收質(zhì)量降低卿,無線電信道上的信噪比減小)吋,S聲道通常質(zhì)量降低比M聲道要嚴(yán)重。在許多FM接收器實(shí)施中,當(dāng)接收條件有太多噪聲時,將S聲道靜音。這意味著在差的HF無線電信號的情況下接收器從立體聲后退到單聲道。即使在中間信號M具有可接受的質(zhì)量的情況下,側(cè)邊信號S也可能是有噪聲的,因此當(dāng)混合在輸出信號的左聲道和右聲道中(例如,根據(jù)L=M+S和R=M-S導(dǎo)出)時,可以嚴(yán)重地降低總體音頻質(zhì)量。當(dāng)側(cè)邊信號S具有差到中級的質(zhì)量的情況下,有兩個選擇:接收器選擇接受與側(cè)邊信號S相關(guān)的噪聲并且輸出包括有噪聲的左信號和右信號的實(shí)際立體聲信號,或者接收器放棄側(cè)邊信號S并且后退到單聲道。參數(shù)化立體聲(PS)編碼是一種來自甚低比特率音頻編碼領(lǐng)域的技木。PS使得能夠結(jié)合附加的PS側(cè)邊信息來將2-聲道立體聲音頻信號作為單聲道下混信號進(jìn)行編碼。單聲道下混信號被獲得為立體聲信號的兩個聲道的組合。PS參數(shù)使得PS解碼器能夠根據(jù)單聲道下混信號和PS側(cè)邊信息來重構(gòu)立體聲信號。通常,PS參數(shù)是時變和頻變的,并且PS解碼器中的PS處理通常在合并QMF組的混合濾波器組域中執(zhí)行。文獻(xiàn)“Low ComplexityParametric Stereo Coding in MPEG-4,,,Heiko Purnhagen, Proc.Digital Audio EffectsWorkshop (DAFx), pp.163-168,Naples, IT, Oct.2004 描述了對于MPEG-4 的示例性 PS 編碼系統(tǒng)。通過引用將其對參數(shù)化立體聲的討論合并到本文中。參數(shù)化立體聲受例如MPEG-4Audio的支持。在MPEG-4標(biāo)準(zhǔn)化文獻(xiàn)IS0/IEC14496-3:2005 (MPEG_4Audio,第三版)的附錄8.A和8.C以及章節(jié)8.6.4中討論了參數(shù)化立體聲。出于所有目的將該標(biāo)準(zhǔn)化文獻(xiàn)的這些部分通過引用而合并到本文中。在MPEG Surround標(biāo)準(zhǔn)(參見文獻(xiàn)IS0/IEC23003-1:2007, MPEGSurround)中也使用了參數(shù)化立體聲。此外,出于所有目的通過引用將該文獻(xiàn)合并到本文中。在文獻(xiàn)“Binaural Cue Coding - Part 1:Psychoacoustic Fundamentals and DesignPrinciples,,’Frank Baumgarte and Christof Faller, IEEE Transactions on Speechand Audio Processing, vol 11,no6, pages509_519, November2003 以及在文獻(xiàn) “BinauralCue Coding - Part I1: Schemes and Applications,,,Christof Faller and FrankBaumgarte, IEEE Transaction on Speech and Audio Processing, vol11, no6, pages520-531,11.2003中討論了參數(shù)化立體聲編碼系統(tǒng)的另外的示例。在后兩個文獻(xiàn)中,使用了詞語“雙耳線索編碼”,其是參數(shù)化立體聲編碼的示例。在本文獻(xiàn)中,描述了基于PS參數(shù)的生成的方法及系統(tǒng)。PS參數(shù)用于即使在接收到差質(zhì)量的側(cè)邊信號時也生成低噪聲立體聲信號。此外,描述了一種誤差隱藏方法,其可以用于通過維護(hù)先前所估計(jì)的PS參數(shù)來隱藏到單聲道的中間后退。該情況下的問題是需要以高效和可靠的方式來檢測單聲道失落(dropout)情形。鑒于此,本文獻(xiàn)描述了一種用于檢測和隱藏單聲道失落情形的機(jī)制。
發(fā)明內(nèi)容
根據(jù)一個方面,描述了一種被配置為生成輸出立體聲信號和/或被配置為根據(jù)雙聲道音頻信號確定參數(shù)化立體聲參數(shù)的系統(tǒng)??梢栽诶缱鳛闊o線通信設(shè)備的一部分的FM立體聲無線電接收器處接收雙聲道音頻信號??梢詫⑺邮盏碾p聲道音頻信號表示為中間信號和側(cè)邊信號。換言之,雙聲道音頻信號可以包括中間信號和側(cè)邊信號或可以包括可表示為中間信號和側(cè)邊信號的信號。可以根據(jù)左信號和右信號導(dǎo)出中間信號和側(cè)邊信號。再換言之,可以根據(jù)雙聲道音頻信號來獲得中間信號和/或側(cè)邊信號。因而,雙聲道音頻信號可以包括能夠從其導(dǎo)出中間信號和側(cè)邊信號的信息。在實(shí)施例中,中間信號M和側(cè)邊信號S與左音頻信號L和右音頻信號R按照M=(L+R)/2和S= (L-R)/2有關(guān)。輸出立體聲信號通??梢杂勺笮盘柡陀倚盘杹肀硎?。可替代地,可以將輸出立體聲信號稱為雙聲道輸出信號。該雙聲道輸出信號可以攜帶單聲道音頻信號或立體聲音頻信號。具體地,如果雙聲道輸出信號的左信號與雙聲道輸出信號的右信號對應(yīng),則雙聲道輸出信號通常攜帶單聲道音頻信號。所述系統(tǒng)可以包括參數(shù)化立體聲參數(shù)估計(jì)級,其被配置為基于所接收的雙聲道音頻信號的第一幀來確定第一參數(shù)化立體聲參數(shù)(或至少一個第一參數(shù)化立體聲參數(shù))。換言之,可以使用所接收的雙聲道音頻信號的摘錄來確定第一參數(shù)化立體聲參數(shù),例如,指示聲道電平差的參數(shù)和/或指示聲道間交叉相關(guān)性的參數(shù)。可以將摘錄稱為信號幀。參數(shù)化立體聲參數(shù)估計(jì)級可以被配置為確定所接收的雙聲道音頻信號的每個隨后幀的新的參數(shù)化立體聲參數(shù)(或至少一個新的參數(shù)化立體聲參數(shù))。該系統(tǒng)可以包括被配置為確定第一信號幀內(nèi)的側(cè)邊信號能量的隱藏檢測級??梢曰谛盘枎瑑?nèi)側(cè)邊信號的樣本的均方根值來確定信號幀內(nèi)的側(cè)邊信號的能量。隱藏檢測級可以被配置為確定第一信號巾貞內(nèi)的側(cè)邊信號的能量大于高閾值。隱藏檢測級可以被配置為確定特定數(shù)量的跟隨的連續(xù)信號幀,在特定數(shù)量的跟隨的連續(xù)信號幀期間,側(cè)邊信號的能量(Es)從大于高閾值的值下降到小于低閾值的值。跟隨的連續(xù)的信號幀的數(shù)量可以稱為從高能量側(cè)邊信號(Es>高閾值)到低能量側(cè)邊信號(Es〈低閾值)的轉(zhuǎn)變時段。換言之,隱藏檢測級可以被配置為確定直接接著第一信號幀的特定數(shù)量個信號幀的側(cè)邊信號的能量小于高閾值并且最終下降到小于低閾值。具體地,隱藏檢測級可以被配置為確定能量從大于高閾值的能量下降至小于低閾值的能量期間信號幀的精確數(shù)量。甚至更具體地,隱藏檢測級可以被配置為當(dāng)連續(xù)信號幀的數(shù)量,即當(dāng)所述轉(zhuǎn)變時段小于幀閾值時確定跟隨第一信號幀的雙聲道音頻信號是劣化的立體聲信號或強(qiáng)迫的單聲道信號。在實(shí)施例中,幀閾值可以是ー個或更多個信號幀,例如,I個信號幀、2個信號幀、3個信號巾貞或4個信號巾貞中的任意ー種。隱藏檢測級可以被配置為尤其在已經(jīng)檢測到強(qiáng)迫的單聲道信號時,基于第一參數(shù)化立體聲參數(shù)來確定參數(shù)化立體聲參數(shù)。參數(shù)化立體聲參數(shù)可以用于處理雙聲道音頻信號。特別地,參數(shù)化立體聲參數(shù)可以用于處理雙聲道音頻信號的接著雙聲道音頻信號的第一信號巾貞的中貞。該系統(tǒng)可以包括上混級,所述上混級被配置為基于輔助音頻信號以及基于第一參數(shù)化立體聲參數(shù)來生成跟隨第一信號幀的輸出立體聲信號的幀。換言之,如果確定所接收的跟隨第一信號幀的雙聲道音頻信號是強(qiáng)迫單聲道信號,例如,側(cè)邊信號非常小例如具有很小能量的側(cè)邊信號的立體聲信號,則根據(jù)第一參數(shù)化立體聲參數(shù)(即,已經(jīng)根據(jù)基于所接收的雙聲道音頻信號的沒有劣化的幀確定的第一參數(shù)化立體聲參數(shù))確定輸出立體聲信號的隨后幀。另ー方面,可以從所接收的跟隨第一信號幀的雙聲道音頻信號獲得輔助音頻信號,即,輔助音頻信號可以根據(jù)所接收的雙聲道音頻信號的與輸出立體聲信號的幀相對應(yīng)的幀來確定。在實(shí)施例中,將輔助音頻信號確定為(L+R)/a,其中a是實(shí)數(shù),例如2。S卩,輔助音頻信號可以與包括在所接收的雙聲道音頻信號內(nèi)的中間信號相對應(yīng)。隱藏檢測級還可以被配置為當(dāng)連續(xù)信號幀的數(shù)量等于或大于幀閾值時確定跟隨第一信號幀的雙聲道音頻信號是真實(shí)的單聲道信號。因而,隱藏檢測級可以被配置為通過確定側(cè)邊信號的能量從大于高閾值下降到小于低閾值所花費(fèi)的信號幀的數(shù)量來檢測從立體聲信號到真實(shí)的單聲道信號(例如,語音信號)的轉(zhuǎn)變。隱藏檢測級可以被配置為狀態(tài)機(jī)。具體地,隱藏檢測級可以包括指定總體系統(tǒng)的多個模式的多個狀態(tài)。所述系統(tǒng)的模式通常確定如何處理所接收的雙聲道音頻信號的當(dāng)前幀。具體地,上混級的處理可以取決于系統(tǒng)的當(dāng)前狀態(tài)。隱藏檢測級還可以包括指定所述多個狀態(tài)之間的轉(zhuǎn)變條件的多個邊緣。因而,兩個狀態(tài)之間的邊緣可以指定針對系統(tǒng)從當(dāng)前狀態(tài)通過至隨后狀態(tài)所要滿足的條件。該條件可以包括一個或更多個條件,例如,關(guān)于側(cè)邊信號的隨后幀的能量、時間限制、幀數(shù)量限制等的條件。通過指定狀態(tài)之間的轉(zhuǎn)變條件,邊緣可以確定如何處理雙聲道音頻信號的當(dāng)前幀的緊挨的隨后幀。多個狀態(tài)可以包括立體聲狀態(tài)即以下狀態(tài):在該狀態(tài)期間,系統(tǒng)將雙聲道音頻信號作為非劣化的立體聲信號來處理。如果系統(tǒng)位于立體聲狀態(tài),則參數(shù)化立體聲估計(jì)級可以被配置為基于所接收的雙聲道音頻信號的當(dāng)前幀來確定當(dāng)前參數(shù)化立體聲參數(shù)。上混級可以被配置為基于輔助音頻信號和當(dāng)前參數(shù)化立體聲參數(shù)來生成輸出立體聲信號的當(dāng)前幀??梢詮乃邮盏碾p聲道音頻信號的當(dāng)前幀獲得輔助音頻信號。具體地,可以從包括在所接收的雙聲道音頻信號內(nèi)的中間信號的當(dāng)前幀獲得輔助音頻信號。應(yīng)當(dāng)注意:可替代地或另外地,所述系統(tǒng)可以旁路上混級,并直接從雙聲道音頻信號確定輸出立體聲信號。具體地,可以直接從所接收的雙聲道音頻信號的幀確定例如拷貝輸出立體聲信號的幀。多個狀態(tài)可以包括真實(shí)單聲道狀態(tài),即以下狀態(tài):在該狀態(tài)期間,系統(tǒng)將所接收的雙聲道音頻信號作為真實(shí)單聲道信號來處理,諸如例如語音信號等。如果該系統(tǒng)處于真實(shí)單聲道狀態(tài),參數(shù)化立體聲參數(shù)估計(jì)級可以被配置為基于所接收的雙聲道音頻信號的當(dāng)前幀來確定當(dāng)前參數(shù)化立體聲參數(shù)。上混級可以被配置為基于輔助音頻信號和當(dāng)前參數(shù)化立體聲參數(shù)來生成輸出立體聲信號的當(dāng)前幀。可以從所接收的雙聲道音頻信號的當(dāng)前幀獲得輔助音頻信號。應(yīng)當(dāng)注意:以與立體聲狀態(tài)類似的方式,系統(tǒng)在真實(shí)單聲道操作期間可以工作在芳路|旲式。該多個狀態(tài)可以包括隱藏狀態(tài),即該系統(tǒng)隱藏強(qiáng)迫的單聲道信號的狀態(tài)。如果該系統(tǒng)處于隱藏狀態(tài),則上混級可以被配置為基于輔助音頻信號和所存儲的參數(shù)化立體聲參數(shù)來生成輸出立體聲信號的當(dāng)前幀。因而,上混級可以被配置為基于先前所確定的參數(shù)化立體聲參數(shù)來確定輸出立體聲信號,從而隱藏包括在當(dāng)前所接收的側(cè)邊信號幀內(nèi)的單聲道信號。以與其它狀態(tài)類似的方式,輔助音頻信號可以從所接收的雙聲道音頻信號的當(dāng)前幀獲得。另一方面,所存儲的參數(shù)化立體聲參數(shù)可能已經(jīng)由參數(shù)化立體聲參數(shù)估計(jì)級在該系統(tǒng)處于先前立體聲狀態(tài)時確定。在實(shí)施例中,根據(jù)多個參數(shù)化立體聲參數(shù)確定了所存儲的參數(shù)化立體聲參數(shù),優(yōu)選地,通過平滑或平均。通過考慮在達(dá)到隱藏狀態(tài)前已經(jīng)針對不同的信號幀確定了的參數(shù)化立體聲參數(shù),可以確保該系統(tǒng)在隱藏狀態(tài)期間不使用難用的參數(shù)化立體聲參數(shù)。此外,所存儲的參數(shù)化立體聲參數(shù)可以是時變的。具體地,所存儲的參數(shù)化立體聲參數(shù)可以隨時間衰退到單聲道。換言之,所存儲的參數(shù)化立體聲參數(shù)可以轉(zhuǎn)變?yōu)檫m于生成單聲道音頻信號的參數(shù)化立體聲參數(shù)。對于這種轉(zhuǎn)變的時間間隔可以是可變的。該多個邊緣可以包括以下邊緣中的一個或更多個:當(dāng)隨后幀的能量小于高閾值并且大于低閾值時,從立體聲狀態(tài)到真實(shí)單聲道狀態(tài)的轉(zhuǎn)變;當(dāng)隨后幀的能量小于低閾值時,從立體聲狀態(tài)到隱藏狀態(tài)的轉(zhuǎn)變;當(dāng)隨后幀的能量小于高閾值并且大于低閾值時從隱藏狀態(tài)到真實(shí)單聲道狀態(tài)的轉(zhuǎn)變;當(dāng)隨后幀的能量大于高閾值時從隱藏狀態(tài)到立體聲狀態(tài)的轉(zhuǎn)變;和/或當(dāng)隨后幀的能量大于閾值時從真實(shí)單聲道狀態(tài)到立體聲狀態(tài)的轉(zhuǎn)變。在實(shí)施例中,從真實(shí)單聲道狀態(tài)到隱藏狀態(tài)的轉(zhuǎn)變還取決于當(dāng)前幀前面的、該系統(tǒng)處于真實(shí)單聲道狀態(tài)的幀的數(shù)量。可替代地或另外地,僅在當(dāng)前幀前面的、該系統(tǒng)處于真實(shí)單聲道狀態(tài)的幀數(shù)量小于幀閾值時,才可能出現(xiàn)從真實(shí)單聲道狀態(tài)到隱藏狀態(tài)的轉(zhuǎn)變。隱藏檢測級還可以被配置為確定側(cè)邊信號的隨后幀的譜平坦度。可以基于側(cè)邊信號的幀的功率譜來確定該譜平坦度。功率譜可以包括與相應(yīng)的多個頻帶相關(guān)聯(lián)的多個能量值??梢詫⒆V平坦度確定為該多個能量值的幾何平均與該多個能量值的算術(shù)平均之間的比率。因而,接近O的譜平坦度指示集中的功率譜,其中接近I的譜平坦度指示平坦的功率譜,即,噪聲信號的功率譜。隱藏檢測級還可以被配置為考慮該多個邊緣中的至少之一的轉(zhuǎn)變條件中的譜平坦度。即,隱藏級的邊緣的轉(zhuǎn)變條件可以考慮:側(cè)邊信號的隨后幀包括或不包括高度的噪聲。具體地,從真實(shí)單聲道狀態(tài)到立體聲狀態(tài)的轉(zhuǎn)變可能取決于隨后幀的譜平坦度。更加具體地,僅當(dāng)譜平坦度小于平坦度閾值時才可能發(fā)生從真實(shí)單聲道狀態(tài)到立體聲狀態(tài)的轉(zhuǎn)變。因而,能夠避免由側(cè)邊信號中的噪聲突發(fā)引起的從真實(shí)單聲道狀態(tài)到立體聲狀態(tài)的虛假轉(zhuǎn)變。這還避免了從真實(shí)單聲道狀態(tài)到會導(dǎo)致真實(shí)的單聲道信號的非期望的隱藏的隱藏狀態(tài)的轉(zhuǎn)變(經(jīng)由立體聲狀態(tài))。該系統(tǒng)可以包括噪聲估計(jì)級。噪聲估計(jì)級可以被配置為確定所接收的側(cè)邊信號的噪聲功率所特有的噪聲參數(shù)。此外,參數(shù)化立體聲參數(shù)估計(jì)級可以被配置為基于所接收的雙聲道音頻信號和噪聲參數(shù)來確定參數(shù)化立體聲參數(shù),即第一或當(dāng)前參數(shù)化立體聲參數(shù)。該系統(tǒng)還包括音頻編碼器支持參數(shù)化立體聲。音頻編碼器可以包括參數(shù)化立體聲編碼器,其中參數(shù)化立體聲參數(shù)估計(jì)級是參數(shù)化立體聲編碼器的一部分。根據(jù)另外的方面,描述了ー種FM立體聲無線電接收器。FM立體聲無線電接收器可以被配置為接收包括或表示為中間信號和側(cè)邊信號的FM無線電信號。此外,F(xiàn)M立體聲無線電接收器可以包括具有在本文獻(xiàn)中所概括的特征和功能中的一個或更多個的系統(tǒng)。根據(jù)另ー個方面,描述了ー種移動通信設(shè)備,例如蜂窩式電話或智能手機(jī)。該移動通信設(shè)備可以包括被配置為接收包括或可表示為中間信號和側(cè)邊信號的FM無線電信號的FM立體聲接收器。此外,該移動通信設(shè)備可以包括根據(jù)在本文獻(xiàn)中所概括的特征和功能中的一個或更多個的系統(tǒng)。根據(jù)另外的方面,描述了ー種用于確定輸出立體聲信號(或雙聲道輸出信號)和/或用于根據(jù)所接收的雙聲道音頻信號來確定參數(shù)化立體聲參數(shù)的方法。所接收的雙聲道音頻信號可以包括或可以表示為中間信號和側(cè)邊信號。該方法可以包括基于所接收的雙聲道音頻信號的第一幀來確定第一參數(shù)化立體聲參數(shù)的步驟。該方法可以進(jìn)行第一信號幀內(nèi)的側(cè)邊信號的能量的確定和第一信號幀內(nèi)的側(cè)邊信號的能量高于高閾值的確定。此外,該方法可以包括確定特定數(shù)量的跟隨的連續(xù)信號幀,例如直接跟隨第一信號幀的信號幀,在該特定數(shù)量的連續(xù)信號幀期間側(cè)邊信號的能量從大于高閾值的值下降到小于低閾值的值。具體地,該方法可以確定在側(cè)邊信號的能量從大于高閾值下降到小于低閾值期間幀的數(shù)量。接著,該方法可以進(jìn)行當(dāng)連續(xù)的信號幀的數(shù)量低于幀閾值時跟隨第一信號幀的雙聲道音頻信號是劣化的立體聲信號或強(qiáng)迫的單聲道信號的確定。如果是這種情況,即如果確定跟隨第一信號幀的雙聲道音頻信號是強(qiáng)迫的單聲道信號,該方法可以包括基于第一參數(shù)化立體聲參數(shù)來確定參數(shù)化立體聲參數(shù)的步驟??商娲鼗蛄硗獾兀摲椒梢园ɑ谳o助音頻信號以及基于第一參數(shù)化立體聲參數(shù)生成輸出立體聲信號的跟隨第一信號幀的幀的步驟;其中根據(jù)所接收的跟隨第一信號幀的雙聲道音頻信號獲得輔助音頻信號。根據(jù)另外的方面,描述了ー種軟件程序。該軟件程序可以適于執(zhí)行在處理器上并且當(dāng)執(zhí)行在計(jì)算設(shè)備上時用于執(zhí)行在本文獻(xiàn)中所概括的方法步驟。根據(jù)另ー個方面,描述了ー種存儲介質(zhì)。該存儲介質(zhì)可以包括軟件程序,該軟件程序適于執(zhí)行在處理器上,并且當(dāng)執(zhí)行在計(jì)算設(shè)備上時適于進(jìn)行在本文獻(xiàn)中所概括的方法步驟。根據(jù)另外的方面,描述了ー種計(jì)算機(jī)程序產(chǎn)品。該計(jì)算機(jī)程序產(chǎn)品可以包括當(dāng)執(zhí)行在計(jì)算機(jī)上時用于執(zhí)行本文獻(xiàn)所概括的方法步驟的可執(zhí)行指令。應(yīng)當(dāng)注意,包括方法及系統(tǒng)的如在本專利申請中概括的優(yōu)選實(shí)施例的方法及系統(tǒng)可以獨(dú)立使用或結(jié)合在本文獻(xiàn)中公開的其它方法及系統(tǒng)來使用。此外,可以任意組合在本專利申請中概括的方法及系統(tǒng)的所有方面。具體地,權(quán)利要求的特征可以以任意方式互相進(jìn)行組合。
參考附圖通過例示性實(shí)例來說明本發(fā)明,其中圖1例示用于改善FM立體聲無線電接收器的立體聲輸出的示意性實(shí)施例;
圖2例示基于參數(shù)化立體聲的概念的音頻處理裝置的實(shí)施例;圖3例示具有PS編碼器和PS解碼器的基于PS的音頻處理裝置的另一實(shí)施例;圖4例示圖3的音頻處理裝置的擴(kuò)展版本;圖5例示圖4的PS編碼器和PS解碼器的實(shí)施例;圖6例示用于在FM接收器的僅單聲道輸出的情況下生成偽立體聲的音頻處理裝置的另一實(shí)施例;圖7例示FM接收器的輸出處立體聲播放中的短暫失落的發(fā)生;圖8例示用于進(jìn)行單聲道失落檢測和單聲道誤差隱藏的示例狀態(tài)機(jī);圖9例示具有單聲道失落的信號的示例誤差隱藏;圖10例示示例音頻信號的功率譜;圖11例示使用誤差隱藏的示例PS參數(shù)估計(jì)級;圖12例示示例“單聲道”檢測級或隱藏檢測級;圖13例示具有誤差補(bǔ)償?shù)南冗M(jìn)的PS參數(shù)估計(jì)級;以及圖14例示基于HE-AAC v2編碼器的音頻處理裝置的另外實(shí)施例。
具體實(shí)施例方式圖1示出用于改善FM立體聲無線電接收器I的立體聲輸出的簡化的示意性實(shí)施例。如在背景技術(shù)部分所討論的,在FM無線電中有意地將立體聲信號作為中間信號和側(cè)邊信號來傳輸。在FM接收器I中,使用側(cè)邊信號來產(chǎn)生FM接收器I的輸出處左聲道L與右聲道R之間的立體聲差(至少當(dāng)接收足夠好并且沒有靜音側(cè)邊信號信息時)。左聲道L和右聲道R可以是數(shù)字或模擬信號。為了改善FM接收器的音頻信號L和R,使用音頻處理裝置2,該音頻處理裝置2在其輸出處生成立體聲音頻信號L’和R’。音頻處理裝置2對應(yīng)于能夠使用參數(shù)化立體聲來對所接收的FM無線電信號進(jìn)行降噪的系統(tǒng)。優(yōu)選地,在數(shù)字域中進(jìn)行裝置2中的音頻處理;因此,在FM接收器I與音頻處理裝置2之間的模擬接口的情況下,在裝置2的數(shù)字音頻處理之前使用模數(shù)轉(zhuǎn)換器??梢詫M接收器I和音頻處理裝置2結(jié)合在相同的半導(dǎo)體芯片上或可以是兩個半導(dǎo)體芯片的一部分。FM接收器I和音頻處理裝置2可以是無線通信設(shè)備的一部分,無線通信設(shè)備諸如蜂窩電話、個人數(shù)字終端(PDA)或智能手機(jī)。在這種情況下,F(xiàn)M接收器I可以是具有附加的FM無線電接收器功能的基帶芯片的一部分。替代在FM接收器I的輸出處以及裝置2的輸入處使用左/右表示(representation),可以在FM接收器I與裝置2之間的接口處使用中/側(cè)表示(參見圖1中對于中/側(cè)表示的M、S和對于左/右表示的L、R)。因?yàn)镕M接收器I已經(jīng)接收了中/側(cè)邊信號并且音頻處理裝置2可以在不進(jìn)行下混的情況下直接處理中/側(cè)邊信號,所以FM接收器I與裝置2之間的接口處的這種中/側(cè)表示可以事半功倍。當(dāng)FM接收器I與音頻處理裝置2緊密整合時,尤其是當(dāng)FM接收器I與音頻處理裝置2結(jié)合在相同的半導(dǎo)體芯片中時,中/側(cè)表示可能是有利的??蛇x地,可以將指示無線電接收條件的信號強(qiáng)度信號6用于適應(yīng)(adapt)音頻處理裝置2中的音頻處理。后面將在本說明書中對此進(jìn)行說明。FM無線電接收器I和音頻處理裝置2的組合對應(yīng)于具有集成降噪系統(tǒng)的FM無線電接收器。圖2示出基于參數(shù)化立體聲概念的音頻處理裝置2的實(shí)施例。裝置2包括PS參數(shù)估計(jì)級3。參數(shù)估計(jì)級3被配置為基于要改善的輸入音頻信號(其可以用左/右表示或中/側(cè)表示)確定PS參數(shù)5。PS參數(shù)5可以但不限于包括指示聲道間強(qiáng)度差(IID或也稱為CLD -聲道電平差)的參數(shù)和/或指示聲道間交叉相關(guān)性(ICC)的參數(shù)。優(yōu)選地,PS參數(shù)5是時變和頻變的。在參數(shù)估計(jì)級3的輸入處的M/S表示的情況下,參數(shù)估計(jì)級3仍然可以確定與L/R聲道有關(guān)的PS參數(shù)5。從輸入信號獲得音頻信號DM。在輸入音頻信號已經(jīng)使用中/側(cè)表示的情況下,音頻信號DM可以直接對應(yīng)中間信號。在輸入音頻信號具有左/右表示的情況下,通過下混音頻信號來生成音頻信號。優(yōu)選地,下混后的結(jié)果信號DM對應(yīng)于中間信號M并且可以通過下面的等式來生成:DM= (L+R) /a,例如 a=2,S卩,下混信號DM可以與L和R信號的平均值相對應(yīng)。對于a的不同值,L和R信號的平均值被放大或減小。該裝置還包括也稱為立體聲混合模塊或立體聲上混器的上混級4。上混級4被配置為基于音頻信號DM和PS參數(shù)5生成立體聲信號L’和R’。優(yōu)選地,上混級4不僅使用DM信號而且還使用側(cè)邊信號或某種偽側(cè)邊信號(未示出)。后面將在本說明書中聯(lián)系圖4和圖5中的更延伸的實(shí)施例來進(jìn)行說明。裝置2基于這種思想:由于其噪聲,對于通過簡單地組合所接收的中間信號和側(cè)邊信號來重構(gòu)立體聲信號而言,所接收的側(cè)邊信號的噪聲可能太大;盡管如此,在這種情況下,L/R信號中的側(cè)邊信號或側(cè)邊信號的分量對PS參數(shù)估計(jì)級3中的立體聲參數(shù)分析可能仍然足夠好。然后可以將獲得的PS參數(shù)5用于生成相比直接在FM接收器I的輸出處的音頻信號具有減小了的噪聲水平的立體聲信號L’、R’。因此,可以通過使用參數(shù)化立體聲概念來“凈化”差的FM無線電信號。FM無線電信號中的失真與噪聲的主要部分位于可能不在PS下混中使用的側(cè)邊聲道。盡管如此,即使在差的接收的情況下,對于PS參數(shù)提取,側(cè)邊聲道通常具有足夠的質(zhì)量。在所有下面的圖中,到音頻處理裝置2的輸入信號是左/右立體聲信號。在對音頻處理裝置2內(nèi)的一些模塊進(jìn)行較小的修改后,音頻處理裝置2還能夠處理中/側(cè)表示下的輸入信號。因此,可以聯(lián)系中/側(cè)表示下的輸入信號來使用本文所討論的概念。圖3示出使用PS編碼器7和PS解碼器8的基于PS的音頻處理裝置2的實(shí)施例。在該示例中,參數(shù)估計(jì)級3是PS編碼器7的一部分,并且上混級4是PS解碼器8的一部分。將術(shù)語“PS編碼器”和“PS解碼器”用作描述裝置2內(nèi)的音頻處理塊的功能的名字。應(yīng)當(dāng)注意:音頻處理都是發(fā)生在相同的FM接收器設(shè)備處。這些PS編碼和PS解碼處理可以緊密地耦接,并且僅使用術(shù)語“PS編碼”和“PS解碼”描述音頻處理功能的傳承。PS編碼器7基于立體聲音頻輸入信號L、R生成音頻信號DM和PS參數(shù)5??蛇x地,PS編碼器7還使用信號強(qiáng)度信號6。音頻信號DM為單聲道下混并且優(yōu)選地對應(yīng)于所接收的中間信號。當(dāng)加和L/R聲道以形成DM信號時,在DM信號中可以完全排除所接收的側(cè)邊聲道信息。因此,在該情況下,在單聲道下混DM中僅包含中間信息。因此,在DM信號中可以排除來自側(cè)邊聲道的任何噪聲。但是,由于編碼器7通常采用L=M+S和R=M-S作為輸入(因此,DM=(L+R)/2=M),所以側(cè)邊信號是編碼器7中的立體聲參數(shù)分析的一部分。隨后,在PS解碼器8中使用單聲道信號DM和PS參數(shù)5來重構(gòu)立體聲信號L’、R’。圖4示出圖3的音頻處理裝置2的擴(kuò)展版本。此處,除了單聲道下混信號DM和PS參數(shù)以外,還將原始接收的側(cè)邊信號S0傳遞到PS解碼器8。該方法與來自PS編碼的“殘差編碼”技術(shù)類似,并且使得能夠在良好但不完美的接收條件的情況下使用所接收的側(cè)邊信號S0的至少部分(例如,某些頻帶)。優(yōu)選地,在單聲道下混信號對應(yīng)于中間信號的情況下使用所接收的側(cè)邊信號S0。但是,在單聲道下混信號不對應(yīng)于中間信號的情況下,可以使用更一般的殘差信號替代所接收的側(cè)邊信號S0這種殘差信號指示與通過原始聲道的下混和PS參數(shù)表示原始聲道相關(guān)的誤差,并且經(jīng)常用在PS編碼方案中。下面,對所接收的側(cè)邊信號的S0的用途的評論也適用于殘差信號。圖5示出圖4的PS編碼器7和PS解碼器8的實(shí)施例。PS編碼器模塊7包括下混生成器9和PS參數(shù)估計(jì)級3。例如,下混生成器9可以產(chǎn)生優(yōu)選地與中間信號M對應(yīng)的單聲道下混DM(例如,DM=M= (L+R)/a),并且可選地還可以生成與所接收的側(cè)邊信號S0=(L-R)/a對應(yīng)的第二信號。PS參數(shù)估計(jì)級3可以將PS參數(shù)5估計(jì)為L輸入與R輸入之間的電平差(leveldifference)和相關(guān)性??蛇x地,參數(shù)估計(jì)級接收信號強(qiáng)度6。可以使用該信息對PS參數(shù)5的可靠性做出決定。在低可靠性的情況下,例如在低信號強(qiáng)度6的情況下,可以設(shè)置PS參數(shù)5使得輸出信號L’、R’是單聲道輸出信號或偽立體聲輸出信號。在偽立體聲輸出信號的情況下,可以使用默認(rèn)的PS參數(shù)來生成偽或默認(rèn)的立體聲輸出信號L’、R’。PS解碼器模塊8包括立體聲混合矩陣4a和去相關(guān)器10。去相關(guān)器接收單聲道下混DM并且生成用作偽側(cè)邊信號的去相關(guān)信號S’??梢酝ㄟ^如在引用文獻(xiàn)“Low ComplexityParametric Stereo Coding in MPEG-4”的章節(jié)4中討論的適當(dāng)?shù)娜V波器來實(shí)現(xiàn)去相關(guān)器10。在該實(shí)施例中,立體聲混合矩陣4a是2 × 2上混矩陣。取決于所估計(jì)的參數(shù)5,立體聲混合矩陣4a將DM信號與所接收的側(cè)邊信號S0或去相關(guān)信號S’進(jìn)行混合來產(chǎn)生立體聲輸出信號L’和R’。信號S0與信號S’之間的選擇可以取決于指示接收條件(諸如信號強(qiáng)度6)的無線電接收指示器??梢蕴娲鼗蚋郊拥厥褂弥甘舅邮盏膫?cè)邊信號的質(zhì)量的質(zhì)量指示器。這種質(zhì)量指示器的一個示例是所接收的側(cè)邊信號的估計(jì)噪聲(功率)。在側(cè)邊信號包括高度噪聲的情況下,可以使用去相關(guān)信號S’來產(chǎn)生立體聲輸出信號L’和R’,而在低噪聲情形中,可以使用側(cè)邊信號后面在本說明中討論用于估計(jì)所接收的側(cè)邊信號的噪聲的各種實(shí)施例。優(yōu)選地,根據(jù)下面的矩陣等式來執(zhí)行上混操作:
權(quán)利要求
1.種被配置為根據(jù)雙聲道音頻信號確定參數(shù)化立體聲參數(shù)的系統(tǒng),包括: -參數(shù)化立體聲參數(shù)估計(jì)級,被配置為基于所接收的雙聲道音頻信號的第一幀來確定第一參數(shù)化立體聲參數(shù);以及-隱藏檢測級,被配置為: -確定所述第一信號幀內(nèi)的側(cè)邊信號的能量;其中所述側(cè)邊信號能夠從所述雙聲道音頻信號獲得,并且其中所述能量大于高閾值; -確定具有特定數(shù)量的跟隨連續(xù)信號幀的轉(zhuǎn)變時段,在所述轉(zhuǎn)變時段期間所述側(cè)邊信號的能量從大于所述高閾值的值下降到小于低閾值的值; -如果所述轉(zhuǎn)變時段的連續(xù)信號幀的數(shù)量小于幀閾值,則確定跟隨所述第一信號幀的所述雙聲道音頻信號是強(qiáng)制單聲道信號;以及 -基于所述第一參數(shù)化立體聲參數(shù)來確定所述參數(shù)化立體聲參數(shù)。
2.據(jù)權(quán)利要求1所述的系統(tǒng),其中所接收的雙聲道音頻信號能夠表示為中間信號和所述側(cè)邊信號。
3.據(jù)權(quán)利要求1或2所述的系統(tǒng),還包括: -上混級,被配置為基于輔助音頻信號并且基于所述第一參數(shù)化立體聲參數(shù)來生成跟隨所述第一信號幀的輸出立體聲信號的幀;其中根據(jù)跟隨所述第一信號幀的所接收的雙聲道音頻信號來獲得所述輔助音頻信號。
4.據(jù)權(quán)利要求1至3中任一項(xiàng)所 述的系統(tǒng),其中所述隱藏檢測級還被配置為: -如果所述轉(zhuǎn)變時段的連續(xù)信號幀的數(shù)量等于或大于所述幀閾值,則確定跟隨所述第一信號幀的所述雙聲道音頻信號是真實(shí)的單聲道信號。
5.據(jù)任一前述權(quán)利要求所述的系統(tǒng),其中所述隱藏檢測級包括: -指定所述系統(tǒng)的多個模式的多個狀態(tài);其中所述系統(tǒng)的模式確定如何處理所述雙聲道音頻信號的當(dāng)前幀;以及 -指定所述多個狀態(tài)之間的轉(zhuǎn)變條件的多個邊緣,從而確定如何處理所述雙聲道音頻信號的所述當(dāng)前幀的緊挨隨后幀。
6.據(jù)權(quán)利要求5所述的系統(tǒng),其中所述多個狀態(tài)包括立體聲狀態(tài);其中在所述立體聲狀態(tài)中: -所述參數(shù)化立體聲參數(shù)估計(jì)級被配置為基于所接收的雙聲道音頻信號的所述當(dāng)前幀來確定當(dāng)前參數(shù)化立體聲參數(shù);以及 -所述上混級被配置為基于所述輔助音頻信號和所述當(dāng)前參數(shù)化立體聲參數(shù)來生成所述輸出立體聲信號的當(dāng)前幀;其中根據(jù)所接收的雙聲道音頻信號的所述當(dāng)前幀來獲得所述輔助音頻信號。
7.據(jù)權(quán)利要求6所述的系統(tǒng),其中所述多個狀態(tài)包括真實(shí)單聲道狀態(tài);其中在所述真實(shí)單聲道狀態(tài)中: -所述參數(shù)化立體聲參數(shù)估計(jì)級被配置為基于所接收的雙聲道音頻信號的所述當(dāng)前幀來確定當(dāng)前參數(shù)化立體聲參數(shù);以及 -所述上混級被配置為基于所述輔助音頻信號和所述當(dāng)前參數(shù)化立體聲參數(shù)來生成所述輸出立體聲信號的當(dāng)前幀;其中根據(jù)所接收的雙聲道音頻信號的所述當(dāng)前幀來獲得所述輔助音頻信號。
8.據(jù)權(quán)利要求7所述的系統(tǒng),其中所述多個狀態(tài)包括隱藏狀態(tài);其中在所述隱藏狀態(tài)中: -所述上混級被配置為基于所述輔助音頻信號和所存儲的參數(shù)化立體聲參數(shù)來生成所述輸出立體聲信號的當(dāng)前幀;其中根據(jù)所接收的雙聲道音頻信號的所述當(dāng)前幀來獲得所述輔助音頻信號;并且其中所存儲的參數(shù)化立體聲參數(shù)已經(jīng)在所述系統(tǒng)處于先前的立體聲狀態(tài)時由所述參數(shù)立體聲參數(shù)估計(jì)級確定。
9.據(jù)權(quán)利要求8所述的系統(tǒng),其中已經(jīng)根據(jù)多個參數(shù)化立體聲參數(shù)確定所存儲的參數(shù)化立體聲參數(shù),優(yōu)選地已經(jīng)通過低通濾波或求平均來根據(jù)多個參數(shù)化立體聲參數(shù)確定所存儲的參數(shù)化立體聲參數(shù)。
10.據(jù)權(quán)利要求8或9所述的系統(tǒng),其中所存儲的參數(shù)化立體聲參數(shù)是時變的并且隨時間衰退到單聲道。
11.據(jù)權(quán)利要求8至10中任一項(xiàng)所述的系統(tǒng),其中所述多個邊緣包括: -當(dāng)所述隨后幀的所述能量小于所述高閾值并且大于所述低閾值時從所述立體聲狀態(tài)到真實(shí)單聲道狀態(tài)的轉(zhuǎn)變; -當(dāng)所述隨后幀的所述能量小于所述低閾值時從所述立體聲狀態(tài)到所述隱藏狀態(tài)的轉(zhuǎn)變; -當(dāng)所述隨后幀的所述能量小于所述高閾值并且大于所述低閾值時從所述隱藏狀態(tài)到所述真實(shí)單聲道狀態(tài)的轉(zhuǎn)變; -當(dāng)所述隨后幀的所述能量大于所述高閾值時從所述隱藏狀態(tài)到所述立體聲狀態(tài)的轉(zhuǎn)變;和/或 -當(dāng)所述隨后幀的所述能量大于所述高閾值時從所述真實(shí)單聲道狀態(tài)到所述立體聲狀態(tài)的轉(zhuǎn)變。
12.據(jù)權(quán)利要求11所述的系統(tǒng),其中從所述真實(shí)單聲道狀態(tài)到所述隱藏狀態(tài)的所述轉(zhuǎn)變還取決于所述當(dāng)前幀之前的、所述系統(tǒng)處于所述真實(shí)單聲道狀態(tài)的幀的數(shù)量。
13.據(jù)權(quán)利要求12所述的系統(tǒng),其中僅當(dāng)所述當(dāng)前幀之前的、所述系統(tǒng)處于所述真實(shí)單聲道狀態(tài)的幀的數(shù)量小于所述幀閾值時,才發(fā)生從所述真實(shí)單聲道狀態(tài)到所述隱藏狀態(tài)的所述轉(zhuǎn)變。
14.據(jù)任一前述權(quán)利要求所述的系統(tǒng),其中所述幀閾值是I幀、2幀、3幀或4幀中任何ー個。
15.據(jù)權(quán)利要求11至14中任一項(xiàng)所述的系統(tǒng),其中所述隱藏檢測級還被配置為: -確定所述側(cè)邊信號的所述隨后幀的譜平坦度;以及 -考慮在所述多個邊緣中的至少之ー的轉(zhuǎn)變條件中的所述譜平坦度。
16.據(jù)權(quán)利要求15所述的系統(tǒng),其中從所述真實(shí)單聲道狀態(tài)到所述立體聲狀態(tài)的所述轉(zhuǎn)變?nèi)Q于所述隨后幀的所述譜平坦度。
17.據(jù)權(quán)利要求16所述的系統(tǒng),其中僅當(dāng)所述譜平坦度小于平坦度閾值時才發(fā)生從所述真實(shí)單聲道狀態(tài)到所述立體聲狀態(tài)的所述轉(zhuǎn)變。
18.據(jù)權(quán)利要求3至17中任一項(xiàng)所述的系統(tǒng),其中 -所述中間信號M和所述側(cè)邊信號S與左音頻信號L和右音頻信號R按照M= (L+R) /2并且S= (L-R)/2相關(guān);以及-所述輔助音頻信號被確定為(L+R)/a,其中a是實(shí)數(shù)。
19.據(jù)任一前述權(quán)利要求所述的系統(tǒng),其中所述參數(shù)化立體聲參數(shù)包括指示聲道電平差的參數(shù)和/或指示聲道間交叉相關(guān)性的參數(shù)。
20.據(jù)任一前述權(quán)利要求所述的系統(tǒng),其中 -所述系統(tǒng)還包括噪聲估計(jì)級,所述噪聲估計(jì)級被配置為確定所接收的所述側(cè)邊信號的噪聲功率所特有的噪聲參數(shù);以及 -所述參數(shù)化立體聲參數(shù)估計(jì)級被配置為基于所接收的雙聲道音頻信號和所述噪聲參數(shù)來確定所述參數(shù)化立體聲參數(shù)。
21.據(jù)任一前述權(quán)利要求所述的系統(tǒng),還包括支持參數(shù)化立體聲的音頻編碼器,所述音頻編碼器包括參數(shù)化立體聲編碼器,其中所述參數(shù)化立體聲參數(shù)估計(jì)級是所述參數(shù)化立體聲編碼器的一部分。
22.種調(diào)頻立體聲無線電接收器,被配置為接收包括中間信號和側(cè)邊信號的調(diào)頻無線電信號,并且包括根據(jù)權(quán)利要求1至21中任一項(xiàng)所述的系統(tǒng)。
23.種移動通信設(shè)備,包括: -調(diào)頻立體聲接收器,被配置為接收包括中間信號和側(cè)邊信號的調(diào)頻無線電信號;以及 -根據(jù)權(quán)利要求1至21中任一項(xiàng)所述的系統(tǒng)。
24.種用于根據(jù)雙聲道音頻信號來確定參數(shù)化立體聲參數(shù)的方法,包括: -基于所接收的雙聲道音頻信號的第一幀來確定第一參數(shù)化立體聲參數(shù); -確定所述第一信號幀內(nèi)的側(cè)邊信號的能量;其中所述側(cè)邊信號能夠從所述雙聲道音頻信號來獲得并且其中所述能量大于高閾值; -確定特定數(shù)量的跟隨連續(xù)信號幀,在所述跟隨連續(xù)信號幀期間,所述側(cè)邊信號的能量從大于所述高閾值的值降至小于低閾值的值; -如果連續(xù)信號幀的所述數(shù)量小于幀閾值,則確定跟隨所述第一信號幀的所述雙聲道音頻信號是強(qiáng)迫單聲道信號;以及 -基于所述第一參數(shù)化立體聲參數(shù)來確定所述參數(shù)化立體聲參數(shù)。
25.種軟件程序,所述軟件程序適于在處理器上執(zhí)行并且當(dāng)在計(jì)算設(shè)備上執(zhí)行時用于執(zhí)行權(quán)利要求24所述的方法步驟。
26.種包括軟件程序的存儲介質(zhì),所述軟件程序適于在處理器上執(zhí)行并且當(dāng)在計(jì)算設(shè)備上執(zhí)行時用于執(zhí)行權(quán)利要求24所述的方法步驟。
27.種包括可執(zhí)行指令的計(jì)算機(jī)程序產(chǎn)品,當(dāng)在計(jì)算機(jī)上執(zhí)行時,所述可執(zhí)行指令用于執(zhí)行權(quán)利要求24所述的方法。
全文摘要
本發(fā)明涉及音頻信號處理。特別地,本發(fā)明涉及用于可靠地隱藏FM立體聲無線電接收器的間歇單聲道接收的方法及系統(tǒng)。該系統(tǒng)包括參數(shù)化立體聲參數(shù)估計(jì)級,其被配置為基于所接收的雙聲道音頻信號的第一幀來確定第一參數(shù)化立體聲參數(shù)。該系統(tǒng)還包括隱藏檢測級,其被配置為確定第一信號幀內(nèi)的側(cè)邊信號的能量;確定特定數(shù)量的跟隨的連續(xù)信號幀,在特定數(shù)量的跟隨的連續(xù)信號幀期間,側(cè)邊信號的能量從大于高閾值的值下降到小于低閾值的值;當(dāng)連續(xù)的信號幀的數(shù)量小于幀閾值時確定跟隨的第一信號幀的雙聲道音頻信號是強(qiáng)迫單聲道信號;以及基于第一參數(shù)化立體聲參數(shù)確定參數(shù)化立體聲參數(shù)。
文檔編號G10L19/00GK103098131SQ201180041216
公開日2013年5月8日 申請日期2011年8月16日 優(yōu)先權(quán)日2010年8月24日
發(fā)明者利夫·塞爾斯特倫, ??啤て諣柟? 約納什·恩德加德 申請人:杜比國際公司