專利名稱:基于復指數(shù)調(diào)制的濾波器組的高級處理和自適應時間信號傳送方法
技術領域:
本發(fā)明涉及音頻源編碼系統(tǒng),但是同樣的方法也可應用于許多其他技術領域中。介紹了可用于利用立體聲屬性的參數(shù)表示的音頻編碼系統(tǒng)的不同技術。
背景技術:
本發(fā)明涉及音頻信號的立體聲聲像的參數(shù)編碼。用于描述立體聲聲像屬性的典型參數(shù)是聲道間強度差異(IID)、聲道間時間差異(ITD)和聲道間相干(IC)。為了基于這些參數(shù)重建立體聲聲像,要求一種能夠根據(jù)IC參數(shù)重建兩個聲道間的正確相關級別的方法。這是通過去相關方法來實現(xiàn)的。
有幾種創(chuàng)建去相關后的信號的方法可用。理想情況下,要求具有全通頻率響應的線性時不變(LTI)函數(shù)。用于實現(xiàn)這一點的一種明顯方法是通過使用恒定延遲。但是,使用延遲或任何其他LTI全通函數(shù),將會導致加上未經(jīng)處理的信號后的非全通響應。在延遲的情況下,結(jié)果將會是典型梳狀濾波器。梳狀濾波器通常給出不合需要的“金屬”聲音,即使立體聲加寬效果有效,該聲音也會大大降低原始聲音的自然度。
現(xiàn)有技術還已知通過沿頻率軸向IID值添加隨機序列來生成去相關后的信號的頻域方法,其中不同序列用于不同音頻聲道。通過隨機序列修改進行的頻域去相關的一個問題是引入了前回聲。主觀測試表明對于非靜止信號,前回聲比起后回聲來惱人得多,已確立的心理聲學原理也支持這一點。此問題可通過就瞬態(tài)內(nèi)容而言針對信號特性而動態(tài)自適應變換尺寸來減小。但是,切換變換尺寸始終是硬(即二元)判決,它影響整個信號帶寬并且難以用魯棒的方式來實現(xiàn)。
美國專利申請公布US 2003/0219130 A1公開了基于相干的音頻編碼和合成。具體而言,通過為每個臨界頻帶修改聽覺情景參數(shù),從單聲道(mono)音頻信號合成聽覺情景,所述參數(shù)例如是臨界頻帶內(nèi)的每個子頻帶的耳間級別差異(ILD)和/或耳間時間差異(ITD),其中修改是基于臨界頻帶的平均估計相干的?;谙喔傻男薷漠a(chǎn)生了具有對象寬度的聽覺情景,這精確地匹配了原始輸入聽覺情景中的對象的寬度。立體聲參數(shù)是公知的BCC參數(shù),其中BCC代表技術心理聲學編碼(binaural cue coding)。當生成兩個不同的去相關后的輸出聲道時,由離散付立葉變換所獲得的頻率系數(shù)被一起聚集在單個臨界頻帶中?;诼暤篱g相干測量,加權因子被乘以偽隨機序列,該序列優(yōu)選地被選擇為使得對于所有臨界頻帶方差大致恒定,并且在每個臨界頻帶內(nèi)平均值為0。相同的序列適用于每個不同幀的頻譜系數(shù)。
發(fā)明內(nèi)容
本發(fā)明的目的是提供一種用于參數(shù)性編碼的多聲道信號的解碼概念或用于生成這種信號的編碼概念,這種信號產(chǎn)生良好的音頻質(zhì)量和良好的編碼效率。
此目的是通過用于根據(jù)權利要求1的用于生成去相關信號的裝置、根據(jù)權利要求13的多聲道解碼器、根據(jù)權利要求20的生成去相關信號的方法、根據(jù)權利要求21的多聲道解碼方法、根據(jù)權利要求22的對立體聲信號編碼的裝置或根據(jù)權利要求26的對立體聲信號編碼的方法或者根據(jù)權利要求27的計算機程序來實現(xiàn)的。
本發(fā)明基于在使用混響濾波器(reverberation filter)時在解碼側(cè)發(fā)現(xiàn)獲得一個用于基于輸入單聲道信號生成多聲道信號的第一和第二聲道的良好的去相關信號,該混響濾波器向輸入信號引入了整數(shù)延遲或者優(yōu)選地引入了分數(shù)延遲。重要的是,此混響濾波器不被應用到整個輸入信號。相反,幾個混響濾波器被應用到原始輸入信號即單聲道信號的幾個子帶,以便當應用付立葉變換時,利用混響濾波器進行的混響濾波不被應用于時域或頻域中,即所到達的域中。發(fā)明性地,利用混響濾波器為子帶進行的混響濾波是在子帶域中單獨執(zhí)行的。
子帶信號包括至少兩個子帶采樣的序列,子帶采樣的序列代表子帶信號的帶寬,該帶寬小于輸入信號的帶寬。顯然,子帶信號的頻率帶寬高于歸因于由付立葉變換獲得的頻率系數(shù)的頻率帶寬。子帶信號優(yōu)選地由濾波器組生成,該濾波器組例如具有32或64個濾波器組信道,而對于同一示例,F(xiàn)FT將會具有1.024或2.048個頻率系數(shù),即頻率信道。
子帶信號可以是通過對一批輸入信號采樣進行濾波而獲得的子帶信號?;蛘撸訋V波器組也可被連續(xù)應用,而沒有按批進行的處理。但是對于本發(fā)明按批進行的處理是優(yōu)選的。
由于混響濾波不被應用到整個信號,而是按照子帶應用的,所以避免了由梳狀濾波導致的“金屬”聲。
當子帶的兩個連續(xù)子帶采樣之間的采樣周期對于解碼器端的良好聲音印象來說太大時,在混響濾波器中最好使用分數(shù)延遲,例如子帶信號的采樣周期的0.1至0.9之間的延遲,并且最好是子帶信號的采樣周期的0.2至0.8之間的延遲。注意,在臨界采樣情況下,當利用具有64個濾波器組信道的濾波器組生成64個子帶信號時,子帶信號中的采樣周期比原始輸入信號的采樣周期大64倍。
這里要注意延遲是混響設備中使用的濾波過程的不可缺少的部分。輸出信號由輸入信號的多個延遲后的版本構(gòu)成。最好將信號延遲子帶采樣周期的若干分之幾,以便在子帶域中實現(xiàn)良好的混響設備。
在本發(fā)明的優(yōu)選實施例中,由每個子帶中的每個混響濾波器引入的延遲以及優(yōu)選地分數(shù)延遲對于所有子帶是相等的。然而,對于每個子帶,濾波器系數(shù)是不同的。優(yōu)選使用IIR濾波器。根據(jù)實際情形,可利用收聽測試來經(jīng)驗地確定不同濾波器的分數(shù)延遲和濾波器系數(shù)。
由混響濾波器組進行濾波的子帶構(gòu)成去相關信號,該去相關信號將被與原始輸入信號即單聲道信號相混合,以獲得解碼后的左聲道和解碼后的右聲道。去相關信號與原始信號的這一混合是基于與參數(shù)性編碼的信號一起傳輸?shù)穆暤篱g相干參數(shù)來執(zhí)行的。為了獲得不同的左聲道和右聲道,即不同的第一和第二聲道,將去相關信號與單聲道信號混合以獲得第一輸出聲道與將去相關信號與單聲道信號混合以獲得第二輸出聲道是不同的。
為了在編碼側(cè)獲得高效效率,利用立體聲參數(shù)集合的自適應式確定,而執(zhí)行多聲道編碼。為此,編碼器除了包括用于計算單聲道信號的裝置以及用于生成立體聲參數(shù)集合的裝置外,還包括用于確定左聲道和右聲道的后續(xù)部分的立體聲參數(shù)集合的有效性的裝置。優(yōu)選地,該用于確定的裝置可操作以在確定立體聲參數(shù)集合不再有效時激活所述用于生成的裝置,以便為開始于第二時間邊界處的左聲道和右聲道的部分計算第二立體聲參數(shù)集合。此第二時間邊界也是通過所述確定有效性的裝置來確定的。
于是編碼后的輸出信號包括單聲道信號,第一立體聲參數(shù)集合和與第一參數(shù)集合相關聯(lián)的第一時間邊界以及第二立體聲參數(shù)集合和與第二立體聲參數(shù)集合相關聯(lián)的第二時間邊界。在解碼側(cè),解碼器將會使用有效立體聲參數(shù)集合,直到達到新的時間邊界。當達到此新的時間邊界時,利用新的立體聲參數(shù)集合執(zhí)行解碼操作。
與現(xiàn)有技術方法(即執(zhí)行按批進行的處理,因而執(zhí)行立體聲參數(shù)集合的按批確定)相比,所發(fā)明的自適應地確定編碼側(cè)所確定的不同時間邊界的立體聲參數(shù)集合的方式一方面提供了高編碼效率,另一方面提供了高編碼質(zhì)量。這是因為對于相對靜止的信號,相同的立體聲參數(shù)集合可用于許多批的單聲道信號采樣,而不會引入可聽誤差。另一方面,當考慮非靜止信號時,所發(fā)明的自適應立體聲參數(shù)確定提供了增大的時間分辨率,以便每個信號部分具有其最優(yōu)立體聲參數(shù)集合。
本發(fā)明通過用混響單元作為去相關器,其用濾波器組中的分數(shù)延遲線實現(xiàn),并且利用去相關后的混響信號的自適應級別調(diào)整,從而提供了對現(xiàn)有技術問題的解決方案。
以下將概述本發(fā)明的幾個方面。
本發(fā)明的一個方面是用于通過以下步驟延遲信號的方法通過復數(shù)濾波器組的一解析部分對實數(shù)值時域信號進行濾波;修改從濾波獲得的復值子帶信號;通過濾波器組的合成部分對修改后的復值子帶信號進行濾波;并取復值時域輸出信號的實部,其中輸出信號是從合成濾波獲得的信號之和。
本發(fā)明的另一方面是一種用于通過利用復值有限沖擊響應濾波器對每個復值子帶信號進行濾波來修改復值子帶信號的方法,其中用于第n號子帶的有限沖擊響應濾波器是離散時間付立葉變換,其具有以下形式 其中參數(shù)τ=T/L,并且其中合成濾波器組具有L個子帶,并且在以輸出信號采樣為單位測量的情況下所需延遲為T。
本發(fā)明的另一個方面是用于通過濾波而修改復值子帶信號的方法,其中濾波器Gτ(ω)大致滿足Vτ(ω)Gτ(ω)+Vτ(ω+π)Gτ(ω+π)=1,其中Vτ(ω)是序列vτ(k)=AikΣlp(l)p(l-T-Lk),]]>的離散時間付立葉變換,p(l)是所述復濾波器組的原型濾波器,A是適當?shù)膶崝?shù)規(guī)一化因子。
本發(fā)明的另一方面是用于通過濾波而修改復值子帶信號的方法,其中濾波器Gτ(ω)滿足Gτ(-ω)=Gτ(ω+π)*,以便偶數(shù)索引的沖擊響應采樣是實值的,而奇數(shù)索引的沖擊響應采樣是純虛值的。
本發(fā)明的另一方面是一種用于通過以下步驟對輸入信號的立體聲屬性進行編碼的方法在編碼器處計算描述每個立體聲參數(shù)集合在時間中的位置的時間柵格參數(shù),并且在解碼器數(shù)根據(jù)該時間柵格應用參數(shù)性立體聲合成,其中立體聲參數(shù)集合的數(shù)目是任意的。
本發(fā)明的另一方面是一種用于對輸入信號的立體聲屬性進行編碼的方法,其中在立體聲參數(shù)集合的時間暗示(time cue)與幀開始一致的情況下,第一立體聲參數(shù)集合的時間本地化之處被明確用信令通知,而不是發(fā)送時間指針。
本發(fā)明的另一方面是一種用于通過以下步驟生成用于參數(shù)性立體聲重建的立體聲相關的方法在解碼器處,應用人工混響過程以合成側(cè)邊信號。
本發(fā)明的另一方面是一種通過以下步驟生成用于參數(shù)性立體聲重建的立體聲去相關的方法在解碼器處,在復調(diào)制的濾波器組內(nèi)利用每個濾波器組信道中的相位延遲調(diào)整而進行混響過程。
本發(fā)明的另一方面是一種用于通過以上步驟生成用于參數(shù)性立體聲重建的立體聲去相關的方法在解碼器處,混響過程利用一個檢測器,其被設計用于查找其中混響尾部可能不必要的信號而使得混響尾部被衰減或去除。
現(xiàn)將通過參考附圖以不限制本發(fā)明的范圍或精神的示例性示例的方式來描述本發(fā)明,附圖中圖1示出所發(fā)明的裝置的框圖;圖2示出用于生成去相關后的信號的裝置的框圖;圖3示出根據(jù)本發(fā)明基于重建后的立體聲子帶信號分析單個聲道和合成立體聲聲道;圖4示出基于信號特性將參數(shù)性立體聲參數(shù)集合分成時間片段的框圖;圖5示出基于信號特性將參數(shù)性立體聲參數(shù)集合分成時間片段的示例。
具體實施例方式
下述實施例僅用于例示本發(fā)明用于參數(shù)性立體聲編碼的原理。要理解對這里所描述的配置和細節(jié)的修改和變化對于本領域的技術人員來說是顯而易見的。因此,希望僅由緊隨之后的專利權利要求書的范圍所限,而不由通過描述和說明這里的實施例而提供的特定細節(jié)所限。
將信號延遲一個采樣的若干分之幾可通過幾種現(xiàn)有技術插值方法來實現(xiàn)。但是,當原始信號是作為過采樣的復數(shù)值采樣而獲得的時,會出現(xiàn)特殊情況。通過僅為對應于恒定時間延遲的每個qmf施加某個因數(shù)的相位延遲,從而來在qmf組中執(zhí)行分數(shù)延遲,會導致嚴重的假象。
通過根據(jù)一種允許對任何復指數(shù)調(diào)制的濾波器組中的任意延遲的高質(zhì)量逼近的新穎方法來使用補償濾波器,可有效避免這一點。詳細描述如下。
連續(xù)時間模型為了易于計算,這里將通過利用合成波形的連續(xù)時間加窗變換來模擬復指數(shù)調(diào)制的L頻帶濾波器組un,k(t)=v(t-k)exp[iπ(n+1/2)(t-k+θ)],(1)其中n,k是整數(shù),n≥0,θ是固定相位項。離散時間信號的結(jié)果是通過利用間隔1/L對t-變量進行適當?shù)牟蓸佣@得的。假設實值窗口v(t)被選擇為使得對于實值信號x(t),它保持非常高的精度x(t)=2Re{Σn=0∞Σk=-∞∞cn(k)un,k(t)}···(2)]]>如果cn(k)=∫-∞∞x(t)un,k*(t)dt,···(3)]]>其中*表示復共軛。還假設v(t)本質(zhì)上頻帶受限于頻率區(qū)間[-π,π]??紤]通過利用具有沖擊響應hn(k)的濾波器對離散時間分析采樣cn(k)濾波,來對每個頻帶n進行的修改,dn(k)=Σlhn(l)cn(k-l).···(4)]]>則修改后的合成y(t)=2Re{Σn=0∞Σk=-∞∞dn(k)un,k(t)}···(5)]]>在頻域中可被計算為y^(ω)=H(ω)x^(ω),···(6)]]>其中 表示f(t)的付立葉變換,并且H(ω)=Σn=-∞∞Hn(ω)|v^(ω-π(n+1/2))|2.···(7)]]>這里,Hn(ω)=∑khn(k)exp(-ikω)是在n≥0情況下頻帶n中應用的濾波器的離散時間付立葉變換,并且對于n<0,Hn(ω)=H-1-n(-ω)*(8)這里觀察到由于窗口v(t)的特殊設計,特殊情況Hn(ω)=1導致(7)中H(ω)=1。另一個感興趣的情況是Hn(ω)=exp(-iω),其給出H(ω)=exp(-iω),以使得y(t)=x(t-1)。
所提議的解決方案為了實現(xiàn)大小為τ的延遲,以便y(t)=x(t-τ),問題在于對于n≥0設計濾波器Hn(ω),以使得H(ω)=exp(-iτω),(9)其中H(ω)由(7)和(8)給出。這里提議的特定解決方法是應用濾波器 這里Gτ(-ω)=Gτ(ω+π)*意味著對于所有n與(8)的一致性。將(10)插入到(7)的右手側(cè)導致H(ω)=exp(-iωτ)[Vτ(ω)Gτ(ω)+Vτ(ω+π)Gτ(ω+π)](11)其中在b(ω)=exp(iτω)|v^(ω)|2]]>的情況下Vτ(ω)=∑nb(ω-π(2n+1/2))?;居嬎泔@示Vτ(ω)是以下變量的離散時間付立葉變換vτ(k)=ik∫-∞∞v(t)v(t-τ-k)dt.···(12)]]>通過在最小二乘意義上解以下線性系統(tǒng)可獲得對理想延遲的非常良好的逼近Vτ(ω)Gτ(ω)+Vτ(ω+π)Gτ(ω+π)=1(13)其中FIR濾波器Gτ(ω)=Σk=-NMgτ(k)exp(-ikω).]]>就濾波器系數(shù)而言,方程(13)可寫為2Σlvτ(2k-l)gτ(l)=δ[k],···(14)]]>其中對于k=0,δ[k]=1,對于k≠0,δ[k]=0。
在具有原型濾波器p(k)的離散時間L頻帶濾波器組的情況下,所獲得以采樣為單位的延遲為Lτ,計算(12)被替換為vτ(k)=ikΣlp(l)p(l-T-Lk),···(15)]]>其中T是最接近Lτ的整數(shù)。這里p(k)被其支持以外的零所擴展。對于有限長度原型濾波器,只有有限多個vτ(k)不等于零,并且(14)是線性方程組。未知gτ(k)的數(shù)目通常被選擇為較小的數(shù)字。對于良好的QMF濾波器組設計,3-4個抽頭就已經(jīng)給出非常好的延遲性能。此外,濾波器抽頭gτ(k)對延遲參數(shù)τ的依賴性通??捎傻碗A多項式來成功模擬。
用信號通知立體聲參數(shù)的自適應時間柵格參數(shù)性立體聲系統(tǒng)通常導致就有限時間或頻率分辨率而言的折衷,以便使所輸送的數(shù)據(jù)最小化。但是,從心理聲學中所公知的是,某些空間暗示可能比其他的更重要,這導致了丟棄不太重要的暗示的可能性。因此,時間分辨率不必是恒定的。通過使時間柵格與空間暗示同步,可實現(xiàn)比特率上的巨大增益。通過為對應于固定大小的時間片段的每個數(shù)據(jù)幀發(fā)送可變數(shù)目的參數(shù)集合,可以很容易地實現(xiàn)這一點。為了使參數(shù)集合與相應的空間暗示同步,必須發(fā)送描述每個參數(shù)集的時間位置的額外的時間柵格數(shù)據(jù)。這些時間指針的分辨率可被選擇為相當?shù)?,以保持?shù)據(jù)總量最小。參數(shù)集合的時間暗示與幀的開頭一致的特殊情況可被明確地用信號通知,以避免發(fā)送該時間指針。
圖4示出用于對具有可變的和信號相關的時間邊界的時間片段執(zhí)行參數(shù)分析的所發(fā)明的裝置。所發(fā)明的裝置包括裝置401,用于將輸入信號劃分成一個或幾個時間片段。分隔時間片段的時間邊界由裝置402提供。裝置402使用檢測器,其特別設計來用于抽取與確定在何處設置時間邊界有關的空間暗示。裝置401輸出劃分成一個或多個時間片段的所有輸入信號。此輸出被輸入到裝置403,以便為每個時間片段進行單獨的參數(shù)分析。裝置403為每個被分析的時間片段輸出一個參數(shù)集合。
圖5示出時間柵格生成器能夠如何對假設的輸入信號執(zhí)行操作的示例。在此示例中,如果不存在其他時間邊界信息,則對于每個數(shù)據(jù)幀使用一個參數(shù)集合。因此,當不存在其他時間邊界信息時,使用數(shù)據(jù)幀的固有時間邊界。圖5中所示的時間邊界是來自圖4中的裝置402的輸出。圖5中所示的時間片段是由圖4中的裝置401提供的。
用于對立體聲信號編碼以獲得一個單聲道輸出信號和該立體聲的參數(shù)集合的裝置,包括用于通過由加權加法組合立體聲信號的左聲道和右聲道來計算所述單聲道信號的裝置。此外,裝置403利用左聲道的一部分和右聲道的一部分來生成第一立體聲參數(shù)集合,開始于第一時間邊界處的所述部分被連接到一個裝置,該裝置用于確定左聲道和右聲道的后續(xù)部分的第一立體聲參數(shù)集合的有效性。
用于確定的裝置是由圖1中的裝置402和401共同形成的。
具體而言,所述用于確定的裝置可操作以便在確定此第一立體聲參數(shù)集合不再有效時生成第二時間邊界并且激活用于生成的裝置,以便生成開始于第二時間邊界處的左聲道和右聲道的部分的第二立體聲參數(shù)集合。
圖4中未示出的是用于輸出單聲道信號、第一立體聲參數(shù)集合和與第一立體聲參數(shù)集合相關聯(lián)的第一時間邊界以及第二立體聲參數(shù)集合和與第二立體聲參數(shù)集合相關聯(lián)的第二時間邊界,作為參數(shù)編碼后的立體聲信號的裝置。用于確定立體聲參數(shù)集合的有效性的裝置可包括瞬態(tài)檢測器,因為很可能在一個瞬態(tài)之后,必須生成新的立體聲參數(shù),這是因為信號已大大改變其形狀?;蛘撸糜诖_定有效性的裝置可包括綜合分析設備,其適用于對單聲道信號和立體聲參數(shù)集合解碼,以獲得解碼后的左聲道和解碼后的右聲道,以便將解碼后的左聲道和解碼后的右聲道與左聲道和右聲道相比較,從而在解碼后的左聲道和解碼后的右聲道與左聲道和右聲道的差異大于預定閾值時,激活所述用于生成的裝置。
數(shù)據(jù)幀1對應于參數(shù)集合1的時間片段開始于數(shù)據(jù)幀1的開頭處,這是因為在此數(shù)據(jù)幀中不存在其他時間邊界信息。
數(shù)據(jù)幀2此數(shù)據(jù)幀中存在兩個時間邊界。對應于參數(shù)集合2的時間片段開始于此數(shù)據(jù)幀中的第一時間邊界處。對應于參數(shù)集合3的時間片段開始于此數(shù)據(jù)幀中的第二時間邊界處。
數(shù)據(jù)幀3此數(shù)據(jù)幀中存在一個時間邊界。對應于參數(shù)集合4的時間片段開始于此數(shù)據(jù)幀中的時間邊界處。
數(shù)據(jù)幀4此數(shù)據(jù)幀中存在一個時間邊界。此時間邊界與數(shù)據(jù)幀4的開始邊界一致,并且不必被用信號通知,這是因為這是由缺省情況所處理的。因此,可去除此時間邊界信號。對應于參數(shù)集合5的時間片段開始于數(shù)據(jù)幀4的開頭處,即使在沒有用信號通知此時間邊界的情況下也是如此。
利用人工混響作為用于參數(shù)性立體聲重建的去相關方法在參數(shù)性立體聲系統(tǒng)中進行立體聲合成的一個至關重要的部分是減小左聲道和右聲道之間的相干,以便產(chǎn)生立體聲聲像的寬度。這可通過將原始單聲道信號的濾波后版本添加到側(cè)邊信號來完成的,其中側(cè)邊信號和單聲道信號分別由以下式子定義單聲道信號=(左+右)/2,側(cè)邊信號=(左-右)/2。
為了不太多改變音色,所考慮的濾波器優(yōu)選地應該具有全通特性。一個成功的方法是使用與用于人工混響過程類似的全通濾波器。人工混響算法通常要求高時間分辨率,以給出在時間上符合要求地散布的沖擊響應。使人工混響算法基于諸如復qmf組這樣的復濾波器組具有重大優(yōu)點。濾波器組使得很有可能令混響屬性就例如混響均衡、衰減時間、密度和音色而言具有頻率選擇性。但是,濾波器組實現(xiàn)方式通常用時間分辨率來交換較高的頻率分辨率,這通常使得難以實現(xiàn)在時間上足夠平滑的混響過程。為了處理此問題,一種新穎的方法是使用分數(shù)延遲逼近,該分數(shù)延遲逼近是通過僅為每個對應于恒定時間延遲的qmf聲道施加某個因數(shù)的相位延遲來進行的。此原始分數(shù)延遲方法引入了嚴重的時間拖尾效應,幸運的是,在這種情況下是非常需要這種拖尾效應的。時間拖尾效應對混響算法非常需要的時間散布作出貢獻,并且隨著相位延遲接近pi/2或-pi/2而變得更大。
由于自然原因,人工混響過程是具有無限沖突響應的過程,并且提供自然的指數(shù)衰減。在[PCT/SE02/01372]中指出,如果混響單元被用于生成立體聲信道,則在聲音真正結(jié)束之后,混響衰減有時是不必要的。但是,只要通過更改混響信號的增益,就可容易地衰減或完全去除這種不必要的混響尾部。被設計用于查找聲音結(jié)尾的檢測器可用于該用途。如果混響單元在某個特定信號處生成假象,例如在瞬態(tài)信號,則用于這些信號的檢測器也可用于衰減這些信號。
圖1示出在參數(shù)性立體聲系統(tǒng)中使用的信號的去相關方法的發(fā)明裝置。發(fā)明裝置包括用于提供多個子帶信號的裝置101。提供裝置可以是復QMF濾波器組,其中每個信號與子帶索引相關聯(lián)。
由圖1中的裝置101輸出的子帶信號被輸入到用于提供去相關后的信號102的裝置102中,以及用于修改子帶信號的裝置103和106中。來自102的輸出被輸入到用于修改信號的裝置104和105中,并且103、104、105和106的輸出被輸入到用于將子帶信號相加的裝置107和108中。
在目前描述的本發(fā)明的實施例中,用于修改子帶信號的裝置103、104、105和106通過將子帶信號乘以增益因子,來調(diào)整去相關后的信號和作為101的輸出的未經(jīng)處理的信號的水平,以便每對之和產(chǎn)生一個信號,該信號的去相關后的信號量由控制參數(shù)給定。應該注意,用于修改的裝置103-106中使用的增益因子不限于正值。它也可為負值。
來自用于使子帶信號相加的裝置107和108的輸出被輸入到用于提供時域信號的裝置109和110。來自109的輸出對應于重建后的立體聲信號的左聲道,來自110的輸出對應于重建后的立體聲信號的右聲道。在這里所描述的實施例中,相同的去相關器被用于兩個輸出聲道,而用于將去相關后的信號與未經(jīng)處理的信號相加的裝置對于兩個輸出聲道是不同的。從而目前描述的實施例確保了兩個輸出信號可以相同并且完全被去相關,這取決于提供到用于調(diào)整信號水平的裝置的控制數(shù)據(jù)以及提供到用于使信號相加的裝置的控制數(shù)據(jù)。
在圖2中,顯示了用于提供去相關后的信號的裝置的框圖。輸入子帶信號被輸入到用于對子帶信號濾波的裝置201。在目前描述的本發(fā)明的實施例中,濾波步驟是包含了全通濾波的混響單元。所使用的濾波器系數(shù)是由用于提供濾波器系數(shù)的裝置202提供的。當前被處理的子帶信號的子帶索引被輸入到202。在本發(fā)明的一個實施例中,基于提供到202的子帶索引計算不同的濾波器系數(shù)。201中的濾波步驟依賴于輸入子帶信號的延遲后的采樣以及濾波過程中的中間信號的延遲后的采樣。
本發(fā)明的必要特征是用于提供整數(shù)子帶采樣延遲和分數(shù)子帶采樣延遲的裝置由203提供。201的輸出被提供到用于調(diào)整子帶信號的水平的裝置204,并且還輸入到用于估計子帶信號的信號特性的裝置205。在本發(fā)明的優(yōu)選實施例中,被估計的特性是子帶信號的瞬態(tài)行為。在此實施例中,檢測的瞬態(tài)被以信號方式通知給用于調(diào)整子帶信號的水平的裝置204,以便在瞬態(tài)通過期間信號的水平被降低。來自204的輸出是輸入到圖1的104和105的去相關后的信號。
在圖3中,示出了單個解析濾波器組和兩個合成濾波器組。解析濾波器組301在單聲道輸入信號上進行操作,而合成濾波器組302和303在重建后的立體聲信號上進行操作。
因此,圖1示出用于生成去相關信號的所發(fā)明的裝置,它由標號102表示。如圖1或3所示,此裝置包括用于提供多個子帶信號的裝置,其中一個子帶信號包括至少兩個子帶采樣的序列,所述子帶采樣的序列代表子帶信號的帶寬,其小于輸入信號的帶寬。每個子帶信號被輸入到用于濾波的裝置201。每個用于濾波的裝置201包括混響濾波器,以便獲得多個混響后的子帶信號,其中多個混響后的子帶信號一起表示所述去相關信號。優(yōu)選地,如圖2所示,可以對混響后的子帶信號進行按照子帶的后處理,該后處理是由受塊205控制的塊204所執(zhí)行的。
每個混響濾波器被設置到某個延遲,優(yōu)選地被設置到分數(shù)延遲,并且每個混響濾波器具有幾個濾波器系數(shù),這些濾波器系數(shù)取決于子帶索引,如圖2所示。此意味著最好對每個子帶使用相同延遲,但對不同子帶使用不同的濾波器系數(shù)集合。這由圖2中的裝置203和202表示,雖然這里要提到,最好在運送去相關設備時固定地確定延遲和濾波器系數(shù),其中延遲和濾波器系數(shù)可利用收聽測試等來經(jīng)驗地確定。
多聲道解碼器由圖1示出,并包括用于生成相關信號的發(fā)明裝置,該裝置在圖1中表示為102。圖1中所示的多聲道解碼器是用于對單聲道信號和相關聯(lián)的聲道間相干測量結(jié)果進行解碼的,該聲道間相干測量結(jié)果代表多個原始聲道間的相干,其中單聲道信號是從多個原始聲道導出的。圖1中的塊102構(gòu)成用于為單聲道信號生成去相關信號的生成器。塊103、104、105、106和107以及108構(gòu)成混合器,該混合器用于根據(jù)第一混合模式將單聲道信號與去相關信號混合以獲得第一解碼后輸出信號,以及根據(jù)第二混合模式將單聲道信號與去相關信號混合以獲得第二解碼后輸出信號,其中混合器可操作以基于作為單聲道信號的側(cè)帶信息而傳輸?shù)穆暤篱g相干測量結(jié)果來確定第一混合模式和第二混合模式。
混合器優(yōu)選地可操作以基于不同子帶的分離的聲道間相干測量結(jié)果而在子帶域中混合。在這種情況下,多聲道解碼器還包括裝置109和110,用于在時域中轉(zhuǎn)換來自子帶域的第一和第二解碼輸出信號,以獲得時域中第一解碼輸出信號和第二解碼輸出信號。因此用于生成去相關信號的發(fā)明裝置102和圖1所示的所發(fā)明的多聲道解碼器在子帶域中進行操作,并且執(zhí)行子帶域到時域轉(zhuǎn)換,作為最后的步驟。
根據(jù)實際情況,所發(fā)明的設備可在硬件或硬件中或包括硬件組成部分和軟件組成部分的固件中實現(xiàn)。當部分或全部在軟件中實現(xiàn)時,本發(fā)明還是計算機程序,該計算機程序具有當在計算機上運行時執(zhí)行所發(fā)明的方法的計算機可讀代碼。
權利要求
1.用于利用輸入信號生成去相關信號的裝置(102),包括裝置(101),用于提供多個子帶信號,其中一個子帶信號包括至少兩個子帶采樣的一個序列,所述子帶采樣的序列代表所述子帶信號的帶寬,所述帶寬小于所述輸入信號的帶寬;以及裝置(201),用于利用混響濾波器對每個子帶信號濾波以獲得多個混響后的子帶信號,其中多個混響后的子帶信號一起表示所述去相關信號。
2.如權利要求1所述的裝置,其中所述用于濾波的裝置(201)可操作以向所述子帶信號施加延遲。
3.如權利要求2所述的裝置,其中所述用于濾波的裝置(201)可操作以向子帶信號施加一個分數(shù)延遲,所述分數(shù)延遲大于“0”并小于所述子帶信號的采樣周期。
4.如權利要求3所述的裝置,其中所述分數(shù)延遲小于所述子帶信號的采樣周期的0.9,并大于所述子帶信號的采樣周期的0.1。
5.如前述權利要求之一所述的裝置,其中所述用于濾波的裝置(201)適合于具有全通特性。
6.如前述權利要求之一所述的裝置,其中所述混響濾波器(201)可操作以向每個子帶信號施加相同延遲。
7.如前述權利要求之一所述的裝置,其中所述混響濾波器(201)適合于為每個子帶信號具有不同的濾波器系數(shù)集合。
8.如前述權利要求之一所述的裝置,其中所述混響濾波器可操作以向所述子帶信號中引入預定相位延遲。
9.如前述權利要求之一所述的裝置,其中子帶的數(shù)目小于或等于128并大于1。
10.如前述權利要求之一所述的裝置,其中所述輸入信號包括一批預定數(shù)目的輸入采樣,并且其中子帶信號的數(shù)目小于輸入采樣的數(shù)目。
11.如權利要求10所述的裝置,其中所述子帶采樣的數(shù)目乘以所述子帶的數(shù)目產(chǎn)生所述輸入采樣的預定數(shù)目。
12.如前述權利要求之一所述的裝置,其中所述用于提供的裝置(101)是復數(shù)正交鏡像濾波器。
13.用于對單聲道信號和相關聯(lián)的聲道間相干測量結(jié)果進行解碼的多聲道解碼器,所述聲道間相干測量結(jié)果代表多個原始聲道間的相干,所述單聲道信號是從多個原始聲道導出的,所述解碼器包括生成器(102),用于根據(jù)權利要求1至12之一從所述單聲道信號生成一個去相關信號;混合器(103、104、105、106、107、108),用于根據(jù)第一混合模式將所述單聲道信號與所述去相關信號混合以獲得第一解碼后輸出信號,以及根據(jù)第二混合模式將所述單聲道信號與所述去相關信號混合以獲得第二解碼后輸出信號,其中所述混合器可操作以基于所述聲道間相干測量結(jié)果而確定所述第一混合模式和所述第二混合模式。
14.如權利要求13所述的多聲道解碼器,其中所述混合器可操作以基于不同子帶的分離的聲道間相干測量結(jié)果而在子帶域中混合,并且還包括裝置(109,110),用于在時域中轉(zhuǎn)換來自所述子帶域的所述第一和所述第二解碼后輸出信號,以獲得時域的第一和第二解碼后輸出信號。
15.如權利要求13或14所述的多聲道解碼器,其中所述多個原始聲道包括左立體聲聲道和右立體聲聲道,并且其中所述第一解碼后輸出信號是解碼后的左立體聲聲道,并且其中所述第二解碼后輸出信號是解碼后的右立體聲聲道。
16.如權利要求13至15之一所述的多聲道解碼器,其中所述混合器包括裝置(103、106),用于修改所述單聲道信號的子帶,或者包括裝置104和105,用于修改所述去相關信號的子帶。
17.如權利要求16所述的多聲道解碼器,其中所述用于修改的裝置被實現(xiàn)為信號水平修改設備。
18.如權利要求16或17所述的多聲道解碼器,其中所述混合器包括加法器(107),用于將所述單聲道信號的未經(jīng)修改的子帶與所述去相關信號的修改后的子帶相加,或者用于將所述單聲道信號的修改后的子帶與所述去相關信號的未修改的子帶相加,或者用于將所述單聲道信號的修改后的子帶與所述去相關信號的修改后的子帶相加,以獲得第一解碼后輸出聲道或第二解碼后輸出聲道的子帶。
19.多聲道解碼器,其中所述生成器(102)包括用于提供所述單聲道信號的多個子帶的濾波器組,所述濾波器組具有連接到混合器和混響濾波器(201)的子帶輸出以用于所述子帶。
20.用于利用輸入信號生成去相關信號的方法,包括提供(101)多個子帶信號,其中一個子帶信號包括至少兩個子帶采樣的一個序列,所述子帶采樣的序列代表所述子帶信號的帶寬,所述帶寬小于所述輸入信號的帶寬;并且利用混響濾波器為每個子帶信號濾波(201)以獲得多個混響后的子帶信號,其中多個混響后的子帶信號一起表示所述去相關信號。
21.用于對單聲道信號和相關聯(lián)的聲道間相干測量結(jié)果進行解碼的多聲道解碼方法,所述聲道間相干測量結(jié)果代表多個原始聲道之間的相干,所述單聲道信號是從多個原始聲道導出的,所述方法包括根據(jù)權利要求20的方法從所述單聲道信號生成(102)去相關信號;根據(jù)第一混合模式將所述單聲道信號與所述去相關信號混合(103、104、105、106、107、108)以獲得第一解碼后輸出信號,以及根據(jù)第二混合模式將所述單聲道信號與所述去相關信號混合(103、104、105、106、107、108)以獲得第二解碼后輸出信號,其中所述混合器可操作以基于所述聲道間相干測量結(jié)果而確定所述第一混合模式和所述第二混合模式。
22.用于對立體聲信號編碼以獲得單聲道輸出信號和立體聲參數(shù)集合的裝置,包括用于通過組合所述立體聲信號的左聲道和右聲道來計算所述單聲道信號的裝置;用于利用所述左聲道的一部分和所述右聲道的一部分來生成第一立體聲參數(shù)集合的裝置(403),所述部分開始于第一時間邊界處;用于確定第一立體聲參數(shù)集合對所述左聲道和所述右聲道的后續(xù)部分的有效性的裝置(401、402),其中所述用于確定的裝置可操作以便生成第二時間邊界,并且在確定所述第一立體聲參數(shù)集合不再有效時激活所述用于生成的裝置,以便生成開始于所述第二時間邊界處的、用于左信號和右信號的部分的第二立體聲參數(shù)集合;以及用于輸出所述單聲道信號、所述第一立體聲參數(shù)集合和與所述第一參數(shù)集合相關聯(lián)的所述第一時間邊界、以及所述第二立體聲參數(shù)集合和與所述第二立體聲參數(shù)集合相關聯(lián)的所述第二時間邊界的裝置。
23.如權利要求22所述的裝置,其中所述用于生成的裝置可操作以計算聲道間時間差異參數(shù)、聲道間水平差異參數(shù)和/或聲道間相干參數(shù)來作為所述立體聲參數(shù)集合。
24.如權利要求22或23所述的裝置,其中所述用于確定的裝置包括瞬態(tài)檢測器,其被配置為在檢測到一個瞬態(tài)時激活所述用于生成的裝置,并且生成所述瞬態(tài)的時刻作為所述第二時間邊界。
25.如權利要求22至24中任何一項所述的裝置,其中所述用于確定的裝置是綜合分析設備,其適用于對所述單聲道信號和所述立體聲參數(shù)集合解碼,以獲得解碼后的左聲道和解碼后的右聲道;將所述解碼后的左聲道和所述解碼后的右聲道與所述左聲道和所述右聲道相比較;并且在所述解碼后的左聲道和所述解碼后的右聲道與所述左聲道和所述右聲道的差異大于預定閾值時,激活所述用于生成的裝置。
26.用于對立體聲信號編碼以獲得單聲道輸出信號和立體聲參數(shù)集合的方法,包括通過組合所述立體聲信號的左聲道和右聲道來計算所述單聲道信號;利用所述左聲道的一部分和所述右聲道的一部分來生成(403)第一立體聲參數(shù)集合,所述部分開始于第一時間邊界處;通過以下步驟確定(401、402)第一立體聲參數(shù)集合對所述左聲道和所述右聲道的后續(xù)部分的有效性生成第二時間邊界,并且在確定所述第一立體聲參數(shù)集合不再有效時進行所述生成步驟,以便生成開始于所述第二時間邊界處的、用于左信號和右信號的部分的第二立體聲參數(shù)集合;以及輸出所述單聲道信號、所述第一立體聲參數(shù)集合和與所述第一參數(shù)集合相關聯(lián)的所述第一時間邊界以及所述第二立體聲參數(shù)集合和與所述第二立體聲參數(shù)集合相關聯(lián)的所述第二時間邊界。
27.計算機程序,其具有當在計算機上運行時執(zhí)行如權利要求20、21、26所述的方法的計算機可讀代碼。
全文摘要
用于利用輸入信號生成去相關信號的合成器可在多個子帶信號上進行操作,其中一個子帶信號包括至少兩個子帶采樣的序列,該子帶采樣的序列代表子帶信號的帶寬,該帶寬小于輸入信號的帶寬。合成器包括第一級(201),用于利用混響濾波器對每個子帶信號濾波以獲得多個混響后的子帶信號,其中多個混響后的子帶信號一起表示去相關信號。此去相關信號被用于基于參數(shù)編碼后的立體聲信號重建信號,該立體聲信號由單聲道信號和相干測量結(jié)果組成。
文檔編號G10L19/008GK1781338SQ200480011462
公開日2006年5月31日 申請日期2004年4月30日 優(yōu)先權日2003年4月30日
發(fā)明者約納斯·恩德加德, 拉斯·維爾莫斯 申請人:編碼技術股份公司