專利名稱:信號處理器、窗口提供器、編碼的媒體信號、用于處理信號的方法以及用于提供窗口的方法
技術領域:
根據(jù)本發(fā)明的實施方式涉及用于根據(jù)輸入信號提供處理版本的輸入信號的信號處理器、涉及用于提供信號處理窗口值的窗口提供器、涉及編碼的媒體信號、涉及用于處理信號的方法、以及涉及用于提供信號處理窗口值的方法。根據(jù)本發(fā)明的一個實施方式涉及用于使用可變的窗口函數(shù)將音頻或視頻信號進行編碼或解碼的設備。根據(jù)本發(fā)明的另一個實施方式涉及用于使用可變的窗口函數(shù)將音頻或視頻信號進行編碼或解碼的方法。根據(jù)本發(fā)明的實施方式大致涉及信號分析和處理方法,例如,音頻或視頻編碼系統(tǒng)內可使用的那些方法。
背景技術:
離散信號的有限脈沖響應(FIR)過濾,尤其在濾波器組的環(huán)境下進行過濾,被廣泛地用于頻譜分析、處理、合成以及媒體數(shù)據(jù)壓縮等應用。眾所周知,F(xiàn)IR濾波器的時間上(或空間上)的有限性以及在時間或空間內的某個瞬間可處理的信號間隔的有限性可產(chǎn)生稱為偏置或泄漏的現(xiàn)象。例如,通過不同的增益變化或量子化,修改過濾的間隔時,反轉過濾操作時,可發(fā)生塊效應或環(huán)效應。已發(fā)現(xiàn),發(fā)生這些效應,可歸因于所處理的間隔(后文中稱為區(qū)段)的信號波形的端點之間的不連續(xù)性及其微分的不連續(xù)性。已發(fā)現(xiàn),為了減少這種不必要的泄露影響,因此,將區(qū)段內的不連續(xù)性及其微分的某些不連續(xù)性最小化是有利的或者甚至是必須的。通過在過濾之前、以及在過濾域內操作信號的情況下、以及在反向過濾之
后,將N長度區(qū)段的每個樣品s(n),n=0、l.....N-I乘以某個權重w (η),可實現(xiàn)這種最小化,
從而區(qū)段的端點及其微分的端點逐漸減小為零。一種等效的方法是,將這些權重用于濾波器組的每個基礎濾波器(例如,見參考文獻[2])。由于通常使用解析表達式描述加權因子,所以一組因子通常稱為加權函數(shù)或窗口函數(shù)。在通常的音頻和視頻編碼系統(tǒng)內,如上分割源波形,并且將每個區(qū)段量化為更粗糙的形式,以便完成高數(shù)據(jù)壓縮,即,儲存或發(fā)送信號所需要的較低的比特率。試圖通過能量壓縮為少于N個樣品(或者,換言之,提高用于指定比特率的編碼信號的感知質量),從而獲得編碼增益時,在量子化之前區(qū)段的濾波器組變換已經(jīng)變得普遍。近年來研發(fā)的系統(tǒng)使用改進的離散余弦變換(MDCT)形式的重疊正交時間頻率轉換,濾波器組允許相鄰的區(qū)段重疊,同時依然允許臨界抽樣。對于改進性能而言,正向和反向MDCT操作與每個區(qū)段的加權結合在中心側,在正向MDCT之前應用分析窗口 ra(n),并且在接收器側,在反向MDCT之后使用合成窗口 ws(n)。遺憾的是,并非所有的加權函數(shù)都適用于MDCT。假設具有預定的(時間/空間不變)窗口,已經(jīng)發(fā)現(xiàn),為了在沒有量子化或傳輸誤差時,整個結構進行完整的輸入重構,必須如下選擇wa (η)和ws (η)wa(η) · Ws (n) +wa(N/2+n) · ws(N/2+n) = 1,n = 0,1,· · ·,N/2-1,(I)如果wa(n)和ws(n)相同,即,wa(n) =ws(n) =w(n),那么等式(I)降低為參考文獻[7]內所公布的更熟知的約束條件w(n)2+w(N/2 (η)2 = I, η = O, I, , N/2-1, (2)為了最好地進行能量壓縮,通常使用關于n=N/2_l/2對稱的w(n),即w(N-1-n) = w(n), η = O, I, . . . , N/2-1, (3)在高級音頻編碼(AAC)標準(參考文獻[8])內,可使用兩個窗口函數(shù)。一個為正弦函數(shù),表示為wsin(n) = sin O · (n+1/2)/N), η = O, I, · · · , N_l, (4)另一個為貝塞爾導出(KBD)窗,在Fielder和Davidson申請的題為“Low bitrate transform coder, decoder, and encoder/decoder for high-qualityaudio,,的美國專利5109417和5142656中描述了該窗口。該窗口也用于AC-3 (杜比數(shù)字)編碼標準(ATSC, Inc. , “Digital Audio CompressionStandard (AC-3, E-AC-3),修訂本 B, ” 文檔·A/52B,2005年6月)內,雖然具有不同的配置(α =5)。Vorbis規(guī)格(參考文獻[9])限定了窗口Wvarbis (n) = sin O/2 · Sin2O · (η-1/2)/Ν)), η = O, I, . . , Ν-1, (5)圖5示出了 AAC和Vorbis窗口函數(shù)的頻率響應,根據(jù)參考文獻[4],通過傅里葉變換獲得該頻率響應??梢姡掖翱诰哂休^高的閉頻選擇性(主瓣較窄)以及較低的阻帶抑制度(旁波瓣衰減較低)。相反,KBD窗口具有較高的阻帶抑制度以及較低的閉頻選擇性。Vorbis窗口位于前面兩個窗口之間的中間。已經(jīng)發(fā)現(xiàn),對于某些應用而言,最好更細微地控制滿足等式(2)的加權函數(shù)的通帶選擇性和阻帶抑制度。更具體地說,已經(jīng)發(fā)現(xiàn),為了提高編碼效率,窗口參數(shù)需要連續(xù)地將窗口特性調整成適應于輸入頻譜的那些特性。在上述所有三個函數(shù)中,僅僅KBD函數(shù)提供這種參數(shù)α,該參數(shù)可變化,從而具有不同的選擇性/衰減權衡。然而,該函數(shù)包括需要大量計算的數(shù)學(貝塞爾函數(shù)、雙曲正弦、平方根以及除法),潛在地阻止了在低功率裝置上或在實時系統(tǒng)內計算每個信號區(qū)段。這同樣適用于窗口函數(shù)的類別,在Sinha和Ferreira發(fā)布的題為“A New Class of Smooth PowerComplementary Windows and their Applicationto Audio Signal Processing” 的文章中(AES 第 119 次會議,2005 年 10 月,第 6604 頁),顯示了這些窗口函數(shù),需要復值操作、譜因子分解和傅里葉變換。也已經(jīng)發(fā)現(xiàn),兩個函數(shù)(例如,KBD和正弦)之間的內插(通過加權和最有效),可用于稍微控制頻率響應,但是這種方法的靈活性有限。例如,在參考文獻[I]、[2]、[3]、[4]、[5]內,已經(jīng)引證了多個窗口函數(shù),朝著不同的標準優(yōu)化這些函數(shù)。如今使用的最流行的函數(shù)中大概有三個函數(shù)由Hann、Hamming以及Blackman手艮告。下面描述某些典型的窗口函數(shù)。換言之,下面再次訪問上述窗口函數(shù)(例如,Harm、Hamming以及Blackman),并且確認基本的總體設計等式。為了與窗口函數(shù)的開創(chuàng)性調查一致并且與其相比,在本討論中采用Nuttall的方法和符號(例如,見參考文獻[4])。尤其地,L表示窗口實現(xiàn)的持續(xù)時間(長度),t表示加權內的位置(時間)、f表示窗口的功率密度譜內的頻率,由窗口函數(shù)的傅里葉變換獲取。此夕卜,應將所有的窗口函數(shù)歸一化為一個窗口函數(shù)的峰值振幅。由于本文中僅僅研究了對稱的(優(yōu)選地為均勻長度)鐘形窗口,所以這表示w (L/2) =1。對于DSP應用而言(t的非負值),要考慮的第一加權函數(shù)稱為Hann (或Hanning)函數(shù)。在參考文獻[2]內指定為細⑴=SinlTT-
' 1 ⑴)如參考文獻[2]中所示,并且(11)中可證明,Hann函數(shù)為取冪正弦函數(shù)的特殊情況
'--t = Nlll'j JT-J-It Il > O ,
' ' Lj (12)實際上,a通常取正整數(shù)。要注意的是,(12)也可寫為偏移和縮放余弦的和…= .5-0.5ct sj2rr-yl .
. ' (13)該公式允許通過改變偏移和縮放因子,Hann窗口(見以下有關估算和優(yōu)化的討論)具有特定的譜優(yōu)化。結果為Hamming函數(shù),在參考文獻[4]將其精確的參數(shù)化表示為M',,...... I! I = 0.5 3 H 36 - 0.46164c Os I 2τγ—I ·
*''(14)Nuttall (例如,見參考文獻[4])指出,Hann以及Hamming窗口為(k+1)項函數(shù)的類別的二項體現(xiàn),稱為余弦總和函數(shù)。用于DSP應用中時,將Nuttall的符號簡化,可寫為 ·,JjI = 2] {-I)"/;,con 21; ττ·—
ι =o\LI (15)這與參考文獻[4]的等式11相等,標量1/L被省略。也常見三項實施方式。簡單的實例為(15),K=2,并且因子為b0 = O. 375,bi = O. 5,b2 = O. 125,(16)這相當于(12), a=4。與Hamming方法一樣,Blackman (例如,見參考文獻[I])得出以下優(yōu)化的bk:b0 = O. 42,bi = O. 5,b2 = O. 08,(17)Nuttall (例如,見參考文獻[4])進一步改善Blackman的值,用于更好的近場譜響應(第一旁瓣,見以下有關估算和優(yōu)化的討論)b0 = O. 40897,b! = O. 5,b2 = O. 09103,(18)鼓勵有興趣的讀者參看參考文獻[4],以便查看其他優(yōu)化的3和4項余弦總和窗□。如上所述,需要替換的窗口函數(shù),這種函數(shù)的計算復雜性中等,但是提供良好的設計靈活性。因此,本發(fā)明的一個目標在于,提供一種處理信號的思想,這個思想允許獲得計算復雜性中等以及設計靈活性良好的窗口函數(shù)。
發(fā)明內容
根據(jù)本發(fā)明的一個實施方式,提供了一種信號處理器,用于根據(jù)輸入信號提供輸入信號的處理版本。該信號處理器包括窗口化器,被配置為根據(jù)用于多個窗口值指數(shù)值的信號處理窗口值所描述的信號處理窗口,將部分輸入信號或其預處理版本窗口化,以便獲得輸入信號的處理版本。該信號處理器也包括窗口提供器,用于根據(jù)一個或多個窗口形狀參數(shù),提供用于多個窗口值指數(shù)值的信號處理窗口值。窗口提供器被配置為估算與窗口值指數(shù)值相關的多個變元(argument,自變量)值的正弦函數(shù),以便獲得信號處理窗口值。該窗口提供器被配置為計算線性項和一個或多個整形函數(shù)的函數(shù)值的加權和,該線性項線性地取決于窗口值指數(shù)值,一個或多個整形函數(shù)將窗口值指數(shù)值映射到相應的函數(shù)值上,并且該一個或多個整形函數(shù)相對于窗口斜面的中心呈點對稱,以便獲得變元值。根據(jù)本發(fā)明的該實施方式基于以下發(fā)現(xiàn)由于可用非常低的計算工作量計算線性項以及一個或多個整形函數(shù)的加權和,所以通過以上述方式確定信號處理窗口值,可用簡單的可調節(jié)的方式將輸入信號窗口化。然而,也已經(jīng)發(fā)現(xiàn),一個或多個整形函數(shù)的點對稱以及多個變元值的正弦函數(shù)的估算給窗口帶來特別好的性能,例如,隨后的兩個窗口斜面之間具有良好的節(jié)能特性。此外,通過根據(jù)一個或多個窗口形狀參數(shù),修改一個或多個整形函數(shù)的加權,能夠容易地調節(jié)信號處理窗口值所限定的窗口的特性,所以使用較小的計算工作量,可獲得具有不同特性的窗口。例如,通過改變一個或多個整形函數(shù)的加權,本文中所定義的思想允許獲得大量不同的窗口形狀,這些形狀均具有上述良好的特性。 而且,應注意的是,使用上述思想,可以以非常高的粒度計算具有不同特性的窗口,這些窗口的計算不需要特別困難的計算,僅僅需要形成加權和,以便獲得變元值,并且需要使用變元值估算正弦函數(shù)。根據(jù)本發(fā)明的另一個實施方式,提供了一種信號處理器,用于根據(jù)輸入信號提供輸入信號的處理版本。該信號處理器包括窗口化器,被配置為根據(jù)用于多個窗口值指數(shù)值的信號處理窗口值所描述的信號處理窗口,將部分輸入信號或其預處理版本窗口化,以便獲得輸入信號的處理版本。該信號處理窗口值為與窗口值指數(shù)值相關的多個變元值的正弦函數(shù)估算的結果值,其中,變元值為線性項和一個或多個正弦型整形函數(shù)的函數(shù)值的加權和,該線性項線性地取決于窗口值指數(shù)值,一個或多個正弦型整形函數(shù)將窗口值指數(shù)值映射到相應的函數(shù)值上,并且該一個或多個正弦型整形函數(shù)相對于窗口斜面的中心呈點對稱。根據(jù)本發(fā)明的該實施方式基于與上述實施方式相同的關鍵思想。而且,已發(fā)現(xiàn),使用正弦型整形函數(shù)給信號處理窗口帶來特別好的特性。根據(jù)本發(fā)明的另一個實施方式,提供了一種窗口提供器,用于根據(jù)一個或多個窗口形狀參數(shù),提供用于多個窗口值指數(shù)值的信號處理窗口值。窗口提供器被配置為估算與窗口值指數(shù)值相關的多個變元值的正弦函數(shù),以便獲得信號處理窗口值。該窗口提供器被配置為計算線性項和一個或多個整形函數(shù)的函數(shù)值的加權和,該線性項線性地取決于窗口值指數(shù)值,以便獲得變元值。一個或多個整形函數(shù)將窗口值指數(shù)值映射到相應的函數(shù)值上,并且該一個或多個整形函數(shù)相對于窗口斜面的中心呈點對稱。根據(jù)本發(fā)明的該實施方式基于與上述實施方式相同的思想。根據(jù)本發(fā)明的另一個實施方式,提供了一種信號處理器,用于根據(jù)輸入信號提供輸入信號的處理版本。該信號處理器包括窗口化器,被配置為根據(jù)用于多個窗口值指數(shù)值的信號處理窗口值所描述的信號處理窗口,將部分輸入信號或其預處理版本窗口化,以便獲得輸入信號的處理版本。該信號處理器也包括窗口提供器,用于根據(jù)一個或多個窗口形狀參數(shù),提供用于多個窗口值指數(shù)值的信號處理窗口值。窗口提供器被配置為計算多個正弦型整形函數(shù)的函數(shù)值的加權和,以便獲得信號處理窗口值,這些正弦型整形函數(shù)將窗口函數(shù)值指數(shù)值映射到相應的函數(shù)值上。函數(shù)值的加權由窗口形狀參數(shù)確定。根據(jù)本發(fā)明的該實施方式基于以下發(fā)現(xiàn)對于多種應用而言,使用窗口形狀參數(shù)和所述的計算規(guī)則,可獲得具有足夠好的特性的窗口形狀,具有良好的計算效率和靈活性,以便調節(jié)窗口特性。根據(jù)本發(fā)明的另一個實施方式,提供了一種信號處理器,用于根據(jù)輸入信號提供輸入信號的處理版本。該信號處理器包括窗口化器,被配置為根據(jù)用于多個窗口值指數(shù)值的信號處理窗口值所描述的信號處理窗口,將部分輸入信號或其預處理版本窗口化,以便獲得輸入信號的處理版本。該信號處理窗口值為多個正弦型整形函數(shù)的函數(shù)值的加權和的結果值,這些函數(shù)將窗口值指數(shù)值映射到相應的函數(shù)值上。根據(jù)本發(fā)明的該實施方式基于與上述實施方式相同的關鍵思想。根據(jù)本發(fā)明的另一個實施方式,提供了一種編碼的媒體信號,該編碼的媒體信號包括媒體內容的編碼表不和一個或多個窗口形狀參數(shù)。一個或多個窗口形狀參數(shù)限定將媒體內容的編碼表示解碼時所使用的窗口的形狀。一個或多個窗口形狀參數(shù)描述了加權,用于計算線性地取決于窗口值指數(shù)值的線性項和一個或多個整形函數(shù)的函數(shù)值的加權和,以便獲得變元值,用于通過估算多個變元值的正弦函數(shù),從而獲得用于多個窗口值指數(shù)值的 信號處理窗口值。這個編碼的媒體信號為窗口化的信令提供較高的靈活性,這是因為使用窗口形狀參數(shù),能夠描述大量不同類型的窗口,解碼器可有效地獲得這些窗口。
隨后參看附圖,描述根據(jù)本發(fā)明的實施方式,其中圖Ia示出根據(jù)本發(fā)明的一個實施方式的信號處理器的方框示意圖;圖Ib示出根據(jù)本發(fā)明的另一個實施方式的信號處理器的方框示意圖;圖2示出根據(jù)本發(fā)明的另一個實施方式的信號處理器的方框示意圖;圖3示出根據(jù)本發(fā)明的一個實施方式的窗口提供器的方框示意圖;圖4示出根據(jù)本發(fā)明的一個實施方式的編碼媒體信號的示意圖;圖5示出dB縱坐標尺度上的AAC和Vorbis窗口的頻率幅度響應的圖示;圖6示出AAC KBD窗口函數(shù)和本發(fā)明函數(shù)的某個實例的幅度的圖示;圖7示出與線性橫坐標和dB縱坐標規(guī)模的AAC KBD窗口的頻率幅度響應相比,本發(fā)明窗口函數(shù)的所述實例的頻率幅度響應的圖;圖8示出與對數(shù)橫坐標和dB縱坐標規(guī)模的AAC KBD窗口的頻率幅度響應相比,本發(fā)明窗口函數(shù)的所述實例的頻率幅度響應的圖;圖9示出與AAC KBD和第三級Sinha-Ferreira窗口的頻率幅度響應相比,本發(fā)明窗口函數(shù)的另外兩個實例的頻率幅度響應的圖不;圖10示出用于本發(fā)明的以及相似的窗口函數(shù)的信號自適應工序的方框圖;圖11示出根據(jù)等式(12)的某些取冪正弦函數(shù)的頻譜的圖示;圖12示出根據(jù)等式(15)的優(yōu)化余弦總和函數(shù)的頻譜的圖示;圖13示出根據(jù)等式(19)的所提出的優(yōu)化正弦總和窗口的圖示;圖14示出應用不同的窗口函數(shù)之后,頻率為Lf = 32和96. 5的兩個正弦曲線的DFT頻譜的圖示;圖15示出兩個PC窗口和所提出的窗口的頻譜的圖示;以及
圖16示出窗口的示意圖。
具體實施例方式I.根據(jù)圖Ia的信號處理器圖I示出根據(jù)本發(fā)明的第一實施方式的信號處理器100的方框示意圖。信號處理器100被配置為接收輸入信號110,并且根據(jù)該信號,提供輸入信號的處理版本112。信號處理器100包括窗口化器120,被配置為根據(jù)用于多個窗口值指數(shù)值η的信號處理窗口值122所描述的信號處理窗口,將部分輸入信號110或輸入信號的預處理版本110’(可通過可選的預處理111獲得)窗口化,以便獲得輸入信號的處理版本112 (或在可選的后處理器130內經(jīng)歷進一步進行后處理的輸入信號的版本112’)。為此,窗口化器120可從窗口提供器130接收信號處理窗口值w(n),該窗口提供器 通常也為信號處理器100的一部分。窗口提供器130被配置為根據(jù)一個或多個窗口形狀參數(shù)132,提供用于多個窗口值指數(shù)值η的信號處理窗口值w(n)。窗口提供器被配置為估算與窗口值指數(shù)值η相關的多個變元值c’ (η)的正弦函數(shù),以便獲得信號處理窗口值w(n)。該窗口提供器130也被配置為計算線性項和一個或多個整形函數(shù)的函數(shù)值的加權和,該線性項例如由c(n)表示,線性地取決于窗口值指數(shù)值η。一個或多個整形函數(shù)可將窗口值指數(shù)值η映射到相應的函數(shù)值上。一個或多個整形函數(shù)相對于窗口斜面的中心呈點對稱。計算加權和,以便獲得變元值c ’(η)。因此,窗口提供器130提供信號處理窗口值w(n),這些值描述了具有特別好的特性的窗口。兩個相應的窗口斜面重疊時,在窗口提供器內使用正弦函數(shù)估算,以便獲得信號處理窗口值w(η),這允許獲得具有良好的節(jié)能特性的窗口。而且,通過使用用于正弦函數(shù)估算的變元值c’(η),這些值并非窗口值指數(shù)值(也簡稱為“指數(shù)值”)的線性函數(shù),而是為線性項的重疊,該線性項線性地取決于指數(shù)值和一個或多個整形函數(shù)的函數(shù)值,這些函數(shù)是非線性的且相對于窗口斜面的中心點對稱,能夠調節(jié)信號處理窗口值w(n)所描述的信號處理窗口的形狀。例如,能夠調節(jié)一個或多個整形函數(shù)對變元值c’ (η)的影響,所以根據(jù)一個或多個窗口形狀參數(shù)132,可獲得變元值(根據(jù)指數(shù)值η)的不同演化。因此,可根據(jù)一個或多個窗口形狀參數(shù)132,調節(jié)信號處理窗口值所描述的信號處理窗口的特征,以便滿足特定的需要。而且,已經(jīng)發(fā)現(xiàn),選擇相對于窗口斜面的中心呈點對稱的一個或多個形成函數(shù),有助于確保信號處理窗口具有良好的節(jié)能和壓縮特性,并且還提供了減少計算變元值的計算工作量的機會?,F(xiàn)在描述與計算信號處理窗口值Wnew(η)有關的細節(jié),這些窗口值代替信號處理窗口值 w (η)。2.根據(jù)圖Ib的信號處理器圖Ib示出了信號處理器150的方框示意圖,該處理器與信號處理器100相似。因此,相同的裝置和信號由相同的參考數(shù)字表示。然而,信號處理器150包括窗口提供器180,該提供器與窗口提供器130不同。窗口提供器180接收一個或多個形狀參數(shù)ck,182,并且根據(jù)該參數(shù),提供信號處理窗口值w(t),這些值例如由Wc;(t)表示。在本文中應注意的是,變量t為窗口值指數(shù)值,并且也可簡稱為“指數(shù)值”。
窗口提供器180被配置為根據(jù)一個或多個窗口形狀參數(shù)ck,提供用于多個窗口值指數(shù)值t的信號處理窗口值w (t)。窗口提供器180被配置為計算將窗口函數(shù)值指數(shù)值映射到相應的函數(shù)值上的多個正弦型整形函數(shù)的函數(shù)值的加權和,以便獲得信號處理窗口值w(t)。函數(shù)值的加權由窗口形狀參數(shù)Ck確定。通過使用窗口提供器180提供信號處理窗口值,從而可提供信號處理窗口值,使得在多種情況下,這些值包括足夠好的特性。而且,能夠使用一個或多個窗口形狀參數(shù)ck,調節(jié)專有特性,從而對于一個或多個窗口形狀參數(shù)的不同選擇而言,可獲得不同的信號處
理窗口。通過使用正弦型整形函數(shù)并且形成所述正弦型加權函數(shù)的函數(shù)值的加權和,從而獲得具有良好特性的窗口,下面進行詳細的討論。而且,應注意的是,下面討論與計算信號處理窗口值w(t)有關的細節(jié),窗口提供器180提供這些窗口值。 3.根據(jù)圖2的信號處理器圖2示出根據(jù)本發(fā)明的一個實施方式的信號處理器200的方框示意圖。信號處理器200被配置為接收輸入信號210,并且根據(jù)該信號,提供輸入信號的處理版本212。信號處理器200包括窗口化器220,被配置為根據(jù)用于多個窗口值指數(shù)值(簡稱為“指數(shù)值”)的信號處理窗口值所描述的信號處理窗口,將部分輸入信號210或輸入信號的預處理版本210窗口化,以便獲得輸入信號的處理版本212。信號處理器200可包括可選的預處理211和可選的后處理213。該信號處理窗口值為與窗口值指數(shù)值相關的多個變元值的正弦函數(shù)估算的結果值,其中,變元值為線性項和一個或多個正弦型整形函數(shù)的函數(shù)值的加權和,該線性項線性地取決于窗口值指數(shù)值,一個或多個正弦型整形函數(shù)將窗口值指數(shù)值映射到相應的函數(shù)值上。一個或多個正弦型整形函數(shù)相對于窗口斜面的中心呈點對稱。因此,窗口化器220可進行窗口化,這與窗口化器120進行窗口化非常相似。例如,窗口化器220所使用的信號處理窗口值可與窗口化器120所使用的信號處理窗口值相同。窗口化器220所使用的信號處理窗口值例如可儲存在查找表內或者可另外獲得這些值。在替換的實施方式中,可使用不同的信號處理窗口值。在一個替換的實施方式中,信號處理窗口值為多個正弦型整形函數(shù)的函數(shù)值的加權和的結果值,這些函數(shù)可將窗口值指數(shù)值映射在相應的函數(shù)值上??傊?,窗口化器220例如可被配置為將信號處理窗口值Wnew(η)所描述的窗口用于輸入信號210中或者用于其預處理版本211’中。然而,或者,窗口化器220可將信號處理窗口值we(t)用于輸入信號210中或者用于其預處理版本210’中。下面可描述與窗口化器220所使用的信號處理窗口有關的細節(jié)。4.根據(jù)圖3的窗口提供器圖3示出根據(jù)本發(fā)明的一個實施方式的窗口提供器300的方框示意圖。窗口提供器300被配置為接收一個或多個窗口形狀參數(shù)310 (通常為可變值),并且根據(jù)這些參數(shù)提供用于多個窗口值指數(shù)值的一組信號處理窗口值w(n)312。窗口提供器300被配置為估算與窗口值指數(shù)值相關的多個變元值的正弦函數(shù),以便獲得信號處理窗口值w(n)。該窗口提供器也被配置為計算線性項和一個或多個整形函數(shù)的函數(shù)值的加權和,該線性項有時稱為C (η)并且線性地取決于窗口值指數(shù)值η。一個或多個整形函數(shù)將窗口值指數(shù)值η映射到相應的函數(shù)值上。一個或多個整形函數(shù)相對于窗口斜面的中心呈點對稱。因此,窗口提供器300基本上履行了窗口提供器130的功能。然而,應注意的是,窗口提供器300可為獨立于窗口化器130的部件。然而,或者,窗口提供器300可履行窗口提供器180的功能。5.根據(jù)圖4的編碼的媒體信號下面描述編碼的媒體信號。圖4示出了這種編碼的媒體信號的示意圖。編碼的媒體信號400包括媒體內容的編碼表示和窗口形狀參數(shù)。窗口整形的參數(shù)例如適合于用作窗口提供器130的一個或多個窗口形狀參數(shù)132,或者用作窗口提供器180的一個或多個窗口形狀參數(shù)132。因此,編碼的媒體信號400中的窗口形狀參數(shù)被選擇,從而使用窗口提供器130或窗口提供器180產(chǎn)生信號處理窗口值w(n)或w(t)。而且,通常根據(jù)窗口形狀參數(shù)所描述的窗口,使用窗口化,將媒體內容的編碼表示進行編碼。
·
6.有關窗口提供器130所提供的或窗口化器220所使用的窗口的細節(jié)6. I概述和定義下面描述有關窗口提供器130所提供的窗口的某些細節(jié),窗口化器220也可使用這些窗口。本文中應注意的是,這些窗口在本文中由信號處理窗口值w(n)限定。所述信號處理窗口值w(η)通常乘以輸入信號110或其預處理版本110’,以便獲得輸入信號的窗口化版本或其預處理版本110’。窗口通常由信號處理窗口值w(n)描述,其中,η為指數(shù)值(例如,時間指數(shù)值),該值表示信號處理器窗口值。此外,應注意的是,窗口通常包括左側窗口斜面和右側窗口斜面。可選地,窗口可進一步包括恒定的(或者大致恒定的)中心部分,使得多個中心信號處理窗口值采用同一個預定的值。然而,應注意的是,窗口的左側窗口斜面和右側窗口斜面可不同。因此,應指出的是,以下討論大致描述了單個窗口斜面的形狀,即,在較小的窗口值(例如,零窗口值)和較大的窗口值(例如,最大的窗口值I)之間進行轉換?,F(xiàn)在參看圖16,該圖示出了窗口的示意圖,在圖16的示圖中更詳細地進行解釋,橫坐標1610描述了指數(shù)值η,并且縱坐標1612描述了與指數(shù)值η相關的信號處理窗口值w(η) ο可見,窗口 1600包括左側窗口部分1620和右側窗口部分1622。左側窗口部分包括左側窗口斜面1630,作為關鍵元素。例如,由多個信號處理窗口值w(n)限定左側窗口斜面1630,H=H1到n=n2。左側窗口部分1620也可可選地包括左側外部部分,對于該部分,信號處理窗口值w(n)采取較小的值,例如,w(n)=0。左側窗口部分可選地也包括一部分中心窗口部分,對于該部分,信號處理窗口值w(n)采取預定的值,例如,w(n)=l。窗口 1600包括右側窗口部分1622,該部分包括右側窗口斜面1640,作為關鍵元素。右側窗口部分可選地包括一部分中心窗口部分,對于該部分,信號處理窗口值米取預定的值,例如,w(n) =I0右側窗口部分也可選地包括右側外部部分,對于該部分,信號處理窗口值w (η)采取較小的值,例如,w (n) =0 ο應注意,左側外部部分、中心窗口部分以及右側外部窗口部分應視為可選。而且,應注意的是,窗口 1600可對稱或非對稱。因此,左側窗口斜面1630和右側窗口斜面1640可相等,或者在某些實施方式中可明顯不同。本文中應注意的是,以下討論大致涉及左側窗口斜面1630,即,在較小的或零窗口值和較大的或最大窗口值之間進行轉換。然而,應注意的是,可選地添加左側外部部分、可選地添加中心窗口部分、添加右側窗口斜面以及可選地添加右側外部部分,從而通過了解左側窗口斜面1630,可獲得整個窗口 1600。還應注意,使用簡單的鏡像處理獲得右側窗口斜面1640的方式可與左側窗口斜面相同,例如,等式(3)的處理。本文中還應注意,根據(jù)以下討論,左側窗口斜面應由值w(n)描述,n=0到n=N/2_l。然而,當然能夠使用不同的指數(shù)值。6. 2 窗口 Wnew(n)的細節(jié)通過揭示到等式(4)的正弦窗口函數(shù)的擴展,根據(jù)本發(fā)明的實施方式解決了 MDCT應用缺少靈活的以及計算上有效的窗口函數(shù)這一問題。要注意的是,等式(4)可視為圍繞n=N/2-l/2對稱的三角形窗口函數(shù)的正弦。給出等式(3),這表示 c (η) = (η+1/2) · 2/Ν, (6)Wsin(η) = sin( π /2 · c(n)), η_0,1, . . . , Ν/2—1, (7)其中,c(n)表示窗口核心函數(shù),由于預先確定該函數(shù),所以可提前計算該函數(shù)。所提議的擴展將加權的正弦曲線加至等式(7)中的c(n),該正弦曲線具有角頻率,角頻率為2 31的整數(shù)倍c1 (n) = c (η) + Σ af · sin (2 π · f · c (η)), f = I, 2, . . . , (8)Wnew(η) = sin( π /2 · c' (η)), η = O, I, · · · , Ν/2—1, (9)也可提前計算C,(η)內的正弦項。僅僅需要調節(jié)其加權,由af因子規(guī)定。因此,以逐個轉換的方式,將所提議的窗口調節(jié)成信號時,僅僅需要重新計算等式(9)和等式(8)內的加權,使得該調節(jié)在計算上的復雜性低于KBD和Sinha-Ferreira窗口。而且,值得一提的是,由于等式(8)和(9)內的正弦項,所提議的窗口函數(shù)類別的每個實現(xiàn)在其端點處均完全裳減為零,這就確保在窗口的頻率響應中,芳辦等級以每倍頻程具有至少12dB的速度進行衰減。對于KBD窗口以及Princen和Bradley的文章(“Analysis/Synthesis Filter BankDesign Based on Time Domain AliasingCancellation,,,IEEE Trans. Acoustics, Speech, and Signal Processing, 1986 年 10 月,1153-1161 頁)以及 Ferreira 的文章(“Convolutional Effects in Transform Codingwith TDAC: An OptimalWindow,,, IEEE Trans. Speech and Audio Processing, 1996年 3 月,104-114頁)中發(fā)布的窗口而言,并非如此,其遠頻率旁瓣因此以每倍頻程少于12dB的速度進行衰減。對于相等的主瓣寬度而言,這表示在遠頻率旁瓣衰減方面,根據(jù)等式(8)和(9)的窗口潛在地超過現(xiàn)有技術的窗口。根據(jù)本發(fā)明的窗口計算或調整包括以下步驟-基于設計上的考慮,選擇c’(η)中正弦項的數(shù)量以及合適的加權因子af。-確定或限定窗口長度N,并且使用所選的af以及正弦項的數(shù)量,計算C,(η)。-計算等式(9)的Wnew(η),η=0、1、.. .、N/2_1,然后,使用等式(3)獲得長度N的窗口實例。-如果一個不同的窗口參數(shù)化用于前面相鄰的區(qū)段,那么通過校正前面窗口實例的右半部,或者校正當前的窗口實例的左半部,或者校正前面實例的右半部以及當前實例的左半部,從而滿足任何完整的反向約束條件。
在優(yōu)選的實施方式中,在計算復雜性方面,窗口函數(shù)可與正弦和Vorbis窗口進行比較,但是至少為KBD和Sinha-Ferreira窗口提供設計靈活性。如上所述,應注意的是,可將值c’(η)視為與窗口值指數(shù)值η相關的變元值。而且,應注意的是,可將函數(shù)sin (2 π · f · c (η))視為整形函數(shù)。而且,應注意的是,不需要將正弦函數(shù)用作整形函數(shù)。更確切地說,選擇整形函數(shù),使得這些整形函數(shù)與窗口斜面的中心呈點對稱即可。窗口斜面的中心例如由線性項的值c (n) =0. 5限定。例如,可使用點對稱的多項式函數(shù)代替正弦函數(shù),有利于在某些情況下進行估算。而且,整形函數(shù)應優(yōu)選地采取足以接近零的值,c(n)=0和c(n)=l,S卩,在窗口斜面的最左邊的窗口值指數(shù)值的環(huán)境中以及在窗口斜面的最右邊的窗口值指數(shù)值的環(huán)境中。換言之,在最左邊的窗口值指數(shù)值(例如,n=0 )和最右邊的窗口值指數(shù)值(例如,n=N/2-1)的環(huán)境(或者相鄰區(qū)域)中,整形函數(shù)應具有零,或者應采取大約為零的值。
而且,應注意的是,例如,通過窗口提供器130的變元值計算,可估算等式(6)和(7),并且通過窗口提供器130的正弦函數(shù)估算,可估算等式(9)。因此,窗口提供器130的正弦函數(shù)估算獲得的值Wnew(η) (η=0到η=Ν/2-1)可描述例如左側窗口斜面1630。因此,窗口提供器130可被配置為根據(jù)與左側窗口斜面相關的所述信號處理窗口值,組裝整個窗口 1610。為此,窗口提供器可添加左側外部部分、中心窗口部分、右側窗口斜面以及左側外部部分,如圖16所示。通過在對稱窗口的情況下,鏡像左側窗口斜面,可獲得右側窗口斜面。然而,或者,右側窗口斜面可與左側窗口斜面不同,并且通過鏡像與左側窗口斜面不同的窗口形狀參數(shù)的窗口斜面,可獲得該右側窗口斜面。而且,應注意,由于滿足了完整的反向約束條件,所以信號處理器可確保,與輸入信號的前面部分相關的右側轉換斜面以及與輸入信號的后面部分相關的左側轉換斜面匹配。為此,可確保,使用已經(jīng)用于獲得與輸入信號的前面部分相關的右側窗口斜面的相同參數(shù),獲得與輸入信號的后面部分相關的左側窗口斜面。而且,應注意,等式(6)、(8)以及(9)限定的算法適合于在具有有限的計算能力的設備內,在線計算窗口函數(shù)。然而,可將等式(6)、(8)以及(9)限定的窗口估算一次,因此,在某些實施方式中,可將這些結果儲存在查找表內,以備后用。6. 3窗口設計的注釋下面討論某些條件,這些條件產(chǎn)生具有特別好的特性的窗口。然而,應注意的是,遵守下面討論的條件,不應視為是必須的。如背景技術部分的討論中所述,采用MDCT的信號編碼器需要將某些條件施加給用于該信號的窗口函數(shù),以便不操作任何信號時,允許完全可反轉整個系統(tǒng),即,提供完整的輸入重構。符合等式(2)的函數(shù)也稱為功率互補函數(shù),表示合適的分類。該窗口類別的所有實現(xiàn)方式屬于這個分類。然而,可顯示出,具有對于所有部署的η為非負值c’ (η)的實現(xiàn)方式c' (n) ^ O, η = O, I, , N/2-1, (10)產(chǎn)生特別好的通帶選擇性和阻帶抑制度。因此,以下討論集中于窗口類別的這個子集。在某些情況下,對于所有部署的η為非負值c’ (η)的實現(xiàn)方式同時產(chǎn)生滿意的通帶選擇性和阻帶抑制度。
通常,在等式(8)內能夠使用任意數(shù)量的正弦項,以設計適合于指定的使用情況的窗口頻率響應,發(fā)現(xiàn)兩個正弦項(f=l、2)在靈活性、復雜性以及內存使用之間提供充分的權衡。尤其地,使用兩個正弦項,可得出參數(shù),在窗口實例中,這些參數(shù)-將主瓣寬度最小化,即,將閉頻選擇性最大化,-將某個歸一化頻率之上的最大旁瓣等級最小化,-將旁瓣衰減的速率最大化,即,遠頻率阻帶衰減,-將最大微分最小化為現(xiàn)有的參考窗口實例。下面,借助于特定實例,檢查這些設計考慮中的每一個。
6. 3. I具有最大的通帶選擇性的窗口雖然等式(2)的功率互補條件限制了可實現(xiàn)的頻率響應的范圍,尤其是在最初的幾個旁瓣的寬度和等級方面,但是通過將c’ (η)內所有的~因子設為零,可獲得產(chǎn)生最窄主瓣的窗口函數(shù)。顯而易見,所產(chǎn)生的窗口等于等式(4)的AAC正弦窗口。在圖5中描述了其頻譜,以及KBD ( α =4)和Vorbis窗口的頻譜。然而,總之,應注意的是,優(yōu)選地,應將至少一個窗口形狀參數(shù)af設為非零值。然而,窗口提供器113的上述結構具有靈活性,從而通過僅僅設置窗口形狀參數(shù)af,甚至獲得AAC正弦窗口,而沒有任何特定的信號。6. 3. 2具有最小的旁瓣最大值的窗口等式(9)的配置將最大的旁瓣等級最小化,通過窮舉或基于梯度的搜索方法,共同優(yōu)化af參數(shù),從而可獲得這些配置。然而,由于等式(2),值得推薦的是,限定更低的頻率界限Ncoq>1· 5,在該頻率界限上,進行極小極大優(yōu)化。發(fā)現(xiàn),Νωα=4· 5值產(chǎn)生參數(shù)&1=0· 1224和&2=0. 00523。圖6中示出了這樣配置的窗口函數(shù)。與還描繪出的AAC KBD窗口函數(shù)的相似性是明顯的。圖7中示出了相應的窗口頻譜。值得注意的是,與KBD窗口相比時,本發(fā)明窗口的最初兩個旁瓣具有更低的等級,并且Ncoci 5之上的最大的旁瓣等級減小(該頻率之上所提出的窗口的最初三個旁瓣的等級為-66. 8dB,而KBD窗口到達略微更高的等級-63. OdB) ο由于在c’ (η)內使用正弦項,所以該窗口類別的每個實現(xiàn)方式均具有連續(xù)性,并且因此確保在其端點處,平穩(wěn)地衰減為零。在圖8中闡述了這個優(yōu)點??梢?,先前獲得的窗口的旁瓣以每倍頻程12dB的速率衰減。相反,KBD窗口具有更小的衰減速率,這是因為KBD的加權函數(shù)的端點具有輕微的不連續(xù)性。結果,即使在Νω ^ 250和Νω ^ 7之間,KBD窗口超過所提出的窗口,但是在Νω ^ 250之上,與KBD窗口相比,所提出的窗口具有更高的抑制度。在某些分析或合成應用中,該特征有利。6. 3. 3具有最大的旁瓣衰減的窗口在某些情況下,最好使用其旁瓣以每倍頻程大于12dB的速率衰減的窗口。本發(fā)明允許例如構成以每倍頻程24dB的速率衰減的窗口。要求加權函數(shù)具有連續(xù)的一階微分,即,在窗口實例邊緣的微分消沒,從而實現(xiàn)該目的。該問題最直觀的解決方法為配置al=0. 1591、a2=0。圖9中描述了所產(chǎn)生的窗口響應,以及下面討論的另外三個響應。6. 3. 4近似參考窗口的窗口為了完成所提出的窗口類別的靈活性的這種展示,試圖產(chǎn)生兩個窗口實現(xiàn)方式,這兩個實現(xiàn)方式與兩個現(xiàn)有的窗口非常相似。由于其多樣性,選擇KBD(a=4)以及第三階Sinha-Ferreira函數(shù)作為參考。在最小均方的意義上,通過c’ (η)和等式(9)進行重構,即,通過將參考和近似值之間的平方差最小化(要注意的是,也能夠使用其他方法)。圖9示出了結果??梢?,本發(fā)明的窗口與其現(xiàn)有技術的窗口大致相同,并且主要的差別僅僅在于具有非常低的等級。因此,在復雜性或內存較為關鍵的環(huán)境中,可由使用本窗口類別的裝置代替參考窗口,同時將向后兼容性維持較高的程度,并且如果適用,可維持近乎完整的重構的可能性。7.信號自適應系統(tǒng)內的實施方式系統(tǒng)處理具有不同長度的信號區(qū)段時,該窗口類別顯示出額外的優(yōu)點,該長度為2的整數(shù)冪。在AAC內,例如,該過程也被稱為區(qū)塊切換,通過在每個幀的2048 (1920)個采樣上使用一次MDCT,或者在每個幀的256 (240)個采樣上使用8次,從而現(xiàn)實該過程。在本文中,等式(8)內的各項的子集(例如,n=0、l、. . .、Ν/8-1)可重新用作核心函數(shù),用于長度較小的窗口,或者在正弦項的情況下,甚至用作窗口函數(shù)本身。如果可接受長度較小的窗口降低的設計靈活性,那么這可用于進一步減小儲存核心函數(shù)所需要的存儲器容量。
8.本發(fā)明的其他應用對于音頻或視頻編碼以外的若干個應用情況而言,功率互補窗口函數(shù)(例如,本文中所報告的那些函數(shù))可相當具有吸引力。如背景技術部分的第6段中引用的論文中所述,功率互補窗口可用于瞬時能量儲存軟切換或開關系統(tǒng)以及在連續(xù)的模塊之間具有重疊的逐塊進行操作的信號分析和處理裝置內。更具體地說,在構建其過濾內核時,在一維或高維信號上執(zhí)行過濾任務的任何設備可使用該報告的窗口,包括但不限于高通(微分)、低通(積分)以及帶通濾波器,下采樣器(抽取濾波器)和上采樣器(內插濾波器),單頻帶或多頻帶均衡器、壓縮器、擴展器和限制器,用于減噪以及相關的提高的算法或特效工具。通過在這種系統(tǒng)內采用本文中所示的本發(fā)明的窗口函數(shù)以及使得其頻譜特性適用于應用要求,優(yōu)選地以信號區(qū)段自適應的方式,希望可提高感知性能。9.根據(jù)圖10的媒體信號編碼器和媒體信號解碼器圖10示出了媒體信號編碼器和媒體信號解碼器的方框示意圖。媒體信號編碼器1010被配置為接收一個或多個信道信號S1 (η)到sM(η),并且根據(jù)該信號,提供編碼表示。輸入媒體信號的編碼表示可采取MDCT系數(shù)S1GO到SM(k)的方式,或者可為這種MDCT系數(shù)的編碼表示。信號編碼器1010例如包括多個相同的信號路徑1012a-1012m,這些路徑可單獨地操作或者可耦合。此外,信號編碼器1010還包括編碼參數(shù)計算器602,該計算器確定一個或多個編碼參數(shù)(例如,塊長度)、時間噪聲成形(TNS)參數(shù)、子帶增益補償參數(shù)、配置信息和/或心理聲學模型信息。下面討論路徑或分支1012a,但是以上討論也可用于其他的分支,例如,分支1012m。分支1012a包括窗口檢測器603,該檢測接收各個信道的輸入信號S1 (η)以及來自編碼參數(shù)測定器602的信息。窗口檢測器603可提供例如窗口形狀信息603a,該信息描述了所需要的窗口的形狀。窗口形狀信息例如可根據(jù)到窗口檢測器603的輸入來確定,從而優(yōu)化或提高編碼器1010的客觀性能(編碼增益、頻率選擇性或能量壓縮、數(shù)據(jù)壓縮、引入的混淆量)或主觀性能(無誤差或錯誤的傳輸和解碼之后,編碼輸出的感知質量)。分支1012a還包括窗口同步器604,應將該同步器視為可選,并且該同步器可結合該分支1012a的窗口檢測器603所提供的窗口形狀信息和不同分支的窗口檢測器所提供的窗口形狀信息。因此,同步的窗口形狀信息604a可選地由窗口同步器604提供。信號路徑1012a還包括完整的重構實施器605,被配置為接收窗口形狀信息603a或同步的窗口形狀信息604a,并且根據(jù)該信息,提供自適應窗口形狀信息605a。例如,完整的重構實施器605可確保與輸入信號的前面部分相關的窗口的右側轉換斜面(也稱為窗口斜面)是與輸入信號的后面部分相關的窗口的窗口斜面的鏡像版本。例如,可確保,與輸入信號的后面部分相關的窗口的那些窗口斜面由相同的窗口形狀參數(shù)限定。信號路徑1012a還包括窗口計算器606,被配置為將信號處理窗口值W1 (η)提供給窗口化器1014。窗口化器1014被配置為將輸入信號S1 (η)的采樣乘以相應的信號處理窗口值W1(Ii),以便獲得窗口化的信號值s/ (η),將這些值輸入到改進的離散余弦變換器607內,以便獲得MDCT系數(shù)S1 (k)。此處應注意,窗口計算器606可具有窗口提供器130或窗口提供器180的功能,從 而信號處理窗口值W1 (η)等于信號處理窗口值w(n)或者等于信號處理窗口值w(t)。而且,窗口化器1014可采用窗口化器120的功能。因此,編碼器1010被配置為根據(jù)自適應窗口形狀信息605a,使用多個不同的窗口,從而將輸入信號S1(Ii)窗口化,其中,窗口計算器606提供信號處理窗口值。編碼器1010可選地包括其他編碼級,用于有效地編碼MDCT變換器607所提供的頻譜值S1GO到sM (k)。信號解碼器1020被配置為接收解碼的頻譜值Q1 (k)到QM(k)。從比特流中可獲取解碼的頻譜值Q1GO到Qm(k),通過編碼頻譜值S1GO到SM(k),編碼器1010可提供該比特流。換言之,頻譜系數(shù)Q1GO到QmGO可與頻譜值S1GO到SmGO相同,除了具有量子化誤差以外。此處,k為頻率指數(shù),并且M彡I表示信道數(shù)量(其中,每個信道具有一個分支)。解碼器1020還被配置為接收窗口長度值N1到Nm (采用上述變量N的函數(shù))以及一個或多個窗口形狀參數(shù)S1到aM (例如,每個分支或信道具有一個參數(shù))。解碼器1020包括反向的改進離散余弦變換器608,被配置為接收頻譜系數(shù)Q1 (k)到Qm(k),并且根據(jù)這些系數(shù),提供反向變換的信號Q1 (η)到qM(n)。解碼器1020還包括窗口選擇器609,該選擇器與完整的重構實施器605 —起進行操作,以便從輸入窗口形狀參數(shù)B1到aM獲得自適應窗口形狀參數(shù)605a,其中,可從表示媒體內容的比特流中,提取或獲得輸入窗口形狀參數(shù)S1到aM。例如,在編碼的媒體信號內可表示輸入窗口形狀參數(shù)B1到aM和頻譜值Q1GO到QM(k)。解碼器1020還包括窗口計算器606,該計算器接收自適應窗口形狀參數(shù)605a (或者,可替代地,輸入窗口形狀參數(shù)B1到aM),并且根據(jù)這些參數(shù),提供信號處理窗口值W1 (η)到wM(n)。窗口計算器606可執(zhí)行窗口提供器130或窗口提供器180的功能,其中,自適應窗口形狀參數(shù)605a可對應于一個或多個窗口形狀參數(shù)132或對應于一個或多個窗口形狀參數(shù)182。同樣,信號處理窗口值W1 (η)到wM(n)可等同于信號處理窗口值w(n)或等于信號處理窗口值w (t)。因此,窗口計算器606可根據(jù)自適應窗口形狀參數(shù)605a或輸入窗口形狀參數(shù)到aM,提供形狀不同的窗口。例如,通過乘法運算1024可將解碼器1020的窗口計算器606所提供的信號處理窗口值W1 (η)到wM(n)用于反向的改進離散余弦變換器608所提供的反向變換的信號qi (η)到qM(n),從而獲得值q 到qM(n)的窗口化版本q/ (η)到qM’ (η)。解碼器1020進一步包括重疊相加器610,被配置為接收反向變換信號qi (η)到q (n)的后面窗口部分q/ (η)到qM’ (η)以及所述后面部分的重疊相加,從而獲得重構的信號又“!!)到y(tǒng)M(n)。重疊相加器610優(yōu)選地與窗口化1024相協(xié)調,從而使用“互補”窗口,將由重疊相加器610重疊的窗口化信號部分q/ (η)到qM’ (η)窗口化,使得第一窗口的右側窗口斜面與后面窗口的左側窗口化斜面重疊,其中,重疊的窗口斜面包括上述節(jié)能和/或完整的重構特性。因此,編碼器1010和解碼器1020能夠將媒體信號編碼和解碼,例如,音頻信號、語
音信號、視頻信號、圖像信號等等??傊鶕?jù)本發(fā)明的上述實施方式可用于軟件和硬件芯片內以及數(shù)字信號處理器(DSP )內,用于各種系統(tǒng)和信號的模擬或數(shù)字儲存或傳輸。 總之,圖10闡述了所提出的窗口化技術可如何用于類似于信號自適應AAC的音頻編解碼器或一種不同類型的信號編碼器或信號解碼器內。將用于構造c’ (η)的窗口核心功能601儲存在存儲器內,同時在存儲器內存儲可用的參數(shù)配置的定義。這些數(shù)據(jù)由編碼器和解碼器共享。在窗口檢測器和選擇器603內分析圖IOa)內所示的參考數(shù)字為1010的編碼器、用于M輸入信道的每個幀的區(qū)段、以及用于M區(qū)段s (η)中的每個的頻譜時間心理聲學模型602的數(shù)據(jù),以便確定合適的窗口形狀,并且如果適用,確定長度和數(shù)量。根據(jù)頻率選擇性(能量壓縮)或低幀重疊(使用TNS或子帶(SB)增益補償時減少混淆)等標準,選擇適當?shù)拇翱?。換言之,編碼器1010 (或者任何其他的信號處理器)可被配置為用信號自適應的方式,確定、改變或調節(jié)一個或多個窗口形狀參數(shù)af,從而優(yōu)化或提高信號處理器的客觀性能或主觀性能。因此,可用輸入信號自適應的方式,確定、改變或調節(jié)一個或多個窗口形狀參數(shù),從而優(yōu)化或提高信號處理器(例如,音頻編碼器1010)的客觀(即,數(shù)字)或主觀(即,感知)性能。通過同步單元604可選地匹配信道的窗口形狀參數(shù)之后,通過調節(jié)現(xiàn)有和先前幀的重疊窗口兩等份的參數(shù),在PR實施單元605內,確保了使用所選的窗口參數(shù)執(zhí)行這些變換的完整重構(PR)。根據(jù)改進的窗口形狀參數(shù),使用等式(8)和(9),計算(606)實際的窗口系數(shù),并且將這些系數(shù)乘以各個音頻區(qū)段,形成窗口化的區(qū)段s’(n),通過MDCT 607將該區(qū)段最終變換成頻域,以便隨后進行量子化、編碼以及傳輸。在圖IOb)內所示的參考數(shù)字為1020的解碼器內,將用于每個幀和信道的所接收的窗口形狀參數(shù)解碼并且轉發(fā)給窗口選擇器609,在去量子化的頻譜Q(k)的反向MDCT 608之后,該選擇器將這些參數(shù)映射到相應的窗口配置中,以供使用。執(zhí)行窗口序列的完整重構并且計算與編碼器相似的窗口系數(shù)之后,將反向MDCT所產(chǎn)生的輸出區(qū)段q(n)窗口化,并且通過重疊相加器610,重構各信道波形 y (η)。10.可替換的窗口計算10. I關于可替換的窗口類別的窗口函數(shù)的計算的概述下面描述窗口函數(shù)的替換類別,窗口提供器(例如,窗口提供器180或窗口提供器300或窗口計算器606)可使用這種類型,提供信號處理窗口值。
換言之,下面通過大幅修改以上某些等式,描述有關窗口的替換類別的定義的細節(jié)。在以上部分之一中,要注意的是,a=2時的等式(12)(即W2 (t))等同于K=l、bQ=0. 5、K=O. 5時的等式(15)。而且,建立Tw4(t)和(15) (K=2)以及(16)的bk之間的等效性。已經(jīng)調查出,bk產(chǎn)生Wl(t)、w3(t)或者一般而言產(chǎn)生任何具有奇數(shù)a的wa(t)。觀察等式
(12)和(15),已經(jīng)發(fā)現(xiàn),不能構成余弦總和窗口,該窗口等同于奇數(shù)取冪正弦窗口。然而,在某些應用中,需要奇數(shù)a的wa (t),期望使用與等式(15)相似的公式,以允許如由Hamming、Blackman以及Nuttall進行的頻譜泄漏優(yōu)化。幸運的是,已發(fā)現(xiàn)正弦總和函數(shù)
權利要求
1.一種信號處理器(100 ;1010 ;1020),用于根據(jù)輸入信號(110 !S1 (n) A1 (η))提供所述輸入信號的處理版本(112 ;Sl’ (n) W1 ’(η)),所述信號處理器包括 窗口化器(120 ;1014 ; 1024),被配置為根據(jù)用于多個窗口值指數(shù)值(η)的信號處理窗口值(w(n) !W1 (η))所描述的信號處理窗口(1600),將所述輸入信號的一部分或其預處理版本窗口化,以獲得所述輸入信號的處理版本;以及 窗口提供器(130 ;603、604、605、606 ;609、605、606),用于根據(jù)一個或多個窗口形狀參數(shù)(132 ;&1),提供用于多個窗口值指數(shù)值的信號處理窗口值,其中,所述窗口提供器被配置為估算與所述窗口值指數(shù)值(η)相關的多個變元值(c’ (η))的正弦函數(shù),以獲得所述信號處理窗口值(w(η)); 其中,所述窗口提供器被配置為計算線性項(c(n))與一個或多個整形函數(shù)的函數(shù)值的加權和,以獲得所述變元值,所述線性項線性地取決于窗口值指數(shù)值(n),所述一個或多個整形函數(shù)將窗口值指數(shù)值(η)映射到相應的函數(shù)值上,并且所述一個或多個整形函數(shù)關于窗口斜面(1630)的中心呈點對稱。
2.根據(jù)權利要求I所述的信號處理器,其中,所述一個或多個整形函數(shù)為正弦型整形函數(shù)。
3.根據(jù)權利要求I或2所述的信號處理器,其中,所述窗口提供器被配置為對與所述窗口值指數(shù)值η相關的多個變元值 π /2 · C, (η) 估算正弦函數(shù) w(n) =sin( π/2 · C,(η)) 以獲得所述信號處理窗口值w(n);并且 其中,所述窗口提供器被配置為計算線性地取決于所述窗口值指數(shù)值η的線性項c (η)與一個或多個整形函數(shù)的函數(shù)值sin (2 τι · f · c (η)) 的加權和
4.根據(jù)權利要求3所述的信號處理器,其中,所述窗口提供器被配置為獲得c(η),使得對于窗口斜面(1630),c (η)取O和I之間的值。
5.根據(jù)權利要求3或4所述的信號處理器,其中,所述窗口提供器被配置為根據(jù) c (η) = (η+1/2) · 2/Ν, 獲得c (η),其中,對于窗口斜面(1630),η處于O和Ν/2-1之間的范圍內。
6.根據(jù)權利要求3至5中任一項所述的信號處理器,其中,所述窗口提供器被配置為獲得c,(η),使得對于O和Ν/2-1之間的n,c’ (η)彡O。
7.根據(jù)權利要求I至6中任一項所述的信號處理器,其中,所述窗口提供器被配置為估算整形函數(shù),所述整形函數(shù)是穩(wěn)定的或穩(wěn)定地可微。
8.根據(jù)權利要求I至7中任一項所述的信號處理器,其中,所述一個或多個整形函數(shù)(sin(2 π · f · c(n)))在距離窗口斜面的最左邊的窗口值指數(shù)值(η=0)不超過窗口斜面(1630)的長度的5%的范圍內包括零值,并且其中,所述一個或多個整形函數(shù)(sin (2 π · f · c (η)))在距離窗口斜面的最右邊的窗口值指數(shù)值(n=N/2_l)不超過窗口斜面的長度的5%的范圍內包括零值;或者 其中,所述一個或多個整形函數(shù)包括不超過用于窗口斜面的最左邊的窗口值指數(shù)值U=O)的整形函數(shù)的最大值的5%的值,并且其中,所述一個或多個整形函數(shù)包括不超過用于窗口斜面的最右邊的窗口值指數(shù)值(n=N/2-l)的最大值的5%的值。
9.根據(jù)權利要求I至8中任一項所述的信號處理器,其中,所述信號處理器為媒體信號編碼器(1010); 其中,所述窗口化器(1014)被配置為根據(jù)信號處理窗口( 1600),將媒體信號(S1 (η))的一部分或其預處理版本窗口化,以獲得所述媒體信號的窗口化部分(s/ (η));以及 其中,所述信號處理器(1010)被配置為將所述媒體信號的窗口化部分(s/ (η))變換至頻域。
10.根據(jù)權利要求9所述的信號處理器,其中,所述媒體信號編碼器(1010)被配置為根據(jù)所述媒體信號(S1 (η))的特性,確定一個或多個窗口形狀參數(shù)U1);以及 其中,所述窗口提供器(603、604、605、606)被配置為根據(jù)所述一個或多個窗口形狀參數(shù)計算加權和,使得所述窗口提供器被配置為根據(jù)所述一個或多個窗口形狀參數(shù),提供描述具有不同窗口形狀的窗口的多組不同的信號處理窗口值W1 (η))。
11.根據(jù)權利要求9或10所述的信號處理器,其中,所述媒體信號編碼器(1010)被配置為調整與所述媒體信號的第一指定部分相關的窗口的右側窗口斜面(1640)的一個或多個窗口形狀參數(shù)(al)以及與所述媒體信號的第一指定部分之后的所述媒體信號的第二指定部分相關的窗口的左側窗口斜面(1630)的一個或多個窗口形狀參數(shù)。
12.根據(jù)權利要求I至8中任一項所述的信號處理器,其中,所述信號處理器為媒體信號解碼器(1020), 其中,所述媒體信號解碼器被配置為將媒體信號的頻域表示(Q1GO )變換成時域表示(Qi (η));以及 其中,所述窗口化器被集成到用于將所述媒體信號的頻域表示變換成所述媒體信號的時域表示的變換器內,或者其中,所述窗口化器被配置為將由用于將媒體信號的頻域表示(Qi (k))變換成媒體信號的時域表不(q: (η))的變換器(608)提供的時域表不Cq1 (η))窗口化。
13.根據(jù)權利要求12所述的信號處理器,其中,所述信號處理器被配置為從代表被編碼的媒體信號的比特流提取所述一個或多個窗口形狀參數(shù)U1),或者從代表被編碼的媒體信號的比特流的一個或多個比特流參數(shù)獲得所述一個或多個窗口形狀參數(shù)。
14.根據(jù)權利要求I至8中任一項所述的信號處理器,其中,所述信號處理器被配置為使用由所述窗口化器進行的窗口化,進行高通濾波器操作、低通濾波器操作、帶通濾波器操作、下采樣操作、上采樣操作、壓縮器操作、擴展器操作、限制器操作、降噪操作、信號增強操作、信號效果操作或均衡器操作。
15.根據(jù)權利要求I至14中任一項所述的信號處理器,其中,所述窗口提供器(130;603、604、605、606 ;609、606、606)被配置為根據(jù)所述窗口形狀參數(shù)(af)中相應的一個,縮放至少一個整形函數(shù)的預先計算版本,以獲得對所述加權和的貢獻。
16.根據(jù)權利要求I至15中任一項所述的信號處理器,其中,所述一個或多個窗口形狀參數(shù)(af)是描述所述一個或多個整形函數(shù)對所述加權和的貢獻的數(shù)值。
17.根據(jù)權利要求I至16中任一項所述的信號處理器,其中,所述窗口提供器被配置為形成至少所述線性項和兩個不同的形狀函數(shù)的加權和,所述兩個不同的形狀函數(shù)根據(jù)兩個數(shù)字窗口形狀參數(shù)值(af)進行加權,從而根據(jù)兩個以上窗口形狀參數(shù)值,能夠獲得至少四個不同的窗口形狀。
18.根據(jù)權利要求I至16中任一項所述的信號處理器,其中,所述信號處理器被配置為以輸入信號自適應的方式確定、改變或調整一個或多個窗口形狀參數(shù)(af),從而優(yōu)化或提高所述信號處理器的客觀性能或主觀性能。
19.一種信號處理器(200),用于根據(jù)輸入信號(210)提供所述輸入信號(210)的處理版本(212),所述信號處理器包括 窗口化器(220),被配置為根據(jù)用于多個窗口值指數(shù)值(η)的信號處理窗口值(w(n);W1 (η))所描述的信號處理窗口,將所述輸入信號的一部分或其預處理版本窗口化,以獲得所述輸入信號的處理版本; 其中,所述信號處理窗口值是與窗口值指數(shù)值(η)相關的多個變元值(π/2 · c’ (η))的正弦函數(shù)估算的結果值;以及 其中,所述變元值(η/2 · c’(η))是線性項(c(n))與一個或多個正弦型整形函數(shù)(sin(2 31 *f *c(n)))的函數(shù)值的加權和,所述線性項線性地取決于所述窗口值指數(shù)值(n),所述一個或多個正弦型整形函數(shù)(sin(2 π · f · c(n)))將窗口值指數(shù)值(η)映射到相應的函數(shù)值上,并且所述一個或多個正弦型整形函數(shù)關于窗口斜面(1630)的中心呈點對稱。
20.根據(jù)權利要求19所述的信號處理器,其中,利用
21.根據(jù)權利要求20所述的信號處理器,其中,f取值I和2。
22.根據(jù)權利要求20或21所述的信號處理器,其中, B1=O. 1224,容差為 +/-1% ;以及a2=0. 00523,容差為 +/_1%。
23.根據(jù)權利要求20所述的信號處理器,其中,f僅取值I;并且 B1=O. 1591,容差為 +/-1% ;以及 &2_0 ο
24.一種窗口提供器(300),用于根據(jù)一個或多個窗口形狀參數(shù)(310 ;af),提供用于多個窗口值指數(shù)值(η)的信號處理窗口值(w(n) -,W1 (η)),其中,所述窗口提供器被配置為估算與所述窗口值指數(shù)值(η)相關的多個變元值的正弦函數(shù),以獲得所述信號處理窗口值, 其中,所述窗口提供器被配置為計算線性項(c(n))與一個或多個整形函數(shù)的函數(shù)值的加權和,以獲得所述變元值,所述線性項線性地取決于所述窗口值指數(shù)值(n),所述一個或多個整形函數(shù)將窗口值指數(shù)值(η)映射到相應的函數(shù)值上,并且所述一個或多個整形函數(shù)關于窗口斜面(1630)的中心呈點對稱。
25.—種被編碼的媒體信號(400),所述被編碼的媒體信號包括 媒體內容的編碼表示(Q1GO、Qm (k));以及 一個或多個窗口形狀參數(shù)(af)或一個或多個比特流參數(shù),從其能夠得出窗口形狀參數(shù); 其中,所述一個或多個窗口形狀參數(shù)限定對所述媒體內容的編碼表示進行解碼時所使用的窗口的形狀; 其中,所述一個或多個窗口形狀參數(shù)描述了權重,所述權重用于計算線性項(c (η))與一個或多個整形函數(shù)的函數(shù)值的加權和,以獲得變元值,所述線性項線性地基于窗口值指數(shù)值(η),所述變元值用于通過估算多個所述變元值的正弦函數(shù)來得出多個窗口值指數(shù)值(η)的窗口值。
26.—種用于根據(jù)輸入信號提供所述輸入信號的處理版本的方法,所述方法包括 根據(jù)用于多個窗口值指數(shù)值的信號處理窗口值所描述的信號處理窗口,將所述輸入信號的一部分或其預處理版本窗口化,以獲得所述輸入信號的處理版本;以及 根據(jù)一個或多個窗口形狀參數(shù),提供用于多個窗口值指數(shù)值的所述信號處理窗口值,其中,對于與所述窗口值指數(shù)值相關的多個變元值,正弦函數(shù)被估算,以獲得所述信號處理窗口值;以及 其中,計算線性項與一個或多個整形函數(shù)的函數(shù)值的加權和,以獲得所述變元值,所述線性項線性地取決于所述窗口值指數(shù)值, 其中,所述一個或多個整形函數(shù)將窗口值指數(shù)值映射到相應的函數(shù)值上,并且其中,所述一個或多個整形函數(shù)關于所述信號處理窗口的窗口斜面的中心呈點對稱。
27.—種用于根據(jù)輸入信號提供所述輸入信號的處理版本的方法,所述方法包括 根據(jù)用于多個窗口值指數(shù)值的信號處理窗口值所描述的信號處理窗口,將所述輸入信號的一部分或其預處理版本窗口化,以獲得所述輸入信號的處理版本, 其中,所述信號處理窗口值是與窗口值指數(shù)值相關的多個變元值的正弦函數(shù)估算的結果值,其中,所述變元值是線性項與一個或多個正弦型整形函數(shù)的函數(shù)值的加權和,所述線性項線性地取決于窗口值指數(shù)值,所述一個或多個正弦型整形函數(shù)將窗口值指數(shù)值映射到相應的函數(shù)值上,并且所述一個或多個正弦型整形函數(shù)關于所述信號處理窗口的窗口斜面的中心呈點對稱。
28.一種用于根據(jù)一個或多個窗口形狀參數(shù)提供用于多個窗口值指數(shù)值的信號處理窗口值的方法,所述方法包括 估算與所述窗口值指數(shù)值相關的多個變元值的正弦函數(shù),以獲得所述信號處理窗口值;以及 計算線性項與一個或多個整形函數(shù)的函數(shù)值的加權和,以獲得所述變元值,所述線性項線性地取決于所述窗口值指數(shù)值,所述一個或多個整形函數(shù)將窗口值指數(shù)值映射到相應的函數(shù)值上,并且所述一個或多個整形函數(shù)關于所述信號處理窗口的窗口斜面的中心呈點對稱。
29.一種計算機程序,當所述計算機程序在計算機上運行時,用于執(zhí)行根據(jù)權利要求26至28中任一項所述的方法。
全文摘要
一種信號處理器,用于根據(jù)輸入信號提供輸入信號的處理版本,該信號處理器包括窗口化器,被配置為根據(jù)用于多個窗口值指數(shù)值的信號處理窗口值所描述的信號處理窗口,將輸入信號的一部分或其預處理版本窗口化,以獲得輸入信號的處理版本。該信號處理器還包括窗口提供器,用于根據(jù)一個或多個窗口形狀參數(shù),提供用于多個窗口值指數(shù)值的信號處理窗口值。
文檔編號G10L19/02GK102893329SQ201180023357
公開日2013年1月23日 申請日期2011年3月8日 優(yōu)先權日2010年3月11日
發(fā)明者克里斯蒂安·赫爾姆里希, 拉爾夫·蓋爾 申請人:弗蘭霍菲爾運輸應用研究公司