用于編碼和解碼激勵模式的方法和裝置的制作方法

文檔序號：2825074閱讀：218來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>樂器;聲學(xué)設(shè)備的制造及制作,分析技術(shù)

專利名稱：用于編碼和解碼激勵模式的方法和裝置的制作方法
技術(shù)領(lǐng)域：
本發(fā)明涉及一種用于編碼和解碼激勵模式的方法和裝置，根據(jù)該激勵模式確定音頻信號變換編解碼的掩蔽等級。
背景技術(shù)：
對于音頻變換編碼器中的譜數(shù)據(jù)的量化，需要心理聲學(xué)的信息，S卩，真正的掩蔽閾值的近似值(approximation)。在對應(yīng)的音頻變換解碼器中，相同的近似值用于重構(gòu)量化后的數(shù)據(jù)。在編碼器側(cè)，使用窗口函數(shù)對源信號的重疊部分進(jìn)行窗口化。在解碼器側(cè)，為解碼信號窗口執(zhí)行重疊+添加。為了限制要傳送的輔助信息數(shù)據(jù)量，正在使用像mp3和AAC的已知的變換編解碼器作為關(guān)鍵頻帶的掩蔽信息縮放因子(也被表示為“縮放因子頻帶”)，這意味著在量化處理之前對于一組相鄰頻率窗口(frequency bin)或者系數(shù)使用相同的縮放因子。 Cf. K. Brandenburg, Μ. Bosi 的"ISO/IEC MPEG_2Advanced Audio Coding :0verview and Applications”，第 103 屆 AES 大會(103rd AES Convention)，1997 年 9 月 26-29 日，紐約，預(yù)印版本No. 4641。然而，縮放因子僅僅代表掩蔽閾值的粗略的(步進(jìn)的)近似值。掩蔽閾值的這種表示的精度是非常有限的，這是因為(些許)不同的幅值頻率窗口的各組將得到相同的縮放因子，并且因此所應(yīng)用的掩蔽閾值對于顯著數(shù)目的頻率窗口不是最優(yōu)的。為了改進(jìn)編碼/解碼質(zhì)量，可以如以下所示來計算掩蔽等級S. van de Par，A. Kohlrausch，G. Charestan，R. Heusdens 的“A newpsychoacoustical masking mode 1 for audio coding applications”， ProceedingsICAS SP^ 02， IEEE International Conference on Acoustics， Speech and SignalProcessing, 2002，Orlando, vol. 2，pp. 1805-1808 ；S. van de Par，A. Kohlrausch，R. Heusdens，J. Jensen，S. H. Jen-sen 的 "APerceptual Model for Sinusoidal Audio Coding Based on Spectral Integration”， EURASIP Journal on Applied Signal Processing，vol. 2005 :9，pp. 1292-1304，其中，從要編碼的音頻信號的功率譜中導(dǎo)出的“激勵模式”中導(dǎo)出掩蔽閾值。在2005年5月28-31日巴塞羅那的第118屆AES大會0. Niemeyer, B. Edler的 "Efficient Coding of Excitation Patterns Combined with a TransformAudio Coder" 的第6466頁中描述了應(yīng)用這種用于掩蔽目的的激勵模式的音頻編解碼器。對于要編碼的每個譜的音頻數(shù)據(jù)塊，計算激勵模式，其中該激勵模式代表人耳的(真正的)依賴于頻率的心理聲學(xué)屬性。為了避免與基于縮放因子的掩蔽相比較而顯著增加作為結(jié)果的數(shù)據(jù)率，在每個情形下組合了 16個連續(xù)的激勵模式以便高效地編碼這些激勵模式。如在2004年11 月白勺 IEEE Transactions on Circuits and Systems for VideoTechnology, vol. 14, no.11， pp.1219-1235 的 W.A. Pearlman, A. Islam, N.Nagaraj, A.Said ^"Efficient,Low-Complexity Image Coding With a Set-PartitioningEmbedded Block Coder"中所描述的對于圖像編碼應(yīng)用將激勵模式矩陣值進(jìn)行SPECK (Set Partitioning Embedded bloCK，集合分裂嵌入塊)編碼。在利用激勵模式值建立頻率和時間上的2維矩陣和對數(shù)尺度矩陣值的2維DCT變換之后執(zhí)行實際的激勵模式編碼。對作為結(jié)果的變換系數(shù)從最高有效的那個開始在比特平面上進(jìn)行量化和熵編碼，由此將SPECK編碼的位置和系數(shù)的符號傳遞到音頻解碼器作為比特流輔助信息。在編碼器和解碼器側(cè)，為計算要在音頻信號編碼和解碼中應(yīng)用的掩蔽閾值，對應(yīng)地解碼編碼的激勵模式，使得計算后的掩蔽閾值在編碼器和解碼器二者中相同。音頻信號量化由作為結(jié)果的改進(jìn)的掩蔽閾值來控制。不同的窗口 /變換長度用于音頻信號編碼，而固定長度用于激勵模式。這種激勵模式音頻編碼處理的缺點是在編碼器中為多個塊一起編碼激勵模式造成的處理延遲，但是其可以實現(xiàn)用于編碼譜數(shù)據(jù)的掩蔽閾值的更精確的表示并且由此增加編碼/解碼質(zhì)量，同時多個塊的組合的激勵模式編碼僅僅造成輔助信息數(shù)據(jù)的少量增加。

發(fā)明內(nèi)容
在上述的Niemeyer/Edler處理中，從激勵模式導(dǎo)出的掩蔽閾值與在音頻信號編碼中選擇的窗口和變換長度無關(guān)。替代地，從音頻信號的定長部分中導(dǎo)出激勵模式。然而，短的窗口和變換長度代表更高的時間分辨率并且針對最優(yōu)的編碼/解碼質(zhì)量，有關(guān)掩蔽閾值的等級應(yīng)當(dāng)相應(yīng)地適配。本發(fā)明要解決的問題是通過改進(jìn)掩蔽閾值計算來進(jìn)一步提高音頻信號編碼/解碼的質(zhì)量，而不造成輔助信息數(shù)據(jù)率的增加。通過在權(quán)利要求1和5中公開的方法來解決該問題。在權(quán)利要求2和6中公開了利用這些方法的裝置。根據(jù)本發(fā)明，對于在音頻信號的編碼中要量化的每個譜，計算并編碼激勵模式，即，對于每個較短的窗口 /變換，計算其自身的激勵模式并且由此該激勵模式的時間分辨率是可變的。在對應(yīng)的矩陣或者塊中將用于長窗口/變換和用于較短的窗口/變換的激勵模式編組在一起。激勵模式數(shù)據(jù)量對于長窗口 /變換長度與較短的窗口 /變換長度(即，對于非瞬態(tài)源信號部分和對于瞬態(tài)源信號部分)二者是相同的。因此，在每個幀中激勵模式矩陣可以具有不同數(shù)目的行。關(guān)于激勵模式編碼，在可選的對矩陣值進(jìn)行的對數(shù)計算之后，向二維變換的激勵模式數(shù)據(jù)矩陣值應(yīng)用預(yù)定的掃描或者排序順序，并且通過重新排序，可以形成方形矩陣，對于該方形矩陣，向其矩陣比特平面直接應(yīng)用SPECK編碼。僅僅編碼掃描路徑的固定數(shù)目的值。原則上，本發(fā)明的編碼方法適合編碼激勵模式，在對應(yīng)的激勵模式解碼之后，根據(jù)該激勵模式確定用于音頻信號編碼的掩蔽等級，其中對于所述音頻信號編碼，使用不同的窗口和譜變換長度連續(xù)地處理所述音頻信號，并且代表給定的多個最長的變換長度的音頻信號的部分被表示為幀，并且其中所述激勵模式與所述音頻信號的連續(xù)部分的譜表示相關(guān)，所述方法包括以下步驟a)對于所述音頻信號的當(dāng)前幀，在針對對應(yīng)的一組連續(xù)激勵模式的情形下形成激勵模式矩陣P，其中對于所述不同譜變換長度中的每一個譜變換長度，在所述矩陣P中包括對應(yīng)的激勵模式，并且對每個矩陣P的條目取對數(shù)，
并且其中，在作為結(jié)果的矩陣尺寸不適合于之后步驟的變換的情況下，通過將位于矩陣邊界的激勵模式的值復(fù)制必需的次數(shù)來增加矩陣的尺寸；b)對取了對數(shù)的矩陣P值應(yīng)用二維變換，產(chǎn)生矩陣Pt ；c)向所述矩陣Pt中的系數(shù)應(yīng)用預(yù)定的排序順序，所述預(yù)定的排序順序依賴于矩陣尺寸，該矩陣尺寸依賴于當(dāng)前幀中非最長的變換長度的數(shù)目并且通過對應(yīng)的排序索引來表示，并且，從第一個值開始僅僅取得對應(yīng)的排序路徑的固定數(shù)目的值，利用這些值形成矩陣 Pt的方形版本Ρτ、d)執(zhí)行對矩陣P”的SPECK編碼，其中處理矩陣P”的SPECK編碼比特平面并且使用連續(xù)的分區(qū)來定位并編碼所述比特平面中的對應(yīng)系數(shù)比特的位置。原則上，本發(fā)明的編碼裝置是一種音頻信號編碼器，其中激勵模式被編碼，在對應(yīng)的激勵模式解碼之后，根據(jù)該激勵模式，確定用于編碼所述音頻信號的掩蔽等級，其中為編碼所述音頻信號，使用不同的窗口和譜變換長度連續(xù)地處理音頻信號并且代表給定的多個最長的變換長度的音頻信號的部分被表示為幀，并且其中所述激勵模式與所述音頻信號的連續(xù)部分的譜表示相關(guān)，所述裝置包括-適配為對于所述音頻信號的當(dāng)前幀、在每個針對對應(yīng)的一組連續(xù)激勵模式的情形下形成激勵模式矩陣P并且對每個矩陣P的條目取對數(shù)的部件，其中對于所述不同譜變換長度中的每一個譜變換長度，在所述矩陣P中包括對應(yīng)的激勵模式，并且其中，在作為結(jié)果的矩陣尺寸不適合于之后步驟的變換的情況下，通過將位于矩陣邊界的激勵模式的值復(fù)制必需的次數(shù)來增加矩陣的尺寸，并且其中對取了對數(shù)的矩陣P的值應(yīng)用二維變換，產(chǎn)生矩陣Ρτ，以及其中向所述矩陣Pt中的系數(shù)應(yīng)用預(yù)定的排序順序，所述預(yù)定的排序順序依賴于矩陣尺寸，該矩陣尺寸依賴于當(dāng)前幀中非最長的變換長度的數(shù)目并且通過對應(yīng)的排序索引來表示，以及其中從第一個值開始僅僅取得對應(yīng)的排序路徑的固定數(shù)目的值，利用這些值形成矩陣Pt的方形版本P” ；-適配為對矩陣Ρτ<1執(zhí)行SPECK編碼的部件，其中處理矩陣P”的SPECK編碼比特平面并且使用連續(xù)的分區(qū)來定位并編碼所述比特平面中的對應(yīng)系數(shù)比特的位置。原則上，本發(fā)明的解碼方法適合于解碼根據(jù)上述編碼方法編碼的激勵模式，根據(jù)該激勵模式確定用于對編碼的音頻信號進(jìn)行解碼的掩蔽等級，其中對于所述音頻信號解碼，使用不同的窗口和譜的逆變換長度連續(xù)地處理所述音頻信號并且代表給定的多個最長的變換長度的音頻信號的部分被表示為幀，并且其中所述激勵模式與所述音頻信號的連續(xù)部分的譜表示相關(guān)，所述方法包括以下步驟a)對從比特流接收的對應(yīng)數(shù)據(jù)執(zhí)行所述方形矩陣P”的對應(yīng)的SPECK解碼；b)向重構(gòu)的矩陣嚴(yán)數(shù)據(jù)附加零以便重新獲得如在編碼中使用的排序路徑中的原始數(shù)目的數(shù)據(jù)，并且根據(jù)用于當(dāng)前矩陣的排序索引通過應(yīng)用如在編碼中使用的逆排序順序?qū)⑦@些數(shù)據(jù)轉(zhuǎn)換回重構(gòu)的矩陣Pt，其中該排序索引還用于建立合適的矩陣尺寸；c)在矩陣Pt上應(yīng)用對應(yīng)的逆二維變換和反對數(shù)以便重新獲得重構(gòu)的激勵模式矩陣P。原則上，本發(fā)明的解碼裝置是一種音頻信號解碼器，其中對根據(jù)上述編碼方法編碼的激勵模式進(jìn)行解碼并且將其用于確定對編碼的音頻信號進(jìn)行解碼的掩蔽等級，其中對
7于所述音頻信號的解碼，使用不同的窗口和譜的逆變換長度連續(xù)地處理所述音頻信號并且代表給定的多個最長的變換長度的音頻信號的部分被表示為幀，并且其中所述激勵模式與所述音頻信號的連續(xù)部分的譜表示相關(guān)，所述裝置包括-適配于進(jìn)行以下處理的部件用于對從比特流接收的對應(yīng)數(shù)據(jù)執(zhí)行所述方形矩陣ph的對應(yīng)的SPECK解碼，和用于向重構(gòu)的矩陣數(shù)據(jù)附加零以便重新獲得如在編碼中使用的排序路徑中的原始數(shù)目的數(shù)據(jù)，并且用于根據(jù)當(dāng)前矩陣的排序索引通過應(yīng)用如在編碼中使用的逆排序順序?qū)⑦@些數(shù)據(jù)轉(zhuǎn)換回重構(gòu)的矩陣Pt，其中該排序索引還用于建立合適的矩陣尺寸；并且用于在矩陣Pt上應(yīng)用對應(yīng)的逆二維變換和反對數(shù)以便重新獲得重構(gòu)的激勵模式矩陣P ；-適配為根據(jù)矩陣P的激勵模式計算所述掩蔽閾值的部件；-適配為使用所述掩蔽閾值對所述編碼的音頻信號進(jìn)行解碼和重新量化，并且對作為結(jié)果的信號進(jìn)行逆變換并且在其上應(yīng)用重疊+添加處理的部件。在相應(yīng)的從屬權(quán)利要求中公開了本發(fā)明的有利的附加實施例。

參照附圖來描述本發(fā)明的示例實施例，在附圖中圖1示出本發(fā)明的編碼器的框圖；圖2示出本發(fā)明的解碼器的框圖；圖3示出激勵模式編碼的流程圖；圖4示出激勵模式解碼的流程圖。
具體實施例方式在圖1的本發(fā)明的音頻變換編碼器的框圖中，音頻輸入信號10通過超前 (look-ahead)延遲121傳遞到瞬態(tài)檢測器級或階11，瞬態(tài)檢測器級或階11選擇在頻率變換級或階12中在輸入信號10上要應(yīng)用的當(dāng)前窗口類型WT。在級/階12中，使用具有與當(dāng)前窗口類型對應(yīng)的塊長度的調(diào)制交疊變換(MLT)，例如，MDCT(修改的離散余弦變換)。將 K個輸入信號樣本的連續(xù)部分輸入到級/階12，其中K具有例如“ 128”或者“ IOM”的值。由于50%窗口重疊，變換長度是N = 2*K。在對應(yīng)的級/階15中對變換的音頻信號進(jìn)行量化和熵編碼。如同在級/階14中的激勵模式塊處理，不是必須在級/階15中按塊對變換系數(shù)進(jìn)行處理。在輸出編碼的比特流17的比特流多路復(fù)用級/階16中對編碼的頻率窗口 CFB、窗口類型碼WT、激勵數(shù)據(jù)矩陣碼ΕΡΜ，以及可能的其他輔助信息數(shù)據(jù)進(jìn)行多路復(fù)用。如上述的，在部分14中計算激勵模式需要功率譜。為了得到功率譜，在級/階12 中還使用MDST (修改的離散正弦變換)來變換當(dāng)前窗口化的信號塊。MLT和MDST類型的兩種頻率表示被饋入存儲直至L個塊的緩沖器13中，其中L是例如“8”或“16”。當(dāng)前窗口類型碼還經(jīng)由與一個塊變換時段對應(yīng)的延遲111被饋入緩沖器13。每個變換的輸出包含用于一個信號塊的K個頻率窗口。如果在級/階11中檢測到瞬態(tài)，則通過整數(shù)個Ls個短窗口 (即，塊)而不是長度N = 2Κ的單個長窗口來對時域輸入信號進(jìn)行窗口化，其中Ls是例如“3”或者“8”，并且其中用于一個長信號塊的所有短窗口的頻率窗口的總數(shù)是K。L個數(shù)目的信號塊形成被表示為“幀”的一數(shù)據(jù)組。在級/階141中向幀的激勵模式應(yīng)用激勵模式編碼。對于隨后要量化的每個譜，計算一個激勵模式。該特征不同于上述的Brandenburg and the Niemeyer/Edler的公開中描述的音頻編碼和其中使用激勵模式的固定時間分辨率的以下標(biāo)準(zhǔn)(國際標(biāo)準(zhǔn)IS0/IEC 11172-3 "Information technology-Coding of moving pictures andassociated audio for digital storage media at up to about 1,5Mbit/s-Part 3 :Audio", _ U t示IS0/IEC 13818-3"Information technology-Generic coding ofmoving pictures and associated audio information-Part 3 :Audio")巾才百jS白勺·IE。激勵模式數(shù)據(jù)量對于長變換長度和短變換長度二者是相同的。結(jié)果，對于包含短窗口的信號塊比對于包含長窗口的信號塊必須要編碼更多的激勵模式數(shù)據(jù)。優(yōu)選地在具有非方形形狀的矩陣P中排列要編碼的激勵模式。該矩陣的每一行包含與要量化的一個譜對應(yīng)的一個激勵模式。由此，行和列的索引分別對應(yīng)于時間軸和頻率軸。矩陣P中的行數(shù)至少是L，但是與Niemeyer/Edler公開中描述的處理相反，矩陣P可以在每個幀中具有不同行數(shù)，這是因為該數(shù)目將依賴于相應(yīng)幀中短窗口的數(shù)目。作為替換，可以交換矩陣P的行和列。為了應(yīng)用2維變換(例如，通過使用兩個級聯(lián)的1維DCT)，可以復(fù)制矩陣的最后一行(或者甚至更多行)以便得到該變換可以處理的行數(shù)(例如，偶數(shù))。表1示出了可能導(dǎo)致11行的、具有使用短窗口的一個塊的幀的示例。因為2維變換可以處理作為“4”的倍數(shù)的輸入尺寸，所以復(fù)制最后一行
塊索引窗口類型模式索引1長12開始23短33短43短53短64停止75長86長97長10
權(quán)利要求
1.一種編碼(141)激勵模式的方法，在對應(yīng)的激勵模式解碼(14 之后，根據(jù)該激勵模式確定(143)用于音頻信號(10)編碼(11，12，15)的掩蔽等級，其中對于所述音頻信號編碼，使用不同的窗口和譜變換長度連續(xù)地處理(12,1 所述音頻信號，并且代表給定的多個(L個)最長的變換長度的音頻信號的部分被表示為幀，并且其中所述激勵模式與所述音頻信號的連續(xù)部分的譜表示(1 相關(guān)，所述方法包括以下步驟a)對于所述音頻信號(10)的當(dāng)前幀，在每個針對對應(yīng)的一組連續(xù)激勵模式的情形中形成(12，13，31)激勵模式矩陣P，其中對于所述不同的譜變換長度中的每一個譜變換長度，在所述矩陣P中包括對應(yīng)的激勵模式，并且對每個矩陣P的條目取對數(shù)(3 ，并且其中，在作為結(jié)果的矩陣尺寸不適合于之后步驟的變換的情況下，通過將位于矩陣邊界的激勵模式的值復(fù)制必需的次數(shù)來增加矩陣的尺寸；b)對取了對數(shù)的矩陣P的值應(yīng)用(33)二維變換，產(chǎn)生矩陣Pt ；c)向所述矩陣Pt中的系數(shù)應(yīng)用(3 預(yù)定的排序順序，所述預(yù)定的排序順序依賴于矩陣尺寸，該矩陣尺寸依賴于當(dāng)前幀中非最長的變換長度的數(shù)目并且通過對應(yīng)的排序索引來表示，以及，從第一個值開始僅僅取得對應(yīng)的排序路徑的固定數(shù)目的值，利用這些值形成 (35)矩陣Pt的方形版本Ρτ、d)對矩陣執(zhí)行(36)SPECK編碼，其中處理矩陣I^WSPECK編碼比特平面并且使用連續(xù)的分區(qū)來定位并編碼所述比特平面中的對應(yīng)系數(shù)比特的位置。
2.一種解碼( 根據(jù)權(quán)利要求1的方法編碼的激勵模式的方法，根據(jù)該激勵模式確定(M3)用于對編碼的音頻信號(XT)進(jìn)行解碼(25，23)的掩蔽等級，其中對于所述音頻信號解碼，使用不同的窗口和譜的逆變換長度連續(xù)地處理所述音頻信號并且代表給定的多個 (L個)最長的變換長度的音頻信號的部分被表示為幀，并且其中所述激勵模式與所述音頻信號的連續(xù)部分的譜表示(1 相關(guān)，所述方法包括以下步驟a)對從比特流接收06)的對應(yīng)數(shù)據(jù)(EPM)執(zhí)行所述方形矩陣的對應(yīng)的SPECK 解碼；b)向重構(gòu)的矩陣數(shù)據(jù)附加G2)零以便重新獲得如在編碼中使用的排序路徑中的原始數(shù)目的數(shù)據(jù)，并且根據(jù)用于當(dāng)前矩陣的排序索引通過應(yīng)用如在編碼中使用的逆排序順序?qū)⑦@些數(shù)據(jù)轉(zhuǎn)換G3)回重構(gòu)的矩陣Pt，其中該排序索引還用于建立合適的矩陣尺寸；c)在矩陣Pt上應(yīng)用(45，46)對應(yīng)的逆二維變換和反對數(shù)以便重新獲得重構(gòu)的激勵模式矩陣P。
3.根據(jù)權(quán)利要求1的方法，其中在步驟b)和c)之間，通過移除代表在統(tǒng)計上具有最低幅度的頻率的至少一個矩陣邊界列或行來減少矩陣Pt的尺寸。
4.根據(jù)權(quán)利要求1或3的方法，其中在編碼的音頻信號比特流中包括用于發(fā)信號通知當(dāng)前窗口和譜變換長度的窗口類型碼(WT)以及可選地發(fā)信號通知當(dāng)前矩陣尺寸的排序索引。
5.根據(jù)權(quán)利要求2的方法，其中在步驟b)和c)之間，利用零來填充G4)代表在統(tǒng)計上具有最低幅度的頻率的矩陣邊界列或行的缺少的值以便重新獲得所述重構(gòu)的矩陣Ρτ。
6.根據(jù)權(quán)利要求2或5的方法，其中根據(jù)每幀的短窗口的數(shù)目來自動地確定矩陣尺寸以及排序索引。
7.根據(jù)權(quán)利要求1至6中任一項的方法，其中所述窗口和譜變換長度具有兩種類型長的和短的，并且其中起始窗口在短窗口之前，停止窗口接在短窗口之后。
8.根據(jù)權(quán)利要求1至7中任一項的方法，其中代表矩陣P”的值的符號的比特在沒有特定的編碼的情況下被包括在編碼的音頻信號比特流中。
9.根據(jù)權(quán)利要求1以及3-8的任一項的方法，其中，在音頻信號(10)是多聲道音頻信號的情形下，對于當(dāng)前幀，在激勵模式編碼(141)中在所有聲道中使用相同的矩陣尺寸，并且在以下多聲道編碼模式k中的至少一個中編碼單獨的矩陣；-每聲道的交錯的激勵模式； -具有聲道數(shù)據(jù)的組合的矩陣； -每個聲道的一個單獨的矩陣，并且其中在比特流中包括代表所述編碼模式k的代碼，并且在激勵模式解碼處理 (142，242)中對應(yīng)地使用該代碼。
10.一種編碼(141)激勵模式的音頻信號編碼器，在對應(yīng)的激勵模式解碼(14 之后，根據(jù)該激勵模式確定(14 所述音頻信號(10)的編碼(11，12，1幻的掩蔽等級，其中為編碼所述音頻信號，使用不同的窗口和譜變換長度連續(xù)地處理所述音頻信號并且代表給定的多個(L個)最長的變換長度的音頻信號的部分被表示為幀，并且其中所述激勵模式與所述音頻信號的連續(xù)部分的譜表示(1 相關(guān)，所述裝置包括-適配為對于所述音頻信號的當(dāng)前幀、在每個針對對應(yīng)的一組連續(xù)激勵模式的情形中形成激勵模式矩陣P并且對每個矩陣P的條目取對數(shù)的部件(12，13，141)，其中對于所述不同譜變換長度中的每一個譜變換長度，在所述矩陣P中包括對應(yīng)的激勵模式，并且其中，在作為結(jié)果的矩陣尺寸不適合于之后步驟的變換的情況下，通過將位于矩陣邊界的激勵模式的值復(fù)制必需的次數(shù)來增加矩陣的尺寸，并且其中對取了對數(shù)的矩陣P的值應(yīng)用二維變換，產(chǎn)生矩陣^，以及其中向所述矩陣^ 中的系數(shù)應(yīng)用預(yù)定的排序順序，所述預(yù)定的排序順序依賴于矩陣尺寸，該矩陣尺寸依賴于當(dāng)前幀中非最長的變換長度的數(shù)目并且通過對應(yīng)的排序索引來表示，以及其中從第一個值開始僅僅取得對應(yīng)的排序路徑的固定數(shù)目的值，利用這些值形成矩陣Pt的方形版本P” ；-適配為對矩陣Ptq執(zhí)行SPECK編碼的部件，其中處理矩陣P”的SPECK編碼比特平面并且使用連續(xù)的分區(qū)來定位并編碼所述比特平面中的對應(yīng)系數(shù)比特的位置。
11.一種音頻信號解碼器，其中對根據(jù)權(quán)利要求1的方法編碼的激勵模式進(jìn)行解碼并且將其用于確定對編碼的音頻信號(XT)進(jìn)行解碼的掩蔽等級，其中對于所述音頻信號的解碼，使用不同的窗口和譜的逆變換長度連續(xù)地處理所述音頻信號并且代表給定的多個(L 個)最長的變換長度的音頻信號的部分被表示為幀，并且其中所述激勵模式與所述音頻信號的連續(xù)部分的譜表示相關(guān)，所述裝置包括-適配于用于以下處理的部件042)用于對從比特流接收的對應(yīng)數(shù)據(jù)(EPM)執(zhí)行 (41)所述方形矩陣嚴(yán)的對應(yīng)的SPECK解碼，和用于向重構(gòu)的矩陣嚴(yán)的數(shù)據(jù)附加02)零以便重新獲得如在編碼中使用的排序路徑中的原始數(shù)目的數(shù)據(jù)，并且用于根據(jù)當(dāng)前矩陣的排序索引通過應(yīng)用如在編碼中使用的逆排序順序?qū)⑦@些數(shù)據(jù)轉(zhuǎn)換G3)回重構(gòu)的矩陣Pt，其中該排序索引還用于建立合適的矩陣尺寸；并且用于在矩陣Pt上應(yīng)用(45，46)對應(yīng)的逆二維變換和反對數(shù)以便重新獲得重構(gòu)的激勵模式矩陣P;-適配為根據(jù)矩陣P的激勵模式計算所述掩蔽閾值的部件043)； -適配為使用所述掩蔽閾值對所述編碼的音頻信號進(jìn)行解碼和重新量化，并且對作為結(jié)果的信號進(jìn)行逆變換并且在其上應(yīng)用重疊+添加處理的部件05，23)。
12.根據(jù)權(quán)利要求10的裝置，其中在所述二維變換和所述應(yīng)用所述預(yù)定的排序順序之間，通過移除代表在統(tǒng)計上具有最低幅度的頻率的至少一個矩陣邊界列或行來減少矩陣Pt 的尺寸。
13.根據(jù)權(quán)利要求10或12的裝置，其中在編碼的音頻信號比特流中包括用于發(fā)信號通知當(dāng)前窗口和譜變換長度的窗口類型碼(WT)以及可選地發(fā)信號通知當(dāng)前矩陣尺寸的排序索引。
14.根據(jù)權(quán)利要求11的裝置，其中在所述逆排序之后，利用零來填充G4)代表在統(tǒng)計上具有最低幅度的頻率的矩陣邊界列或行的缺少的值以便重新獲得所述重構(gòu)的矩陣Ρτ。
15.根據(jù)權(quán)利要求11或14的裝置，其中根據(jù)每幀的短窗口的數(shù)目來自動地確定矩陣尺寸以及排序索引。
16.根據(jù)權(quán)利要求10至15中任一項的裝置，其中所述窗口和譜變換長度具有兩種類型長的和短的，并且其中起始窗口在短窗口之前，停止窗口接在短窗口之后。
17.根據(jù)權(quán)利要求10至16中任一項的裝置，其中代表矩陣P”的值的符號比特在沒有特定的編碼的情況下被包括在編碼的音頻信號比特流中。
18.一種根據(jù)權(quán)利要求1、3、4以及7-9中的任一項的方法編碼的數(shù)字音頻信號。
19.一種包含或存儲、或者已經(jīng)在其上記錄根據(jù)權(quán)利要求18的數(shù)字音頻信號的存儲介質(zhì)。
全文摘要
用于編碼和解碼激勵模式的方法和裝置。對于音頻變換編碼器中的譜數(shù)據(jù)的量化，需要心理聲學(xué)信息，即，真正的掩蔽閾值的近似值。根據(jù)本發(fā)明，對音頻信號編碼中要量化的每個譜，為長和短窗口/變換長度計算并編碼激勵模式。在可變尺寸的矩陣中將各激勵模式編組在一起。僅僅向激勵模式數(shù)據(jù)矩陣值應(yīng)用具有固定數(shù)目的值的預(yù)定的排序順序，并且通過重新排列順序形成向矩陣的比特平面應(yīng)用SPECK編碼的方形矩陣。
文檔編號G10L19/08GK102201238SQ201110071448
公開日2011年9月28日申請日期2011年3月24日優(yōu)先權(quán)日2010年3月24日
發(fā)明者奧利弗.沃博爾特, 弗洛里安.基勒, 約翰尼斯.貝姆申請人:湯姆森特許公司

完整全部詳細(xì)技術(shù)資料下載