用于多通道音頻的平滑配置切換的制作方法
【專利摘要】解碼系統(tǒng)(100)基于輸入信號(hào)(A)重構(gòu)n通道音頻信號(hào),所述輸入信號(hào)通過參數(shù)譯碼表示音頻信號(hào)或者將音頻信號(hào)表示為n個(gè)離散譯碼通道。參數(shù)解碼基于控制空間合成級(jí)(150)的混合參數(shù)(a)以及核心信號(hào)進(jìn)行,所述空間合成級(jí)被從下混級(jí)(140)供給下混信號(hào)。選擇器(170)在穩(wěn)態(tài)的參數(shù)解碼模式和離散解碼模式下控制解碼系統(tǒng)的組件,并且在這些模式之間進(jìn)行轉(zhuǎn)變。下混級(jí)基于n通道信號(hào)實(shí)現(xiàn)下混信號(hào)上的投影,所述n通道信號(hào)是n通道輸入信號(hào)或者填充有中性值的核心信號(hào)。下混級(jí)在其中輸入信號(hào)通過參數(shù)譯碼表示音頻信號(hào)的每個(gè)時(shí)間幀中以及至少在每段參數(shù)譯碼時(shí)間幀中的最后一個(gè)時(shí)間幀之后的第一個(gè)時(shí)間幀中工作。
【專利說明】用于多通道音頻的平滑配置切換
【技術(shù)領(lǐng)域】
[0001] 本文中所公開的本發(fā)明總地涉及視聽媒體發(fā)布。具體地講,本發(fā)明涉及一種使得 能夠在解碼期間實(shí)現(xiàn)高比特率模式和低比特率模式兩者以及無縫模式轉(zhuǎn)變的自適應(yīng)發(fā)布 格式。本發(fā)明還涉及用于根據(jù)發(fā)布格式對(duì)信號(hào)進(jìn)行編碼和解碼的方法和裝置。
【背景技術(shù)】
[0002] 就收聽質(zhì)量而言,參數(shù)立體聲和多通道譯碼方法已知是可伸縮的并且有效率的, 這使得它們?cè)诘捅忍芈蕬?yīng)用中特別有吸引力。然而,在比特率限制是瞬變的性質(zhì)(例如,網(wǎng) 絡(luò)抖動(dòng)、載荷變化)的情況下,可以通過使用自適應(yīng)發(fā)布格式來獲得可供使用的網(wǎng)絡(luò)資源 的充分益處,其中,在正常狀況下使用相對(duì)高的比特率,當(dāng)網(wǎng)絡(luò)運(yùn)行不良時(shí),使用較低的比 特率?,F(xiàn)有的自適應(yīng)發(fā)布格式和相關(guān)聯(lián)的譯碼(coding/碼化)(解碼)技術(shù)可以從它們的 帶寬效率、計(jì)算效率、差錯(cuò)恢復(fù)、算法延遲的角度來進(jìn)行改進(jìn),并且進(jìn)一步,在視聽媒體發(fā)布 中就比特率切換事件對(duì)于享用解碼的媒體的人的明顯程度來進(jìn)行改進(jìn)。
【專利附圖】
【附圖說明】
[0003] 現(xiàn)在將參照附圖來描述本發(fā)明的實(shí)施例,其中:
[0004] 圖1是根據(jù)本發(fā)明的示例實(shí)施例的解碼系統(tǒng)的總體框圖;
[0005] 圖2類似于圖1,示出根據(jù)本發(fā)明的示例實(shí)施例的編碼系統(tǒng);
[0006] 圖3例示位于編碼器和解碼器側(cè)的下混級(jí)的機(jī)能;
[0007] 圖4示出用于部署在解碼系統(tǒng)中的根據(jù)示例實(shí)施例的上混級(jí)的細(xì)節(jié);
[0008] 圖5示出用于部署在解碼系統(tǒng)中的根據(jù)示例實(shí)施例的空間合成級(jí)的細(xì)節(jié);
[0009] 圖6例示在配備有圖5的空間合成級(jí)的示例解碼系統(tǒng)中出現(xiàn)的數(shù)據(jù)信號(hào)和控制信 號(hào);
[0010] 圖7示出用于部署在解碼系統(tǒng)中的根據(jù)示例實(shí)施例的空間合成級(jí)的細(xì)節(jié);
[0011] 圖8例示在配備有圖7的空間合成級(jí)的示例解碼系統(tǒng)中出現(xiàn)的數(shù)據(jù)信號(hào)和控制信 號(hào);
[0012] 圖9示出根據(jù)本發(fā)明的示例實(shí)施例的將信息發(fā)送到解碼器裝置的編碼系統(tǒng);
[0013] 圖10例示在配備有圖5的空間合成級(jí)的示例解碼系統(tǒng)中出現(xiàn)的數(shù)據(jù)信號(hào)和控制 信號(hào);
[0014] 圖11是根據(jù)本發(fā)明的示例實(shí)施例的解碼系統(tǒng)的總體框圖;和
[0015] 圖12示出用于部署在解碼系統(tǒng)中的根據(jù)示例實(shí)施例的音頻解碼器的細(xì)節(jié)。
[0016] 所有的附圖都是示意性的,并且僅從大體上示出了為了闡明本發(fā)明而必需的部 分,而其他部分則可以被略去或者僅僅被建議。除非另有指示,否則相似的標(biāo)號(hào)在不同圖中 指示相似的部分。
【具體實(shí)施方式】
[0017] I.概沭
[0018] 如本文中所使用的,音頻信號(hào)可以是純音頻信號(hào)、視聽信號(hào)或多媒體信號(hào)的音頻 部分、或者與元數(shù)據(jù)組合的這些信號(hào)中的任何一個(gè)。
[0019] 在本發(fā)明的第一方面內(nèi),示例性實(shí)施例提出了使得能夠以改進(jìn)的比特率選擇能力 和/或減小的延遲來自適應(yīng)地發(fā)布媒體內(nèi)容(諸如音頻或視頻內(nèi)容)的方法和裝置。示例 實(shí)施例還提供了適合于這樣的自適應(yīng)媒體發(fā)布的譯碼格式,所述譯碼格式有助于比特率之 間的無縫轉(zhuǎn)變。
[0020] 本發(fā)明的示例實(shí)施例提供具有獨(dú)立權(quán)利要求中所闡述的特征的編碼方法、編碼系 統(tǒng)、解碼方法、解碼系統(tǒng)、音頻發(fā)布系統(tǒng)和計(jì)算機(jī)程序產(chǎn)品。
[0021] 解碼系統(tǒng)適于基于輸入信號(hào)重構(gòu)音頻信號(hào),所述輸入信號(hào)可以直接提供給解碼系 統(tǒng),或者可替代地可以被用解碼系統(tǒng)所接收的比特流進(jìn)行編碼。輸入信號(hào)被分割為與音頻 信號(hào)的(重疊的或相連的)時(shí)間段相應(yīng)的時(shí)間巾貞。輸入信號(hào)的一個(gè)時(shí)間巾貞根據(jù)譯碼機(jī)制表 示音頻信號(hào)的時(shí)間段,所述譯碼機(jī)制選自包括參數(shù)譯碼和離散譯碼的一組譯碼機(jī)制。特別 地,如果編碼的音頻信號(hào)是η通道信號(hào),則輸入信號(hào)在所接收的它被離散譯碼的幀中(至 少)包含相等數(shù)量的通道,即,在離散譯碼機(jī)制中,η個(gè)離散編碼的通道被用于表示音頻信 號(hào)。在參數(shù)譯碼的所接收的幀中,輸入信號(hào)包括比η個(gè)通道少的通道(但是它可以是η通 道格式,其中一些通道不被使用),但是可以另外包括元數(shù)據(jù),諸如在編碼處理期間例如通 過計(jì)算信號(hào)能量值或相關(guān)系數(shù)從音頻信號(hào)推導(dǎo)的至少一個(gè)混合參數(shù)??商娲?,所述至少 一個(gè)混合參數(shù)可以通過不同的通信路徑(例如,經(jīng)由與承載輸入信號(hào)的比特流分離的元數(shù) 據(jù)比特流)被供給解碼系統(tǒng)。如所指出的,輸入信號(hào)可以處于至少兩種不同的機(jī)制(即,參 數(shù)譯碼或離散譯碼),解碼系統(tǒng)通過轉(zhuǎn)變到--或者保持處于--參數(shù)模式或離散模式來 對(duì)這些機(jī)制做出反應(yīng)。系統(tǒng)的轉(zhuǎn)變可以具有有限的持續(xù)時(shí)間,使得解碼系統(tǒng)只有在一個(gè)或 多個(gè)時(shí)間幀過去之后才進(jìn)入輸入信號(hào)的當(dāng)前譯碼機(jī)制所引起的模式。因此,在操作中,解碼 系統(tǒng)的模式可能落后于輸入信號(hào)的機(jī)制與一個(gè)或多個(gè)時(shí)間幀相應(yīng)的時(shí)段。參數(shù)譯碼時(shí)間幀 集合(印isode)是指全都通過參數(shù)譯碼表示音頻信號(hào)的一個(gè)或多個(gè)連續(xù)時(shí)間幀的序列。類 似地,離散譯碼時(shí)間幀集合是具有η個(gè)離散譯碼通道的一個(gè)或多個(gè)連續(xù)時(shí)間幀的序列。如 本文中所使用的,解碼系統(tǒng)在如下這樣的那些時(shí)間幀中處于參數(shù)模式,在那些時(shí)間幀中,解 碼系統(tǒng)輸出對(duì)于幀持續(xù)時(shí)間的更大部分是通過空間合成而生成的(不管底層數(shù)據(jù)的來源 如何);離散模式是指在其中解碼系統(tǒng)不處于參數(shù)模式的任何時(shí)間幀。
[0022] 解碼系統(tǒng)包括下混級(jí),所述下混級(jí)適于基于輸入信號(hào)輸出m通道下混信 號(hào)。優(yōu)選地,解碼系統(tǒng)接受控制下混操作的定量和/或定性方面的下混規(guī)范(downmix specification),例如,下混級(jí)所形成的將在任何線性組合中施加的增益。優(yōu)選地,下混規(guī)范 是可被從數(shù)據(jù)通信或存儲(chǔ)介質(zhì)提供給至少一個(gè)進(jìn)一步的下混級(jí)的數(shù)據(jù)結(jié)構(gòu),所述進(jìn)一步的 下混級(jí)例如是將輸入信號(hào)或者對(duì)輸入信號(hào)進(jìn)行編碼的比特流提供給解碼系統(tǒng)的編碼器中 的具有類似的或不同的結(jié)構(gòu)特性的下混級(jí)。這樣,可以確保這些下混級(jí)在功能上是等同的, 例如,它們響應(yīng)于相同的輸入信號(hào)提供相同的下混信號(hào)。下混規(guī)范的加載可以相當(dāng)于部署 之后下混級(jí)的重新配置,但是可替代地可以在其制造、初始編程、安裝、部署等期間執(zhí)行。下 混規(guī)范可以用輸入信號(hào)的特定形式或格式(包括一種格式中的通道的位置或編號(hào))來表 達(dá)??商娲?,它可以從語義上來表達(dá)(包括通道的幾何意義,而不管其相對(duì)于格式的位置 如何)。優(yōu)選地,下混規(guī)范與輸入信號(hào)的當(dāng)前形式或格式和/或輸入信號(hào)的機(jī)制無關(guān)地制 定,從而下混操作可越過輸入信號(hào)格式改變繼續(xù)進(jìn)行,而不中斷。
[0023] 解碼系統(tǒng)還包括空間合成級(jí),所述空間合成級(jí)適于接收下混信號(hào),并且輸出音頻 信號(hào)的η通道表示??臻g合成級(jí)由于其算法延遲的原因與非零通過時(shí)間相關(guān)聯(lián);本發(fā)明的 基礎(chǔ)問題之一是盡管存在該延遲,但是仍然實(shí)現(xiàn)平滑切換。音頻信號(hào)的η通道表示可以作 為解碼系統(tǒng)輸出而輸出;可替代地,它經(jīng)受了以更忠實(shí)地和/或以更少的偽像和差錯(cuò)重構(gòu) 音頻信號(hào)為總體目標(biāo)的附加的處理??臻g合成級(jí)接受控制空間合成操作的定量和/或定性 方面的至少一個(gè)混合參數(shù)。原則上,空間合成級(jí)至少在參數(shù)模式下(例如,當(dāng)下混信號(hào)可供 使用時(shí))工作(active)。在離散模式下,解碼系統(tǒng)通過對(duì)η個(gè)離散編碼的通道中的每個(gè)進(jìn) 行解碼來從輸入信號(hào)推導(dǎo)輸出信號(hào)。
[0024] 根據(jù)這個(gè)示例實(shí)施例,下混級(jí)至少在每個(gè)離散譯碼時(shí)間幀集合中的第一時(shí)間幀中 (例如,在整個(gè)幀內(nèi))以及至少在每個(gè)離散譯碼時(shí)間幀集合之后的第一時(shí)間幀中(例如,在 整個(gè)幀內(nèi))工作。這意味著,輸入信號(hào)一從離散譯碼轉(zhuǎn)變?yōu)閰?shù)譯碼,m通道下混信號(hào)就可 以可供使用。因此,空間合成級(jí)可以在較短的時(shí)間內(nèi)啟動(dòng),即使它包括與固有的非零算法延 遲相關(guān)聯(lián)的處理(例如,時(shí)頻變換、實(shí)復(fù)轉(zhuǎn)換和/或混合分析濾波)仍如此。此外,音頻信 號(hào)的η通道表示在從參數(shù)模式到離散模式的整個(gè)轉(zhuǎn)變中可以保持可供使用,并且可以用于 使這樣的轉(zhuǎn)變更快速和/或更不明顯。
[0025] 如本文中所使用的,時(shí)間幀(或幀)是輸入信號(hào)的對(duì)于其譯碼機(jī)制可被控制的最 小單元。優(yōu)選地,輸入信號(hào)的非空通道通過加窗的變換而獲得。例如,如MDCT中那樣,每個(gè) 變換窗口可以與樣本相關(guān)聯(lián),并且連續(xù)變換窗口可以重疊。明確的是,如果連續(xù)窗口重疊 50%,則時(shí)間幀的長(zhǎng)度不小于變換窗口的一半長(zhǎng)度(例如,512樣本的變換窗口的一半長(zhǎng)度 等于256個(gè)樣本),該長(zhǎng)度于是等于變換步幅。因?yàn)榭梢允骨袚Q事件更少地被享用解碼的音 頻的人感知到,所以這個(gè)示例實(shí)施例不需要限制操作期間的切換事件的數(shù)量,而是可以專 心地對(duì)網(wǎng)絡(luò)狀況的變化做出響應(yīng)。這使得可供使用的網(wǎng)絡(luò)資源可以被更充分地利用。減小 的解碼系統(tǒng)延遲可以增強(qiáng)媒體的保真度,在實(shí)時(shí)媒體流傳輸中尤其如此。
[0026] 為了本公開的目的,下混級(jí)在時(shí)間幀中工作意味著下混級(jí)至少在該時(shí)間幀的子集 期間工作。下混級(jí)可以在整個(gè)幀內(nèi)/期間或者僅在時(shí)間幀的子集(諸如幀的起始部分)期 間工作。起始部分可以對(duì)應(yīng)于幀長(zhǎng)度的1/2、1/3、1/4、1/6 ;起始部分可以對(duì)應(yīng)于變換步幅; 可替代地,起始部分可以對(duì)應(yīng)于Τ/ρ,其中,T是幀長(zhǎng)度,ρ是在每個(gè)幀內(nèi)開始的變換窗口的 數(shù)量。輸入信號(hào)中的譯碼機(jī)制之間的轉(zhuǎn)變典型地涉及在時(shí)間幀開始時(shí)(例如,在時(shí)間幀的 前1/6期間或者在1536個(gè)時(shí)間米樣之中的256個(gè)時(shí)間米樣期間)、在前一時(shí)間巾貞的譯碼與 當(dāng)前時(shí)間幀的譯碼之間(例如,作為當(dāng)將輸入信號(hào)從頻域格式變換到時(shí)域時(shí)使用重疊變換 窗口的結(jié)果,在頻域格式中,輸入信號(hào)可以從比特流獲得)的交錯(cuò)淡變。下混級(jí)優(yōu)選地可以 至少在緊接在輸入信號(hào)轉(zhuǎn)變?yōu)殡x散譯碼或者輸入信號(hào)從離散譯碼轉(zhuǎn)變之后的時(shí)間幀的起 始部分期間工作。這使得下混信號(hào)在輸入信號(hào)中的交錯(cuò)淡變期間可供使用,由此空間合成 級(jí)可以對(duì)于與輸入信號(hào)中的交錯(cuò)淡變相關(guān)聯(lián)的時(shí)間幀的部分輸出音頻信號(hào)的η通道表示。 關(guān)于輸入信號(hào)的當(dāng)前機(jī)制(例如,參數(shù)譯碼或離散譯碼)的信息可以與輸入信號(hào)一起(例 如,其中包含輸入信號(hào)的比特流中的某一位置處的比特)被接收。例如,在參數(shù)譯碼期間, 關(guān)于空間參數(shù)的信息可以在比特流的某些位置處被找到,而在離散譯碼期間,這些位置/ 比特不被使用。通過檢查這樣的比特在它們的預(yù)期位置的存在與否,解碼系統(tǒng)可以確定輸 入信號(hào)的當(dāng)前譯碼機(jī)制。
[0027] 在前面的示例實(shí)施例的進(jìn)一步發(fā)展中,輸入信號(hào)的時(shí)間段可以通過譯碼機(jī)制來表 示音頻信號(hào)的時(shí)間段,所述譯碼機(jī)制選自包括參數(shù)譯碼、離散譯碼和縮減(reduced)參數(shù) 譯碼的一組譯碼機(jī)制。因此,在進(jìn)一步的發(fā)展中,存在另外的被稱為縮減參數(shù)譯碼的譯碼機(jī) 制,在所述縮減參數(shù)譯碼中,輸入信號(hào)是m通道核心信號(hào)(可以伴隨有混合參數(shù)和其他元數(shù) 據(jù))。該核心信號(hào)可以通過根據(jù)下混規(guī)范進(jìn)行下混從表示相同的音頻信號(hào)(即,表示與第一 次提及的音頻信號(hào)相同的音頻信號(hào))的假定離散η通道輸入信號(hào)獲得。相反,基于離散譯 碼時(shí)間幀中的輸入信號(hào),下混規(guī)范使得能夠確定在縮減參數(shù)譯碼已經(jīng)用于在這些幀內(nèi)表示 相同的音頻信號(hào)的情況下核心信號(hào)將會(huì)是什么。
[0028] 在輸入信號(hào)通過縮減參數(shù)譯碼表示音頻信號(hào)的幀中,可能不需要執(zhí)行任何下混。 實(shí)際上,輸入信號(hào)是m通道核心信號(hào),在它被發(fā)送到空間合成級(jí)之前,不需要進(jìn)行下混。因 此,空間合成級(jí)優(yōu)選地可以直接接收輸入信號(hào),或者輸入信號(hào)可以在到達(dá)空間合成級(jí)之前 不受影響地通過下混級(jí)。在輸入信號(hào)通過縮減參數(shù)譯碼表示音頻信號(hào)的幀中,空間合成級(jí) 因此可以基于輸入信號(hào)和至少一個(gè)混合參數(shù)輸出音頻信號(hào)的η通道表示。當(dāng)接收到縮減參 數(shù)譯碼時(shí)間幀時(shí)停用下混級(jí)(或者使它置于空閑/被動(dòng)/休息模式)可以節(jié)省能量,由此 例如便攜式裝置中的電池時(shí)間可以得以延長(zhǎng)。
[0029] 在示例實(shí)施例中,下混級(jí)在其中輸入信號(hào)通過參數(shù)譯碼表示音頻信號(hào)的每個(gè)時(shí)間 幀中工作。在僅存在兩種譯碼機(jī)制(參數(shù)和離散)的例子中,這意味著,下混級(jí)至少在所有 的不被離散譯碼的幀中工作。在存在另外的可供使用的譯碼機(jī)制(諸如縮減參數(shù)譯碼)的 例子中,下混級(jí)在不被離散譯碼的時(shí)間幀中還可以不工作/被停用/空閑。這可以節(jié)省能 量和/或延長(zhǎng)電池時(shí)間。
[0030] 在示例實(shí)施例中,解碼系統(tǒng)適于接收輸入信號(hào),所述輸入信號(hào)在參數(shù)譯碼時(shí)間幀 期間還包括m通道核心信號(hào)(除了任何混合參數(shù)和其他元數(shù)據(jù)之外)。核心信號(hào)可以通過 根據(jù)下混規(guī)范進(jìn)行下混從表示相同的音頻信號(hào)(即,表示與第一次提及的音頻信號(hào)相同的 音頻信號(hào))的假定離散η通道輸入信號(hào)獲得。相反,基于離散譯碼時(shí)間幀中的輸入信號(hào),下 混規(guī)范使得能夠確定在參數(shù)譯碼已經(jīng)被用于在那些幀中表示相同的音頻信號(hào)的情況下核 心信號(hào)將會(huì)是什么。
[0031] 然而,因?yàn)橄禄旒?jí)在輸入信號(hào)可能不包含核心信號(hào)的至少一些離散譯碼時(shí)間幀 (諸如,離散譯碼時(shí)間幀集合中的第一時(shí)間幀)中工作,所以解碼系統(tǒng)將能夠預(yù)測(cè)在這些離 散譯碼時(shí)間幀內(nèi)該核心信號(hào)將會(huì)是什么。因此,即使在原則上核心信號(hào)和離散譯碼通道可 能不能共存,輸入信號(hào)中的與(參數(shù)譯碼或縮減參數(shù)譯碼與離散譯碼之間的)機(jī)制改變相 關(guān)的任何間斷也可以一起被減輕或避免。
[0032] 在前面的示例實(shí)施例的進(jìn)一步發(fā)展中,下混級(jí)適于通過再現(xiàn)輸入信號(hào)中的核心信 號(hào)(如果該核心信號(hào)可供使用)來產(chǎn)生下混信號(hào)。換句話說,下混級(jí)適于尤其通過拷貝或 轉(zhuǎn)發(fā)核心信號(hào)來對(duì)參數(shù)譯碼時(shí)間幀的接收做出響應(yīng),以使得下混級(jí)將核心信號(hào)作為下混信 號(hào)輸出。換句話說,如果下混信號(hào)中的m通道被認(rèn)為是η通道輸入信號(hào)的空間的子空間,則 下混級(jí)是該子空間上的投影。特別地,存在輸入信號(hào)的如下m通道子集,下混級(jí)將所述m通 道子集相同地映射到下混信號(hào)中的各m個(gè)通道。這可以在下混規(guī)范中被規(guī)定。對(duì)于離散譯 碼時(shí)間幀,基于輸入信號(hào)并且根據(jù)下混規(guī)范來產(chǎn)生下混信號(hào)。如以上所討論的,下混規(guī)范定 義了輸入信號(hào)中的η個(gè)離散譯碼通道與核心信號(hào)之間的關(guān)系。這意味著,輸入信號(hào)中的機(jī) 制改變本身不能引起間斷;也就是說,如果音頻信號(hào)跨越模式改變是連續(xù)的,則下混級(jí)輸出 將保持為連續(xù)的,并且基本上不會(huì)中斷。
[0033] 在可以實(shí)現(xiàn)為以上所概述的示例實(shí)施例的替代方案或者這些示例實(shí)施例的進(jìn)一 步發(fā)展的示例實(shí)施例中,解碼系統(tǒng)適于接收如下比特流,所述比特流以在參數(shù)譯碼機(jī)制和 離散譯碼機(jī)制兩者中都可適用的格式對(duì)輸入信號(hào)進(jìn)行編碼。為了適應(yīng)η個(gè)離散譯碼通道, 所接收的比特流以包括η個(gè)通道或更多個(gè)通道的格式對(duì)輸入信號(hào)進(jìn)行編碼。因此,參數(shù)譯 碼機(jī)制中的時(shí)間幀可以包含例如n-m個(gè)未被使用的通道。為了保持參數(shù)譯碼機(jī)制中的格式 的均一 1丨生,未被使用的通道存在,但是被設(shè)為與無激勵(lì)相應(yīng)的中性值(neutral value),例 如,零序列。發(fā)明人認(rèn)識(shí)到,解碼器產(chǎn)品可包含其設(shè)計(jì)不意圖部署在其中格式改變可能頻繁 的自適應(yīng)媒體發(fā)布設(shè)備中的老式組件或通用組件(例如,硬件、算法、軟件庫(kù))。這樣的組件 可以通過停用它們自己或者使它們自己部分?jǐn)嚯妬韺?duì)檢測(cè)到變?yōu)榈捅忍芈矢袷阶龀鲰憫?yīng)。 當(dāng)這些組件回到正常操作時(shí),這可能由于與格式改變相關(guān)的間斷而阻止比特率之間的平滑 轉(zhuǎn)變或者使得平滑轉(zhuǎn)變更難以實(shí)現(xiàn)。當(dāng)諸如與具有重疊窗口函數(shù)的變換有關(guān)地,來自不同 譯碼機(jī)制的幀的貢獻(xiàn)被累計(jì)時(shí),也可能引起困難。在本示例實(shí)施例中,因?yàn)榫桓袷奖挥糜?輸入格式,所以解碼系統(tǒng)中的具有這些特性的組件將典型地保持基本上不受從參數(shù)譯碼機(jī) 制到離散譯碼機(jī)制的轉(zhuǎn)變的影響,反之亦然。以上適用于所有的被離散譯碼或參數(shù)譯碼的 時(shí)間幀。在某些示例實(shí)施例中,輸入信號(hào)可以作為替代在兩個(gè)參數(shù)譯碼時(shí)間幀集合之間以m 通道格式(縮減參數(shù)譯碼機(jī)制)被提供,以便在沒有模式轉(zhuǎn)變即將發(fā)生或者正被執(zhí)行時(shí)不 需要下混。可選地,在所有的不被離散譯碼的幀中可以使用m通道格式(即,縮減參數(shù)譯碼 機(jī)制),并且解碼系統(tǒng)可選地可以適于至少在某些幀內(nèi)將所接收的m通道格式重新格式化 為η通道格式。例如,在緊接在離散譯碼時(shí)間幀前面或后面的縮減參數(shù)譯碼幀中,可以通過 將n-m個(gè)中性通道附加到m通道格式來重新格式化縮減參數(shù)譯碼,以便獲得上述在不同譯 碼機(jī)制之間的轉(zhuǎn)變期間具有相同數(shù)量的通道的優(yōu)點(diǎn)中的至少一些。優(yōu)選地,均一格式容納 混合參數(shù)和參數(shù)和/或離散模式中所使用的其他元數(shù)據(jù)。優(yōu)選地,通過熵編碼或類似的方 法來對(duì)輸入信號(hào)進(jìn)行編碼,以使得未被使用的通道僅將有限程度地增加所需的帶寬。
[0034] 在示例實(shí)施例中,解碼系統(tǒng)還包括第一延遲線和混合器。第一延遲線接收輸入信 號(hào),并且可操作為輸出輸入信號(hào)的延遲版本??商娲兀谝谎舆t線可以可操作為延遲輸 入信號(hào)的經(jīng)處理的版本,例如,在已經(jīng)從輸入信號(hào)推導(dǎo)η個(gè)通道之后,或者在拆包之后。第 一延遲線不需要在參數(shù)模式下(即,在其中通過空間合成生成解碼系統(tǒng)輸出的那些時(shí)間幀 中)工作(可能除了解碼系統(tǒng)處于離散模式的時(shí)間幀序列中的起始時(shí)間幀之外),以便利于 模式轉(zhuǎn)變。混合器連接到第一延遲線輸出和空間合成級(jí)輸出兩者,并且充當(dāng)這兩個(gè)源之間 的選擇器。在參數(shù)模式中,混合器輸出空間合成級(jí)輸出。在離散模式中,混合器輸出第一延 遲線輸出。當(dāng)在輸入信號(hào)中在離散譯碼機(jī)制與參數(shù)譯碼機(jī)制(或如上所述那樣,在解碼系 統(tǒng)適于將所接收的縮減參數(shù)譯碼時(shí)間幀重新格式化為η通道格式的情況下的縮減參數(shù)譯 碼機(jī)制)之間轉(zhuǎn)變時(shí),混合器執(zhí)行這兩個(gè)輸出之間的混合轉(zhuǎn)變?;旌限D(zhuǎn)變可以包括交錯(cuò)淡 變類型的操作或者已知不是顯然可感知到的其他混合轉(zhuǎn)變?;旌限D(zhuǎn)變可以占據(jù)從其發(fā)生模 式轉(zhuǎn)變的時(shí)間幀或者時(shí)間幀的一小部分。第一延遲線的存在使得通過空間合成級(jí)提供的音 頻信號(hào)的η通道表示可以保持與從輸入信號(hào)基于η個(gè)離散編碼通道推導(dǎo)的信號(hào)同步。這促 進(jìn)了模式轉(zhuǎn)變的平滑性。此外,因?yàn)椴恍枰獌蓚€(gè)信號(hào)之間的初步對(duì)齊,混合器將能夠以短的 等待時(shí)間在模式之間進(jìn)行轉(zhuǎn)變。特別地,第一延遲線可以被配置為使輸入信號(hào)延遲與下混 級(jí)和空間合成級(jí)的總通過時(shí)間相應(yīng)的時(shí)段。總通過時(shí)間可以是各個(gè)通過時(shí)間的和。然而, 如果采取了延遲減小措施,則總通過時(shí)間可能小于該和。指出,下混級(jí)的通過時(shí)間可以是非 零數(shù)字或者零,在下混級(jí)在時(shí)域中進(jìn)行操作時(shí)尤其如此。
[0035] 在前面的實(shí)施例的進(jìn)一步發(fā)展中,解碼系統(tǒng)還包括在混合器下游的第二延遲線。 第二延遲線被配置為在參數(shù)模式和離散模式下類似地起作用(即,通過添加延遲,所述延 遲為時(shí)間幀持續(xù)時(shí)間與第一延遲線所引起的延遲之間的差值)。因此,解碼系統(tǒng)的總通過 時(shí)間正好為一個(gè)時(shí)間幀??商娲兀诙舆t線所引起的延遲被選擇為使得第一延遲線和 第二延遲線所引起的總延遲對(duì)應(yīng)于一個(gè)時(shí)間幀的長(zhǎng)度的倍數(shù)。這兩種替代方案都簡(jiǎn)化了切 換。特別地,這簡(jiǎn)化了解碼系統(tǒng)與連接實(shí)體之間的和切換相關(guān)的協(xié)作。
[0036] 在示例實(shí)施例中,空間合成級(jí)適于應(yīng)用通過時(shí)間內(nèi)插而獲得的混合參數(shù)值。在參 數(shù)譯碼機(jī)制和縮減參數(shù)譯碼機(jī)制中,時(shí)間幀可以承載針對(duì)在給定時(shí)間幀中的參考點(diǎn)(或錨 點(diǎn))被明確定義的一個(gè)混合參數(shù)(多個(gè)混合參數(shù)),所述參考點(diǎn)諸如為該時(shí)間幀的中間點(diǎn) 或終點(diǎn)(end)。基于所述明確定義的值,空間合成級(jí)通過連續(xù)的(相連的)時(shí)間幀中的各 個(gè)參考點(diǎn)之間的內(nèi)插來推導(dǎo)用于中間時(shí)間點(diǎn)的中間混合參數(shù)值。換句話說,在兩個(gè)連續(xù)的 (相連的)時(shí)間幀中的每一個(gè)承載混合參數(shù)值的情況下,例如,在這兩個(gè)時(shí)間幀中的每一個(gè) 被參數(shù)譯碼或縮減參數(shù)譯碼的情況下,可以僅在這兩個(gè)時(shí)間幀之間執(zhí)行內(nèi)插。在該設(shè)置中, 特別是如果參考點(diǎn)不是起始點(diǎn),則空間合成級(jí)適于通過下述方式響應(yīng)當(dāng)前時(shí)間幀是在其中 每個(gè)時(shí)間幀被參數(shù)譯碼或縮減參數(shù)譯碼的時(shí)間幀集合中的第一時(shí)間幀(即,當(dāng)前時(shí)間幀前 面的時(shí)間幀不承載混合參數(shù)值),即從當(dāng)前時(shí)間幀中的參考點(diǎn)向后對(duì)混合參數(shù)值進(jìn)行外插 直至當(dāng)前時(shí)間幀的開始。空間合成級(jí)可以被配置為用常數(shù)值對(duì)混合參數(shù)進(jìn)行外插。也就 是說,混合參數(shù)將被取為在幀開頭具有它們的參考點(diǎn)值,將不變地保持該值(作為中間值) 直到參考點(diǎn)為止,并且然后將朝著后一時(shí)間幀中的參考點(diǎn)發(fā)起內(nèi)插。優(yōu)選地,外插可以伴隨 有解碼系統(tǒng)中的到參數(shù)模式的轉(zhuǎn)變??臻g合成單元可以在當(dāng)前時(shí)間幀中被啟動(dòng)。在當(dāng)前幀 和/或其后的幀期間,解碼系統(tǒng)可以轉(zhuǎn)變?yōu)槭褂脧目臻g合成單元輸出的音頻信號(hào)的η通道 表示重構(gòu)音頻信號(hào)。在當(dāng)前時(shí)間幀是離散譯碼時(shí)間幀集合中的第一時(shí)間幀時(shí),空間合成級(jí) 可以適于從緊接在當(dāng)前時(shí)間幀前面的時(shí)間幀中的參考點(diǎn)開始執(zhí)行(混合參數(shù)值的)向前外 插??梢酝ㄟ^從最后一個(gè)參考點(diǎn)直到當(dāng)前時(shí)間幀的終點(diǎn)為止保持混合參數(shù)值不變來實(shí)現(xiàn)向 前外插??商娲兀瑢?duì)于在當(dāng)前時(shí)間幀之后的另一個(gè)時(shí)間幀,可以繼續(xù)進(jìn)行外插,以便適應(yīng) 到離散模式的模式轉(zhuǎn)變。因此,空間合成級(jí)可以將來自當(dāng)前時(shí)間幀(或后一時(shí)間幀)的核 心信號(hào)與從一個(gè)時(shí)間幀(緊接在當(dāng)前時(shí)間幀前面的時(shí)間幀)外插的混合參數(shù)值組合使用。 在當(dāng)前幀之后的幀和/或其后的時(shí)間幀期間,解碼系統(tǒng)優(yōu)選地可以轉(zhuǎn)變?yōu)榛谳斎胄盘?hào)中 所包含的η個(gè)離散編碼通道推導(dǎo)音頻信號(hào)。
[0037] 在示例實(shí)施例中,空間合成級(jí)包括對(duì)下混信號(hào)的頻域表示進(jìn)行操作的混合矩陣。 混合矩陣可以可操作為執(zhí)行m到η上混。為此,空間合成級(jí)還包括在混合矩陣上游的時(shí)頻 變換級(jí)以及在混合矩陣下游的頻時(shí)變換級(jí)。附加地或者可替代地,混合矩陣被配置為通過 包括m個(gè)下混通道的線性組合來產(chǎn)生其η個(gè)輸出通道。線性組合優(yōu)選地可以包括下混通道 中的至少一些通道的去相關(guān)版本。混合矩陣接受混合參數(shù),并且通過根據(jù)混合參數(shù)的值調(diào) 整線性組合中的與下混通道中的至少一個(gè)相關(guān)的至少一個(gè)增益來做出反應(yīng)。所述至少一個(gè) 增益可以應(yīng)用于下混信號(hào)的m通道頻域表示中的通道中的一個(gè)或多個(gè)?;旌蠀?shù)值中的點(diǎn) 改變可以導(dǎo)致立即增益變化或漸變?cè)鲆孀兓?;例如,如以上所概述的,可以通過連續(xù)幀之間 的內(nèi)插來實(shí)現(xiàn)漸變變化。指出,不管是對(duì)下混信號(hào)的時(shí)域表示還是頻域表示執(zhí)行上混操作, 都可以實(shí)現(xiàn)增益的可控性。
[0038] 在示例實(shí)施例中,下混級(jí)適于對(duì)輸入信號(hào)的時(shí)域表示進(jìn)行操作。更確切地說,為了 生成m通道下混信號(hào),下混級(jí)被供給核心信號(hào)的時(shí)域表示或者η個(gè)離散編碼信號(hào)。時(shí)域中 的下混是計(jì)算貧乏(computationally lean)的技術(shù),在典型使用情況下這意味著下混級(jí)的 操作將使解碼系統(tǒng)中的總計(jì)算載荷增加非常小的程度(與沒有下混級(jí)的解碼器相比)。如 已經(jīng)描述的,下混的定量特性可以由下混規(guī)范控制。特別地,下混規(guī)范可以包括將施加的增 Mo
[0039] 在示例實(shí)施例中,如果在解碼系統(tǒng)中提供空間合成級(jí)和混合器,則這樣的空間合 成級(jí)和混合器由可以實(shí)現(xiàn)為例如有限狀態(tài)機(jī)(FSM)的控制器控制。下混級(jí)可以獨(dú)立于所述 控制器進(jìn)行操作,或者當(dāng)不需要下混時(shí),例如,當(dāng)輸入信號(hào)被縮減參數(shù)譯碼時(shí)或者當(dāng)輸入信 號(hào)在當(dāng)前時(shí)間幀和前一(或先前多個(gè))時(shí)間幀中被離散譯碼時(shí),下混級(jí)可以被所述控制器 停用。所述控制器(例如,有限狀態(tài)機(jī))可以是處理器,其狀態(tài)由當(dāng)前時(shí)間幀和前一時(shí)間幀 的以及可能地在所述前一時(shí)間幀之前的時(shí)間幀的譯碼類型/機(jī)制(參數(shù)、離散,并且如果縮 減參數(shù)可供使用,縮減參數(shù))唯一地確定。如以下將看見的,所述控制器不需要包括堆棧、 隱式狀態(tài)變量、或者存儲(chǔ)除了出于能夠?qū)嵤┍景l(fā)明的目的的程序指令之外的任何內(nèi)容的內(nèi) 部存儲(chǔ)器。這給予了簡(jiǎn)單性、透明性(例如,在驗(yàn)證和測(cè)試中)和/或魯棒性。
[0040] 在示例實(shí)施例中,可以在每個(gè)時(shí)間幀中根據(jù)如下三種譯碼機(jī)制來表示音頻信號(hào): 離散譯碼(D)、參數(shù)譯碼(P)和縮減參數(shù)譯碼(rP)。在目前的示例實(shí)施例(在該示例實(shí)施 例中,解碼系統(tǒng)不適于將縮減參數(shù)譯碼時(shí)間幀重新格式化為η通道格式,而如上所述,這在 其他示例實(shí)施例中是可以的)中,可以避免以下的連續(xù)(相連)時(shí)間幀序列:
[0041] rP D 或 D rP,
[0042] 即,縮減參數(shù)譯碼時(shí)間幀不(緊接)在離散譯碼時(shí)間幀的后面或前面。換句話說, 離散譯碼時(shí)間幀后面為離散譯碼時(shí)間幀或參數(shù)譯碼時(shí)間幀,離散譯碼時(shí)間幀前面為離散譯 碼時(shí)間幀或參數(shù)譯碼時(shí)間幀??商娲鼗蛘吡硗獾?,由于編碼效率,以下連續(xù)(相連)時(shí)間 幀序列:
[0043] P rP P 和 P rP...rP P
[0044] 分別優(yōu)于:
[0045] P P P 和 P P…P P
[0046] 換句話說,緊隨參數(shù)譯碼時(shí)間幀的每個(gè)時(shí)間幀優(yōu)選地可以被縮減參數(shù)譯碼或離散 譯碼。例外情況可以是非常短的集合被接受的實(shí)現(xiàn);在這樣的情況下,可能不總是存在足以 進(jìn)入縮減參數(shù)譯碼機(jī)制的時(shí)間,由此可能出現(xiàn)兩個(gè)連續(xù)的參數(shù)譯碼時(shí)間幀。
[0047] 在上述的與根據(jù)不同機(jī)制譯碼的時(shí)間幀的次序相關(guān)的規(guī)則全都應(yīng)用的示例實(shí)施 例中,輸入信號(hào)中的時(shí)間幀序列典型地看起來像:
[0048] DDPDDDDPrPrPrPrPrPPDDDPDPDDDPrPPDD,
[0049] 其中,縮減參數(shù)譯碼(rP)總是分離離散譯碼(D)和參數(shù)(P)編碼。要指出,如上 所述,上述示例實(shí)施例中的至少一些的編碼系統(tǒng)可以適于接收連續(xù)幀(的編碼機(jī)制)的其 他組合。
[0050] 在示例實(shí)施例中,在輸入信號(hào)在當(dāng)前時(shí)間幀中以及在緊接在當(dāng)前時(shí)間幀前面的先 前兩個(gè)時(shí)間幀中被離散譯碼的所有情況下,解碼通過從輸入信號(hào)推導(dǎo)η個(gè)離散編碼通道來 進(jìn)行。另外地,解碼通過下述方式進(jìn)行,即,在音頻信號(hào)在當(dāng)前時(shí)間幀內(nèi)被參數(shù)譯碼或者當(dāng) 前時(shí)間幀是離散譯碼時(shí)間幀集合中的第一時(shí)間幀的情況下,根據(jù)下混規(guī)范基于輸入信號(hào)產(chǎn) 生m通道下混信號(hào);在音頻信號(hào)在當(dāng)前幀中以及在先前兩個(gè)幀中被參數(shù)譯碼的所有情況 下,基于下混信號(hào)產(chǎn)生音頻信號(hào)的η通道表不。輸入信號(hào)在當(dāng)前時(shí)間巾貞和僅前一時(shí)間巾貞中 被參數(shù)譯碼(或縮減參數(shù)譯碼)的時(shí)間幀中的行為在不同示例實(shí)施例中可不同??蛇x地, 當(dāng)音頻信號(hào)在(緊接)該前一時(shí)間幀前面的時(shí)間幀中被參數(shù)譯碼時(shí),還產(chǎn)生m通道下混信 號(hào)。
[0051] 在這個(gè)示例實(shí)施例的進(jìn)一步發(fā)展中,接收輸入信號(hào)(例如,通過對(duì)比特流進(jìn)行解 碼)(所述輸入信號(hào)在給定時(shí)間幀中通過參數(shù)譯碼或縮減參數(shù)譯碼來表示音頻信號(hào))的步 驟包括接收對(duì)于所述給定時(shí)間幀中的非起始點(diǎn)的至少一個(gè)混合參數(shù)的值。如果當(dāng)前時(shí)間幀 是時(shí)間巾貞集合(在該時(shí)間巾貞集合中,每個(gè)時(shí)間巾貞被參數(shù)譯碼或縮減參數(shù)譯碼)中的第一時(shí) 間幀,則對(duì)所接收的至少一個(gè)混合參數(shù)的值向后進(jìn)行外插,直到當(dāng)前時(shí)間幀的起點(diǎn)為止。另 外地,或者可替代地,參數(shù)譯碼時(shí)間幀之后的兩個(gè)連續(xù)的離散譯碼時(shí)間幀(當(dāng)前時(shí)間幀和 前一時(shí)間幀)的接收使解碼系統(tǒng)進(jìn)行參數(shù)解碼(即,基于下混信號(hào)產(chǎn)生音頻信號(hào)的η通道 表示),不過這是基于與在所述前一時(shí)間幀前面的時(shí)間幀相關(guān)聯(lián)的混合參數(shù)值的。因?yàn)椴?存在可以形成向前內(nèi)插的基礎(chǔ)的緊接在后的時(shí)間幀,所以解碼系統(tǒng)在整個(gè)當(dāng)前幀內(nèi)對(duì)最后 的明確的混合參數(shù)值向前進(jìn)行外插。同時(shí),例如,通過在幀的起始部分(例如,其持續(xù)時(shí)間 的1/3、1/4或1/6,其長(zhǎng)度已經(jīng)在上面進(jìn)行了討論)執(zhí)行交叉混合,解碼系統(tǒng)轉(zhuǎn)變?yōu)殡x散解 碼/模式。所述方法還可以包括以下步驟:響應(yīng)于輸入信號(hào)在當(dāng)前時(shí)間幀和前一時(shí)間幀中 被參數(shù)譯碼并且在所述前一時(shí)間幀前面的時(shí)間幀中被離散譯碼,在當(dāng)前時(shí)間幀期間轉(zhuǎn)變?yōu)?基于下混信號(hào)和至少一個(gè)混合參數(shù)產(chǎn)生音頻信號(hào)的η通道表不。
[0052] 在本發(fā)明的示例實(shí)施例中,編碼系統(tǒng)適于對(duì)分割為時(shí)間幀的η通道音頻信號(hào)進(jìn)行 編碼。編碼系統(tǒng)適于輸出比特流(P),所述比特流在給定時(shí)間幀中根據(jù)譯碼機(jī)制表示音頻信 號(hào),所述譯碼機(jī)制選自包含參數(shù)譯碼和使用η個(gè)離散編碼通道的離散譯碼的組。編碼系統(tǒng) 包括選擇器,所述選擇器適于對(duì)于給定時(shí)間幀選擇哪個(gè)編碼機(jī)制將用于表示音頻信號(hào)。編 碼系統(tǒng)還包括參數(shù)分析級(jí),所述參數(shù)分析級(jí)可操作為基于音頻信號(hào)的η通道表示并且根據(jù) 下混規(guī)范來輸出在參數(shù)譯碼中將形成輸出比特流的一部分的核心信號(hào)和至少一個(gè)混合參 數(shù)。在本示例實(shí)施例的進(jìn)一步發(fā)展中,譯碼機(jī)制的組還包括縮減參數(shù)譯碼。在本實(shí)施例中, 參數(shù)譯碼使用具有η個(gè)信號(hào)通道的格式,離散譯碼也是如此。另一方面,縮減參數(shù)譯碼使用 具有m個(gè)信號(hào)通道的格式,其中,n>m> 1。
[0053] 在本發(fā)明的第二方面內(nèi),提供一種用于重構(gòu)η通道音頻信號(hào)的解碼系統(tǒng)。解碼系 統(tǒng)適于接收對(duì)輸入信號(hào)進(jìn)行編碼的比特流。輸入信號(hào)分割為時(shí)間幀,并且在給定時(shí)間幀中 根據(jù)譯碼機(jī)制表示音頻信號(hào),所述譯碼機(jī)制選自包含以下譯碼機(jī)制的組:使用η個(gè)離散編 碼通道表示音頻信號(hào)的離散譯碼;以及使用m通道核心信號(hào)和至少一個(gè)混合參數(shù)表示音頻 信號(hào)的縮減參數(shù)譯碼,其中,n>m> 1。要指出,除了核心信號(hào)之外,縮減參數(shù)譯碼機(jī)制還可 以例如使用諸如至少一個(gè)混合參數(shù)的元數(shù)據(jù)來表示音頻信號(hào)。
[0054] 本示例實(shí)施例的解碼系統(tǒng)可操作為基于η個(gè)離散編碼通道或者通過空間合成來 推導(dǎo)音頻信號(hào)。解碼系統(tǒng)包括音頻解碼器,所述音頻解碼器適于將它從比特流提取的輸入 信號(hào)的頻域表示變換為輸入信號(hào)的時(shí)域表示。解碼系統(tǒng)還包括下混級(jí)和空間合成級(jí),所述 下混級(jí)可操作為根據(jù)下混規(guī)范基于輸入信號(hào)的時(shí)域表示來輸出m通道下混信號(hào),所述空間 合成級(jí)可操作為基于下混信號(hào)和至少一個(gè)混合參數(shù)(例如,在同一比特流中被接收并且被 音頻解碼器提取,或者例如在某些其他比特流中被分離地接收)來輸出音頻信號(hào)的η通道 表不。
[0055] 在本示例實(shí)施例的縮減參數(shù)譯碼時(shí)間幀中,與輸入信號(hào)的頻域表示是η通道信號(hào) 的離散譯碼時(shí)間幀不同,輸入信號(hào)的頻域表示是m通道信號(hào)(即,核心信號(hào))。音頻解碼器 可以適于在將輸入信號(hào)的頻域表示變換到時(shí)域之前,在與離散譯碼時(shí)間幀相鄰的縮減參數(shù) 譯碼時(shí)間幀的至少部分中,對(duì)輸入信號(hào)的頻域表示進(jìn)行重新格式化(也就是說,修改其格 式),以便使這些部分中的輸入信號(hào)的頻域表示(從而,還使時(shí)域表示)具有數(shù)量與離散譯 碼時(shí)間幀中的通道數(shù)量相同的通道。在離散譯碼與縮減參數(shù)譯碼之間轉(zhuǎn)變期間具有恒定 (但是在各縮減參數(shù)譯碼時(shí)間幀集合期間不必是恒定的)數(shù)量的通道的輸入信號(hào)的時(shí)域表 示可有助于在這樣的轉(zhuǎn)變期間仍提供平滑的收聽體驗(yàn)。這通過促使在解碼系統(tǒng)中的布置在 更下游的解碼/處理部分中進(jìn)行轉(zhuǎn)變來實(shí)現(xiàn)。例如,具有恒定數(shù)量的通道可以有助于提供 輸入信號(hào)的時(shí)域表示中的平滑轉(zhuǎn)變。
[0056] 為了這個(gè)目的,音頻解碼器可以適于至少在緊接在離散譯碼時(shí)間幀后面的各縮減 參數(shù)譯碼時(shí)間幀的起始部分期間,以及至少對(duì)于緊接在離散譯碼時(shí)間幀前面的各縮減參數(shù) 譯碼時(shí)間幀的最后部分,對(duì)輸入信號(hào)的頻域表示進(jìn)行重新格式化。音頻解碼器適于通過將 n-m個(gè)中性通道附加到m通道核心信號(hào)來將在這些部分的輸入信號(hào)的頻域表示(其用縮減 參數(shù)譯碼時(shí)間幀中的m通道核心信號(hào)表示)重新格式化為η通道格式。中性通道可以是包 含中性信號(hào)值(即,與無音頻內(nèi)容或無激勵(lì)相應(yīng)的值,諸如零)的通道。換句話說,中性值 可以被選擇為使得當(dāng)中性通道的內(nèi)容被添加到包含音頻信號(hào)的通道時(shí),通過其生成音頻信 號(hào)的添加不受中性值的影響(中性值加上非中性貢獻(xiàn)等于非中性貢獻(xiàn)),但是仍然被明確 地定義為操作。以上述方式,(一些)縮減參數(shù)譯碼時(shí)間幀(的至少部分)中的音頻信號(hào) 的頻域表示的m通道核心信號(hào)可以被音頻解碼器重新格式化為與離散譯碼時(shí)間幀中的輸 入信號(hào)的格式同質(zhì)的格式,特別是包括相同數(shù)量的通道的格式。
[0057] 根據(jù)示例實(shí)施例,音頻解碼器可以適于使用重疊變換窗口來執(zhí)行頻時(shí)變換,其中, 每個(gè)時(shí)間幀等于變換窗口中的至少一個(gè)的一半長(zhǎng)度(例如,具有與該一半長(zhǎng)度相同的長(zhǎng) 度)。換句話說,每個(gè)時(shí)間幀可以對(duì)應(yīng)于為等同于一個(gè)變換窗口的時(shí)間段的長(zhǎng)度的至少一半 的時(shí)間段。當(dāng)變換窗口重疊時(shí),在來自不同時(shí)間幀的變換窗口之間可能重疊,并且給定時(shí)間 幀中的輸入信號(hào)的時(shí)域表示的值因此可以基于來自除了給定時(shí)間幀之外的時(shí)間幀(例如, 至少緊接在所述給定時(shí)間幀前面或后面的時(shí)間幀)的貢獻(xiàn)。
[0058] 在示例實(shí)施例中,音頻解碼器可以適于在緊接在離散譯碼時(shí)間幀后面的各縮減參 數(shù)譯碼時(shí)間幀中通過下述方式來確定輸入信號(hào)的時(shí)域表示的至少一個(gè)通道,即,至少對(duì)來 自縮減參數(shù)譯碼時(shí)間幀的中性通道中的至少一個(gè)中性通道的第一貢獻(xiàn)和來自緊接在前的 離散譯碼時(shí)間幀的第二貢獻(xiàn)進(jìn)行求和。如關(guān)于前面的實(shí)施例所描述的,m通道核心信號(hào)在 縮減參數(shù)譯碼時(shí)間幀中表示輸入信號(hào)(在頻域中),并且音頻解碼器可以適于在緊接在離 散譯碼時(shí)間幀后面的縮減參數(shù)譯碼時(shí)間幀中(至少在這些縮減參數(shù)譯碼時(shí)間幀的起始部 分上)將m-n個(gè)中性通道附加到m通道核心信號(hào)。輸入信號(hào)的η通道時(shí)域表示可以在這樣 的縮減參數(shù)譯碼時(shí)間幀中通過下述方式獲得,即,對(duì)于η個(gè)通道中的每一個(gè),對(duì)來自前一離 散譯碼時(shí)間幀和縮減參數(shù)譯碼時(shí)間幀的相應(yīng)通道的貢獻(xiàn)進(jìn)行求和。對(duì)于與m通道核心信號(hào) 相應(yīng)的m個(gè)通道中的每一個(gè),這可以包括對(duì)來自核心信號(hào)的通道(來自縮減參數(shù)譯碼時(shí)間 幀)的第一貢獻(xiàn)和來自離散譯碼時(shí)間幀中的相應(yīng)通道的第二貢獻(xiàn)進(jìn)行求和。對(duì)于與n-m個(gè) 中性通道相應(yīng)的n-m個(gè)通道中的每一個(gè),這可以對(duì)應(yīng)于對(duì)來自這些中性通道之一的第一貢 獻(xiàn)(即,諸如零的中性值)和來自前一離散譯碼時(shí)間幀中的相應(yīng)通道的第二貢獻(xiàn)進(jìn)行求和。 這樣,來自離散譯碼時(shí)間幀的所有η個(gè)通道的貢獻(xiàn)可當(dāng)在緊接在該離散譯碼時(shí)間幀后面的 縮減參數(shù)譯碼時(shí)間幀中形成輸入信號(hào)的時(shí)域表示時(shí)被使用。這可以使得在輸入信號(hào)的時(shí)域 表示中可以進(jìn)行更平滑的和/或較不明顯的轉(zhuǎn)變。例如,在縮減參數(shù)譯碼中,可以使得來自 離散譯碼時(shí)間幀的貢獻(xiàn)可以在與n-m個(gè)中性通道相應(yīng)的n-m個(gè)通道中淡出。這還可以有助 于解碼系統(tǒng)中的布置在更下游的級(jí)/單元中的輸入信號(hào)的處理/解碼,以便在輸入信號(hào)的 離散譯碼與縮減參數(shù)譯碼之間的轉(zhuǎn)變期間實(shí)現(xiàn)改進(jìn)的(或更平滑的)收聽體驗(yàn)。
[0059] 在示例實(shí)施例中,音頻解碼器可以適于在緊接在參數(shù)譯碼時(shí)間幀后面的各離散譯 碼時(shí)間幀中通過下述方式來確定輸入信號(hào)的時(shí)域表示的至少一個(gè)通道,即,至少對(duì)來自離 散譯碼時(shí)間幀的第一貢獻(xiàn)和來自緊接在前的縮減參數(shù)譯碼時(shí)間幀的中性通道中的至少一 個(gè)的第二貢獻(xiàn)進(jìn)行求和。如關(guān)于前面的實(shí)施例所描述的,m通道核心信號(hào)在縮減參數(shù)譯碼時(shí) 間幀中表示輸入信號(hào)(在頻域中),并且音頻解碼器可以適于在緊接在離散譯碼時(shí)間幀前 面的縮減參數(shù)譯碼時(shí)間幀中(至少在這些縮減參數(shù)譯碼時(shí)間幀的最終部分上)將m-n個(gè)中 性通道附加到m通道核心信號(hào)。輸入信號(hào)的η通道時(shí)域表示可以在緊接在這樣的縮減參數(shù) 譯碼時(shí)間幀后面的離散譯碼時(shí)間幀中通過下述方式來獲得,即,對(duì)于所述η個(gè)通道中的每 一個(gè),對(duì)來自離散譯碼時(shí)間幀和前一縮減參數(shù)譯碼時(shí)間幀的相應(yīng)通道的貢獻(xiàn)進(jìn)行求和。對(duì) 于與m通道核心信號(hào)相應(yīng)的m個(gè)通道中的每一個(gè),這可以包括對(duì)來自離散譯碼時(shí)間幀中的 相應(yīng)通道的第一貢獻(xiàn)和來自核心信號(hào)的相應(yīng)通道(來自縮減參數(shù)譯碼時(shí)間幀)的第二貢獻(xiàn) 進(jìn)行求和。對(duì)于與n-m個(gè)中性通道相應(yīng)的n-m個(gè)通道中的每一個(gè),這可以對(duì)應(yīng)于對(duì)來自離 散譯碼時(shí)間幀中的相應(yīng)通道的第一貢獻(xiàn)和來自前一縮減參數(shù)譯碼時(shí)間幀的相應(yīng)的中性通 道的第二貢獻(xiàn)(即,諸如零的中性值)進(jìn)行求和。這樣,來自縮減參數(shù)譯碼時(shí)間幀中的核心 信號(hào)的m個(gè)通道的貢獻(xiàn)可當(dāng)在緊接在后的離散譯碼時(shí)間幀中形成輸入信號(hào)的時(shí)域表示時(shí) 被使用,例如,以使離散譯碼時(shí)間幀的相應(yīng)通道的值在該離散譯碼時(shí)間幀的起始部分期間 淡入。而且,在其余的n-m個(gè)通道中,附加到m通道核心信號(hào)的通道中的中性值(例如,零) 可以用于使離散譯碼時(shí)間幀的相應(yīng)通道的值淡入。特別地,在音頻解碼器的緩沖器/存儲(chǔ) 器中剩余的來自早先的離散譯碼時(shí)間幀的以及與(典型的)在各縮減參數(shù)譯碼集合期間不 使用的n-m個(gè)通道相關(guān)的任何值可以被附加的中性通道的中性值取代,S卩,可能不被允許 影響在這個(gè)稍后的離散譯碼時(shí)間幀的編碼系統(tǒng)的音頻輸出。以上所提及的早先的離散譯碼 時(shí)間幀可潛在地安置為比當(dāng)前離散譯碼時(shí)間幀早許多個(gè)時(shí)間幀,即,它們可與當(dāng)前離散譯 碼時(shí)間幀相隔許多個(gè)縮減參數(shù)譯碼時(shí)間幀,并且可潛在地對(duì)應(yīng)于輸入信號(hào)所表示的音頻信 號(hào)中后退幾秒或者甚至幾分鐘的音頻內(nèi)容。因此,可能可取的是當(dāng)對(duì)當(dāng)前離散譯碼時(shí)間幀 進(jìn)行解碼時(shí)避免使用與這些早先的離散譯碼時(shí)間幀相關(guān)的數(shù)據(jù)和/或音頻內(nèi)容。
[0060] 本示例性實(shí)施例可以允許輸入信號(hào)的時(shí)域表示中的更平滑的和/或較不明顯的 轉(zhuǎn)變(由從縮減參數(shù)譯碼到離散譯碼的轉(zhuǎn)變引起)。它還可以有助于解碼系統(tǒng)中的更下游 的級(jí)/單元中的輸入信號(hào)的進(jìn)一步處理/解碼,以便在輸入信號(hào)的縮減參數(shù)譯碼與離散譯 碼之間的轉(zhuǎn)變期間實(shí)現(xiàn)改進(jìn)的(或更平滑的)收聽體驗(yàn)。
[0061] 在示例實(shí)施例中,下混級(jí)可以適于在每一離散譯碼時(shí)間幀集合中的至少第一時(shí)間 幀中以及在每一離散譯碼時(shí)間幀集合之后的至少第一時(shí)間幀中工作。下混級(jí)優(yōu)選地可以在 這些時(shí)間幀的起始部分中(即,在輸入信號(hào)的時(shí)域表示中的到離散譯碼的變換以及從離散 譯碼的變換期間)工作。它然后可以在這些轉(zhuǎn)變期間提供下混信號(hào),所述下混信號(hào)可以用 于在輸入信號(hào)中的到離散譯碼的變換以及從離散譯碼的變換期間使編碼系統(tǒng)的輸出具有 改進(jìn)的(或更平滑的)收聽體驗(yàn)。
[0062] 在示例實(shí)施例中,譯碼機(jī)制的組還可以包括參數(shù)譯碼。解碼系統(tǒng)可以適于接收對(duì) 輸入信號(hào)進(jìn)行編碼的比特流,所述輸入信號(hào)在輸入信號(hào)通過參數(shù)譯碼表示音頻信號(hào)的每個(gè) 時(shí)間幀中包括m通道核心信號(hào),所述m通道核心信號(hào)為使得在輸入信號(hào)將音頻信號(hào)表示為η 個(gè)離散編碼通道的每個(gè)時(shí)間幀中,可以使用下混規(guī)范從輸入信號(hào)獲得表示相同的音頻信號(hào) 的m通道核心信號(hào)。
[0063] 在本示例實(shí)施例中,可以使用如下三種譯碼機(jī)制中的任何一種來對(duì)經(jīng)由比特流接 收的輸入信號(hào)的時(shí)間幀進(jìn)行譯碼:離散譯碼、參數(shù)譯碼和縮減參數(shù)譯碼。特別地,用這些譯 碼機(jī)制中的任何一種譯碼的時(shí)間幀可以跟隨在用這些譯碼機(jī)制中的任何一種譯碼的時(shí)間 幀的后面。解碼系統(tǒng)可以適于處理使用這三種譯碼機(jī)制中的任何一種譯碼的時(shí)間幀之間的 任何轉(zhuǎn)變。
[0064] 在本發(fā)明的第二方面內(nèi),提供一種類似于前面的任一示例實(shí)施例中所描述的解碼 系統(tǒng)(所執(zhí)行的方法)那樣重構(gòu)η通道音頻信號(hào)的方法。所述方法可以包括:接收比特流; 從所述比特流提取輸入信號(hào)的頻域表示;并且響應(yīng)于輸入信號(hào)在當(dāng)前時(shí)間幀中被縮減參數(shù) 譯碼并且在緊接在前的時(shí)間幀中被離散譯碼,或者輸入信號(hào)在當(dāng)前時(shí)間幀中被縮減參數(shù)譯 碼并且在緊接在后的時(shí)間幀中被離散譯碼,將輸入信號(hào)的頻域表示的當(dāng)前時(shí)間幀的至少一 部分重新格式化為η通道格式;并且將輸入信號(hào)的頻域表示變換為輸入信號(hào)的時(shí)域表示。 所述方法還可以包括:響應(yīng)于輸入信號(hào)在當(dāng)前時(shí)間幀和(一個(gè)或)兩個(gè)緊接在前的時(shí)間幀 中被離散譯碼,基于η個(gè)離散編碼通道來推導(dǎo)音頻信號(hào);并且響應(yīng)于輸入信號(hào)在當(dāng)前時(shí)間 幀和(一個(gè)或)兩個(gè)緊接在前的時(shí)間幀中被縮減參數(shù)譯碼,基于核心信號(hào)和至少一個(gè)混合 參數(shù)來產(chǎn)生音頻信號(hào)的η通道表示。
[0065] 在本發(fā)明的第二方面內(nèi),提供一種用于對(duì)分割為時(shí)間幀的η通道音頻信號(hào)進(jìn)行編 碼的編碼系統(tǒng),其中,編碼系統(tǒng)適于輸出比特流,所述比特流在給定時(shí)間幀中根據(jù)譯碼機(jī)制 表示音頻信號(hào),所述譯碼機(jī)制選自包含以下譯碼機(jī)制的組:使用η個(gè)離散編碼通道的離散 譯碼;以及縮減參數(shù)譯碼。編碼系統(tǒng)包括:選擇器,其適于對(duì)于給定時(shí)間幀選擇哪個(gè)編碼機(jī) 制將用于表示音頻信號(hào);以及參數(shù)分析級(jí),其可操作為基于音頻信號(hào)的η通道表示并且根 據(jù)下混規(guī)范來輸出將由輸出比特流在縮減參數(shù)譯碼機(jī)制中編碼的m通道核心信號(hào)和至少 一個(gè)混合參數(shù)??蛇x地,編碼系統(tǒng)可以可操作為輸出如下比特流,所述比特流在給定時(shí)間幀 中也根據(jù)參數(shù)譯碼機(jī)制表示音頻信號(hào),并且選擇器可以適于對(duì)于給定時(shí)間幀在離散譯碼、 參數(shù)譯碼和縮減參數(shù)譯碼之間進(jìn)行選擇。
[0066] 在本發(fā)明的第二方面內(nèi),提供一種將η通道音頻信號(hào)編碼為比特流的方法,所述 方法類似于前面的任一實(shí)施例的編碼系統(tǒng)(所執(zhí)行的方法)。所述方法可以包括:接收音 頻信號(hào)的η通道表示;選擇將用于在給定時(shí)間幀中表示音頻信號(hào)的譯碼機(jī)制;響應(yīng)于選擇 通過縮減參數(shù)譯碼對(duì)音頻信號(hào)進(jìn)行編碼,基于音頻信號(hào)的η通道表示并且根據(jù)下混規(guī)范來 形成對(duì)m通道核心信號(hào)和至少一個(gè)混合參數(shù)進(jìn)行編碼的比特流;并且響應(yīng)于選擇通過離散 譯碼對(duì)音頻信號(hào)進(jìn)行編碼,輸出通過η個(gè)離散編碼通道對(duì)音頻信號(hào)進(jìn)行編碼的比特流。
[0067] 在本發(fā)明的第二方面內(nèi),提供一種音頻傳輸系統(tǒng),所述音頻傳輸系統(tǒng)包括根據(jù)前 面的編碼系統(tǒng)和解碼系統(tǒng)的任一實(shí)施例的編碼系統(tǒng)和解碼系統(tǒng)。這些系統(tǒng)通信地連接,并 且編碼系統(tǒng)和解碼系統(tǒng)各自的下混規(guī)范是相同的。
[0068] 要指出,與本發(fā)明的第二方面的實(shí)施例相關(guān)地描述的譯碼機(jī)制(離散譯碼、參數(shù) 譯碼和縮減參數(shù)譯碼)是與關(guān)于本發(fā)明的第一方面描述的譯碼機(jī)制相同的譯碼機(jī)制,并 且本發(fā)明的第二方面的另外的實(shí)施例可以通過將已經(jīng)描述的本發(fā)明的第二方面的實(shí)施例 (或它們的組合)與來自關(guān)于本實(shí)施例的第一方面所描述的實(shí)施例的特征組合來獲得。在 這樣做時(shí),要指出,對(duì)于來自根據(jù)本發(fā)明的第一方面的實(shí)施例的至少一些特征,參數(shù)譯碼時(shí) 間幀和縮減參數(shù)譯碼時(shí)間幀可以互換使用,即,可能不需要區(qū)分這兩種譯碼機(jī)制。
[0069] 在從屬權(quán)利要求中定義了本發(fā)明的兩個(gè)方面的進(jìn)一步的示例實(shí)施例。指出,本發(fā) 明涉及所有特征組合,即使特征被記載在互相不同的權(quán)利要求中仍如此。
[0070] II.示例實(shí)施例
[0071] 圖1以框圖形式例示了根據(jù)本發(fā)明的示例實(shí)施例的解碼系統(tǒng)100。音頻解碼器110 接收比特流Ρ,并且在一個(gè)或多個(gè)處理步驟中從該比特流產(chǎn)生由加圈的字母A所指示的輸 入信號(hào),所述輸入信號(hào)表示η通道音頻信號(hào)。作為一個(gè)例子,可以將Dolby Digital Plus 格式(或Enhanced AC-3)與適于其的音頻解碼器110 -起使用。以下將更詳細(xì)地討論音 頻解碼器110的內(nèi)部工作。輸入信號(hào)A被分割為與音頻信號(hào)的時(shí)間段相應(yīng)的時(shí)間巾貞。優(yōu)選 地,連續(xù)時(shí)間幀是相連的,并且不重疊的。輸入信號(hào)A在給定時(shí)間幀內(nèi)(b)通過參數(shù)譯碼來 表示音頻信號(hào)或者(a)將音頻信號(hào)表示為η個(gè)離散編碼通道W。參數(shù)譯碼數(shù)據(jù)包括與可通 過對(duì)音頻信號(hào)進(jìn)行下混而獲得的下混信號(hào)X相應(yīng)的m通道核心信號(hào)。在輸入信號(hào)A中接收 的參數(shù)譯碼數(shù)據(jù)還可以包括與下混信號(hào)X相關(guān)聯(lián)的一個(gè)或多個(gè)混合參數(shù),這些混合參數(shù)共 同用α表示??商娲?,與下混信號(hào)X相關(guān)聯(lián)的至少一個(gè)混合參數(shù)α可以通過在同一比特 流P或不同比特流中與輸入信號(hào)分離的信號(hào)被接收。關(guān)于輸入信號(hào)的當(dāng)前譯碼機(jī)制(即, 參數(shù)譯碼或離散譯碼)的信息可以在比特流P中被接收或者作為單獨(dú)的信號(hào)被接收。在圖 1中所示的解碼系統(tǒng)中,音頻信號(hào)具有六個(gè)通道,核心信號(hào)具有兩個(gè)通道,即,m = 2,η = 6。 在本公開的一些段落中,為了明確地指示一些連接線適于發(fā)送多通道信號(hào),為這些線提供 了與各自的通道數(shù)量相鄰的交叉線。在離散譯碼機(jī)制中,輸入信號(hào)A可以是音頻信號(hào)的作 為5. 1環(huán)繞聲的表示,具有通道L (左)、R(右)和C (中心)、Lfe (低頻效果)、Ls (左環(huán)繞 聲)、Rs (右環(huán)繞聲)。然而,在參數(shù)譯碼機(jī)制中,在2. 0立體聲中,L通道和R通道用于發(fā)送 核心信號(hào)通道LO (核心左)和RO (核心右)。
[0072] 解碼系統(tǒng)100可以在離散模式下進(jìn)行操作,在所述離散模式下,解碼系統(tǒng)100從η 個(gè)離散編碼通道W推導(dǎo)音頻信號(hào)。解碼系統(tǒng)100還可以在參數(shù)模式下進(jìn)行操作,在所述參 數(shù)模式下,解碼系統(tǒng)100通過執(zhí)行包括空間合成的上混操作來從核心信號(hào)重構(gòu)音頻信號(hào)。
[0073] 下混級(jí)140接收輸入信號(hào),根據(jù)下混規(guī)范執(zhí)行輸入信號(hào)的下混,并且輸出m通道下 混信號(hào)X。在本實(shí)施例中,下混級(jí)140將輸入信號(hào)看作η通道信號(hào),S卩,如果輸入信號(hào)僅包含 m通道核心信號(hào),則輸入信號(hào)被認(rèn)為具有n-m個(gè)另外的通道,這些通道為空/零。在實(shí)踐中, 這可以變?yōu)橛弥行灾担ㄖT如零序列)填充未被占據(jù)的通道。下混級(jí)140形成η個(gè)輸入通道 的m通道線性組合,并且將這些作為下混信號(hào)X輸出。下混規(guī)范規(guī)定了該線性組合的增益, 并且與輸入信號(hào)的譯碼無關(guān),即,當(dāng)下混級(jí)140工作時(shí),它與輸入信號(hào)的譯碼無關(guān)地進(jìn)行操 作。
[0074] 在本實(shí)施例中,當(dāng)音頻信號(hào)被參數(shù)譯碼時(shí),下混級(jí)140接收具有n-m個(gè)空通道的m 通道核心信號(hào)。下混規(guī)范所規(guī)定的線性組合的增益被選擇為使得當(dāng)音頻信號(hào)被參數(shù)譯碼 時(shí),下混信號(hào)X與核心信號(hào)相同,即,線性組合通過核心信號(hào)??梢匀缦碌貙?duì)下混級(jí)進(jìn)行建 模:
【權(quán)利要求】
1. 一種用于重構(gòu)n通道音頻信號(hào)的解碼系統(tǒng)(100),其中,所述解碼系統(tǒng)適于接收比特 流(P),所述比特流(P)對(duì)輸入信號(hào)進(jìn)行編碼,所述輸入信號(hào)被分割為時(shí)間幀,并且在給定 時(shí)間幀中根據(jù)選自以下組的譯碼機(jī)制表示所述音頻信號(hào),所述組包含: a) 使用至少一個(gè)混合參數(shù)(a)的參數(shù)譯碼;和 b) 使用n個(gè)離散編碼通道的離散譯碼, 所述解碼系統(tǒng)能夠操作為基于所述n個(gè)離散編碼通道或者通過空間合成來推導(dǎo)所述 音頻信號(hào), 所述解碼系統(tǒng)包括: 下混級(jí)(140),能夠操作為根據(jù)下混規(guī)范基于所述輸入信號(hào)來輸出m通道下混信號(hào) (X),其中,n>m彡1 ;和 空間合成級(jí)(150),能夠操作為基于所述下混信號(hào)和所述至少一個(gè)混合參數(shù)來輸出所 述音頻信號(hào)的n通道表示(Y), 其中,所述下混級(jí)適于在每一離散譯碼時(shí)間幀集合中的至少第一時(shí)間幀中以及在每一 離散譯碼時(shí)間幀集合之后的至少第一時(shí)間幀中工作。
2. 根據(jù)權(quán)利要求1所述的解碼系統(tǒng),還包括音頻解碼器(110),所述音頻解碼器適于基 于所述比特流輸出所述輸入信號(hào),其中,所述音頻解碼器適于使用重疊變換窗口來執(zhí)行時(shí) 頻變換。
3. 根據(jù)權(quán)利要求2所述的解碼系統(tǒng),其中,所述時(shí)間幀中的每一個(gè)等于所述變換窗口 中的至少一個(gè)的一半長(zhǎng)度。
4. 根據(jù)前述任一項(xiàng)權(quán)利要求所述的解碼系統(tǒng),其中,所述下混級(jí)適于在所述輸入信號(hào) 通過參數(shù)譯碼表示所述音頻信號(hào)的每個(gè)時(shí)間幀內(nèi)工作。
5. 根據(jù)前述任一項(xiàng)權(quán)利要求所述的解碼系統(tǒng),其中,所述解碼系統(tǒng)適于接收對(duì)輸入信 號(hào)進(jìn)行編碼的比特流,所述輸入信號(hào)在其中所述輸入信號(hào)通過參數(shù)譯碼表示音頻信號(hào)的每 個(gè)時(shí)間幀中包括m通道核心信號(hào),所述m通道核心信號(hào)為使得在所述輸入信號(hào)將音頻信號(hào) 表示為n個(gè)離散編碼通道的每個(gè)時(shí)間幀中,能夠使用所述下混規(guī)范從所述輸入信號(hào)獲得表 示相同的音頻信號(hào)的m通道核心信號(hào)。
6. 根據(jù)權(quán)利要求5所述的解碼系統(tǒng),其中,所述下混級(jí)適于在所述輸入信號(hào)通過參數(shù) 譯碼表示音頻信號(hào)的每個(gè)時(shí)間幀中、通過將所述音頻信號(hào)的參數(shù)譯碼表示的核心信號(hào)再現(xiàn) 為下混信號(hào)來產(chǎn)生所述下混信號(hào)。
7. 根據(jù)前述任一項(xiàng)權(quán)利要求所述的解碼系統(tǒng),其中,所述解碼系統(tǒng)適于接收對(duì)輸入信 號(hào)進(jìn)行編碼的比特流,所述輸入信號(hào)在其中所述輸入信號(hào)通過參數(shù)譯碼表示音頻信號(hào)的每 個(gè)時(shí)間幀中是n通道信號(hào),其中,n-m個(gè)通道不用于表示所述音頻信號(hào)。
8. 根據(jù)前述任一項(xiàng)權(quán)利要求所述的解碼系統(tǒng),還包括: 第一延遲線(120),適于接收所述輸入信號(hào);和 混合器(130),通信地連接到所述空間合成級(jí)和所述第一延遲線,并且適于 -在所述系統(tǒng)的參數(shù)模式下,輸出空間合成級(jí)輸出或者從其推導(dǎo)的信號(hào); -在所述系統(tǒng)的離散模式下,輸出第一延遲線輸出;和 -響應(yīng)于在所述輸入信號(hào)中發(fā)生的參數(shù)譯碼和離散譯碼之間的變化,輸出空間合成級(jí) 輸出與第一延遲線輸出之間的混合轉(zhuǎn)變。
9. 根據(jù)權(quán)利要求8所述的解碼系統(tǒng),其中,所述第一延遲線能夠操作為引起與總通過 時(shí)間相對(duì)應(yīng)的延遲,所述總通過時(shí)間是與所述下混級(jí)和所述空間合成級(jí)相關(guān)聯(lián)的。
10. 根據(jù)權(quán)利要求9所述的解碼系統(tǒng),還包括適于接收混合器輸出的第二延遲線 (160),其中,所述第一延遲線和第二延遲線所引起的總延遲對(duì)應(yīng)于一個(gè)時(shí)間幀的長(zhǎng)度的倍 數(shù)。
11. 根據(jù)前述任一項(xiàng)權(quán)利要求所述的解碼系統(tǒng),其中,所述空間合成級(jí)適于應(yīng)用混合 參數(shù)值,所述混合參數(shù)值通過如下這樣的連續(xù)時(shí)間幀之間的內(nèi)插而獲得,在所述連續(xù)時(shí)間 幀中,在參數(shù)譯碼或者在適用的情況下的縮減參數(shù)譯碼中輸入信號(hào)定義用于時(shí)間幀中的非 起始點(diǎn)的明確的混合參數(shù)值。
12. 根據(jù)權(quán)利要求11所述的解碼系統(tǒng),其中,所述空間合成級(jí)適于響應(yīng)于當(dāng)前時(shí)間幀 是時(shí)間幀集合中的第一時(shí)間幀而發(fā)起離散到參數(shù)轉(zhuǎn)變,在所述集合中每個(gè)時(shí)間幀被參數(shù)譯 碼或者在適用的情況下被縮減參數(shù)譯碼,所述離散到參數(shù)轉(zhuǎn)變包括對(duì)最早的明確的混合參 數(shù)值進(jìn)行向后外插直到當(dāng)前時(shí)間幀的開始為止。
13. 根據(jù)權(quán)利要求11或12所述的解碼系統(tǒng),其中,所述空間合成級(jí)適于響應(yīng)于當(dāng)前時(shí) 間幀是離散譯碼時(shí)間幀集合中的第一時(shí)間幀而發(fā)起參數(shù)到離散轉(zhuǎn)變,所述參數(shù)到離散轉(zhuǎn)變 包括對(duì)最新的明確的混合參數(shù)值進(jìn)行向前外插,直到至少當(dāng)前時(shí)間幀的結(jié)束為止。
14. 根據(jù)前述任一項(xiàng)權(quán)利要求所述的解碼系統(tǒng),其中,所述空間合成級(jí)包括: 第一變換級(jí)(151),適于接收所述m通道下混信號(hào)的時(shí)域表示,并且基于其輸出所述下 混信號(hào)的頻域表示(Xf); 上混級(jí)(155),適于基于所述下混信號(hào)的頻域表示和所述至少一個(gè)混合參數(shù)來輸出所 述音頻信號(hào)的所述n通道表示的頻域表示(Yf);和 第二變換級(jí)(152),適于接收所述音頻信號(hào)的n通道表示的頻域表示,并且基于其輸出 所述音頻信號(hào)的n通道表示的時(shí)域表示作為所述空間合成級(jí)的輸出。
15. 根據(jù)權(quán)利要求14所述的解碼系統(tǒng),其中,所述上混級(jí)適于形成包括所述下混信號(hào) 的m通道頻域表示中的通道的線性組合;并且將其輸出作為所述音頻信號(hào)的n通道表示的 頻域表示,所述至少一個(gè)混合參數(shù)控制所述線性組合中的所述下混信號(hào)的m通道頻域表示 中的至少一個(gè)通道相關(guān)的至少一個(gè)增益。
16. 根據(jù)前述任一項(xiàng)權(quán)利要求所述的解碼系統(tǒng),其中,所述下混級(jí)適于形成所述輸入信 號(hào)的時(shí)域表示的通道的線性組合。
17. 根據(jù)前述任一項(xiàng)權(quán)利要求所述的解碼系統(tǒng),還包括控制器(170),所述控制器用于 基于當(dāng)前時(shí)間幀和前一時(shí)間幀的譯碼機(jī)制來控制所述空間合成級(jí)和任何混合器。
18. 根據(jù)權(quán)利要求17所述的解碼系統(tǒng),其中,所述控制器基于當(dāng)前時(shí)間幀和先前兩個(gè) 時(shí)間幀的譯碼機(jī)制來控制所述空間合成級(jí)和任何混合器。
19. 根據(jù)前述任一項(xiàng)權(quán)利要求所述的解碼系統(tǒng),其中,譯碼機(jī)制的組還包括: c)縮減參數(shù)譯碼, 所述解碼系統(tǒng)適于接收對(duì)輸入信號(hào)進(jìn)行編碼的比特流,所述輸入信號(hào)在其中輸入信號(hào) 通過縮減參數(shù)譯碼表示音頻信號(hào)的每個(gè)時(shí)間幀中具有m通道核心信號(hào)的形式,所述m通道 核心信號(hào)為使得在其中輸入信號(hào)將音頻信號(hào)表示為n個(gè)離散編碼通道的每個(gè)時(shí)間幀中,能 夠使用下混規(guī)范從所述輸入信號(hào)獲得表示相同的音頻信號(hào)的m通道核心信號(hào)。
20. 根據(jù)權(quán)利要求19所述的解碼系統(tǒng),其中,所述空間合成級(jí)(150)能夠操作為在其中 輸入信號(hào)通過縮減參數(shù)譯碼表示音頻信號(hào)的每個(gè)時(shí)間幀中基于所述輸入信號(hào)和所述至少 一個(gè)混合參數(shù)輸出所述音頻信號(hào)的n通道表示。
21. 根據(jù)權(quán)利要求19或20所述的解碼系統(tǒng),適于接收如下格式的比特流,在所述格式 中,所述輸入信號(hào)的緊接在所述輸入信號(hào)的參數(shù)譯碼時(shí)間幀后面的每個(gè)時(shí)間幀通過縮減參 數(shù)譯碼或離散譯碼被譯碼。
22. 根據(jù)前述任一項(xiàng)權(quán)利要求所述的解碼系統(tǒng),適于接收如下格式的比特流,在所述格 式中,所述輸入信號(hào)的緊接在所述輸入信號(hào)的離散譯碼時(shí)間幀前面的每個(gè)時(shí)間幀通過離散 譯碼或參數(shù)譯碼被譯碼,并且其中,所述輸入信號(hào)的緊接在所述輸入信號(hào)的離散譯碼時(shí)間 幀后面的每個(gè)時(shí)間幀通過離散譯碼或參數(shù)譯碼被譯碼。
23. -種重構(gòu)n通道音頻信號(hào)的方法,所述方法包括以下步驟: 接收比特流(P),所述比特流對(duì)輸入信號(hào)進(jìn)行編碼,所述輸入信號(hào)被分割為時(shí)間幀,并 且在給定時(shí)間幀中根據(jù)選自以下組的譯碼機(jī)制表示所述音頻信號(hào),所述組包含: a) 使用至少一個(gè)混合參數(shù)(a )的參數(shù)譯碼;和 b) 使用n個(gè)離散編碼通道的離散譯碼, 響應(yīng)于當(dāng)前時(shí)間幀是離散譯碼時(shí)間幀集合中的第一時(shí)間幀,或者當(dāng)前時(shí)間幀是離散譯 碼時(shí)間幀集合之后的第一時(shí)間幀,根據(jù)下混規(guī)范基于所述輸入信號(hào)產(chǎn)生m通道下混信號(hào), 其中,n>m > 1 ; 響應(yīng)于所述輸入信號(hào)在當(dāng)前時(shí)間幀和先前兩個(gè)時(shí)間幀中被離散譯碼,基于所述n個(gè)離 散編碼通道推導(dǎo)音頻信號(hào);和 響應(yīng)于所述輸入信號(hào)在當(dāng)前時(shí)間幀和先前兩個(gè)時(shí)間幀中被參數(shù)譯碼,基于所述下混信 號(hào)和所述至少一個(gè)混合參數(shù)產(chǎn)生音頻信號(hào)的n通道表示。
24. 根據(jù)權(quán)利要求23所述的方法,包括以下步驟: 響應(yīng)于所述輸入信號(hào)在當(dāng)前時(shí)間巾貞和前一時(shí)間巾貞中被離散譯碼,基于所述n個(gè)離散編 碼通道推導(dǎo)音頻信號(hào);以及 響應(yīng)于所述輸入信號(hào)在當(dāng)前時(shí)間幀和前一時(shí)間幀中被參數(shù)譯碼,基于所述下混信號(hào)和 所述至少一個(gè)混合參數(shù)產(chǎn)生音頻信號(hào)的n通道表示。
25. 根據(jù)權(quán)利要求23或24所述的方法,其中,所述輸入信號(hào)的其中所述輸入信號(hào)通過 參數(shù)譯碼表示音頻信號(hào)的每個(gè)時(shí)間巾貞包括對(duì)于給定時(shí)間巾貞中的非起始點(diǎn)的所述至少一個(gè) 混合參數(shù)的值,所述方法還包括以下步驟: 響應(yīng)于當(dāng)前時(shí)間幀是參數(shù)譯碼時(shí)間幀集合中的第一時(shí)間幀,對(duì)所接收的所述至少一個(gè) 混合參數(shù)的值進(jìn)行向后外插,直到當(dāng)前時(shí)間幀的開始為止。
26. 根據(jù)權(quán)利要求23至25中任一項(xiàng)所述的方法,還包括以下步驟: 響應(yīng)于所述輸入信號(hào)在當(dāng)前時(shí)間幀中被離散譯碼并且在前一時(shí)間幀中被參數(shù)譯碼,基 于所述下混信號(hào)并且基于所述至少一個(gè)混合參數(shù)的與前一時(shí)間幀相關(guān)聯(lián)的至少一個(gè)值來 產(chǎn)生音頻信號(hào)的n通道表示,并且在當(dāng)前時(shí)間幀期間轉(zhuǎn)變?yōu)榛谒鰊個(gè)離散編碼通道推 導(dǎo)音頻信號(hào)。
27. -種用于對(duì)分割為時(shí)間幀的n通道音頻信號(hào)進(jìn)行編碼的編碼系統(tǒng)(200),其中,所 述編碼系統(tǒng)適于輸出比特流(P),所述比特流在給定時(shí)間幀中根據(jù)選自以下組的譯碼機(jī)制 表示所述音頻信號(hào),所述組包含: a) 參數(shù)譯碼;和 b) 使用n個(gè)離散編碼通道的離散譯碼, 所述編碼系統(tǒng)包括: 選擇器(230),適于對(duì)于給定時(shí)間幀選擇哪個(gè)編碼機(jī)制將用于表示音頻信號(hào);和 參數(shù)分析級(jí)(240),能夠操作為基于音頻信號(hào)的n通道表示并且根據(jù)下混規(guī)范來輸 出將由輸出的比特流在參數(shù)譯碼機(jī)制中編碼的m通道核心信號(hào)(X)和至少一個(gè)混合參數(shù) (a ),其中,n>m 彡 1。
28. 根據(jù)權(quán)利要求27所述的編碼系統(tǒng),其中,該譯碼機(jī)制的組還包括: c) 縮減參數(shù)譯碼, 其中,在參數(shù)譯碼機(jī)制和離散譯碼機(jī)制中使用n通道信號(hào)格式,并且在縮減參數(shù)譯碼 機(jī)制中使用m通道信號(hào)格式。
29. 根據(jù)權(quán)利要求28所述的編碼系統(tǒng),其中,所述選擇器適于選擇在緊接在參數(shù)譯碼 時(shí)間幀后面的時(shí)間幀中通過縮減參數(shù)譯碼或離散譯碼表示音頻信號(hào)。
30. 根據(jù)權(quán)利要求27至29中的任一個(gè)所述的編碼系統(tǒng),其中,所述選擇器適于: 選擇在緊接在離散譯碼時(shí)間幀后面的時(shí)間幀中通過離散譯碼或參數(shù)譯碼表示音頻信 號(hào);以及 選擇在緊接在離散譯碼時(shí)間幀后面的時(shí)間幀中通過離散譯碼或參數(shù)譯碼表示音頻信 號(hào)。
31. -種音頻發(fā)布系統(tǒng),所述音頻發(fā)布系統(tǒng)包括根據(jù)權(quán)利要求27至30中任一項(xiàng)所述的 編碼系統(tǒng)和根據(jù)權(quán)利要求1至22中任一項(xiàng)所述的解碼系統(tǒng),所述編碼系統(tǒng)和所述解碼系統(tǒng) 通信地連接,并且所述編碼系統(tǒng)和所述解碼系統(tǒng)各自的下混規(guī)范是相同的。
32. -種將n通道音頻信號(hào)編碼為比特流(P)的方法,所述方法包括以下步驟: 接收所述音頻信號(hào)的n通道表示; 從以下組選擇要使用哪個(gè)譯碼機(jī)制在給定時(shí)間幀中表示所述音頻信號(hào),所述組包括: a) 參數(shù)譯碼;和 b) 使用n個(gè)離散編碼通道的離散譯碼; 響應(yīng)于通過參數(shù)譯碼對(duì)所述音頻信號(hào)進(jìn)行編碼的決定,基于所述音頻信號(hào)的n通道表 示并且根據(jù)下混規(guī)范來形成比特流,所述比特流對(duì)m通道核心信號(hào)(X)和至少一個(gè)混合參 數(shù)(〇)進(jìn)行編碼,其中,n>m彡1 ;和 響應(yīng)于通過離散譯碼對(duì)所述音頻信號(hào)進(jìn)行編碼的決定,輸出通過n個(gè)離散編碼通道對(duì) 所述音頻信號(hào)進(jìn)行編碼的比特流。
33. -種包括計(jì)算機(jī)可讀介質(zhì)的計(jì)算機(jī)程序產(chǎn)品,所述計(jì)算機(jī)可讀介質(zhì)具有用于執(zhí)行 根據(jù)權(quán)利要求23至26和32中任一項(xiàng)所述的方法的指令。
34. -種根據(jù)前述任一項(xiàng)權(quán)利要求所述的裝置或方法,其中,n = 6, m = 2。
【文檔編號(hào)】G10L19/18GK104364843SQ201380030996
【公開日】2015年2月18日 申請(qǐng)日期:2013年6月14日 優(yōu)先權(quán)日:2012年6月14日
【發(fā)明者】H·普恩哈根, L·塞勒斯特羅姆, K·J·羅德恩, K·克約爾林, L·維爾莫斯 申請(qǐng)人:杜比國(guó)際公司