元數(shù)據(jù)驅(qū)動的動態(tài)范圍控制的制作方法
【專利說明】
[000。 相關(guān)問題
[0002] 本專利申請要求于2013年3月29日提交的美國臨時專利申請61/806, 628 ;于 2013年7月24日提交的美國臨時專利申請61/857, 966 及于2013年10月16日提交的 美國臨時專利申請61/891,687的較早申請日期的權(quán)益。
技術(shù)領(lǐng)域
[0003] 本發(fā)明的實(shí)施例通常設(shè)及一種用于對音頻信號進(jìn)行編碼并對其應(yīng)用動態(tài)范圍控 制/壓縮值RC)的系統(tǒng)和方法。此外,本文所述的系統(tǒng)和方法考慮到開發(fā)中的新的編解碼 器在MPEG-H(3D音頻)中的DRC需求。還描述了其他實(shí)施例。
【背景技術(shù)】
[0004] 動態(tài)范圍控制/壓縮值RC)通過(1)使得音頻信號中的輕柔部分較響亮;似使得 音頻信號中的響亮部分較輕柔;或(3)同時使得輕柔部分較響亮并使得響亮部分較輕柔來 在某種程度上減小音頻信號的動態(tài)范圍。減小的動態(tài)范圍在若干個情況下可為所期望的, 運(yùn)些情況包括對于可僅再現(xiàn)小的動態(tài)范圍并同時保持低失真、收聽具有分屯、噪聲的環(huán)境的 音頻回放系統(tǒng)的情況,W及在收聽者不想打擾其他人的情況。
[0005] 盡管DRC是如今音頻編解碼器的重要特征,但若干個新近的音頻編解碼器并不支 持DRC。例如,移動圖像專家組(MPEG)設(shè)定的統(tǒng)一的語音和音頻編碼扣SAC)標(biāo)準(zhǔn)中缺少 DRC。高級音頻編碼(AAC)結(jié)合DRC工具,但該DRC工具具有包括有限時間分辨率和混疊失 真在內(nèi)的缺點(diǎn)。
【發(fā)明內(nèi)容】
[0006] 本發(fā)明描述了一種用于對動態(tài)范圍控制/壓縮值RC)增益值進(jìn)行編碼并將其應(yīng)用 于一條聲音節(jié)目內(nèi)容的系統(tǒng)和方法。在一個實(shí)施例中,表示一條聲音節(jié)目內(nèi)容的DRC增益 曲線的一組DRC增益值可被分為與該條聲音節(jié)目內(nèi)容的帖對應(yīng)的若干個帖。附加字段或一 組字段可與表示一條聲音節(jié)目內(nèi)容的音頻信號一起被包括。附加字段可使用線性插值或樣 條插值來表示DRC增益值。在一個實(shí)施例中,附加字段可包括:1)用于每個DRC帖的初始增 益值,2)DRC曲線中的特定點(diǎn)處的一組斜率值,3)用于每對連續(xù)斜率值的一組時間增量值, W及4)表示與斜率值對應(yīng)的點(diǎn)之間的DRC增益曲線中的DRC增益值的變化的一個或多個 增益增量值。如本文所述,本文的系統(tǒng)和方法提供了一種用于對DRC增益值進(jìn)行編碼并將 其應(yīng)用于一條聲音節(jié)目內(nèi)容的有效技術(shù)。
[0007] W上概述不包括本發(fā)明的所有方面的詳盡列表??深A(yù)期的是,本發(fā)明包括可由上 文概述的各個方面W及在下文的【具體實(shí)施方式】中公開并且在隨該專利申請?zhí)峤坏臋?quán)利要 求中特別指出的各種方面的所有合適的組合來實(shí)施的所有系統(tǒng)和方法。此類組合具有未在 上述
【發(fā)明內(nèi)容】
中具體闡述的特定優(yōu)點(diǎn)。
【附圖說明】
[000引本發(fā)明的實(shí)施例W舉例的方式進(jìn)行說明,而不僅限于各個附圖的圖示,在附圖中 類似的附圖標(biāo)號指示類似的元件。應(yīng)當(dāng)指出,本公開中提到"一"或"一個"實(shí)施例未必是 同一實(shí)施例,并且它們表示至少一個實(shí)施例。
[0009] 圖1示出了根據(jù)一個實(shí)施例的在音頻解碼器之后的壓縮后處理的框圖。
[0010] 圖2示出了根據(jù)一個實(shí)施例的動態(tài)范圍控制/壓縮值RC)增益表示。
[0011] 圖3示出了根據(jù)一個實(shí)施例的編碼器DRC特性。
[0012] 圖4示出了根據(jù)一個實(shí)施例的在發(fā)射器處生成的一組示例性DRC元數(shù)據(jù)。
[0013] 圖5示出了根據(jù)一個實(shí)施例的示例性差值類型。
[0014] 圖6示出了根據(jù)一個實(shí)施例的兩個延遲模式。
[0015] 圖7示出了根據(jù)一個實(shí)施例的林奎茨-萊利化inkwitz-化ley)交叉濾波器的拓 撲結(jié)構(gòu)。
[0016] 圖8示出了根據(jù)一個實(shí)施例的利用具有64個子頻帶的濾波器組的4頻帶DRC的 加權(quán)系數(shù)的實(shí)例。
[0017] 圖9示出了根據(jù)一個實(shí)施例的用于某些對應(yīng)解碼器窗口形狀的動態(tài)范圍控制/壓 縮值RC)窗口形狀。
[0018] 圖10示出了根據(jù)一個實(shí)施例的應(yīng)用于單獨(dú)小塊窗口的DRC增益值。
[0019] 圖11示出了根據(jù)一個實(shí)施例的應(yīng)用于音頻信號上的DRC增益值。
【具體實(shí)施方式】
[0020] 現(xiàn)在將參考所附附圖來解釋本發(fā)明的若干個實(shí)施例。每當(dāng)在實(shí)施例中描述的部件 的形狀、相對位置和其它方面未明確限定時,本發(fā)明的范圍并不僅局限于所示出的部件,所 示出的部件僅用于例證的目的。另外,雖然闡述了許多細(xì)節(jié),但應(yīng)當(dāng)理解,本發(fā)明的一些實(shí) 施例可在沒有運(yùn)些細(xì)節(jié)的情況下被實(shí)施。在其他情況下,未詳細(xì)示出熟知的電路、結(jié)構(gòu)和技 術(shù),W免模糊對本【具體實(shí)施方式】的理解。
[0021] 將動態(tài)范圍控制/壓縮值RC)元數(shù)據(jù)結(jié)合到比特流/格式中的元數(shù)據(jù)系統(tǒng)相比于 在收聽者端處(即,在回放處)確定DRC增益值的系統(tǒng)提供若干個優(yōu)點(diǎn)。運(yùn)些優(yōu)點(diǎn)包括(1) 音頻信號的回放處的較低復(fù)雜性;(2)DRC的復(fù)雜性在回放期間出現(xiàn)的問題減少,運(yùn)就允許 實(shí)現(xiàn)更復(fù)雜的DRC程序;W及(3)收聽者端處的音頻回放設(shè)備可決定是否應(yīng)用DRC。盡管 使用DRC元數(shù)據(jù)系統(tǒng)提供了若干個優(yōu)點(diǎn),但傳統(tǒng)的DRC元數(shù)據(jù)系統(tǒng)諸如由高級電視系統(tǒng)委 員會(ATSC)和移動圖像專家組(M陽G)所提供的那些傳統(tǒng)的DRC元數(shù)據(jù)系統(tǒng)也提供了若干 個缺點(diǎn)。
[002引傳統(tǒng)的DRC元數(shù)據(jù)系統(tǒng)(例如,由ATSC和MPEG標(biāo)準(zhǔn)所限定的那些傳統(tǒng)DRC元數(shù) 據(jù)系統(tǒng))支持如表1所示的輕壓縮和重壓縮。在大多數(shù)情況下,DRC增益值更新的速率為 每帖一個值。在48曲Z的采樣率下,運(yùn)相當(dāng)于介于21ms和43ms之間的更新間隔。輕壓縮 模式中的AC-3在48曲Z、約5ms的情況下具有快六倍的速率。此外,對于較低音頻采樣率, 運(yùn)些傳統(tǒng)的DRC元數(shù)據(jù)系統(tǒng)中的DRC增益值W較低速率更新。
[0023]
[002引表I:音頻標(biāo)準(zhǔn)中的DRC增益元數(shù)據(jù)的參數(shù)
[0026] 實(shí)際DRC調(diào)諧表明,對于某些音頻信號的增益變化應(yīng)比可利用當(dāng)前標(biāo)準(zhǔn)所實(shí)現(xiàn)的 增益變化快得多。
[0027] 當(dāng)前DRC標(biāo)準(zhǔn)和系統(tǒng)(諸如MPEG-AAC和ATSC)的另一問題源于在應(yīng)用反相MDCT 濾波器組之前將DRC增益應(yīng)用于頻域中的事實(shí)。MDCT濾波器組為基于時域混疊消除的轉(zhuǎn) 換。如果對連續(xù)重疊塊應(yīng)用不同的增益值,則無法實(shí)現(xiàn)混疊消除。增益變化可導(dǎo)致聽覺失 真諸如預(yù)回聲。運(yùn)對于響板記錄可能很容易示出。
[0028] 在一個實(shí)施例中,如果在解碼器重建音頻信號之后將DRC增益應(yīng)用于時域中,貝U 可避免MDCT偽像。在頻域中,每個長塊或每個短塊至多可修改增益一次。相比之下,本文 所述的時域方法支持所期望的更高時間分辨率。
[0029] 盡管時域方法當(dāng)前不支持多頻帶DRC(對MPEG輕壓縮可用),但可改進(jìn)本文所述的 實(shí)施例W支持多頻帶DRC。由于插值和DRC增益的應(yīng)用,本發(fā)明提出的方案可稍微增大解碼 器復(fù)雜性。然而,考慮到特別是利用可在高比特率下出現(xiàn)并且可利用高質(zhì)量回放系統(tǒng)重現(xiàn) 的內(nèi)容來避免不必要的失真,運(yùn)些缺點(diǎn)顯得無關(guān)緊要。
[0030] DRC工具
[0031] SM
[0032] 本文所述的DRC工具基于可應(yīng)用于時域或子頻帶域音頻信號(諸如肥-AAC解碼 器的QMF濾波器組的子頻帶)的統(tǒng)一DRC增益編碼。W下描述首先涵蓋了時域應(yīng)用。對于 子頻帶域應(yīng)用,僅描述了對時域方法的修改。
[0033] 時域麻用
[0034] 如圖1所示,本節(jié)描述了動態(tài)壓縮工具如何應(yīng)用于解碼之后的時域音頻信號。圖 1示出了在音頻解碼器之后的壓縮后處理的框圖。在一個實(shí)施例中,DRC工具的解碼器部件 由元數(shù)據(jù)來驅(qū)動,該元數(shù)據(jù)有效地表示壓縮增益樣本和用于插值的參數(shù)。在一些實(shí)施例中, 增益樣本可盡可能快地更新W準(zhǔn)確地表示下至至少Ims的更新間隔的增益變化。如果增益 基本上恒定,則每DRC帖僅使用單個增益樣本可足W。為了使比特率最小化,編碼器可僅選 擇足夠的DRC增益樣本W(wǎng)確保解碼之后的音頻信號中的重建的DRC增益的足夠精度。實(shí)際 上,在存在較大增益變化的情況下,運(yùn)可能意味著較小的更新間隔。
[0035] 由于編碼器僅提供稀疏采樣的增益值,因此解碼器可應(yīng)用插值W實(shí)現(xiàn)樣本之間的 平滑增益轉(zhuǎn)換。經(jīng)插值的增益的采樣率為音頻采樣率。所使用的插值技術(shù)可基于樣條。兩個 相繼增益樣本之間的一個區(qū)段的內(nèi)插值從該區(qū)段的兩端處的兩個增益樣本及其斜率(導(dǎo) 數(shù))導(dǎo)出。因此,當(dāng)從一個區(qū)段過渡到下一個區(qū)段時,由于該兩個區(qū)段在過渡點(diǎn)處具有相同 斜率,因此一階導(dǎo)數(shù)是連續(xù)的。
[0036] 圖2示出了基于經(jīng)量化的DRC增益樣本的插值。上面的曲線A示出了W諸如音頻 采樣率的高采樣率的DRC輸出增益。DRC增益的樣本和斜率(即,圓圈和箭頭)基于均勻時 間網(wǎng)格稀疏地提取。下面的曲線B示出了經(jīng)量化的增益樣本坐標(biāo)(時間和值)和經(jīng)量化的 斜率,該兩者被傳輸至DRC解碼器工具。解碼器工具在增益曲線應(yīng)用于由虛線所示的音頻 信號之前對其進(jìn)行插值。
[0037] 在一個實(shí)施例中,用于對增益曲線進(jìn)行采樣的最小可能時間間隔為介于0. 5ms和 1.Oms之間的固定值并且最大可能時間間隔為每DRC帖一個增益樣本。
[0038] 除了上述樣條模式之外,"簡單"模式在沒有定時參數(shù)和斜率參數(shù)的情況下也可用 于傳輸每DRC帖僅一個DRC增益值。該模式最適合于具有基本上恒定DRC增益的帖并且占 用最小數(shù)量的位。
[0039] 對于DRC工具與音頻編解碼器協(xié)同應(yīng)用,提供如下參數(shù)來調(diào)節(jié)DRC帖尺寸和時間 分辨率,使得編解碼器和DRC處理在復(fù)雜性和延遲方面可最有效地完成。運(yùn)些參數(shù)為:
[0040] ?W音頻采樣間隔為單位的DRC帖尺寸
[00川 ?W音頻采樣間隔為單位的delta_t_min
[004引.延遲模式
[0043] 盡管運(yùn)些參數(shù)具有默認(rèn)值,但編解碼器規(guī)格可覆寫運(yùn)些默認(rèn)值。
[0044] 修放DRC特忡
[0045] DRC工具支持通過W下若干種方式對經(jīng)解碼的DRC增益進(jìn)行的修改:
[0046] ?升壓因子
[0047] ?壓縮因子
[004引 ?自定義DRC特性
[0049] 升壓因子為W地為單位的應(yīng)用于正增益值