用于校正影響音頻信息的播放響度和動(dòng)態(tài)范圍的元數(shù)據(jù)的方法

文檔序號(hào)：7537996閱讀：526來(lái)源：國(guó)知局

導(dǎo)航： X技術(shù)> 最新專利>電子電路裝置的制造及其應(yīng)用技術(shù)

專利名稱：用于校正影響音頻信息的播放響度和動(dòng)態(tài)范圍的元數(shù)據(jù)的方法
技術(shù)領(lǐng)域：
一般而言，本發(fā)明涉及音頻編碼和播放，具體來(lái)說(shuō)，涉及控制播放過(guò)程中的音頻信息的響度和動(dòng)態(tài)范圍。
背景技術(shù)：
隨著廣播和電視節(jié)目和預(yù)先記錄的音頻材料中的音頻的響度的變化，在消費(fèi)者和音頻專業(yè)人員等人士中出現(xiàn)不滿意的狀況越來(lái)越嚴(yán)重。隨著聽(tīng)眾從一個(gè)電臺(tái)(電視臺(tái))調(diào)諧到另一個(gè)電臺(tái)(電視臺(tái))，隨著從一個(gè)給定電臺(tái)(電視臺(tái))接收到的節(jié)目在主節(jié)目和商業(yè)廣告之間切換，以及隨著聽(tīng)眾在其播放系統(tǒng)中改變介質(zhì)，如在不同的CD或不同的DVD之間切換，常常會(huì)發(fā)生響度變化比較大的情況。聽(tīng)眾常常被迫調(diào)整它們的接收器和播放系統(tǒng)的音量控制器，以保持相對(duì)的響度。
已經(jīng)提出的用于克服此問(wèn)題的一個(gè)解決方案是使用伴隨音頻信息的控制信息或“元數(shù)據(jù)”。在節(jié)目或記錄的信號(hào)中可以提供元數(shù)據(jù)或描述音頻數(shù)據(jù)的數(shù)據(jù)，以控制音頻信息的播放響度。在2001年8月20日發(fā)布的標(biāo)題為“Revision A to Digital Audio Compression(AC-3)Standard”的Advanced Television Systems Committee(ATSC)A/52A文檔中描述了這種元數(shù)據(jù)的一個(gè)示例。此特別的標(biāo)準(zhǔn)規(guī)定了包括涉及播放信號(hào)電平和動(dòng)態(tài)范圍的DIALNORM、COMPR和DYNRNG參數(shù)的元數(shù)據(jù)。信號(hào)電平和動(dòng)態(tài)范圍兩者都影響信號(hào)的感覺(jué)到的或主觀級(jí)別，被稱為“響度”。符合此ATSC音頻標(biāo)準(zhǔn)的接收器使用DIALNORM參數(shù)來(lái)控制播放信號(hào)電平，并可以使用COMPR和DYNRNG參數(shù)來(lái)控制播放信號(hào)動(dòng)態(tài)范圍的壓縮。
如果這種元數(shù)據(jù)在音頻內(nèi)容創(chuàng)建、分發(fā)、播放和記錄過(guò)程中被正確地使用，則可以消除或至少大大地縮小播放響度的過(guò)度的變化的問(wèn)題。令人遺憾的是，元數(shù)據(jù)有時(shí)被濫用或根本不使用，因?yàn)樗诲e(cuò)誤地理解，因?yàn)橄鄳?yīng)的人不知道如何正確地使用它，或因?yàn)樗糜谝圆缓线m的方式產(chǎn)生藝術(shù)效果。

發(fā)明內(nèi)容
本發(fā)明的目的是提供用于校正播放過(guò)程中的音頻信息的播放響度和動(dòng)態(tài)范圍的方法。
根據(jù)本發(fā)明的一個(gè)方面，用于校正音頻信息的播放響度和動(dòng)態(tài)范圍的方法接收輸入信號(hào)，該輸入信號(hào)傳送代表第一響度規(guī)范化級(jí)別、第一動(dòng)態(tài)范圍調(diào)整級(jí)別以及由編碼過(guò)程產(chǎn)生的編碼音頻信息的數(shù)據(jù)；通過(guò)對(duì)輸入信號(hào)應(yīng)用解碼過(guò)程獲取解碼音頻信息；通過(guò)對(duì)解碼音頻信息的分析獲取響度的度量，并從響度的度量導(dǎo)出第二響度規(guī)范化級(jí)別；通過(guò)對(duì)解碼音頻信息的分析，并從第一動(dòng)態(tài)范圍調(diào)整級(jí)別，獲取由編碼過(guò)程使用的壓縮配置文件的估計(jì)；以及生成輸出信號(hào)，該輸出信號(hào)有條件地傳送代表第二響度規(guī)范化級(jí)別和動(dòng)態(tài)范圍調(diào)整級(jí)別的數(shù)據(jù)，所述數(shù)據(jù)是響應(yīng)音頻信息振幅，第二響度規(guī)范化級(jí)別和壓縮配置文件的估計(jì)而獲得的。
通過(guò)參考下列討論和附圖，可以更好地理解本發(fā)明的各種功能以及其優(yōu)選實(shí)施例，在幾個(gè)附圖中，類似的參考編號(hào)表示相同的元素。下列討論和圖形的內(nèi)容是只作為示例來(lái)闡述的，不應(yīng)該理解為對(duì)本發(fā)明的范圍的限制。

圖1是在典型的廣播和記錄系統(tǒng)中發(fā)生的過(guò)程的簡(jiǎn)要方框圖。
圖2是用于提供具有音頻信息和元數(shù)據(jù)的輸出信號(hào)的設(shè)備的簡(jiǎn)要方框圖，其中，元數(shù)據(jù)可以用來(lái)校正音頻信息的播放響度和動(dòng)態(tài)范圍。
圖3-4簡(jiǎn)要圖2中所顯示的設(shè)備內(nèi)的組件的簡(jiǎn)要方框圖。
圖5-8是傳送編碼音頻信息和元數(shù)據(jù)的信號(hào)的示意圖。
圖9-11是元數(shù)據(jù)如何用來(lái)校正三段音頻信息的響度和動(dòng)態(tài)范圍的假設(shè)圖解說(shuō)明。
圖12是顯示了可以用來(lái)利用修改過(guò)的元數(shù)據(jù)參數(shù)生成輸出信號(hào)的幀的過(guò)程中的步驟的圖表。
圖13是可以用來(lái)實(shí)現(xiàn)本發(fā)明的各個(gè)方面的設(shè)備的簡(jiǎn)要方框圖。
具體實(shí)施例方式
A.引言圖1是在典型的廣播或記錄系統(tǒng)中發(fā)生的過(guò)程的示意圖。源過(guò)程1代表通過(guò)合成或通過(guò)從諸如現(xiàn)場(chǎng)音樂(lè)會(huì)或體育賽事之類的來(lái)源獲取音頻信息的活動(dòng)。分發(fā)過(guò)程2代表各種各樣的活動(dòng)從一個(gè)或多個(gè)來(lái)源接收音頻信息并將其中的所有或部分組合為一個(gè)完整的節(jié)目，用于廣播或記錄。也可以獲取視頻信息以及其他信息類型，并以各種方式組合為完整的節(jié)目。傳送過(guò)程3代表使完整的節(jié)目播放或記錄并隨后提供給播放過(guò)程4的活動(dòng)。在這些過(guò)程中的一些或所有過(guò)程中，可以對(duì)音頻信息進(jìn)行編碼，以降低其信息容量要求，以便它可以存儲(chǔ)在較小的空間中或使用較低的帶寬進(jìn)行傳輸。
在播放和記錄系統(tǒng)的優(yōu)選的實(shí)現(xiàn)方式中，如圖1所示的每一個(gè)過(guò)程都允許音頻內(nèi)容作者和音頻工程師指定元數(shù)據(jù)，該元數(shù)據(jù)定義在音頻信息的播放過(guò)程中音頻信息的預(yù)定的響度和動(dòng)態(tài)范圍。令人遺憾的是，甚至在這些優(yōu)選的實(shí)現(xiàn)方式中，這種元數(shù)據(jù)要么被錯(cuò)誤地使用，要么被故意濫用。本發(fā)明的目的是提供可以用來(lái)校正播放過(guò)程中的音頻信息的播放響度和動(dòng)態(tài)范圍的方法和設(shè)備。本發(fā)明可以在圖1中所顯示的任何過(guò)程中使用一次或多次；然而，可以預(yù)料，本發(fā)明可以在分發(fā)過(guò)程2的快結(jié)束時(shí)或傳送過(guò)程3的快開(kāi)始時(shí)最有效地使用。例如，本發(fā)明可以在播放或記錄完整的節(jié)目緊之前使用。
下面所描述的本發(fā)明的實(shí)現(xiàn)方式包括與以符合上文所提及的ATSC標(biāo)準(zhǔn)的格式傳送編碼音頻信息的信號(hào)一起使用的相關(guān)的功能。這些特定的實(shí)現(xiàn)方式和功能僅僅是示例。本發(fā)明的原理可以有益地適用于基本上任何形式的傳送音頻信息和涉及該音頻信息的響度和動(dòng)態(tài)范圍的元數(shù)據(jù)的信號(hào)。
B.設(shè)備概述圖2是集成了本發(fā)明的各個(gè)方面的設(shè)備10的簡(jiǎn)要方框圖，它們可以用來(lái)校正播放過(guò)程中的音頻信息的播放響度和動(dòng)態(tài)范圍。設(shè)備10從通信路徑11中接收傳送編碼音頻信息和元數(shù)據(jù)的輸入信號(hào)，對(duì)此信息進(jìn)行處理，并沿著路徑18生成輸出信號(hào)，該輸出信號(hào)傳送編碼音頻信息和修改過(guò)的元數(shù)據(jù)。元數(shù)據(jù)代表供在播放音頻信息過(guò)程中使用的響度規(guī)范化級(jí)別和動(dòng)態(tài)范圍調(diào)整級(jí)別。
解碼器12對(duì)輸入信號(hào)進(jìn)行處理，以獲取音頻信息的元數(shù)據(jù)和解碼表示法，具體做法是，執(zhí)行對(duì)用于生成輸入信號(hào)的過(guò)程的補(bǔ)充過(guò)程。解碼音頻信息被沿著路徑13傳遞。元數(shù)據(jù)沿著路徑14傳遞。如果設(shè)備10和具有符合上文所提及的ATSC標(biāo)準(zhǔn)的格式的輸入信號(hào)一起使用，則解碼器12執(zhí)行判斷如何分配比特以代表音頻信號(hào)的頻譜含量的過(guò)程，使用此分配方案從輸入信號(hào)中恢復(fù)量化的頻譜分量，并用合成濾波器對(duì)恢復(fù)的頻譜分量進(jìn)行處理，以生成解碼音頻信息。可以從上文所提及的ATSC文檔中獲取附加信息。
由解碼器12執(zhí)行的解碼過(guò)程只與由常規(guī)播放系統(tǒng)執(zhí)行的解碼過(guò)程稍微有點(diǎn)不同，因?yàn)榻獯a器12不使用響度規(guī)范化級(jí)別和動(dòng)態(tài)范圍調(diào)整級(jí)別元數(shù)據(jù)來(lái)對(duì)解碼信息做任何調(diào)整。
在一種實(shí)現(xiàn)方式中，解碼器12與常規(guī)解碼器有顯著的不同之處，在于它不將編碼音頻信息解碼為時(shí)間域信息。相反，它將編碼音頻信息解碼為去量子化的頻譜分量或?qū)ο禂?shù)進(jìn)行轉(zhuǎn)換，這些系數(shù)沿著路徑13進(jìn)行傳遞，供隨后進(jìn)行處理。解碼器12的這種實(shí)現(xiàn)方式的變化影響了響度分析器15、動(dòng)態(tài)范圍分析器23、動(dòng)態(tài)范圍計(jì)算器25、定標(biāo)器31以及編碼器33(下面將對(duì)它們進(jìn)行討論)的實(shí)現(xiàn)方式的細(xì)節(jié)，但不會(huì)改變這些組件執(zhí)行的過(guò)程的特性。
響度分析器15對(duì)它從路徑13接收到的解碼音頻信息進(jìn)行分析，以獲取響度的度量，然后，沿著路徑16傳遞?；旧希驮矶?，可以使用任何分析；然而，分析的選擇可能會(huì)影響響度度量的精度。優(yōu)選情況下，通過(guò)隔離主要為語(yǔ)音的音頻信息的段來(lái)獲取響度的度量。在2002年8月30日提出的，2004年3月4日發(fā)布的出版物編號(hào)US 2004-0044525的Vinton et al.作出的標(biāo)題為“Controlling Loudness of Speech in Signals That Contain Speech andOther Types of Audio Material”的編號(hào)為10/233,073的美國(guó)專利申請(qǐng)中描述了這樣作的一些方式。主要是語(yǔ)音的段的標(biāo)識(shí)不是必需的，但它通常會(huì)改善響度度量的精度。如果不存在語(yǔ)音或語(yǔ)音不是占主導(dǎo)地位，整個(gè)音頻信息的平均響度度量可以提供足夠的度量。
可以獲取整個(gè)音頻節(jié)目的響度的度量，或者，可以獲取基本上可能希望的任何長(zhǎng)度的段的響度度量?？梢杂?jì)算響度度量Leqm的一種方式可以表示為L(zhǎng)eqm10log10(1T&Integral;T0(P(t)P0)2dt)]]>其中P(t)＝在時(shí)間t時(shí)信號(hào)的頻率-加權(quán)聲壓級(jí)；P0＝在時(shí)間t＝0時(shí)信號(hào)的頻率-加權(quán)聲壓級(jí)；以及m表示施加于信號(hào)的頻率加權(quán)。
可以使用的頻率加權(quán)的一個(gè)已知的示例是所謂的“相等-響度”加權(quán)。也可以使用標(biāo)準(zhǔn)B或C加權(quán)的冪度量?；蛘?，也可以使用響度的音質(zhì)模型，如“Acoustics-Method for calculating loudness level，″ISO 532(1975)”中所描述的那種。優(yōu)選情況下，響度的度量是以dB為單位，相對(duì)于數(shù)字”滿刻度”正弦曲線的振幅來(lái)計(jì)算的(0 dB FS)，這是通過(guò)能夠用于代表音頻信息的有限-長(zhǎng)度數(shù)字值表達(dá)的最大的數(shù)字電平。
輸出信號(hào)生成器20對(duì)從路徑11接收到的輸入信號(hào)、從路徑14接收到的響度規(guī)范化級(jí)別和動(dòng)態(tài)范圍調(diào)整級(jí)別元數(shù)據(jù)、從路徑13接收到的音頻信息的解碼表示法、從路徑16接收到的導(dǎo)出的響度的度量進(jìn)行處理，并沿著路徑18生成輸出信號(hào)，該輸出信號(hào)傳送音頻信號(hào)的編碼表示法，以及一組元數(shù)據(jù)，該元數(shù)據(jù)可以用于校正播放過(guò)程中的音頻信息的響度和動(dòng)態(tài)范圍。
下面將描述該實(shí)現(xiàn)方式的其他細(xì)節(jié)。
C.信號(hào)格式這里所描述的設(shè)備10的實(shí)現(xiàn)方式對(duì)輸入信號(hào)進(jìn)行處理，該輸入信號(hào)具有編碼音頻信息和元數(shù)據(jù)，它們以符合上文所提及的ATSC標(biāo)準(zhǔn)的格式傳輸。輸入信號(hào)包括以幀的形式排列的二進(jìn)制數(shù)據(jù)。每一個(gè)幀都包含了編碼音頻信息和元數(shù)據(jù)，代表從數(shù)字音頻信號(hào)的一個(gè)到六個(gè)信道。元數(shù)據(jù)是可配置的，并可以包括諸如所說(shuō)的音頻內(nèi)容的語(yǔ)言，是否對(duì)音頻內(nèi)容進(jìn)行版權(quán)保護(hù)之類的信息，以及定時(shí)信息。元數(shù)據(jù)還包括供在播放音頻信息過(guò)程中使用的響度規(guī)范化級(jí)別和動(dòng)態(tài)范圍調(diào)整級(jí)別。
每一個(gè)輸入信號(hào)幀都被分成圖5所概要顯示的部分。同步信息(SI)部分，如圖6所示，傳送同步字(SW)，以及用于檢測(cè)前5/8幀中的誤碼的兩個(gè)循環(huán)冗余代碼中的第一個(gè)(CRC1)。比特流信息(BSI)部分，如圖7所示，傳送幀的大部分元數(shù)據(jù)。六個(gè)音頻塊(AB0到AB5)傳送編碼音頻信息和額外的元數(shù)據(jù)，如圖8所示。幀的其余部分包括Waste(W)比特部分，該部分傳送在對(duì)音頻內(nèi)容進(jìn)行編碼之后剩余的未使用的比特，以便每一個(gè)幀都具有恒定的比特?cái)?shù)，輔助(AUX)部分，該部分可以傳送與本發(fā)明不相關(guān)的額外的元數(shù)據(jù)，以及用于檢測(cè)后3/8幀中的誤碼的兩個(gè)循環(huán)冗余代碼(CRC2)中的第二個(gè)(CRC2)。
響度規(guī)范化每一個(gè)幀的BSI部分都傳送被稱為DIALNORM的元數(shù)據(jù)參數(shù)，這是供在播放過(guò)程中使用的響度規(guī)范化級(jí)別。此參數(shù)用于表示音頻信息中的語(yǔ)音或?qū)υ挼钠骄蛘贾鲗?dǎo)地位的響度。在沒(méi)有語(yǔ)音的情況下，該參數(shù)可以代表音頻項(xiàng)目的全部?jī)?nèi)容的平均響度。“音頻項(xiàng)目”是一段音頻信息，如，30秒電視廣告的音頻，或全長(zhǎng)電影的完整聲音軌。
圖9是三個(gè)假設(shè)的音頻項(xiàng)目的信號(hào)電平的圖解說(shuō)明。每一個(gè)音頻項(xiàng)目的“數(shù)字級(jí)別”是其音頻信息的振幅相對(duì)于數(shù)字滿刻度正弦曲線的振幅(0 dB FS)。圖中顯示了每一個(gè)音頻項(xiàng)目的最大和最小信號(hào)電平以及其DIALNORM參數(shù)的值。每一個(gè)音頻項(xiàng)目的DIALNORM值被四舍五入為1 dB單位。
在播放期間，播放過(guò)程4使用DIALNORM參數(shù)的值來(lái)放大用于播放的信號(hào)的振幅，以便語(yǔ)音的被感覺(jué)到的響度在不同的音頻項(xiàng)目之間是一致的。圖10用圖形方式顯示了此過(guò)程。播放過(guò)程4調(diào)整每一個(gè)音頻項(xiàng)目中的信號(hào)，以便DIALNORM參數(shù)所表示的其響度，被放大到等于-31 dB FS的基準(zhǔn)電平。在每一個(gè)播放系統(tǒng)中可以校準(zhǔn)此基準(zhǔn)電平，以匹配所希望的聲壓級(jí)。
動(dòng)態(tài)范圍調(diào)整輸入信號(hào)的每一個(gè)幀都可以傳送被稱為COMPR和DYNRNG的元數(shù)據(jù)參數(shù)，這是供播放過(guò)程中使用的動(dòng)態(tài)范圍調(diào)整級(jí)別。請(qǐng)參看圖7和8，幀的BSI部分可以包括適用于整個(gè)幀的COMPR參數(shù)，每一個(gè)音頻塊都可以具有其自己的相應(yīng)的DYNRNG參數(shù)。使用幾個(gè)壓縮配置文件中的某一個(gè)的編碼過(guò)程中確定這些參數(shù)的值。每一個(gè)配置文件都包括典型的壓縮參數(shù)，指定壓縮器的諸如壓縮比、攻擊和釋放時(shí)間常量，以及壓縮的幅度范圍之類的操作特征。參考DIALNORM參數(shù)，確定這些動(dòng)態(tài)范圍壓縮參數(shù)的值，以便音頻項(xiàng)目的平均響度不會(huì)通過(guò)壓縮被改變。
再請(qǐng)參看圖9，該圖顯示了三個(gè)假設(shè)的音頻項(xiàng)目的最大和最小信號(hào)電平，以及DIALNORM參數(shù)的值。在播放過(guò)程中，播放過(guò)程4可以使用COMPR參數(shù)或DYNRNG參數(shù)，對(duì)用于播放的信號(hào)進(jìn)行壓縮，以便縮小動(dòng)態(tài)范圍。圖11用圖形方式顯示了此過(guò)程。播放過(guò)程4對(duì)每一個(gè)音頻項(xiàng)目中的信號(hào)進(jìn)行壓縮，以便音頻項(xiàng)目的動(dòng)態(tài)范圍更加一致。
縮小音頻項(xiàng)目的動(dòng)態(tài)范圍的能力在各種情況下有用。例如，在深夜觀看時(shí)常常需要縮小電影或電視節(jié)目的音頻播放電平，以避免干擾家庭成員或鄰居睡眠。當(dāng)音頻項(xiàng)目具有非常大的動(dòng)態(tài)范圍時(shí)，如許多電影那樣，縮小播放電平，以使最響的段保持在可容忍的級(jí)別，會(huì)導(dǎo)致許多對(duì)話難以聽(tīng)見(jiàn)，也幾乎無(wú)法理解。動(dòng)態(tài)范圍壓縮可以用來(lái)縮小最響的段的響度，允許播放響度被設(shè)置在較高的級(jí)別，以便可以理解對(duì)話段。此外，此外，動(dòng)態(tài)范圍壓縮還可以用來(lái)增大比較安靜的段的響度，否則，在播放環(huán)境中環(huán)境噪聲下可能聽(tīng)不見(jiàn)。
為保證動(dòng)態(tài)范圍壓縮正確起作用，需要對(duì)DIALNORM參數(shù)進(jìn)行適當(dāng)?shù)脑O(shè)置。如果DIALNORM參數(shù)設(shè)置得不正確，那么，很可能動(dòng)態(tài)范圍壓縮將改變對(duì)話電平，會(huì)非常煩人。
適當(dāng)?shù)闹档闹匾援?dāng)適當(dāng)?shù)卦O(shè)置DIALNORM參數(shù)時(shí)，播放系統(tǒng)可以通過(guò)縮小響度和動(dòng)態(tài)范圍中的明顯的差別(否則將存在于不同的音頻項(xiàng)目的播放中)，提供比較一致的和可預(yù)測(cè)的收聽(tīng)體驗(yàn)?？梢韵?，或至少大大地縮小電視廣告、電視娛樂(lè)和新聞節(jié)目之間的，以及不同的電視臺(tái)之間的煩人的差異。
直到現(xiàn)在，播放和記錄系統(tǒng)不得不依賴音頻內(nèi)容作者和音頻工程師來(lái)正確地設(shè)置DIALNORM。已經(jīng)預(yù)期，將正確地度量音頻項(xiàng)目的平均或占主導(dǎo)地位的對(duì)話電平，將相應(yīng)地設(shè)置DIALNORM參數(shù)。令人遺憾的是，有時(shí)不能正確地設(shè)置或不能明確地設(shè)置DIALNORM參數(shù)，導(dǎo)致播放系統(tǒng)使用不合適的默認(rèn)值。這會(huì)導(dǎo)致在由DIALNORM參數(shù)表示的電平和音頻中的對(duì)話的實(shí)際電平之間產(chǎn)生差異，這妨礙了或至少損害了播放系統(tǒng)在不同的音頻項(xiàng)目之間提供一致的收聽(tīng)體驗(yàn)的能力。
在大多數(shù)情況下，每一個(gè)幀都傳送適用于所有信道的對(duì)于響度規(guī)范化和動(dòng)態(tài)范圍調(diào)整的單一參數(shù)集合；然而，ATSC標(biāo)準(zhǔn)允許幀對(duì)于雙信道系統(tǒng)中的每一個(gè)信道，傳送單獨(dú)的參數(shù)集合。請(qǐng)參看圖7和8，第二個(gè)參數(shù)集合被顯示為DIALNORM2、COMPR2和DYNRNG2。下列討論只引用第一個(gè)參數(shù)集合。當(dāng)對(duì)于一個(gè)幀存在兩組參數(shù)時(shí)，使用第二參數(shù)集合的方式與使用第一參數(shù)集合的方式相同。
D.輸出信號(hào)生成器圖3是上文結(jié)合圖2所討論的輸出信號(hào)生成器20的簡(jiǎn)要方框圖。比較器21將從路徑14接收到的響度規(guī)范化級(jí)別(DIALNORM)與從路徑16接收到的導(dǎo)出的響度的度量進(jìn)行比較，并沿著路徑22生成表示DIALNORM參數(shù)是否足夠準(zhǔn)確的控制信號(hào)。如果兩個(gè)輸入之間的差的絕對(duì)值小于閾值，則DIALNORM參數(shù)可以被視為足夠準(zhǔn)確。如果需要，可以將此閾值設(shè)置為等于零，但在優(yōu)選實(shí)現(xiàn)方式中，閾值的選擇必須在以下幾個(gè)方面取得平衡元數(shù)據(jù)參數(shù)的精度、實(shí)現(xiàn)本發(fā)明所需要的計(jì)算資源的成本，以及DIALNORM參數(shù)的計(jì)算值和其他元數(shù)據(jù)參數(shù)的值不正確以及它們的使用將降低播放過(guò)程中的音頻信息的質(zhì)量的可能性。閾值3 dB適用于許多應(yīng)用場(chǎng)合。
信號(hào)組合器30從路徑22接收控制信號(hào)，并從路徑11接收輸入信號(hào)。如果控制信號(hào)表明DIALNORM參數(shù)足夠準(zhǔn)確，則輸入信號(hào)按原樣傳遞到路徑18。如果控制信號(hào)表明DIALNORM參數(shù)不夠準(zhǔn)確，那么，信號(hào)組合器30使用從路徑16接收到的導(dǎo)出的響度的度量來(lái)為輸出信號(hào)提供修改過(guò)的DIALNORM參數(shù)。
每當(dāng)改變DIALNORM參數(shù)的值時(shí)，很可能也應(yīng)該改變COMPR和DYNRNG參數(shù)的值。COMPR和DYNRNG參數(shù)代表可以由常規(guī)播放系統(tǒng)中的解碼器應(yīng)用的增益變化。COMPR參數(shù)代表可以應(yīng)用于從整個(gè)幀解碼的所有音頻信息的定標(biāo)因數(shù)。相應(yīng)的音頻塊中的DYNRNG參數(shù)代表可以應(yīng)用于從該音頻塊解碼的音頻信息的定標(biāo)因數(shù)。
由生成了輸入信號(hào)的編碼器來(lái)計(jì)算這些參數(shù)的值。在輸出信號(hào)中，原始值可以保持原樣不變，但常規(guī)播放系統(tǒng)對(duì)所產(chǎn)生的輸出信號(hào)的解碼將產(chǎn)生嚴(yán)重的增益波動(dòng)，并可能剪輯音頻信號(hào)。本發(fā)明的優(yōu)選實(shí)現(xiàn)方式提供了COMPR和/或DYNRNG參數(shù)的修改過(guò)的值(當(dāng)它被保證時(shí))。由動(dòng)態(tài)范圍分析器23和動(dòng)態(tài)范圍計(jì)算器25生成這些修改過(guò)的值；然而，如果可以獲得有關(guān)編碼器如何計(jì)算原始元數(shù)據(jù)值的附加信息，則可以更加準(zhǔn)確地生成修改過(guò)的值。
所需要的附加信息是編碼器所使用的壓縮配置文件。令人遺憾的是，在輸入信號(hào)中沒(méi)有傳送此信息。動(dòng)態(tài)范圍分析器23通過(guò)對(duì)從路徑14接收到的DIALNORM、COMPR和DYNRNG參數(shù)、和從路徑13接收到的音頻信息的解碼表示法進(jìn)行分析，估計(jì)編碼器使用了什么壓縮配置文件。通過(guò)反復(fù)地使用由編碼器使用的相同的計(jì)算過(guò)程，來(lái)計(jì)算已知由當(dāng)前編碼器實(shí)現(xiàn)方式使用的每一個(gè)壓縮配置文件的COMPR和/或DYNRNG參數(shù)，可以估計(jì)配置文件。產(chǎn)生了與輸入信號(hào)中所傳送的原始值最近的計(jì)算出的參數(shù)值的配置文件被認(rèn)為是由編碼器使用的壓縮配置文件。估計(jì)的配置文件的指示被沿著路徑24傳遞到動(dòng)態(tài)范圍計(jì)算器25。
可以對(duì)于每一個(gè)幀，更新壓縮配置文件的估計(jì)，也可以不是那么太頻繁地更新。頻率的選擇可以在精度和計(jì)算復(fù)雜性之間取得平衡。
估計(jì)的壓縮配置文件有可能是不正確的；因此，只有在原始DIALNORM參數(shù)值的值被判斷不足夠準(zhǔn)確的(如上文所討論的)情況下，可能需要將修改過(guò)的元數(shù)據(jù)插入到輸出信號(hào)中。
E.輸出信號(hào)組合器每當(dāng)向輸出信號(hào)中插入修改過(guò)的元數(shù)據(jù)時(shí)，所產(chǎn)生的輸出信號(hào)都應(yīng)該符合ATSC標(biāo)準(zhǔn)所規(guī)定的所有要求。這是通過(guò)信號(hào)組合器30來(lái)實(shí)現(xiàn)的。圖4中顯示了信號(hào)組合器的一種實(shí)現(xiàn)方式，并在下面進(jìn)行了討論。
輸出信號(hào)重新包裝圖12中顯示了可以用來(lái)生成符合ATSC標(biāo)準(zhǔn)的輸出信號(hào)的一個(gè)進(jìn)程中的步驟，并在下面進(jìn)行了討論。
步驟50判斷是否將用修改過(guò)的DIALNORM生成輸出信號(hào)的幀。如上文所描述的，這可以通過(guò)判斷原始DIALNORM參數(shù)值是否足夠準(zhǔn)確來(lái)完成。如果不需要對(duì)DIALNORM參數(shù)值進(jìn)行修改，則繼續(xù)執(zhí)行步驟61。否則，繼續(xù)執(zhí)行步驟51。
步驟51改變輸出信號(hào)的幀中的DIALNORM參數(shù)的值。DIALNORM參數(shù)由符合ATSC標(biāo)準(zhǔn)的所有信號(hào)幀中的八個(gè)比特來(lái)代表?？梢酝ㄟ^(guò)僅僅改變代表原始DIALNORM參數(shù)的比特的值來(lái)輕松地修改輸出信號(hào)中的DIALNORM參數(shù)的值。
步驟52判斷COMPR參數(shù)或任何DYNRNG參數(shù)的值是否有任何變化。如果沒(méi)有，則繼續(xù)執(zhí)行步驟61，用修改過(guò)的DIALNORM參數(shù)值生成輸出信號(hào)的幀。否則，繼續(xù)執(zhí)行步驟53。
修改COMPR和DYNRNG參數(shù)值所需要的步驟比修改DIALNORM參數(shù)值所需要的步驟更復(fù)雜，因?yàn)閹胁⒉豢偸谴嬖贑OMPR和DYNRNG參數(shù)。修改可以改變代表這些參數(shù)所需要的比特?cái)?shù)量。步驟53判斷代表修改過(guò)的COMPR參數(shù)值或任何修改過(guò)的DYNRNG參數(shù)值所需要的比特?cái)?shù)量是否有任何更改。如果沒(méi)有，則繼續(xù)執(zhí)行步驟60，插入向幀的合適的位置中插入修改過(guò)的值，來(lái)修改這些參數(shù)。然后，步驟61用修改過(guò)的DIALNORM參數(shù)值和COMPR和DYNRNG參數(shù)的一個(gè)或多個(gè)修改過(guò)的值，生成輸出信號(hào)的幀。
如果步驟53判斷代表修改過(guò)的COMPR參數(shù)值或任何修改過(guò)的DYNRNG參數(shù)值所需要的比特?cái)?shù)量有更改，那么，數(shù)據(jù)必須在一個(gè)幀內(nèi)移動(dòng)，以接納改變。在此特定實(shí)現(xiàn)方式中，只有在向幀中添加參數(shù)或從幀刪除參數(shù)的情況下，才會(huì)發(fā)生代表參數(shù)所需要的比特?cái)?shù)量更改的情況。如果要添加參數(shù)，則移動(dòng)數(shù)據(jù)，以為新的參數(shù)產(chǎn)生空間。如果要?jiǎng)h除參數(shù)，則將數(shù)據(jù)移動(dòng)到由刪除的參數(shù)所騰出的空間。
當(dāng)COMPR和DYNRNG參數(shù)在幀中存在時(shí)，它們各自都由八個(gè)比特代表。由一個(gè)比特的COMPRE標(biāo)記來(lái)表示在幀中存在COMPR參數(shù)。當(dāng)設(shè)置為1時(shí)，COMPRE標(biāo)記表示COMPR參數(shù)存在于輸入信號(hào)幀的BSI部分。在相應(yīng)的音頻塊(AB0到AB5)中是否存在DYNRNG參數(shù)由該塊中的一個(gè)比特DYNRNGE標(biāo)記來(lái)表示。當(dāng)設(shè)置為1時(shí)，DYNRNGE標(biāo)記表示在相應(yīng)的音頻塊中存在DYNRNG參數(shù)值。如果在音頻塊AB0中不存在DYNRNG參數(shù)，則暗示了默認(rèn)參數(shù)值0 dB(沒(méi)有壓縮)。如果在隨后的音頻塊AB1到AB5中的任何一個(gè)音頻塊中不存在DYNRNG參數(shù)，那么，該音頻塊的參數(shù)值隱式等于緊前面的塊的參數(shù)值。
步驟54計(jì)算代表這些參數(shù)中的每一個(gè)參數(shù)的值的變化所需要的比特的凈變化。這可以表達(dá)為Δ(k)＝M(k)-O(k)其中Δ(k)＝代表參數(shù)k所需要的比特的凈變化；M(k)＝代表修改過(guò)的參數(shù)k值所需要的比特?cái)?shù)；以及O(k)＝代表原始參數(shù)k值所需要的比特?cái)?shù)。
這里使用了簡(jiǎn)單的表示法來(lái)代表元數(shù)據(jù)參數(shù)。在此表示法中，參數(shù)0-5分別對(duì)應(yīng)于音頻塊AB0到AB5的DYNRNG參數(shù)，參數(shù)6對(duì)應(yīng)于COMPR參數(shù)。
步驟55使用參數(shù)0，1和6的Δ(k)值來(lái)判斷對(duì)音頻塊AB0和AB1的COMPR參數(shù)和DYNRNG參數(shù)的值的所提出的修改是否將違犯這里被稱為的“5/8規(guī)則”。ATSC標(biāo)準(zhǔn)要求，一個(gè)幀中的音頻塊AB1和AB2之間的邊界必須位于該幀的前5/8的范圍內(nèi)。如果代表音頻塊AB0和AB1中的COMPR參數(shù)和/或DYNRNG參數(shù)的修改過(guò)的值所需要的額外的比特?cái)?shù)將需要在違犯了5/8規(guī)則的幀內(nèi)移動(dòng)數(shù)據(jù)，那么，繼續(xù)執(zhí)行步驟56，降低代表這些修改過(guò)的參數(shù)值中的一個(gè)或多個(gè)所需要的比特?cái)?shù)量。否則，繼續(xù)執(zhí)行步驟57。
步驟56對(duì)代表音頻塊AB0和AB1中的修改過(guò)的DYNRNG參數(shù)所需要的比特?cái)?shù)作最初步的減少。這是通過(guò)分析對(duì)音頻塊AB0和AB1的DYNRNGE標(biāo)記的所提出的修改來(lái)實(shí)現(xiàn)的。如果只有音頻塊AB0中的修改過(guò)的DYNRNGE標(biāo)記將被設(shè)置為1，那么，此標(biāo)記被重置為0。如果只有音頻塊AB1中的修改過(guò)的DYNRNGE標(biāo)記將被設(shè)置為1，那么，此標(biāo)記被重置為0。如果音頻塊AB0和AB1兩者中的修改過(guò)的DYNRNGE標(biāo)記都將被設(shè)置為1，那么，這些標(biāo)記中的一個(gè)將根據(jù)下列測(cè)試重置如果音頻塊AB0的修改過(guò)的DYNRNG參數(shù)值和0dB之間的絕對(duì)差小于音頻塊AB0和AB1的修改過(guò)的DYNRNG參數(shù)值之間的絕對(duì)差，那么，音頻塊AB0的修改過(guò)的DYNRNGE標(biāo)記被重置為0。否則，音頻塊AB1的修改過(guò)的DYNRNGE標(biāo)記被重置為0，音頻塊AB0的修改過(guò)的DYNRNG參數(shù)值被重置為音頻塊AB0和AB1的兩個(gè)提出的修改過(guò)的DYNRNG參數(shù)值中的較小的那一個(gè)。如果在音頻塊AB0和AB1兩者中DYNRNGE標(biāo)記都將被設(shè)置為0，那么，COMPRE標(biāo)記被設(shè)置為0。從輸出信號(hào)的幀中將省略與被重置為0的標(biāo)記關(guān)聯(lián)的參數(shù)。調(diào)整對(duì)應(yīng)的凈變化Δ(k)的值，以顯示八個(gè)比特的減少。
如果初始的減少不夠，則進(jìn)一步地減少所需的比特?cái)?shù)量。將被設(shè)置為1的音頻塊AB0和AB1中的剩余的DYNRNGE標(biāo)記被重置為0。將從輸出信號(hào)的幀中省略關(guān)聯(lián)的DYNRNG參數(shù)，調(diào)整對(duì)應(yīng)的凈變化Δ(k)的值，以顯示八個(gè)比特的減少。可保證在此步驟中作出的一個(gè)或多個(gè)減少，以滿足5/8規(guī)則，假設(shè)輸入信號(hào)的幀最初滿足5/8規(guī)則。
如果動(dòng)態(tài)范圍計(jì)算器25計(jì)算了等于0的音頻塊AB2的修改過(guò)的DYNRNGE標(biāo)記，那么，該計(jì)算是在這樣的假設(shè)執(zhí)行的音頻塊AB2的修改過(guò)的DYNRNG參數(shù)值將等于音頻塊AB1的參數(shù)值。對(duì)音頻塊AB0和AB1的修改過(guò)的DYNRNGE標(biāo)記作出滿足5/8規(guī)則的任何更改都可能將違犯此假設(shè)，導(dǎo)致音頻塊AB2的DYNRNG參數(shù)值的計(jì)劃的更改。將不會(huì)違犯此假設(shè)的唯一的情況是音頻塊AB0和AB1兩者的修改過(guò)的DYNRNGE標(biāo)記將被設(shè)置為1，但只有音頻塊AB0的標(biāo)記被重置為0。對(duì)于所有其他情況，本發(fā)明的一個(gè)首選的實(shí)現(xiàn)方式是，音頻塊AB2的修改過(guò)的DYNRNGE標(biāo)記被重置為1，修改過(guò)的DYNRNG參數(shù)值被設(shè)置為等于由動(dòng)態(tài)范圍計(jì)算器25計(jì)算出的合適的值。
此過(guò)程中的生成輸出信號(hào)之前的剩余的步驟確保了有足夠的比特?cái)?shù)可用來(lái)代表所有修改過(guò)的壓縮參數(shù)。
步驟57確定代表對(duì)壓縮參數(shù)值的所有提出的修改所需要的比特的總數(shù)，以及未使用的可以在幀中用來(lái)代表這些修改過(guò)的參數(shù)值的比特的總數(shù)。
可以通過(guò)計(jì)算下列總和來(lái)確定比特的總數(shù)NTOT，需要用該比特的總數(shù)表示對(duì)壓縮參數(shù)的所有提出的修改NTOT=Σk=06Δ(k)]]>根據(jù)從幀中獲取的信息來(lái)計(jì)算幀中未使用的比特的總數(shù)NAV以表示修改過(guò)的壓縮參數(shù)值。請(qǐng)參看圖5，每一個(gè)幀通常都包含許多未使用的比特，可以用來(lái)代表添加到幀中的新的元數(shù)據(jù)參數(shù)。這些未使用的比特中的一些在該幀的W范圍之內(nèi)，它們是在對(duì)音頻信息進(jìn)行編碼之后剩余的未分配的比特。在音頻塊的Skip數(shù)據(jù)(SKIPD)區(qū)域中可能存在一些未使用的比特。每一個(gè)SKIPD區(qū)域都與SKIPL參數(shù)(該參數(shù)以8比特的字節(jié)表示SKIPD區(qū)域的長(zhǎng)度)、一比特SKIPLE標(biāo)記(如果設(shè)置為1，表示存在SKIPL參數(shù)和關(guān)聯(lián)的SKIPD)關(guān)聯(lián)。如果例如相應(yīng)的音頻塊具有設(shè)置為1的SKIPLE標(biāo)記和等于10的SKIPL參數(shù)，那么，該相應(yīng)的音頻塊的SKIPD區(qū)域包含10個(gè)字節(jié)或80比特。可以通過(guò)將幀中的所有SKIPL參數(shù)的值與幀的W部分中的比特總數(shù)相加，來(lái)確定一個(gè)幀中的未使用的比特的總數(shù)。
可以根據(jù)三個(gè)已知值計(jì)算W部分中的比特的數(shù)量NW。第一個(gè)值是表示為比特?cái)?shù)的幀的長(zhǎng)度NL，該值可以根據(jù)幀的SI部分中傳遞的指定了采樣速率(FSCOD)和幀大小(FRMSIZECOD)的參數(shù)來(lái)進(jìn)行計(jì)算。可以從上文引用的ATSC文檔中獲取附加信息第二個(gè)值是用于代表幀中的SI和BSI部分，所有音頻塊AB0到AB5和CRC2中傳達(dá)的數(shù)據(jù)的比特?cái)?shù)。第三個(gè)值是幀的AUX部分的長(zhǎng)度NA，以比特?cái)?shù)表示。此長(zhǎng)度在幀的AUX部分末尾部分傳達(dá)。該計(jì)算可以表示為NW＝NL-(ND+NA)步驟58判斷可用的比特?cái)?shù)量NAV是否足以滿足代表修改過(guò)的壓縮參數(shù)所需要比特的總數(shù)NTOT。如果有足夠的比特?cái)?shù)可用，則繼續(xù)執(zhí)行步驟60。如果沒(méi)有，則繼續(xù)執(zhí)行步驟59。
步驟59改變一個(gè)或多個(gè)修改過(guò)的壓縮參數(shù)，以減少代表它們所需要的比特?cái)?shù)。這可以通過(guò)從一個(gè)或多個(gè)音頻塊中刪除DYNRNG參數(shù)并將那些音頻塊與前面的音頻塊的DYNRNG參數(shù)關(guān)聯(lián)來(lái)完成。一個(gè)幀的六個(gè)音頻塊中的修改過(guò)的DYNRNG參數(shù)值和DYNRNGE標(biāo)記用于將多個(gè)塊組合成區(qū)域。第一個(gè)區(qū)域包括音頻塊AB0，以及緊隨其后的它們的相應(yīng)的修改過(guò)的DYNRNGE標(biāo)記設(shè)置為0的所有音頻塊。額外的區(qū)域，如果有的話，每一個(gè)都以其修改過(guò)的DYNRNGE標(biāo)記設(shè)置為1音頻塊開(kāi)始，并包括緊隨在開(kāi)始?jí)K之后的其相應(yīng)的修改過(guò)的DYNRNGE標(biāo)記設(shè)置為0的所有音頻塊。如果一個(gè)幀中沒(méi)有音頻塊(除非可能是音頻塊AB0)將修改過(guò)的DYHRNGE標(biāo)記設(shè)置為1，則區(qū)域的數(shù)量可以少則為1。如果幀中的每個(gè)音頻塊都具有設(shè)置為1的修改過(guò)的DYNRNGE標(biāo)記，則區(qū)域的數(shù)量可以多則為6。一個(gè)區(qū)域所有音頻塊都共享共同的DYNRNG參數(shù)值。如果音頻塊AB0的DYNRNGE標(biāo)記被設(shè)置為0，則如上所述，隱式指定了第一區(qū)域的此值。
如果存在三個(gè)或更多區(qū)域，那么，將第二區(qū)域的共享的修改過(guò)的DYNRNG參數(shù)值與每一個(gè)相鄰區(qū)域的共享的修改過(guò)的DYNRNG參數(shù)值進(jìn)行比較。具有最近的值的區(qū)域?qū)Ρ缓喜⒌揭粋€(gè)區(qū)域中通過(guò)將前面的區(qū)域的第一音頻塊中的DYNRNG參數(shù)值設(shè)置為兩個(gè)區(qū)域的兩個(gè)修改過(guò)的DYNRNG參數(shù)值中的較小的那一個(gè)，并將隨后的區(qū)域的第一音頻塊中的DYNRNGE標(biāo)記設(shè)置為0。這將代表修改過(guò)的DYNRNG參數(shù)所需要的比特的總數(shù)減少了八個(gè)比特。多個(gè)區(qū)域可以以這種方式合并，直到代表修改過(guò)的DYNRNG參數(shù)值所需要的比特的總數(shù)NTOT小于或等于可用于代表的比特的總數(shù)NAV，或直到只保留兩個(gè)區(qū)域。
當(dāng)存在兩個(gè)區(qū)域并且NAV小于NTOT時(shí)，如前段中所描述那樣將兩個(gè)區(qū)域組合起來(lái)。
當(dāng)只有一個(gè)區(qū)域存在并且NAV小于NTOT時(shí)，可以進(jìn)行進(jìn)一步的縮小。如果音頻塊AB0的提出的修改過(guò)的DYNRNGE標(biāo)記被設(shè)置為1，則將此標(biāo)記重置為0將使NTOT減少八個(gè)比特。如果此標(biāo)記已經(jīng)被設(shè)置為0或者如果將它重置為0還不夠，那么，剩余的可以進(jìn)行的唯一的更改是將COMPRE標(biāo)記重置為0。此最后一次更改可保證滿足比特要求，假設(shè)輸入信號(hào)的幀最初滿足了比特要求。
當(dāng)步驟59減少NTOT以便它小于或等于NAV時(shí)，繼續(xù)執(zhí)行步驟60。
在需要接納添加的壓縮參數(shù)或刪除壓縮參數(shù)時(shí)，步驟60在幀內(nèi)移動(dòng)數(shù)據(jù)。
要修改COMPR參數(shù)，如果原始COMPRE標(biāo)記被設(shè)置為1，則原始COMPR參數(shù)值可以替換為修改過(guò)的值。如果原始COMPRE標(biāo)記被設(shè)置為0并且修改過(guò)的COMPRE標(biāo)記被設(shè)置為1，則跟隨在COMPRE標(biāo)記后面的數(shù)據(jù)向幀的末尾方向移動(dòng)八個(gè)比特，以便為新的COMPR參數(shù)騰出空間。輸出信號(hào)的幀中的COMPRE標(biāo)記被設(shè)置為1，將新的COMPR值寫入到新創(chuàng)建的空間中。如果原始COMPRE標(biāo)記被設(shè)置為1并且修改過(guò)的COMPRE標(biāo)記被設(shè)置為0，那么，輸出信號(hào)的幀中的COMPRE標(biāo)記被設(shè)置為0，跟隨在COMPR參數(shù)后面的數(shù)據(jù)向幀的開(kāi)始方向移動(dòng)八個(gè)比特，因?yàn)镃OMPR參數(shù)不再存在于幀中。
要修改每一個(gè)音頻塊中的DYNRNG參數(shù)，如果原始DYNRNGE標(biāo)記被設(shè)置為1，則原始DYNRNG參數(shù)值可以替換為修改過(guò)的值。如果原始DYNRNGE標(biāo)記被設(shè)置為0并且修改過(guò)的DYNRNGE標(biāo)記被設(shè)置為1，則跟隨在DYNRNGE標(biāo)記后面的數(shù)據(jù)向音頻塊的末尾方向移動(dòng)八個(gè)比特，以便為新的DYNRNG參數(shù)騰出空間。音頻塊中的DYNRNGE標(biāo)記被設(shè)置為1，將新的DYNRNG值寫入到新創(chuàng)建的空間中。如果原始DYNRNGE標(biāo)記被設(shè)置為1并且修改過(guò)的DYNRNGE標(biāo)記被設(shè)置為0，那么，輸出信號(hào)的幀中的DYNRNGE標(biāo)記被設(shè)置為0，跟隨在DYNRNG參數(shù)后面的數(shù)據(jù)向音頻塊的開(kāi)始方向移動(dòng)八個(gè)比特，因?yàn)镈YNRNG參數(shù)不再存在于該塊中。
可以只在某一音頻塊中進(jìn)行更改，即可滿足代表相應(yīng)的音頻塊中的修改過(guò)的DYNRNG參數(shù)所需要的比特?cái)?shù)量的變化。倘若如此，可以通過(guò)調(diào)整SKIPD區(qū)域中的比特?cái)?shù)量并在音頻塊內(nèi)移動(dòng)數(shù)據(jù)來(lái)完成。SKIPL參數(shù)改變，以指出SKIPD區(qū)域的修改過(guò)的長(zhǎng)度。如果將向一個(gè)音頻塊添力DYNRNG參數(shù)而該塊中不存在SKIPD區(qū)域，那么必須從W部分或從另一個(gè)音頻塊中獲取未使用的比特。
步驟61產(chǎn)生輸出信號(hào)的幀。如果沒(méi)有元數(shù)據(jù)參數(shù)被修改過(guò)，則輸出信號(hào)幀可以與相應(yīng)的輸入信號(hào)幀相同。當(dāng)一個(gè)幀中的任何數(shù)據(jù)發(fā)生變化時(shí)，應(yīng)該重新計(jì)算該幀的兩個(gè)糾錯(cuò)碼CRC1和CRC2中的一個(gè)或兩個(gè)。如果只有幀的前5/8中的數(shù)據(jù)發(fā)生了變化，則只重新計(jì)算CRC1代碼就足夠了。如果只有幀的后3/8中的數(shù)據(jù)發(fā)生了變化，則只重新計(jì)算CRC2代碼就足夠了。
重新編碼根據(jù)ATSC標(biāo)準(zhǔn)，DIALNORM參數(shù)必須具有從-1到-31 dB(包括這兩者)范圍內(nèi)的整數(shù)值。響度分析器15所獲取的響度的度量超出此范圍之外是有可能的。此情況可以通過(guò)將DIALNORM參數(shù)設(shè)置為該范圍內(nèi)的最近的值來(lái)處理，但首選的解決方案是放大音頻信息和放大響度的度量，以便DIALNORM參數(shù)可以表達(dá)正確的響度的度量。例如，如果計(jì)算出的響度的度量是-36 dB，可以將音頻信息的振幅提高5 dB，以便可以正確地將修改的DIALNORM參數(shù)值設(shè)置為最近的有效值-31 dB。此解決方案要求在放大之后對(duì)解碼音頻信息進(jìn)行編碼。這可以通過(guò)使用如圖4所示的信號(hào)組合器30來(lái)實(shí)現(xiàn)。
在此實(shí)現(xiàn)方式中，定標(biāo)器31響應(yīng)從路徑26接收到的計(jì)算出的響度的度量，放大從路徑28接收到的解碼音頻信息。經(jīng)過(guò)放大的音頻信息沿著路徑32傳遞到編碼器33，該編碼器對(duì)經(jīng)過(guò)放大的音頻信息進(jìn)行編碼。響度的度量值被調(diào)整，以負(fù)責(zé)放大，并被傳遞到輸出信號(hào)格式器40，以包括在輸出信號(hào)中。
優(yōu)選情況下，編碼器33在幀的BSI和AUX部分維護(hù)了DIALNORM參數(shù)之外的所有信息。使用由從路徑27接收到的信息指定的配置文件，重新計(jì)算糾錯(cuò)碼CRC1和CRC2，重新計(jì)算壓縮元數(shù)據(jù)參數(shù)COMPR和/或DYNRNG。這種重新編碼過(guò)程可能會(huì)降低播放過(guò)程中的感覺(jué)到的音頻信息的質(zhì)量；因此，如上文所討論的，只有在原始DIALNORM參數(shù)被認(rèn)為不夠準(zhǔn)確的情況下，才可能需要執(zhí)行重新編碼。
編碼信息被沿著路徑34傳遞到輸出信號(hào)格式器40，該格式器沿著路徑18生成輸出信號(hào)，該輸出信號(hào)傳送重新編碼音頻信息和修改過(guò)的元數(shù)據(jù)參數(shù)值。
如果從路徑22接收到的控制信號(hào)表明，原始DIALNORM參數(shù)足夠準(zhǔn)確，則不需要對(duì)音頻信息進(jìn)行放大和重新編碼。在此情況下，輸出信號(hào)格式器40通過(guò)在從路徑11中接收到的輸入信號(hào)中修改元數(shù)據(jù)參數(shù)值來(lái)生成輸出信號(hào)。
F.硬件實(shí)現(xiàn)方式集成了本發(fā)明的各個(gè)方面的設(shè)備可以以各種方式來(lái)實(shí)現(xiàn)，包括由計(jì)算機(jī)或某些其他設(shè)備執(zhí)行的軟件，其他設(shè)備包括比較專業(yè)化的組件，如連接到類似于通用計(jì)算機(jī)中的那些組件的組件的數(shù)字信號(hào)處理器(DSP)電路。圖13是可以用來(lái)實(shí)現(xiàn)本發(fā)明的各個(gè)方面的設(shè)備70的簡(jiǎn)要方框圖。數(shù)字信號(hào)處理器(DSP)72提供了計(jì)算資源。RAM73是供DSP 72用來(lái)執(zhí)行處理過(guò)程的系統(tǒng)隨機(jī)存取存儲(chǔ)器(RAM)。ROM 74代表某種形式的永久存儲(chǔ)器，如只讀存儲(chǔ)器(ROM)，用于存儲(chǔ)對(duì)設(shè)備70進(jìn)行操作所需要的程序，還可以用于實(shí)現(xiàn)本發(fā)明的各個(gè)方面。I/O控件75代表用于通過(guò)通信信道76、77接收和傳輸信號(hào)的接口電路。在所顯示的實(shí)施例中，所有主要系統(tǒng)組件都連接到總線71，該總線可以代表一個(gè)以上的物理或邏輯總線；然而，不需要總線體系結(jié)構(gòu)即可實(shí)現(xiàn)本發(fā)明。
在由通用計(jì)算機(jī)系統(tǒng)實(shí)現(xiàn)的實(shí)施例中，可以包括額外的組件，用于連接到諸如鍵盤或鼠標(biāo)和顯示器，以及用于控制具有諸如磁帶或磁盤或光學(xué)介質(zhì)之類的存儲(chǔ)介質(zhì)的存儲(chǔ)設(shè)備78。存儲(chǔ)介質(zhì)可以用來(lái)記錄操作系統(tǒng)的指令的程序、實(shí)用程序和應(yīng)用程序，并可以包括實(shí)現(xiàn)本發(fā)明的各個(gè)方面的程序。可以使計(jì)算機(jī)系統(tǒng)能容忍硬件故障。達(dá)到這一目的的一種方式是提供冗余組件(如雙電源)和冗余存儲(chǔ)設(shè)備，并使用能夠檢測(cè)并對(duì)故障作出反應(yīng)的操作系統(tǒng)。
實(shí)施本發(fā)明的各個(gè)方面所需的功能可以通過(guò)以多種方式實(shí)現(xiàn)的組件來(lái)執(zhí)行，包括離散邏輯組件、集成電路、一個(gè)或多個(gè)ASIC和/或程序控制的處理器。實(shí)現(xiàn)這些組件的方式對(duì)本發(fā)明來(lái)說(shuō)不重要。
本發(fā)明的軟件實(shí)現(xiàn)方式可以通過(guò)諸如基帶或調(diào)制通信路徑之類的各種機(jī)器可讀的介質(zhì)，在包括從超聲波到紫外線頻率的頻譜范圍內(nèi)進(jìn)行傳遞，或通過(guò)使用了基本上任何記錄技術(shù)(包括磁帶、磁卡或磁盤、光卡或光盤)，以及包括紙張的介質(zhì)上的可檢測(cè)的標(biāo)記來(lái)傳送信息的存儲(chǔ)介質(zhì)來(lái)進(jìn)行傳遞。
權(quán)利要求
1.一種用于校正音頻信息的播放響度和動(dòng)態(tài)范圍的方法，其中該方法包括下列步驟接收輸入信號(hào)，該輸入信號(hào)傳送代表第一響度規(guī)范化級(jí)別、第一動(dòng)態(tài)范圍調(diào)整級(jí)別和第一編碼音頻信息的數(shù)據(jù)，其中，由輸入信號(hào)傳送的數(shù)據(jù)是通過(guò)編碼過(guò)程產(chǎn)生的，所述編碼過(guò)程按照音質(zhì)原理生成第一編碼音頻信息，并響應(yīng)音頻信息振幅、所述第一響度規(guī)范化級(jí)別和指定信號(hào)壓縮器的一個(gè)或多個(gè)操作特征的壓縮配置文件，確定第一動(dòng)態(tài)范圍調(diào)整級(jí)別；通過(guò)對(duì)輸入信號(hào)應(yīng)用解碼過(guò)程獲取解碼音頻信息；通過(guò)對(duì)解碼音頻信息的分析獲取響度的度量，并從響度的度量導(dǎo)出第二響度規(guī)范化級(jí)別；通過(guò)對(duì)解碼音頻信息的分析，并從第一動(dòng)態(tài)范圍調(diào)整級(jí)別，獲取由編碼過(guò)程使用的壓縮配置文件的估計(jì)；生成輸出信號(hào)，該輸出信號(hào)傳送代表第三響度規(guī)范化級(jí)別、第三動(dòng)態(tài)范圍調(diào)整級(jí)別以及代表編碼形式的音頻信息的第三編碼音頻信息的數(shù)據(jù)，其中如果第一和第二響度規(guī)范化級(jí)別之間的差異沒(méi)有超過(guò)閾值，則第三響度級(jí)別代表第一響度規(guī)范化級(jí)別，第三動(dòng)態(tài)范圍調(diào)整級(jí)別代表第一動(dòng)態(tài)范圍調(diào)整級(jí)別，第三編碼音頻信息代表第一編碼音頻信息，以及如果第一和第二響度規(guī)范化級(jí)別之間的差異超過(guò)閾值，則從第二響度規(guī)范化級(jí)別導(dǎo)出第三響度級(jí)別，響應(yīng)音頻信息振幅、第三響度規(guī)范化級(jí)別和壓縮配置文件的估計(jì)，獲取第三動(dòng)態(tài)范圍調(diào)整級(jí)別。
2.根據(jù)權(quán)利要求1所述的方法，如果第一和第二響度規(guī)范化級(jí)別之間的差異超過(guò)了閾值，則通過(guò)根據(jù)音質(zhì)原理對(duì)解碼音頻信息進(jìn)行編碼而生成第三編碼音頻信息。
3.根據(jù)權(quán)利要求1所述的方法，如果第一和第二響度規(guī)范化級(jí)別之間的差異超過(guò)了閾值，則第三編碼音頻信息代表第一編碼音頻信息。
4.根據(jù)權(quán)利要求1所述的方法，其中，輸入信號(hào)傳送代表第一動(dòng)態(tài)范圍調(diào)整級(jí)別的第一數(shù)量的比特，用重新排列的數(shù)據(jù)生成輸出信號(hào)，以接納代表第三動(dòng)態(tài)范圍調(diào)整級(jí)別的第二數(shù)量的比特，其中第一數(shù)量的比特?cái)?shù)大于第二數(shù)量的比特?cái)?shù)。
5.根據(jù)權(quán)利要求1所述的方法，其中，輸入信號(hào)傳送代表第一動(dòng)態(tài)范圍調(diào)整級(jí)別的第一數(shù)量的比特，用重新排列的數(shù)據(jù)生成輸出信號(hào)，以接納代表第三動(dòng)態(tài)范圍調(diào)整級(jí)別的第二數(shù)量的比特，其中第一數(shù)量的比特?cái)?shù)小于第二數(shù)量的比特?cái)?shù)。
6.一種用于校正音頻信息的播放響度和動(dòng)態(tài)范圍的設(shè)備，其中該設(shè)備包括用于執(zhí)行下列操作的電路接收輸入信號(hào)，該輸入信號(hào)傳送代表第一響度規(guī)范化級(jí)別、第一動(dòng)態(tài)范圍調(diào)整級(jí)別和第一編碼音頻信息的數(shù)據(jù)，其中，由輸入信號(hào)傳送的數(shù)據(jù)是通過(guò)編碼過(guò)程產(chǎn)生的，所述編碼過(guò)程按照音質(zhì)原理生成第一編碼音頻信息，并響應(yīng)音頻信息振幅、所述第一響度規(guī)范化級(jí)別和指定信號(hào)壓縮器的一個(gè)或多個(gè)操作特征的壓縮配置文件，確定第一動(dòng)態(tài)范圍調(diào)整級(jí)別；通過(guò)對(duì)輸入信號(hào)應(yīng)用解碼過(guò)程獲取解碼音頻信息；通過(guò)對(duì)解碼音頻信息的分析獲取響度的度量，并從響度的度量導(dǎo)出第二響度規(guī)范化級(jí)別；通過(guò)對(duì)解碼音頻信息的分析，并從第一動(dòng)態(tài)范圍調(diào)整級(jí)別，獲取由編碼過(guò)程使用的壓縮配置文件的估計(jì)；生成輸出信號(hào)，該輸出信號(hào)傳送代表第三響度規(guī)范化級(jí)別、第三動(dòng)態(tài)范圍調(diào)整級(jí)別以及代表編碼形式的音頻信息的第三編碼音頻信息的數(shù)據(jù)，其中如果第一和第二響度規(guī)范化級(jí)別之間的差異沒(méi)有超過(guò)閾值，則第三響度級(jí)別代表第一響度規(guī)范化級(jí)別，第三動(dòng)態(tài)范圍調(diào)整級(jí)別代表第一動(dòng)態(tài)范圍調(diào)整級(jí)別，第三編碼音頻信息代表第一編碼音頻信息，以及如果第一和第二響度規(guī)范化級(jí)別之間的差異超過(guò)閾值，則從第二響度規(guī)范化級(jí)別導(dǎo)出第三響度級(jí)別，響應(yīng)音頻信息振幅、第三響度規(guī)范化級(jí)別和壓縮配置文件的估計(jì)，獲取第三動(dòng)態(tài)范圍調(diào)整級(jí)別。
7.一種傳送可由設(shè)備執(zhí)行的指令的程序的介質(zhì)，以執(zhí)行用于校正音頻信息的播放響度和動(dòng)態(tài)范圍的方法，其中該方法包括下列步驟接收輸入信號(hào)，該輸入信號(hào)傳送代表第一響度規(guī)范化級(jí)別、第一動(dòng)態(tài)范圍調(diào)整級(jí)別和第一編碼音頻信息的數(shù)據(jù)，其中，由輸入信號(hào)傳送的數(shù)據(jù)是通過(guò)編碼過(guò)程產(chǎn)生的，所述編碼過(guò)程按照音質(zhì)原理生成第一編碼音頻信息，并響應(yīng)音頻信息振幅、所述第一響度規(guī)范化級(jí)別和指定信號(hào)壓縮器的一個(gè)或多個(gè)操作特征的壓縮配置文件，確定第一動(dòng)態(tài)范圍調(diào)整級(jí)別；通過(guò)對(duì)輸入信號(hào)應(yīng)用解碼過(guò)程獲取解碼音頻信息；通過(guò)對(duì)解碼音頻信息的分析獲取響度的度量，并從響度的度量導(dǎo)出第二響度規(guī)范化級(jí)別；通過(guò)對(duì)解碼音頻信息的分析，并從第一動(dòng)態(tài)范圍調(diào)整級(jí)別，獲取由編碼過(guò)程使用的壓縮配置文件的估計(jì)；生成輸出信號(hào)，該輸出信號(hào)傳送代表第三響度規(guī)范化級(jí)別、第三動(dòng)態(tài)范圍調(diào)整級(jí)別以及代表編碼形式的音頻信息的第三編碼音頻信息的數(shù)據(jù)，其中如果第一和第二響度規(guī)范化級(jí)別之間的差異沒(méi)有超過(guò)閾值，則第三響度級(jí)別代表第一響度規(guī)范化級(jí)別，第三動(dòng)態(tài)范圍調(diào)整級(jí)別代表第一動(dòng)態(tài)范圍調(diào)整級(jí)別，第三編碼音頻信息代表第一編碼音頻信息，以及如果第一和第二響度規(guī)范化級(jí)別之間的差異超過(guò)閾值，則從第二響度規(guī)范化級(jí)別導(dǎo)出第三響度級(jí)別，響應(yīng)音頻信息振幅、第三響度規(guī)范化級(jí)別和壓縮配置文件的估計(jì)，獲取第三動(dòng)態(tài)范圍調(diào)整級(jí)別。
8.根據(jù)權(quán)利要求6所述的設(shè)備，如果第一和第二響度規(guī)范化級(jí)別之間的差異超過(guò)了閾值，則通過(guò)根據(jù)音質(zhì)原理對(duì)解碼音頻信息進(jìn)行編碼而生成第三編碼音頻信息。
9.根據(jù)權(quán)利要求6所述的設(shè)備，如果第一和第二響度規(guī)范化級(jí)別之間的差異超過(guò)了閾值，則第三編碼音頻信息代表第一編碼音頻信息。
10.根據(jù)權(quán)利要求6所述的設(shè)備，其中，輸入信號(hào)傳送代表第一動(dòng)態(tài)范圍調(diào)整級(jí)別的第一數(shù)量的比特，用重新排列的數(shù)據(jù)生成輸出信號(hào)，以接納代表第三動(dòng)態(tài)范圍調(diào)整級(jí)別的第二數(shù)量的比特，其中第一數(shù)量的比特?cái)?shù)大于第二數(shù)量的比特?cái)?shù)。
11.根據(jù)權(quán)利要求6所述的設(shè)備，其中，輸入信號(hào)傳送代表第一動(dòng)態(tài)范圍調(diào)整級(jí)別的第一數(shù)量的比特，用重新排列的數(shù)據(jù)生成輸出信號(hào)，以接納代表第三動(dòng)態(tài)范圍調(diào)整級(jí)別的第二數(shù)量的比特，其中第一數(shù)量的比特?cái)?shù)小于第二數(shù)量的比特?cái)?shù)。
12.根據(jù)權(quán)利要求7所述的介質(zhì)，如果第一和第二響度規(guī)范化級(jí)別之間的差異超過(guò)了閾值，則通過(guò)根據(jù)音質(zhì)原理對(duì)解碼音頻信息進(jìn)行編碼而生成第三編碼音頻信息。
13.根據(jù)權(quán)利要求7所述的介質(zhì)，如果第一和第二響度規(guī)范化級(jí)別之間的差異超過(guò)了閾值，則第三編碼音頻信息代表第一編碼音頻信息。
14.根據(jù)權(quán)利要求7所述的介質(zhì)，其中，輸入信號(hào)傳送代表第一動(dòng)態(tài)范圍調(diào)整級(jí)別的第一數(shù)量的比特，用重新排列的數(shù)據(jù)生成輸出信號(hào)，以接納代表第三動(dòng)態(tài)范圍調(diào)整級(jí)別的第二數(shù)量的比特，其中第一數(shù)量的比特?cái)?shù)大于第二數(shù)量的比特?cái)?shù)。
15.根據(jù)權(quán)利要求7所述的介質(zhì)，其中，輸入信號(hào)傳送代表第一動(dòng)態(tài)范圍調(diào)整級(jí)別的第一數(shù)量的比特，用重新排列的數(shù)據(jù)生成輸出信號(hào)，以接納代表第三動(dòng)態(tài)范圍調(diào)整級(jí)別的第二數(shù)量的比特，其中第一數(shù)量的比特?cái)?shù)小于第二數(shù)量的比特?cái)?shù)。
全文摘要
編碼信號(hào)傳送編碼音頻信息和元數(shù)據(jù)，該元數(shù)據(jù)可以用來(lái)控制音頻信息播放過(guò)程中的音頻信息的響度和動(dòng)態(tài)范圍。如果這些元數(shù)據(jù)參數(shù)的值沒(méi)有正確地設(shè)置，則在播放過(guò)程中可能會(huì)導(dǎo)致煩人的響度波動(dòng)。本發(fā)明通過(guò)檢測(cè)信號(hào)中的不正確的元數(shù)據(jù)參數(shù)值并用校正值替換不正確的值，克服了此問(wèn)題。
文檔編號(hào)H03G7/00GK1973434SQ200580020484
公開(kāi)日2007年5月30日申請(qǐng)日期2005年4月8日優(yōu)先權(quán)日2004年7月1日
發(fā)明者邁克爾·J.·史密斯?fàn)査? 杰弗里·C.·瑞德米勒爾, 查爾斯·Q.·魯賓遜, 布萊特·G.·克羅克特申請(qǐng)人:杜比實(shí)驗(yàn)室特許公司

完整全部詳細(xì)技術(shù)資料下載

該技術(shù)已申請(qǐng)專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請(qǐng)聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：邁克爾.J..史密斯?fàn)査?杰弗里.C..瑞德米勒爾;查爾斯.Q..魯賓遜;布萊特.G..克羅克特
技術(shù)所有人：杜比實(shí)驗(yàn)室特許公司
我是此專利的發(fā)明人

上一篇：包括集成頻帶選擇濾波器的電視接收器的制作方法
上一篇：石英器件和石英器件的制造方法

該領(lǐng)域下的技術(shù)專家
如您需求助技術(shù)專家，請(qǐng)點(diǎn)此查看客服電話進(jìn)行咨詢。
1、田老師：1: 建筑節(jié)能綠色建筑能耗的模擬與檢測(cè)(EnergyPlus)；建筑碳排放和生命周期評(píng)價(jià)；城市微氣候、建筑能耗與太陽(yáng)能技術(shù)的相互影響；地理信息系統(tǒng)(GIS)和空間回歸方法用于城市建筑能耗分析；不確定性、敏感性分析和機(jī)器學(xué)習(xí)方法應(yīng)用于建筑能耗分析(R)；貝葉斯方法用于城市和單體建筑能源分析 2: 過(guò)
2、孫老師：1.振動(dòng)信號(hào)時(shí)頻分析理論與測(cè)試系統(tǒng)設(shè)計(jì) 2.汽車檢測(cè)系統(tǒng)設(shè)計(jì) 3.汽車電子控制系統(tǒng)設(shè)計(jì)
3、畢老師：機(jī)構(gòu)動(dòng)力學(xué)與控制
4、王老師：1.計(jì)算機(jī)網(wǎng)絡(luò)安全 2.計(jì)算機(jī)仿真技術(shù)
5、周老師：1.智能機(jī)器人技術(shù) 2.智能檢測(cè)與控制技術(shù) 3.機(jī)構(gòu)運(yùn)動(dòng)學(xué)與動(dòng)力學(xué) 4.機(jī)電一體化技術(shù)
如您是高校老師，可以點(diǎn)此聯(lián)系我們加入專家?guī)臁?/a>

相關(guān)技術(shù)

網(wǎng)友詢問(wèn)留言已有0條留言

還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊！

精彩留言，會(huì)給你點(diǎn)贊！

音頻動(dòng)態(tài)范圍相關(guān)技術(shù)

音頻動(dòng)態(tài)范圍壓縮相關(guān)技術(shù)

音頻動(dòng)態(tài)范圍控制相關(guān)技術(shù)

音頻響度相關(guān)技術(shù)

壓縮標(biāo)準(zhǔn)用于音頻壓縮相關(guān)技術(shù)

用于音頻處理的芯片相關(guān)技術(shù)

動(dòng)態(tài)范圍相關(guān)技術(shù)

無(wú)雜散動(dòng)態(tài)范圍相關(guān)技術(shù)

相機(jī)動(dòng)態(tài)范圍相關(guān)技術(shù)

国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

用于校正影響音頻信息的播放響度和動(dòng)態(tài)范圍的元數(shù)據(jù)的方法