本發(fā)明涉及將可聽透明可逆水印插入到PCM音頻信號中,尤其參照流式傳輸。
背景技術:
在本千禧年,已經提出了若干用于音頻的可逆加水印方案,盡管在檢查時,可逆性經常存在于數(shù)值分析的意義上,并且在算法內存在不可避免的量化的情況下,原始PCM(脈沖編碼調制)信號的重構不是無損的,即,位對位準確的。我們認為確實無損的兩個算法是在WO2004066272中由M.Van Der Veen(M·萬德文)、A.Bruekers(A·布魯克)、A.Van Leest(A·萬力特)和S.Cavin(S·卡文)公開的“Reversible Watermarking of Digital Signals(數(shù)字信號的可逆加水印)”以及在WO2013061062中由P.Craven(P·克萊文)和M.Law(M·勞爾)公開的“Lossless Buried Data(無損埋入數(shù)據(jù))”。
WO2004066272公開了一種通過操縱音頻直方圖而對數(shù)字信號進行可逆加水印的方法。根據(jù)一種方法,S形增益函數(shù)C被應用到原始16位PCM音頻信號,該PCM音頻信號然后被重新量化為15位,在最低有效位(Isb)中留下1位空位。插入到此Isb空位中的數(shù)據(jù)包括所需要的水印數(shù)據(jù)、開銷以及使相應的解碼器將加水印過程逆轉并恢復原始音頻的精確復制品的重構數(shù)據(jù)。
S形增益函數(shù)具有超過1接近0的增益,并且將音頻信號的范圍映射到其自身。從而必須具有小于1接近全范圍的增益。在C的增益小于2的任何信號值范圍上,需要重構數(shù)據(jù),因為C將位于此范圍內的16位值映射到更低的不同的15位值。當C的增益還大于1時,每個重構數(shù)據(jù)樣本需要少于一位,并且當該增益小于1時,需要多于一位重構數(shù)據(jù)。該方案可行,因為信號值音頻的PDF(概率密度函數(shù))不是水平的,小信號值(其中C的S形狀具有大于1的增益)比大信號值(其中C具有小于1的增益)更常見。由此,平均來說,每個重構數(shù)據(jù)樣本小于1位(通常更少),使Isb空位內存在用于開銷和水印的足夠空間。
盡管此方法在嵌入大量水印數(shù)據(jù)時是有效的,但是存在透明度小于可能需要的情況的許多方面。水印數(shù)據(jù)被加到此信號,所以其中的圖案可以是可聽的,并且信號修改在耳朵最敏感的頻率區(qū)域中就像耳朵不敏感的頻率區(qū)域中那樣大聲。此方法不具有提供減少的噪聲交換減少的水印容量的靈活性。
WO2013061062公開了s形增益函數(shù)可以如何被實現(xiàn)為線性增益和削波單元的組合,該削波單元在對信號峰值進行削波時生成重構數(shù)據(jù)。其還公開了分離的無損濾波可以如何有利地結合該方案來修改信號的PDF,從而減少削波單元所生成的重構數(shù)據(jù)量。無論如何,看到可以如何使用WO2004066272或WO2013061062的方法實現(xiàn)與音頻信號不相關并且優(yōu)選地是頻譜成形的低和常量噪聲本底的音樂發(fā)燒友理想是比較困難的。
M.Gerzon(M·格爾茲)和P.Craven(P·克萊文)在“A High Rate Buried Data Channel for Audio CD(音頻CD的高速率埋入數(shù)據(jù))”(發(fā)表于1993年第94屆AES柏林會議的預印本3551)(以下稱為Gerzon)中描述了一種透明有損加水印方案。包括每個樣本n個二進制位的水印數(shù)據(jù)是隨機化的,并且然后被用于噪聲成形(16-n)位量化器的減法顫振。這具有丟棄音頻的n個Isb并且用隨機化水印替換它們的實際效果,但是與常規(guī)的位替換相比對音頻具有更小的傷害。描述了使n是1/2的奇數(shù)倍的兩個立體聲通道的聯(lián)合量化以及更復雜的量化方案。
音頻材料的流式傳輸現(xiàn)在非常流行,并且提出了這樣的技術要求:解碼器必須能夠在未看到編碼項目或“音軌”的開始的情況下開始解碼。在經濟地編碼的流的無損重構的情境中,該要求可造成顯著的技術障礙,以后將會明顯。
技術實現(xiàn)要素:
根據(jù)本申請的透明無損音頻加水印,本發(fā)明的目的是提供一種無損加水印方法,該方法與WO2004066272的方法相比具有改進的透明度,如在未并入本發(fā)明的特征的標準的“傳統(tǒng)”PCM解碼裝置上聽到的,同時保留了現(xiàn)有技術系統(tǒng)的從編碼流的中間部分開始解碼的能力。這是通過減少引入的量化誤差量、對誤差進行頻譜成形并且將信號更改從原始音頻完全地解除關聯(lián)來完成的,由此使誤差更類似于加性噪聲。本公開還致力于更改水印的容易化。
如將更詳細描述的,根據(jù)本發(fā)明的編碼器兩次將原始PCM信號量化,每次量化是量化到量化格柵。因為PCM信號本身已經量化,需要考慮三個量化格柵,第一是原始PCM信號的量化格柵,第二是加水印的信號的量化格柵,以及第三量化格柵是中間信號的量化格柵。
通常,加水印的信號被遞送為具有與原始信號相同的位深度的PCM信號,但是這并不意味著第一和第二量化格柵是相同的。通常,信號的量化格柵可能不是通過在PCM內將可能的位組合解釋為二進制數(shù)所獲得的值集。我們應當考慮被限制為僅由上述值集的更粗略子集執(zhí)行的一些信號。相反地,我們還應當考慮其值從上述值集中的值偏置不是量化步長的整數(shù)倍的某個量的信號。假如信號的發(fā)送器和接收器都知道此偏置,例如,如果此偏置是從這兩者都知道的數(shù)據(jù)或者從這兩者都知道的偽隨機序列生成器生成的,此偏置可以從不同樣本間變化。
這些考慮適用于單通道信號和多通道信號兩者,該信號的樣本值是位于多維格柵的格柵點上的多維向量。向量情況下另一個興趣點是:n維格柵可以是簡單的矩形、立方體或超立方體格柵,換言之,n個一維格柵的笛卡爾積,或者其可以是某個更常見的東西,例如,源自以下約束:n個通道的最低位的異或為零。PCM通道可以被視為具有其自身的量化格柵的容器,并且通過該通道傳輸?shù)腜CM信號的量化格柵可以更粗略。因此,無法簡單地從其位深度的知識推斷PCM信號的量化格柵。
量化通常被認為是丟棄信息的過程,但是如果已經被量化的信號被重新量化為不比原始量化格柵更粗略的量化格柵的話,不見得是這種情況。我們應當使用術語“量化”來指代信號值在量化格柵上到附近值的映射,不管信息是否丟失。
當引用‘噪聲’或‘信噪比’時,我們認為是在標準的PCM設備上再現(xiàn)加水印的信號時聽到的噪聲。當然,如果加水印的信號被根據(jù)本發(fā)明無損地解碼,則不存在來自加水印的附加噪聲。
在第一方面,本發(fā)明提供了一種用于對原始或“第一”音頻信號無損地加水印以便生成“第二”音頻信號的方法,這兩個信號都是脈沖編碼調制‘PCM’信號,并且各自被量化到其對應的“第一”或“第二”量化格柵。所述方法包括以下步驟:
接收作為在第一量化格柵上量化的樣本的所述第一音頻信號;
確定比所述第一量化格柵粗略的第三量化格柵;
向所述第一音頻信號應用量化映射以提供第三音頻信號,所述第三音頻信號具有取決于所述第三量化格柵的樣本值;
當所述第一量化格柵的多個值將通過所述量化映射被映射到所述第三音頻信號的值時生成第一數(shù)據(jù),其中,所述第一數(shù)據(jù)是重構數(shù)據(jù),指示所述多個值中的哪個值是所述第一信號的值;
組合所述第一數(shù)據(jù)和水印數(shù)據(jù)以產生第二數(shù)據(jù);
根據(jù)所述第二數(shù)據(jù)確定不同于所述第一和第三量化格柵的第二量化格柵;以及
根據(jù)所述第二音頻信號的先前樣本通過將所述第三音頻信號量化到所述第二量化格柵上生成所述第二音頻信號的樣本。
在其最基本的形式下,前四個步驟“接收”、“確定”、“應用”和“生成”與在WO2004066272中描述的現(xiàn)有技術過程的運算類似?!傲炕成洹痹诘谌炕駯派蠈⒃夹盘柫炕癁椤暗谌毙盘?,該第三量化格柵通常比第一量化格柵更粗略,導致信號分辨率丟失,這樣使第一信號的后續(xù)無損恢復需要附加的重構數(shù)據(jù)。該重構數(shù)據(jù)是在應用量化映射的過程中生成的“第一”數(shù)據(jù)。
第二音頻信號呈現(xiàn)為PCM信號,但是如所討論的,PCM信號可以具有比包含它的PCM通道的量化格柵更粗略的量化格柵。如果第二量化格柵是固定的,這將意味著與該通道相關聯(lián)的量化格柵的一些點將永不被執(zhí)行。這提供了將第三信號量化為變化的第二量化信號的機會,并且根據(jù)本發(fā)明,第二量化格柵是根據(jù)“第二”數(shù)據(jù)確定的,該第二數(shù)據(jù)包括以上提及的水印和“第一”重構數(shù)據(jù)。以此方式,第二數(shù)據(jù)被“埋入”在加水印的信號內,并且后續(xù)的解碼器可以通過檢查已經執(zhí)行過該通道的量化格柵的哪些點而恢復被埋入的數(shù)據(jù)。
如果量化映射具有整體性的大信號增益,將要因此被埋入的并且后續(xù)被恢復的“第二”數(shù)據(jù)的最大量將與“第一”重構數(shù)據(jù)的量相同,并且將沒有機會傳送水印。然而,在正常運算中,在覆蓋最經常發(fā)生的信號值的信號范圍上,量化映射被配置成提供大于整體性的增益。這減少了所需的重構數(shù)據(jù)的量,由此使第二數(shù)據(jù)攜帶所需要的水印數(shù)據(jù)和任何必要的系統(tǒng)開銷。
由此,量化映射通常不是線性的。如在WO2004066272中討論的,其可以具有S形??商娲兀缭赪O2013061062中討論的,其可以是線性的,在信號范圍的中心部分上具有大于整體性的增益,但是具有特殊配置以避免信號范圍的極值附近的超載。
當?shù)谝灰纛l信號取第一映射的增益小于整體性的值時,重構數(shù)據(jù)臨時地大于可以被埋入的最大第二數(shù)據(jù)??梢酝ㄟ^緩沖重構數(shù)據(jù)容納過量數(shù)據(jù)。由于緩沖造成延遲,通過簡單的緩沖,解碼器將需要讀取流并且在稍后的某個時間開始解碼;可替代地,編碼器可以在第三信號中插入延遲,從而使解碼器將在正確的時間接收所緩沖的重構數(shù)據(jù)。
根據(jù)第二和第三音頻信號中的至少的先前樣本執(zhí)行第三格柵到第二格柵的量化,以提供頻譜成形,并減少所得量化噪聲的感知重要性。該技術被廣泛地用于其他情境中,但是在可能在流式音頻的情境中需要無損重構時使用該技術是不明顯的,因為對先前樣本的依賴會使難以或不可能從流的半路開始重構。
在一些系統(tǒng)實施例中,所述依賴取決于第三音頻信號和第二音頻信號的有限數(shù)量n的先前樣本。解碼器直接接收第二音頻信號,所以僅僅通過等待n個樣本周期解決對第二音頻信號的先前樣本的依賴。第三音頻信號不是這種情況,所以在優(yōu)選實施例中,編碼器通過將與包括n個連續(xù)樣本的第三音頻信號的一部分有關的初始化數(shù)據(jù)包括在第二數(shù)據(jù)內來支持從“重啟點”解碼。
重啟輔助數(shù)據(jù)可以直接包括第三音頻信號的n個先前樣本的二進制表示,但是在提供16位音頻分辨率的系統(tǒng)中,將在流中的可能開始解碼的每個位置處針對每個音頻通道可能需要至少n*16位“重啟輔助數(shù)據(jù)”。注意到假設合適的噪聲成形濾波器,可以對第三音頻信號和第二音頻信號之間的差異進行嚴格的約束,該要求可以被非常顯著地減少。由此,在已經得知第二音頻信號的樣本時,可以從限定其位選擇的信息完全地重構第三音頻信號的相應的樣本。
在另一個優(yōu)選實施例中,編碼器從而提供僅與第三音頻信號的位選擇有關的初始化數(shù)據(jù),所述選擇具有例如少于八位。因此第三音頻信號的與具體的重啟點有關的位總數(shù)不超過通道數(shù)乘以該部分中的n個連續(xù)樣本的八倍乘以通道數(shù)。
優(yōu)選地,所述第一和第三量化格柵中的至少一個格柵在不同樣本間變化。如果不是這種情況,這兩個格柵將具有固定的關系并且到第三的量化映射將需要并入顫振以表面量化偽影,但是顫振引發(fā)噪聲懲罰。
在優(yōu)選實施例中,第三量化格柵根據(jù)偽隨機序列生成器的輸出而變化,以確保由量化格柵引入的量化誤差與第一音頻信號解除關聯(lián)。
在優(yōu)選實施例中,所述第一音頻信號是多通道的,并且所述第二和第三量化格柵中的至少一個格柵未被形成為每個通道上的單獨量化格柵的笛卡爾積。使用已知的量化方法,相比于單獨的通道量化,來自信號重新量化的附加噪聲可以然后被減少。
同樣提供其大信號行為緊密地匹配原始信號的加水印的信號,本發(fā)明還引入了信號修改和具體地濾波以調整頻率響應。無損濾波器在現(xiàn)有技術中是已知的,例如WO 96/37048,但是不可避免的是,它們需要量化到與正在處理的信號相同位深度,并且在“傳統(tǒng)”設備上再現(xiàn)時不可避免地增加噪聲。本發(fā)明允許使用更精細的量化的濾波器,更精細量化用來最小化所增加的噪聲。
因此,在一些實施例中,所述量化映射之前是濾波器,該濾波器的輸出比所述第一量化格柵更精細地被量化。在優(yōu)選實施例中,濾波器被配置為將調整值加到前向信號路徑的側鏈,其中,調整值是濾波器的輸入和輸出的先前樣本的線性或非線性確定性函數(shù)。這種添加可以被無損地逆轉,即使調整值被比前向信號路徑更精細地量化。精細量化減少了來自濾波的附加噪聲。
在第二方面,本發(fā)明提供了一種用于從第二音頻信號的一部分恢復第一音頻信號和水印數(shù)據(jù)的方法,其中,所述第一和第二音頻信號是脈沖編碼調制‘PCM’信號,并且其中,所述第二音頻信號是被無損地加水印的PCM信號,并且所述第一音頻信號具有取決于第一量化格柵的樣本,所述方法包括:
確定第三量化格柵;
接收所述第二音頻信號作為量化樣本;
從所述第二音頻信號恢復第一數(shù)據(jù)和所述水印數(shù)據(jù),其中,所述第一數(shù)據(jù)是用于恢復所述第一音頻信號的重構數(shù)據(jù);
通過根據(jù)所述第二音頻信號和第三音頻信號中的至少一個的先前樣本量化所述第二音頻信號的樣本來生成被量化到所述第三量化格柵上的第三音頻信號的樣本;
根據(jù)所述第一數(shù)據(jù)向所述第三音頻信號應用量化映射以提供映射信號;以及
根據(jù)所述映射信號提供所述第一音頻信號。
通常,所述第一音頻信號無損地復制被呈獻給編碼器的原始PCM音頻信號的一部分,并且所述第二音頻信號是所述原始PCM音頻信號的加水印版本。該信號具有量化樣本,第一音頻信號具有取決于第一量化格柵的樣本。第三量化格柵通常被選擇為比第一量化格柵更粗略,如果第三信號與水印無關的話,該特征通常是必要的,從而使第三信號僅攜帶來自第一信號的音頻信息。更粗略的分辨率意味著丟失某些原始音頻信息,但是該信息被攜帶在第一數(shù)據(jù)內,同樣被稱為“重構數(shù)據(jù)”。在應用量化映射的步驟中,第一數(shù)據(jù)內的重構信息與更粗略地量化的第三信號組合,從而使映射信號具有全分辨率。
直接地,映射信號等于第一信號,所以“提供”方法步驟是空運算。然而,在一些實施例中,提供可以并入其他功能,諸如添加調整樣本,如以下將解釋的。
優(yōu)選地,所述第一和第三量化格柵中的至少一個格柵從不同樣本間變化。如果不是這種情況,這兩個格柵將具有固定的關系,并且相應的編碼器中的相應的兩個格柵也將需要具有固定的關系,如果解碼方法是無損的話。結果,相應的編碼器中的量化映射將需要并入顫振以避免量化偽影,但是如果加水印的信號在標準PCM設備上再現(xiàn)的話,顫振引起噪聲懲罰。
在優(yōu)選實施例中,所述第三量化格柵是根據(jù)偽隨機序列生成器的輸出確定的。與上述類似,該要求需要確保由相應的編碼器中的量化映射引入的量化誤差與第一音頻信號解除關聯(lián)。
在優(yōu)選實施例中,所述第一、第二和第三音頻信號是多通道的,并且所述第二和第三量化格柵中的至少一個格柵未被形成為每個通道上的單獨量化格柵的笛卡爾積。再次,通過與上述類似的爭論,使用已知的量化方法,相比于單獨的通道量化,來自相應的編碼器中的信號重新量化的附加噪聲可以然后被減少。
在一些實施例中,第一信號直接由量化映射產生,所以第一信號等于映射信號。然而,為了避免提供從已經修改的第一信號導出的加水印的信號的無損重構,所述方法可以進一步包括以下步驟:
確定比所述第一量化格柵更精細的第四量化格柵;根據(jù)所述第一音頻信號和所述映射信號中的至少一個信號的先前樣本計算調整樣本,所述調整樣本具有取決于所述第四量化格柵上的值;以及
將所述調整加到所述映射信號。
這種實施例允許使用加水印的信號,這種加水印的信號是使用從第一信號減去相應的調整的編碼器編碼的,從而提供濾波器功能。如以上解釋的,這使加水印的信號在被解釋為普通的PCM信號時具有與原始“第一”信號不同的頻率響應,但是具有比已經使用分離的無損濾波器執(zhí)行的頻率響應修改更少的噪聲。對于無損的解碼方法,調整值還需要被傳達到量化映射,如以下將解釋的。
在優(yōu)選實施例中,第二方面的解碼方法包括以下附加步驟:
從所述第二音頻信號恢復初始化數(shù)據(jù);以及
使用所述初始化數(shù)據(jù)確定從所述第三音頻信號的連續(xù)樣本選擇的位。
該特征與從“重啟點”而不是從開始處解碼流有關。如早先解釋的,一旦已經確定了每個連續(xù)樣本內的位選擇,第三音頻信號的連續(xù)樣本可以被完整地重構。由于第二音頻信號的樣本被直接接收到,這提供了足以允許解碼器中的噪聲成形或其他濾波器的初始化數(shù)據(jù)以精確地模擬編碼器中的相應濾波器的運算,如其他地方解釋的,這足以使得解碼器從那個時間向前確定第三音頻信號。
優(yōu)選地,本系統(tǒng)被配置為使為了確定第三音頻信號而接收的初始化數(shù)據(jù)不大于通道數(shù)乘以第三音頻信號的值數(shù)的8位倍。這最小化了流開銷,并且如早先解釋的,這是通過使用合適的噪聲成形濾波器,并且預先確定第三音頻信號與第二音頻信號之間的差異的嚴格約束促成的。
第三方面,本發(fā)明還提供了一種用于更改第二音頻信號中的水印的方法,所述第二音頻信號是根據(jù)第一方面的方法生成的無損地加水印的PCM信號。該更改是在無需完全地恢復原始信號和重新編碼的情況下實現(xiàn)的,這種恢復和重新編碼將在計算上是更昂貴的。
第三方面,所述方法包括以下步驟:
接收所述第二音頻信號作為量化樣本;
從所述第二音頻信號恢復包括嵌入式水印數(shù)據(jù)的第二數(shù)據(jù);
通過根據(jù)所述第二和第三音頻信號中的至少一個的先前樣本量化所述第二音頻信號來生成被量化到第三量化格柵上的第三音頻信號的樣本;
通過更改所述第二數(shù)據(jù)中的所述嵌入式水印產生第四數(shù)據(jù);
根據(jù)第四數(shù)據(jù)確定第四量化格柵;根據(jù)所述第四和第三音頻信號中的至少一個音頻信號的先前樣本在第四量化格柵上將所述第三音頻信號量化為第四音頻信號。
由此可見,此第三方面的方法步驟基本上對應于第二方面的前幾個步驟和第一方面的最后幾個步驟。
為了提供與第一和第二方面的實施例的兼容性,優(yōu)選地,第三量化格柵從一個采樣時刻到另一個采樣時刻變化。類似地,優(yōu)選地,所述第三量化格柵是根據(jù)偽隨機序列生成器的輸出確定的。
在其中所述第二、第三和第四音頻信號是多通道的應用中,優(yōu)選地,所述第二、第三或第四量化格柵中的至少一個格柵未被形成為每個通道上的單獨量化格柵的笛卡爾積。該優(yōu)選是為了與具有類似的優(yōu)選特性的編碼器和解碼器兼容。
第四方面,本發(fā)明提供了一種被適配成使用第一方面的方法對PCM音頻信號無損地加水印的編碼器。還提供了一種被適配成使用第三方面的方法更改水印的水印修改器。
第五方面,本發(fā)明提供了一種被適配成使用第二方面所述的方法從被無損地加水印的PCM信號恢復PCM音頻信號和水印數(shù)據(jù)的解碼器。
第六方面,本發(fā)明提供了一種包括根據(jù)第四方面的編碼器結合根據(jù)第五方面的解碼器的編解碼器。
第七方面,本發(fā)明提供了一種包括使用第一方面的方法無損地加水印的PCM音頻信號的數(shù)據(jù)載體。
第八方面,一種計算機程序產品包括指令,當被信號處理器執(zhí)行時,所述指令使所述信號處理器執(zhí)行第一至第三方面中任一方面所述的方法。
盡管根據(jù)第三方面的方法可以有利地用于更改已經根據(jù)第一方面的方法生成的無損地加水印的PCM音頻,其還能夠獨立地用于更改任何合適的無損地加水印的PCM音頻。再次,該更改是在無需完全地恢復原始信號和重新編碼的情況下實現(xiàn)的,這種恢復和重新編碼將在計算上更昂貴。
相應地,第九方面,本發(fā)明提供了一種用于更改輸入音頻信號中的水印的方法,所述輸入音頻信號是無損地加水印的PCM信號,所述方法包括以下步驟:
接收所述輸入音頻信號作為量化樣本;
從所述輸入音頻信號恢復包括嵌入式水印數(shù)據(jù)的輸入數(shù)據(jù);
通過根據(jù)所述輸入音頻信號和中間音頻信號中的至少一個音頻信號的先前樣本量化所述輸入音頻信號來生成量化到中間量化格柵上的所述中間音頻信號的樣本;
通過更改所述輸入數(shù)據(jù)中的所述嵌入式水印產生輸出數(shù)據(jù);
根據(jù)所述輸出數(shù)據(jù)確定輸出量化格柵;
根據(jù)所述輸出和中間音頻信號中的至少一個音頻信號的先前樣本在所述輸出量化格柵上將所述第三音頻信號量化為輸出音頻信號。
在一些實施例中,所述中間量化格柵從一個采樣時刻到另一個采樣時刻變化。
在一些實施例中,所述中間量化格柵是根據(jù)偽隨機序列生成器的輸出確定的。
在其他方面,本發(fā)明提供了一種被適配成使用第九方面的方法更改水印的水印修改器,并且還提供了一種包括指令的計算機程序產品,當被信號處理器執(zhí)行時,所述指令使所述信號處理器執(zhí)行第九方面的方法。
如將所理解的,本發(fā)明提供了用于用水印無損地編碼和解碼PCM音頻信號以及用于更改無損地加水印的PCM信號中的水印的各種方法和設備。其他變化和修飾將在本公開中對本領域技術人員明顯。
附圖說明
下面參照附圖,詳細地描述本發(fā)明的示例,在附圖中:
圖1A是根據(jù)本發(fā)明的實施例的編碼器的信號流示意圖;
圖1B是與圖1A的編碼器相對應的解碼器的信號流示意圖;
圖2示出了圖1B中的用于雙通道信號的量化器211的運算的細節(jié);
圖3示出了圖1A中的用于雙通道信號的量化器112的運算的細節(jié);
圖4示出了圖1B中的用于雙通道信號的量化器212的運算的細節(jié);
圖5A示出了圖1A的量化器111的當被適配成用于雙通道信號的維羅尼區(qū)域的曲線圖,以及圖5B示出了維羅尼區(qū)域的擴展曲線圖;
圖6示出了根據(jù)本發(fā)明加水印的PCM音頻流,示出了兩個重啟點和在這兩個重啟點中的每一個重啟點之前編碼的重啟輔助數(shù)據(jù);
圖7示出了在圖1B中示出的解碼器部分的可替代配置,用于立即在重啟點之后使用;
圖8A示出了可以如何通過向PCM音頻信號添加先前樣本值的更精細量化的函數(shù)來修改此信號;
圖8B示出了可以如何修改在圖1B中示出的解碼器的后一級以修改無損地逆轉圖8A的信號;
圖9示出了可以如何修改在圖8B中示出的解碼器部分,以在未接收到提供圖8A中示出的無損重構所需的重啟信號時,臨時地提供原始信號的無損重構;以及
圖10示出了如何從根據(jù)本發(fā)明加水印的流提取水印數(shù)據(jù)以及然后如何用可替代的加水印數(shù)據(jù)對此流加水印而無需完全地解碼和重新編碼音頻信號。
具體實施方式
在被稱為“減法顫振”的過程中,向信號添加隨機偏置,接下來將結果值量化,并且然后再次減去相同的偏置。減法震顫已知用于通過使得量化誤差類似于噪聲并獨立于所量化的信號而增加量化的透明度,如在M.Gerzon和P.Craven在“A High Rate Buried Data Channel for Audio CD(音頻CD的高速率埋入數(shù)據(jù))”(發(fā)表于1993年第94屆AES柏林會議的預印本3551)(以下稱為Gerzon)中所討論的。
如Gerzon所指出的,減法顫振要求從連續(xù)的分布的隨機偏離。在我們的實施例中,我們將需要使得偏離具有有限數(shù)量的位以控制將被用作乘法器的輸入的被減法顫振的信號的字寬。8位的隨機偏離對于我們的目的來說是足夠的,將任何量化偽影從16位水平附近向下移動到24位水平附近,同時仍允許32位字中存在用于16位音頻的大量空間。
通常,使用晶格量化器,從而使在減法之前量化值取決于量化晶格。人們還可以僅僅在量化之前進行減法并且在之后進行加法。在這種情況下,結果值取決于量化晶格,并且具有由隨機偏離給出的偏置。這提供了對減法顫振的可替代視角,即,全部的運算是一次量化到隨機化格柵上。
我們應當使用術語“量化偏置”來表示該格柵從限定量化的晶格的偏置。我們應當頻繁地考慮從音頻信號的不同樣本間變化的量化偏置,該音頻信號通常是通過偽隨機序列生成器生成的,但是有時需要某些修改,并且有時通過其他方式生成。
我們還應當使用術語“量化格柵”來指代量化器將輸出的點集,該點集是量化晶格與偏置的組合。如何量化偏置從不同樣本間變化,則量化格柵也將這樣。
當我們說使用偽隨機數(shù)生成器時,我們將要求其輸出在編碼器和解碼器之間匹配。這可以通過將樣本數(shù)量數(shù)據(jù)包括在開銷中,從而與水印一起傳送而實現(xiàn)。當解碼器在音軌的半路開始運算時,其可以使用樣本數(shù)量數(shù)據(jù)來尋求偽隨機序列中的正確位置,從而使其偽隨機數(shù)生成器的后續(xù)輸出將匹配在編碼器中使用的輸出。
現(xiàn)在將參照處理2通道16位PCM音頻的實施例解釋本發(fā)明。然而,數(shù)量16并不存在任何特殊之處并且本領域技術人員將容易將本公開適用于其他位深度或量化方案。熟悉Gerzon的人也應當容易一般化到一個或多個通道。
加水印器的輸入可以來自諸如CD等源,其在每個通道上的樣本在晶格{2-16k}上被量化,由2-16的所有整數(shù)倍組成。然而,我們不排除以下可能性:其已經由減法顫振過程生成并且具有加水印器已知的并且被編程到水印恢復器或解碼器的偽隨機量化偏置。我們由此將加水印器的輸入和來自后續(xù)恢復器的輸出說成具有“第一量化偏置”。如果是CD,這對于所有樣本將是零,在音頻是通過減法顫振過程提供的情況下,其將由商定的偽隨機序列給出。
我們的加水印器將遵循WO2013061062來將g-1增益(其中g<l)應用到音頻,并且通過對結果音頻進行軟削波(使用削波單元133和求逆運算,解除削波單元233)來處理任何結果超載。增益和削波的組合對應于WO2004066272的S形增益函數(shù)。
將參照圖1A和圖1B描述本發(fā)明。雙通道16位PCM音頻信號被認為包括樣本,每個樣本是分量被量化到16位的二維向量。在圖1A中,被量化到具有量化偏置O1的晶格的信號101呈獻給編碼器。PCM信號的樣本值除以131增益g(其中g<1),并且然后被量化111到粗略量化晶格以生成中間信號103。該粗略格柵聯(lián)合地將兩個通道量化至15.5位級,其中,量化晶格定義為{[2-16,2-16],[2-16,-2-16]},其中,偽隨機偏置為O3。因此,量化格柵為[2-16(j+k),2-16(j-k)]+O3,其中j,
現(xiàn)在假設削波單元133未調整該信號(對于大部分范圍成立),則信號104是信號103的復制。信號104然后再次被量化112到相同15.5位晶格,但是具有根據(jù)數(shù)據(jù)143(包括水印)選擇的偏置以生成具有將數(shù)據(jù)143嵌入到輸出信號102中的效果的輸出信號102。偏置是[0,0]以嵌入0并且是[0,2-16]以嵌入1,所以數(shù)據(jù)143被以類似于在Gerzon中描述的方式包含在這兩個通道的Isb的奇偶校驗中。
如圖1B所示,相應的解碼器從編碼器接收音頻輸出102的復制202。通過檢查樣本值以確定哪一個量化偏置O2被使,從而恢復數(shù)據(jù)243(143的復制品)。信號202然后被量化212到上述15.5位晶格,其中量化偏置為O3,從而使量化器212所引入的量化誤差與量化器112所引入的量化誤差相反,從而使信號204復制信號104。解除削波單元233對削波單元133求逆,從而信號203復制信號103。接下來使用g對該信號進行加乘231,并且該信號被量化211到具有量化偏置O1的16位晶格。量化器211不總是將最近的量化值輸出到其輸入,如以下將參照圖2描述的。其接收可以在每個通道上將其輸出調整±2-16的重構數(shù)據(jù),該重構數(shù)據(jù)被設置成在確立無損運算的信號101上復制該值。
同時,設置了濾波器121、221、122、222,使解碼器版本接收復制編碼器中的那些輸入信號的輸入信號,并且因此在啟動時受到適合的初始化,其輸出同樣匹配。其效果是成形量化器引入的量化誤差,從而使加水印的信號102中的全部量化誤差被頻譜地成形,以減少可聽性,并且由此增加水印的透明度。其用全極傳遞函數(shù)將白量化器噪聲成形,如圖7中的Gerzon。對于44.1kHz運算的合理的濾波器G(z)是:
G(Z)=1+1.2097z-1+0.2578z-2+0.1742z-3+0.0192z-4-0.2392z-5
為了稍后引用,1/G(z)的脈沖響應的絕對值之和小于27。
15.5位量化比編碼器輸入信號的16位量化更粗略。因此,即使g<l,有時存在到111的多個輸入值,這些輸入值被量化到與103相同的值。當這種情況發(fā)生時,歧義解析器113(接收信號105,即,由111所引入的量化器誤差的縮放版本)輸出指示實際上呈現(xiàn)了哪個可能的輸入值的數(shù)據(jù)141。伴隨著格式化開銷,該重構數(shù)據(jù)141與所需要的水印被復用至數(shù)據(jù)143中。
相應地,解碼器從243提取重構數(shù)據(jù)241,并且在到111的多個輸入值可能已經產生相同值103的情況下使用該數(shù)據(jù)來調整來自211的輸出。在圖2中擴展了量化器211。圖2示出了輸入信號如何首先被量化213到最近的值并且量化誤差205如何被饋送到調整器215。事實證明,對于任何增益值g,量化誤差205足以指示多少至111的輸入值可能已經產生103。如果答案是多于一個,調整器215消耗來自241的數(shù)據(jù),以確定將加到213的輸出的調整207。因此,該輔助數(shù)據(jù)241確保201即使在某個其他量化值可能稍微更接近量化器211的輸入時也能復制101。
與在WO2004066272中描述的15位量化器相比,使用上述15.5位量化器確實使運算復雜化。然而,這是有用的,因為這意味著加水印添加了就像使用15位量化器使加水印器更透明那樣一半的噪聲。可以進一步例如使用聯(lián)合量化4個樣本的15.75位量化器進行該過程,4個樣本各自上的1個或者2個通道中的每一通道上2個連續(xù)樣本將再次將所添加的噪聲減半。然而,我們的實施例僅處理2個通道并且在聯(lián)合量化連續(xù)樣本時將存在更大的復雜性。
圖3示出了15.5位量化器112的示例???01實現(xiàn)了采取其雙通道輸入的15.5位晶格量化器,并且通過元件304-307形成通道之和與之差的一半。16位量化器308和309然后量化通道,并且通過進一步的求和求差形成輸出。301的可能輸出是其Isb都是0或者都是1的多對整數(shù)。
通過在框301之前從一個通道減去302位數(shù)據(jù)143并且將其在之后加回去303而將框301擴展到框112。如果該位是零,則112以偏置[0,0]量化到晶格量化格柵上。如果該位是一,則112以偏置[0,2-16]量化到晶格格柵上,其中Isb的一個通道是0,另一個是1。
返回參照圖1B,通過檢查來自兩個通道的相應樣本的多對Isb的奇偶校驗來產生數(shù)據(jù)243以確定在15.5位量化中使用過哪一個偏置。如果這些通道具有相同的Isb,則零被生成至243中,或者如果這些通道具有不同的Isb,則生成一。
量化器212量化到與112相同的分辨率。如圖4所示,這與量化器112非常類似,除了偏置O3是偽隨機地選擇的,而不是兩個偏置之間的數(shù)據(jù)驅使的選擇。相應地,來自生成介于0和2-15之間的值的偽隨機數(shù)生成器(PRNG)的兩個樣本用于為來自301量化到其上的常量格柵的量化格柵G3創(chuàng)建2D偏置。從至301的輸入減去該偏置并且在301的輸出加入該偏置。
有實現(xiàn)相同的效果的其他方式,例如,312和313的輸出可以在量化器308和309之前被立即減去,并且之后被立即加回來。然而,這種方案的不同之處在于來自312和313的值之間的映射與偏置O3的選擇,所以需要在解碼器量化器212與編碼器量化器111之間進行兼容選擇。
只要在112和212中使用的晶格量化器308和309彼此兼容,解碼器量化器212將移除112所引入的量化誤差,將信號203恢復為信號103的復制。然而,兼容并不意味著完全相同。在本實施例中,Q112(x)=Δ(ceiling(Δ-1x-0.5))并且Q212(x)=Δ(floor(Δ-1x+0.5)),其中,Δ是步長2-16。充分的兼容性條件是對于所有x存在Q112(x)=-Q212(-x)=Q112(x-Δ)+Δ。
同樣,量化器111以偏置O3量化到15.5位,并且架構應當與212的架構匹配,從而使其具有從偽隨機數(shù)到O3的相同映射。偏置O3的選擇需要在編碼器和解碼器中都匹配,所以212中的偽隨機數(shù)生成器必須被同步為匹配111中的那些生成器。這可以通過周期性地將同步信息(諸如樣本數(shù))嵌入在數(shù)據(jù)143中來實現(xiàn)。
圖5A和圖5B示出了如何從縮放誤差量化器誤差信號105產生數(shù)據(jù)141。(為了避免混淆示意圖,來自噪聲成形濾波器121的輸出假設為零)。
圖5A中示出的曲線圖中,軸線是信號101的左通道和右通道,其中,水平線和豎直線組成的格柵對應于可以在輸入上呈現(xiàn)的可允許的量化值(由16位晶格和偏置O1給出)。
這些交點之一被標記為表示在這個說明性場景上呈現(xiàn)的實際值。在除以g、由111量化并且乘以g之后,示出了信號106的示意性值。上述量化器111的維羅尼(Veroni)區(qū)域是菱形。圖5A的曲線圖上示出了通過g縮放。當然,由于信號101除以g被量化到信號106,101的實際值位于該區(qū)域內。如果該值是可行的唯一值,則相應的解碼器將能夠從106的值唯一地標識101的實際值。在所示出的情況下,示出了一個其他可能的值,該值也將已經產生106的給定值,所以解碼器將需要附加信息位141來解析位于維羅尼區(qū)域中的哪一個量化值應當被輸出。
圖5B中示出的曲線圖擴展了維羅尼區(qū)域,該區(qū)域的中心在信號105=0上。如果信號105位于任何虛線菱形內,則存在另一個可能值位于相對的虛線菱形中的信號101(該值在一維中由±g轉換),并且歧義解析器113需要發(fā)送數(shù)據(jù)141中的一位信息以解析解碼器應當產生這兩個相反值中的哪一個值。例如,如果信號105位于左側菱形中,則可以發(fā)送零,而如果其位于右側菱形中,則可以發(fā)送1。同樣,可以針對底部菱形發(fā)送0并且可以針對頂部菱形發(fā)送1??商娲?,如果信號105的值位于非虛線菱形中,則其必須位于中央交叉區(qū)域中。在此,信號101不存在任何選擇可能性并且不需要發(fā)送任何數(shù)據(jù)。對于該量化器選擇,永遠不存在多于2個值位于維羅尼區(qū)域中的任何可能性,所以數(shù)據(jù)141每個樣本最多具有1位。
每個虛線菱形的寬度是2g-1,所以如果g<0.5,則虛線菱形消失并且永遠不存在需要解析的任何歧義。同樣,對于g=1,交叉消失并且所以141上的數(shù)據(jù)速率總是每個樣本1位,這使量化器112的數(shù)據(jù)容量飽和,不存在用于開銷或水印的富裕容量。因此,要求g<l。
在某些情況下,可以容忍計算虛線區(qū)域的不準確性。重要的是編碼器計算必須精確地匹配在解碼器中執(zhí)行的計算(否則編碼器和解碼器運算將不同)。同樣重要的是虛線區(qū)域不被計算的太小,否則可能存在信號201的解碼器無法產生的值。但是,如果虛線區(qū)域稍微比嚴格要求的大的話則不是大問題。這種不準確性的后果是數(shù)據(jù)141偶爾攜帶不需要的數(shù)據(jù)位,稍微浪費數(shù)據(jù)容量。
信號105的計算的小誤差(諸如精細量化,如果解碼器乘以231g產生較大字寬的話)可以由此被容忍,只要解碼器作出匹配近似(在231中)并且它們都拉長虛線菱形的大小,以容忍最壞情況下不準確性。
在解碼器中,量化器213的輸出是可能已經被呈獻給編碼器的一個可能值。調整器215可以向歧義解析器113作出有關重構位是否需要從數(shù)據(jù)241拉入的相應決定。如果需要,并且該位指示與205位于其中的虛線菱形相對的虛線菱形,則調整器215輸出調整信號207,以將量化器211的輸出調整到正確值,從而復制信號101。任何在左側通道或右側通道上的調整將是±1Isb。
削波
由于增益元件131,信號103將超過16位音頻的可表示范圍,并且削波122在此將信號帶回可表示范圍中,從而使加水印的輸出102不會超載。
對于大部分信號范圍,削波單元122不對信號進行任何修改。接近±全范圍,其具有<l的小信號增益,并且將其輸入的多個值映射到其輸出的特定值。當這種情況發(fā)生時,其生成指示了實際上呈現(xiàn)了該多個值中的哪一個值的削波重構數(shù)據(jù)142。削波重構數(shù)據(jù)142與重構數(shù)據(jù)141和水印組合以形成數(shù)據(jù)143。
解除削波單元233與削波單元相逆。對于大部分信號范圍,這對信號沒有任何修改。接近±全范圍,其具有<l的小信號增益,并且將其輸入的特定值映射到其輸出的多個值。當這種情況發(fā)生時,其使用削波重構數(shù)據(jù)242以選擇實際上輸出了該多個值中的哪一個值。從數(shù)據(jù)243一起提取削波重構數(shù)據(jù)242、重構數(shù)據(jù)141以及水印。在WO2013061062中描述了該運算,例如,如其圖11所示。
為了本實施例的簡潔,我們將信號103和104都量化到15位晶格(沒有偏置),該晶格是15.5位晶格的子集,并且因此不會更改信號104的量化偏置。當通道未進行削波時,我們希望它通過削波而保持完全地未被修改,并且所以當通道進行削波時,我們選擇以2-15的倍乘更改該信號,從而使我們保持在相同的量化偏置而不會更改另一個通道。
由于削波所造成的調整的15位量化像其他噪聲源被放在一起時那樣大聲,并且未噪聲成形。我們認為在我們尋求更高的透明度的過程中這是可接受的,因為其僅在信號大聲時的削波期間發(fā)生并且從軟削波經歷失真。此外,在稍后的實施例中,我們描述了濾波的使用,可以極大地減少信號削波的發(fā)生率。增益和削波的組合給出了WO2004066272的S形傳遞函數(shù)C。人們可能好奇我們?yōu)槭裁催x擇組合線性增益和S形削波函數(shù),而不是在一個階段中全部執(zhí)行,尤其就像在一個階段中執(zhí)行,將不會引入附加的15位噪聲源那樣。
答案是我們希望從樣本到樣本更改增益g并且相信尤其是假定我們的隨機化15.5位聯(lián)合量化格柵G3構建歧義解析器113和調整器215的復雜性將超過此方法引入的噪聲的缺點。
初始化
如上所述,信號201的無損重構需要來自濾波器221和222的輸出匹配編碼器中的濾波器121和122的輸出。如果解碼器在先前樣本上無損地運算的話,則滿足該要求,并且當編碼器和解碼器都能夠將其各自的濾波器狀態(tài)初始化至通用值(諸如零)時,也可以在編碼軌開始時滿足該要求。然而,解碼器的有用運算還要求經由編碼流半路啟動的能力,這使得將量化噪聲頻譜成形比人們可能剛開始假設的情況更棘手。
在我們的實施例中,我們提供了流中的某些點作為重啟點,如圖6所示。示出了加水印的音頻102,其中數(shù)據(jù)通道143作為其Isb的異或XOR。400、401和402是重啟點,其中,解碼器將能夠開始原始音頻的無損解碼。重啟點在音軌的開始處,并且在此濾波器221和222可以被初始化到0,匹配編碼器處的類似重置。然而,重啟點401和402在音軌中間并且因此埋入數(shù)據(jù)143必須包含重啟輔助信息411和412,這些輔助信息將用于初始化用于啟動解碼器從401或402無損地解碼的濾波器狀態(tài)。
現(xiàn)在,在相應的重啟點401之前埋入重啟輔助信息411,從而使當解碼器需要使用該數(shù)據(jù)來在401初始化濾波器狀態(tài)時,解碼器可以配備該數(shù)據(jù)?,F(xiàn)在,在某個點更改埋入數(shù)據(jù)143影響112的量化和濾波器122意味著此更改后的數(shù)據(jù)同樣影響后續(xù)量化。如果重啟輔助數(shù)據(jù)411取決于濾波器122在重啟點401的狀態(tài),我們將具有用于編碼器進行解析的笨拙循環(huán)性,因為該狀態(tài)取決于早先的埋入數(shù)據(jù)。
幸運的是,其中(G-1)是有線脈沖響應(FIR)濾波器的全極噪聲成形架構允許了避免這種循環(huán)性。濾波器122的狀態(tài)是中間信號104與加水印的信號102的最近值之間的差異。隨著解碼器接近重啟點401,其已經在重啟點之前觸及信號202,即,102的復制。所以這對于重啟信息倆說足以使允許在401之前立即針對n個樣本重構中間信號104,其中,濾波器122的輸出是其輸入的先前n個值的函數(shù)。由于信號104不取決于埋入數(shù)據(jù)143,循環(huán)性得以避免。
重啟信息可以包含信號104的這些n個樣本的完整拷貝,但是如果重啟點比較頻繁,則這可能是不方便的大量數(shù)據(jù)?,F(xiàn)在我們呈現(xiàn)一種允許非常少的重啟信息即以足夠的方法。
信號104和102的不同之處僅僅在于噪聲成形量化,并且所以其不同被界限??梢詮脑肼暢尚蝹鬟f函數(shù)的脈沖響應和量化誤差的大小計算該界限。在我們的實施例中,量化器211在通道上產生2-16g<2-16的最大絕對誤差。并且,噪聲成形濾波器1/G(z)的脈沖響應的絕對值之和小于27。所以信號104與102之差在范圍(-27×2-16,27×2-16)內。此外,對于解碼器來說,信號104在任何樣本上的Isb是從所定義的量化格柵G3是已知的。因此,僅每個樣本需要6位的重啟輔助數(shù)據(jù)(這是非常保守的約束,并且通常更少的比位足夠使用)。
圖7中示出了濾波器222的重啟運算。與常規(guī)運算相比,忽略了來自濾波器222的輸出。而是,量化器431通過量化202到15.5位量化的粗略子集來生成204,其中偏置為O3,如下所述。通過計算信號204的正確值,我們具有濾波器222的正確輸入,并且在n個樣本之后,稍后濾波器222具有正確的狀態(tài)并且我們可以回到常規(guī)運算。
在我們的示例中,量化器431是10位晶格量化器,并且偏置由6位的重啟輔助數(shù)據(jù)由2-16擴展之后以及PRNG 312(或對于另一個通道是313)的輸出之和給出。與15.5位量化相比,PRNG 312確保信號204具有正確的偏置O3,并且重啟輔助選擇靠近輸入信號202的正確值。
該編碼側將理想地需要將信號104的11到16位推送到重啟輔助。然而,PRNG值的范圍高達2-15,所以PRNG和輔助之間存在一位的重疊。由于解碼器將這些值相加,編碼器必須從信號104的11到16位的Isb端減去PRNG輸出的頂位。濾波器221可以按照類似的方式被初始化。
濾波
如WO2013061062中所討論的,在這種直方圖更改無損加水印器之前進行預強調濾波會是有用的。在此,這被實現(xiàn)為完全分離的預處理,其必要地涉及重新量化回到16位水平。
根據(jù)本發(fā)明的另一個實施例,編碼器之前是濾波器,該濾波器具有單一第一脈沖響應并且其輸出被量化到比16位更精細的精度,諸如24位。
圖8A中示出了這種濾波器的一般化形式。函數(shù)520由濾波器輸入501和輸出503的n個延遲值計算出,并且結果被量化530以產生信號502,該信號的值在任何時刻都被稱為A(為了調整)。通過將信號502與信號501相加來形成濾波器輸出503。如果量化器530將量化到編碼器進行運算的16位精度,則這與WO2013061062中的無損預強調濾波器沒有實質性的不同。然而,量化器503在接下來是所不期望的未成形的16位噪聲的額外源。
然而,意外的是,濾波器編碼器組合將仍是可逆的,即使量化器530量化到更精細的精度,例如24位。現(xiàn)在,量化器530所引入的噪聲低很多,并且不會對本發(fā)明所引入的總體噪聲做出實質性的貢獻。
信號501被量化到16位晶格,其中偏置為O1,并且A是先前樣本的函數(shù)。盡管A具有更高的精度,信號503可以由此被認為量化到16位量化格柵(O1+Α)。這不會影響后續(xù)編碼器運算(由于歧義解析器113的運算僅取決于使用16晶格的輸入,而不是量化偏置),但是這確實影響解碼器運算。
在圖8B中示出了解碼器運算,此圖示出了對在圖1B中示出的解碼器的左手側的修改。假設先前無損運算,解碼器可以計算所復制的先前樣本的與編碼器相同的函數(shù)521并且執(zhí)行相同的量化531以產生信號512,該信號的值也是A,復制信號502。
然而,這并不從量化器211的輸出減去A,因為這將改變量化偏置。而是,其在量化器211之前減去A。由此,量化器211的輸出是經濾波的信號、用信號511復制信號501所需的偏置O1量化并且用作解碼器輸出和到函數(shù)521的輸入中的一個輸入。
接下來加A,這給出了具有量化偏置(O1+A)的復制信號503的信號,這正是到函數(shù)501的另一個輸入以及減法節(jié)點饋送噪聲成形濾波器221所需要的。為了引起關注,我們指出虛線框214形成具有量化偏置(O1+A)的16位量化器。
盡管有噪聲成形,當在音軌的中間部分啟動解碼器運算時,上述邏輯失效,并且需要重啟輔助數(shù)據(jù)來引導無損運算。最簡單地,重啟輔助將包括正確的濾波器狀態(tài)的快照(snapshot),但是如果重啟點比較頻繁,則這將是不方便的大量數(shù)據(jù)。
我們現(xiàn)在解析可以如何實質性地減少重啟輔助數(shù)據(jù)量。我們進行以下初步觀察:
●將信號512反饋給量化器214意味著量化器和濾波器需要作為組合單元引導。如果我們不引導濾波器的話,初始化214的噪聲就沒有意義,因為信號512的誤差值致使量化器214量化到誤差的格柵并且因此不以無損的方式運算。這是與WO2013061062中的預強調的關鍵不同,此預強調未被集成到量化器中。
●由于具有噪聲成形,如果信號513和511對于n個樣本是正確的,則信號512將是正確的,并且如果量化器214的噪聲成形也是正確的話,將繼續(xù)無損運算。
●信號513也需要是正確的信號以便引導噪聲成形。
信號513接近信號206,不同之處僅在于量化器214所引入的噪聲成形更改。然而,信號511是513的濾波版本并且具有實質性不同。
如果在流中的任意點啟動解碼器,通常不會立即看到在其處提供重啟輔助數(shù)據(jù)的“重啟點”,并且此重啟點將初始地以有損方式運算,如圖9所示。通過消除噪聲成形量化214、減去調整A并且最終量化結果來從圖8B導出圖9,所以輸出符合具有偏置O1的16位,即使其不復制提供給編碼器的信號501。
我們以有損方式運算足夠長的時間從而使信號511朝向其將在無損運算中具有的正確值會聚。這需要多長時間與濾波器的脈沖響應的長度有關,由于函數(shù)521和量化器531附近的反饋路徑,該長度通常是IIR。但是,信號511將會聚到多近存在限制,由其輸入不正確限定,因為量化器214在有損模式下不可操作。在重啟點處需要重啟輔助以便將511和513的延遲值快速近似為正確值。
如在僅初始化噪聲成形的以上討論的情況一樣,重啟信息可以是無損信號的逐個位。對于信號511,16以下的位由量化偏置O1定義,所以每個延遲數(shù)據(jù)需要向上指定的第16位的某個數(shù)量的Isb,其中數(shù)量取決于近似信號511中可能存在多少誤差。八個比特可能足夠使用,如果包括函數(shù)521和量化器531的IIR濾波器已經具有足夠的時間來穩(wěn)定,并且不具有過度的響應。對于信號513,我們需要比僅噪聲成形情況更多的位,因為,該信號在格柵上被量化(O1+A),并且我們不準確地知道A。所以,如果6位將足夠噪聲成型器使用并且A被量化到24位,我們現(xiàn)在需要每個數(shù)據(jù)14位,傳送無損信號的第11到24位。
散布器
圖10示出了本發(fā)明的另一個實施例,其中,無損地加水印的音頻文件202的水印被更改以產生不同的無損地加水印的音頻文件102。
這是通過使用來自圖1B的解碼器的初始部分重新生成被量化到格柵G3的內部信號204實現(xiàn)的,該內部信號然后傳送到來自圖1A的編碼器的后一部分以嵌入經更改的數(shù)據(jù)143。僅僅數(shù)據(jù)143的水印部分被更改,重構數(shù)據(jù)和重啟輔助通路保持不變。