一種基于多回聲核的音頻水印方法
【專利摘要】本發(fā)明公開了一種基于多回聲核的音頻水印方法,屬于音頻信號處理領(lǐng)域。首先對二進制的原始水印信號進行處理,通過衰減系數(shù)和回聲延遲點位置決定回聲核,將多路回聲嵌入到原始的音頻信號中。提取水印時采用能量倒頻譜分析的方法對信號進行解碼,提取出相應(yīng)水印信息。嵌入過程采取了回聲緩存手段,使得同步性能好,解決了音頻信號遭到隨機剪切時所帶來的水印破壞問題,解決了多重回聲中回聲相互干擾的問題,提高了數(shù)據(jù)的容量,添加了奇偶校驗信息,增強了系統(tǒng)的抗惡意攻擊的能力,具有很高的魯棒性。
【專利說明】-種基于多回聲核的音頻水印方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及一種多媒體信息隱藏方法,尤其涉及一種基于多回聲核的音頻水印方 法,可用作音頻信息標(biāo)簽標(biāo),或用于信息隱藏,屬于音頻信號處理領(lǐng)域和信息安全領(lǐng)域。
【背景技術(shù)】
[0002] 音頻多媒體的版權(quán)保護和內(nèi)容檢索一直以來都是受關(guān)注的問題,數(shù)字水印技術(shù)為 這個問題提供了解決的途徑,將標(biāo)簽作為水印嵌入音頻多媒體,標(biāo)簽可標(biāo)記音頻的來源、版 權(quán)、內(nèi)容摘要或其他屬性,同時,水印標(biāo)簽的嵌入應(yīng)追求在不降低音頻質(zhì)量的前提下提高魯 棒性和水印容量,并可快速、便捷、穩(wěn)健地實現(xiàn)水印的嵌入和提取檢測。
[0003] 舉例來說,當(dāng)采用FM音頻廣播作為載體,承載與廣播內(nèi)容有關(guān)的附屬信息(如版 權(quán)、來源、檢索標(biāo)簽等),這些信息是作為水印嵌入在音頻中的,并且水印的嵌入不能破壞廣 播本身的音頻質(zhì)量,傳輸時是與音頻信息一同傳輸?shù)?。音頻水印技術(shù)就是在不影響音頻本 身質(zhì)量的前提下,將隱藏信息嵌入到宿主信號中,并且能通過相應(yīng)的解碼算法提取出水印 的一種技術(shù)。起初,它的功能只要限制在版權(quán)保護、保密通信、篡改檢測等方面,現(xiàn)在,隨著 技術(shù)的發(fā)展,數(shù)字音頻水印主要算法可以分為以下四類:相位編碼、擴頻調(diào)制、拼接方法、回 聲隱藏?;芈曤[藏技術(shù)基于人耳的掩蔽效應(yīng),人為的給音頻添加回聲信號,在人們感知不到 回聲的前提下將信息嵌入到語音信號中,在保證語音質(zhì)量方面,具有天然的優(yōu)勢。此外,它 還有低復(fù)雜度、沒有噪聲疊加、忙檢測、同步性能好性能好等優(yōu)點,所以應(yīng)用范圍比較廣泛。 目前,存在一些相關(guān)發(fā)明,它們論述了通過基于回聲隱藏的音頻水印應(yīng)用于類似于FM廣播 的媒體節(jié)目中。
[0004] 例如,Bender 的標(biāo)題為"Method and Apparatus for Echo Data Hiding in Audio Signals"的美國專利No. 5, 893, 067將一個或多個回聲嵌入到宿主音頻信號中。Yoiti Suzuki 的標(biāo)題為"Digital Watermark System"的美國專利 US 2003/0172277 A1 公開了一 種通過在時間軸上擴展回聲信號來將生成的回聲信號插入到原始音頻信號中的數(shù)字水印 嵌入方法。陳寧的標(biāo)題為"基于回聲隱藏的多重水印嵌入和提取算法"提出了將多重水印 信號嵌入到同一宿主信號中。
[0005] 但是Bender的回聲隱藏方法容量很低并且解碼過程不安全。Yoiti的方法結(jié)合了 回聲隱藏和擴展頻譜,以提高容量和安全性。但是,考慮到媒體交互場景中的下采樣攻擊, 所允許的嵌入回聲陣列的長度是有限的,從而它不能提供長度足以保證良好的統(tǒng)計屬性的 PN序列。另一方面,這種方法對于回聲抖動攻擊來說是脆弱的。陳寧改進了回聲隱藏的嵌 入算法,但是沒有對所選參數(shù)進行合理的理論驗證,一旦水印的數(shù)量多大,系統(tǒng)性能會變得 很差,它也沒有考慮到FM調(diào)制解調(diào)對系統(tǒng)的影響。尤其是FM廣播中經(jīng)常出現(xiàn)的隨意剪輯 等行為,要求系統(tǒng)有很好的抗失同步攻擊能力。
[0006] 因此,現(xiàn)有技術(shù)未能提供一種通過基于音頻水印獲得媒體節(jié)目相關(guān)信息的有效方 法。
[0007] 對于應(yīng)用于FM廣播的音頻水印系統(tǒng),要滿足以下條件:
[0008] (1)能將FM廣播的相關(guān)內(nèi)容作為水印嵌入到原始廣播中,并且不會影響廣播本身 的語音質(zhì)量。
[0009] (2)通過簡單的方法、步驟就能獲得廣播內(nèi)隱藏的相關(guān)信息,對同步?jīng)]有要求。
[0010] (3)能抵抗壓縮、重采樣、重量化、濾波器、環(huán)境噪聲、同步攻擊等惡意的攻擊。
[0011] (4)經(jīng)過FM調(diào)制、解調(diào)之后不破壞水印信息,能正常的解碼出來我們需要的信息。
[0012] (5)由于FM廣播內(nèi)容豐富,要求該系統(tǒng)容量高。
【發(fā)明內(nèi)容】
[0013] 本發(fā)明的目的是克服以上系統(tǒng)的不足以及滿足系統(tǒng)要求的以上條件,提供一種基 于多回聲核的音頻水印方法,可以快速、便捷、穩(wěn)健獲得音頻內(nèi)容中嵌入的水印標(biāo)簽,并且 不影響廣播本身質(zhì)量,能抵抗多種惡意的攻擊。
[0014] 本發(fā)明所述一種基于多回聲核的音頻水印方法,包括如下步驟:
[0015] 水印的嵌入過程:
[0016] 步驟一:將待嵌入的信息編碼為二進制水印序列,其中an是0或 1,0彡η彡(J*u)-1 ;所述的二進制水印序列長度為M = U*J比特,其中J、U均為大于等于 1的正整數(shù)J為預(yù)設(shè)的回聲的路數(shù),U為每路回聲嵌入的二進制序列比特數(shù);
[0017] 例如,若待嵌入的是每個音頻的ID號,那么首先給每一個音頻多媒體資料分配唯 一的ID號(一一對應(yīng)關(guān)系),將此ID號轉(zhuǎn)換為二進制水印序列(例如通過映射表或直接轉(zhuǎn) 換為二進制);
[0018] 步驟二:將步驟一獲得的二進制水印序列嵌入到對應(yīng)的音頻信號中,具體方法如 下:
[0019] 1、首先將原始音頻信號X(n)進行分段,分段時間為秒,其中Fs為采樣 率,分段之后的第i段音頻信號寫作Xi (η);
【權(quán)利要求】
1. 一種基于多回聲核的音頻水印方法,其特征在于,包括如下步驟: 水印的嵌入過程: 步驟一:將待嵌入的信息編碼為二進制水印序列{aijaiaf ,其中an是0或1, 0彡η < (J*U)-1 ;所述的二進制水印序列長度為M = U*J比特,其中J、U均為大于等于1 的正整數(shù)J為預(yù)設(shè)的回聲的路數(shù),U為每路回聲嵌入的二進制序列比特數(shù); 步驟二:將步驟一獲得的二進制水印序列嵌入到對應(yīng)的音頻信號中,具體方法如下: (1)首先將原始音頻信號X (η)進行分段,分段時間為
秒,其中Fs為采樣率, 分段之后的第i段音頻信號寫作Xi (η); ⑵將步驟一獲得的Μ比特二進制水印信息轉(zhuǎn)化成大小為UXJ的矩 陣:
然后將每列從上往下寫作一個新的二進制數(shù),并將其轉(zhuǎn)化為十進制數(shù),得到J個十進 制值1? b2…bT}并進行保存; (3)根據(jù)這J個十進制值確定J路回聲信號的延遲:屯、d2、…、屯; 屯=A+FXh d2 = d1+FXb2+K dj = dj^+FXbj+K 其中參數(shù)A代表起始延遲點值;K是段間的保護帶長度,也就是不同延遲之間最小的間 隔,F(xiàn)是段內(nèi)分辨率,也就是同一路延遲不同值之間的間隔; 然后,對每一段音頻Xi (η),將\ (η)延遲屯個延遲點,然后乘以衰減系數(shù)α,即得 到第1路回聲信號aXjn-cg ;同理,依次獲得Xjn)的其余回聲信號aXiOi-cQ、…、 aXiOi'),即得到J路回聲信號; ⑷根據(jù)步驟一中Μ比特二進制水印序列中"1"的個數(shù)確定1比特的奇偶校驗信息;將 二進制水印序列按照如下方法嵌入到每一段音頻Xi (η)中,直至整個音頻全部嵌入完畢: 如果奇偶校驗信息為'〇',代表Μ比特二進制水印序列中" 1"的個數(shù)為奇數(shù),則第i段 的含水印信號: Yi (n) = Xi (n) + a Xi (n-d!) + a Xi (n_d2) +..· + a Xi (n_dj) · 如果奇偶校驗信息為'〇',代表M比特二進制水印序列中" 1"的個數(shù)為偶數(shù),則第i段 的含水印信號: Yj (n) = Xj (η)- α Xj (η-dj)- α Xj (η-d2)-···- α Xj (η-dj) (5)將嵌入水印的每段音頻信號t (η)首尾連接起來獲得含水印音頻信號Υ(η); 水印的提取過程: 步驟一:對待檢測的音頻信號Γ (η)進行分段,分段長度為秒,記分段后 的第i段音頻信號為Y' ifc);
步驟二:計算待檢測的每段音頻信號的能量倒頻譜,第i段音頻信號Y' i (η)的能量倒 頻譜Py< i (η)為: Py, i (η) = {IFFT (log (IFFT 況,(n)) |2))}2 步驟三:提取出水印信息;方法如下: (1) 對待檢測的每個分段音頻信號Y' i (η),檢測其能量倒頻譜Py; i (η)的各峰值點位 置,并將檢測到的峰值點位置記錄為d/、d2'、···、(!/ (2) 計算{b/ V…b/ },即:
(3) 將{b/ b2'…b/ }中的每個元素四舍五入取為整數(shù)后分別轉(zhuǎn)換為U位二進 制,并將這些轉(zhuǎn)換后的二進制數(shù)首尾相接組成一個新的二進制數(shù),認為該二進制數(shù)即為所 提取出的水印。
2. 根據(jù)權(quán)利要求1中所述的一種基于多回聲核的音頻水印方法,其特征在于,所述提 取步驟的步驟三,在提取出水印之后,還包括步驟:(4)將所提取出的水印與嵌入步驟中的 二進制水印序列{a^afa^n}進行對比,以判定該音頻信號是否含有水印。
3. 根據(jù)權(quán)利要求1中所述的一種基于多回聲核的音頻水印方法,其特征在于,α = 0· 4。
4. 根據(jù)權(quán)利要求3中所述的一種基于多回聲核的音頻水印方法,其特征在于,Μ = 4。
5. 根據(jù)權(quán)利要求3中所述的一種基于多回聲核的音頻水印方法,其特征在于,U = 4。
6. 根據(jù)權(quán)利要求1中所述的一種基于多回聲核的音頻水印方法,其特征在于,Κ = 6。
7. 根據(jù)權(quán)利要求1中所述的一種基于多回聲核的音頻水印方法,其特征在.于,F(xiàn) = 3。
8. 根據(jù)權(quán)利要求4中所述的一種基于多回聲核的音頻水印方法,其特征在于,A= 154。
【文檔編號】G10L19/018GK104217725SQ201410507604
【公開日】2014年12月17日 申請日期:2014年9月29日 優(yōu)先權(quán)日:2014年9月29日
【發(fā)明者】謝湘, 張學(xué)君, 趙軍輝 申請人:北京理工大學(xué)