本發(fā)明涉及數(shù)字水印技術(shù)領(lǐng)域,主要是一種在時(shí)頻域?qū)ふ姨卣髂芰繅K進(jìn)行水印嵌入和提取的設(shè)計(jì)發(fā)明,特別涉及從時(shí)頻分析角度出發(fā)的魯棒音頻水印算法。
技術(shù)背景
隨著現(xiàn)代通信和多媒體技術(shù)的迅猛發(fā)展,數(shù)字多媒體產(chǎn)品越來越受歡迎,人們可以方便快捷地獲取各種數(shù)字化的圖像,音頻,視頻,動(dòng)畫,軟件和文本等,數(shù)字多媒體產(chǎn)品的廣泛傳播也不可避免地帶來了不少安全問題,非法拷貝,版權(quán)破環(huán),數(shù)字信息惡意篡改等。正因如此,一種可以有效保護(hù)數(shù)字多媒體產(chǎn)品的數(shù)字水印技術(shù)得到了研究者們的廣泛關(guān)注,同時(shí)也得到了迅速的發(fā)展。數(shù)字音頻水印技術(shù)主要通過在一段音頻中嵌入適當(dāng)?shù)乃?,以方便保護(hù)音頻文件的版權(quán),防止有意篡改。魯棒音頻水印技術(shù)具有在音頻受到一系列攻擊,例如:加高斯白噪聲、再量化、幅度縮放、AAC壓縮、MP3壓縮、高低通濾波等,仍能有效提取水印以用于鑒別原始音頻文件的功能。近年來,對魯棒音頻水印技術(shù)的研究和改進(jìn)成為了學(xué)術(shù)界和工業(yè)界廣泛關(guān)注和討論的話題。水印技術(shù)按照水印嵌入域來分,主要可分為原始域水印算法和變換域水印算法。對音頻水印技術(shù)而言,原始域即時(shí)域,時(shí)域水印算法是直接將水印嵌入在時(shí)間域的數(shù)字音頻信號中,這種方法相對于變換域水印算法而言具有容易實(shí)現(xiàn),需要較少計(jì)算資源的特點(diǎn),已有的文獻(xiàn)資料中存在有比較完善的時(shí)域水印算法,但是這樣的算法普遍存在對文件的壓縮和濾波不夠魯棒的缺點(diǎn)。變換域主要分為頻域和時(shí)頻域,現(xiàn)有大量的音頻水印算法都是在頻域中實(shí)現(xiàn),已有的算法顯示,在頻域嵌入水印時(shí),沒有考慮信號的時(shí)域特征,很難權(quán)衡主信號的不可感知性和水印的魯棒性的關(guān)系。目前為止,很少有文獻(xiàn)提出完整的時(shí)頻域水印算法,其實(shí)由于音頻信號的時(shí)變特性,通過時(shí)頻分析同時(shí)考慮信號的時(shí)域和頻域特征可以得到更多的信息,在時(shí)頻域嵌入水印也可以很好地解決不可感知性和魯棒性的權(quán)衡問題。
技術(shù)實(shí)現(xiàn)要素:
鑒于上述現(xiàn)有技術(shù)中存在的問題,本發(fā)明的目的是提出一種能夠有效權(quán)衡主信號的質(zhì)量和水印的魯棒性的時(shí)頻域音頻水印算法。
一種從時(shí)頻分析角度出發(fā)結(jié)合低能量特征塊選取的數(shù)字音頻水印算法,通過短時(shí)傅立葉變換在時(shí)頻域選擇低能量處嵌入水印實(shí)現(xiàn)水印對一般攻擊的魯棒性,包括以下步驟;
步驟1,水印嵌入位置的確定;
步驟2,水印的產(chǎn)生,嵌入;
步驟3,水印的檢測和提??;
所述步驟1和步驟2中,確定水印嵌入位置并進(jìn)行水印嵌入的步驟如下:
第一步:將音頻信號分幀,每一幀進(jìn)行希爾伯特變換消除信號對稱性;
第二步:對信號進(jìn)行非重疊短時(shí)傅立葉變換得到時(shí)頻分布圖;
第三步:在時(shí)頻分布圖中挑選中低頻段進(jìn)行加窗分塊,計(jì)算每一小塊的平均能量,按平均能量從小到大的順序排序,在能量處于排序前50%的前半段中隨機(jī)選出P塊作為水印嵌入的具體位置,保存位置下標(biāo)索引;
第四步:將產(chǎn)生的隨機(jī)的二進(jìn)制信息經(jīng)過擴(kuò)頻碼擴(kuò)頻,利用現(xiàn)有的改進(jìn)擴(kuò)頻通信技術(shù)進(jìn)行水印嵌入,即利用擴(kuò)展碼對水印信息進(jìn)行擴(kuò)頻再進(jìn)行水印嵌入,在嵌入時(shí)通過引入調(diào)節(jié)常數(shù)α調(diào)整水印嵌入強(qiáng)度,以權(quán)衡音頻信號的質(zhì)量和嵌入水印的魯棒性,水印嵌入完成之后,將嵌有水印的時(shí)頻圖段代替主信號原來部分,并進(jìn)行非重疊短時(shí)傅立葉逆變換得到嵌有水印的音頻信號;
所述步驟3中水印提取檢測的步驟如下:
第一步:對加水印音頻信號進(jìn)行非重疊短時(shí)傅立葉變換,得到加水印信號的時(shí)頻分布圖;
第二步:根據(jù)嵌入方提供的特征能量塊下標(biāo)索引找到水印嵌入位置,通過判斷擴(kuò)展碼與嵌有水印信號特征能量塊矢量的內(nèi)積的正負(fù)性提取二進(jìn)制水印,若內(nèi)積符號為正,則恢復(fù)水印信息為1,若內(nèi)積符號為負(fù),則恢復(fù)水印信息為0。
所述步驟1中,水印嵌入位置的確定,具體包括以下步驟;
步驟1.1,對選取的音頻段x進(jìn)行非重疊分幀處理,得到每幀包含M0個(gè)樣本的xi,對每一幀進(jìn)行希爾伯特變換,以消除頻譜在2π范圍內(nèi)的對稱性,由于希爾伯特變換后的信號與原信號除了相位有所改變,其他的特性都不變,希爾伯特變換后的輸出值仍記為xi;
步驟1.2,對得到的音頻信號進(jìn)行非重疊短時(shí)傅立葉變換,得到信號的時(shí)頻表達(dá)式Y(jié);這一過程通過對信號每一幀xi做快速傅立葉變換實(shí)現(xiàn);
步驟1.3,在信號的時(shí)頻域中選擇一段中低頻率區(qū)域作為可行的水印嵌入大范圍,頻率介于f1=60Hz和f2=2800Hz之間;
步驟1.4,對選定的水印嵌入大范圍進(jìn)行加窗操作,用窗寬為W的矩形窗將選定的時(shí)頻區(qū)域分成多個(gè)正方形小塊;
步驟1.5,根據(jù)正方形小塊的平均能量大小隨機(jī)選擇能量較小的P小塊作為水印嵌入的具體位置,這些嵌入位置也叫特征能量塊,記錄特征能量塊在時(shí)頻圖中的具體下標(biāo)索引并保存,以便發(fā)送給合法水印提取者。
所述步驟1.5中選擇P個(gè)特征能量塊的過程為,首先對選定時(shí)頻區(qū)域的所有正方形小塊求平均能量,根據(jù)能量從小到大的順序?qū)φ叫螇K進(jìn)行排序,在隊(duì)列的前50%能量塊中隨機(jī)選出P塊作為水印嵌入的特征塊。
所述步驟2中,水印的產(chǎn)生,嵌入,具體包括以下步驟;
步驟2.1,產(chǎn)生P位二進(jìn)制隨機(jī)水印w∈{0,1};
步驟2.2,將選定的每一個(gè)特征能量塊進(jìn)行矢量化,得到特征矢量i∈{0,1,...,P-1},產(chǎn)生一個(gè)偽隨機(jī)序列作為擴(kuò)展碼;
步驟2.3,利用改進(jìn)的擴(kuò)頻通信技術(shù)進(jìn)行水印的嵌入:通過擴(kuò)展碼p將水印信息進(jìn)行擴(kuò)頻嵌入,按照特征能量塊在水印嵌入大范圍的位置從上至下,從左至右,每一個(gè)特征矢量中嵌入一位水?。划?dāng)水印取1時(shí),嵌入+p,當(dāng)水印取0時(shí),嵌入-p,通過引入來消除主信號干擾;
步驟2.4,水印嵌入后,通過調(diào)節(jié)參數(shù)α來控制水印嵌入強(qiáng)度,取值為0<α<1,給定初始值α=0.1,根據(jù)嵌入水印的不可感知性和魯棒性性能,按步長±0.01逐步調(diào)整α取值,直到水印的不可感知性和魯棒性得以權(quán)衡。所述步驟3中,水印的檢測和提取,具體包括以下步驟;
步驟3.1,水印提取的前幾個(gè)步驟和水印嵌入相同,將加有水印的音頻信號xw經(jīng)過和步驟1.1,步驟1.2,和步驟1.4的操作后,得到分成多個(gè)小塊的時(shí)頻區(qū)域;
步驟3.2,根據(jù)水印嵌入方提供的水印嵌入位置的下標(biāo)索引直接找到P塊嵌有水印的特征塊,對每一小塊進(jìn)行矢量化,按列從上至下排列,通過判斷加水印矢量與擴(kuò)頻碼的內(nèi)積關(guān)系恢復(fù)水印,得到恢復(fù)的水印序列
本發(fā)明的水印檢測方法為盲檢測方法,即無需知道原始音頻數(shù)據(jù)便可通過盲檢測得到水印,這樣的檢測方式更具有優(yōu)勢。
本發(fā)明通過在時(shí)頻域中尋找低能量特征能量塊的方法進(jìn)行水印的嵌入和提取具有以下優(yōu)點(diǎn):
(1)本發(fā)明從時(shí)頻域角度出發(fā)研究音頻信號,充分考慮音頻信號的時(shí)變特性,在時(shí)頻域中尋找若干小塊的水印嵌入?yún)^(qū)域,對音頻信號時(shí)間段的其他部分不造成影響,使水印嵌入的不可感知性增強(qiáng);
(2)本發(fā)明選擇在時(shí)頻域中低頻段的低能量處嵌入水印,提高了水印的魯棒性,且在低能量部分隨機(jī)選擇嵌入能量塊的方法能有效防止惡意攻擊篡改;
(3)本發(fā)明采用改進(jìn)的擴(kuò)頻通信技術(shù)(ISS)進(jìn)行水印嵌入和提取,有效避免了主信號干擾;
附圖說明
圖1為本發(fā)明數(shù)字音頻水印嵌入流程圖;
圖2為水印嵌入強(qiáng)度調(diào)節(jié)機(jī)制圖;
圖3為音頻信號樣本1特征能量塊選取過程圖;
圖4為音頻信號樣本1加水印前后波形圖的對比圖;
圖5為不加攻擊時(shí)圖像水印提取圖與原圖的對比圖;
圖6為不同攻擊下本發(fā)明方案和傳統(tǒng)DCT域水印方案圖像水印提取圖的對比圖。
具體實(shí)施方式
下面結(jié)合附圖和具體實(shí)施例詳細(xì)地說明本發(fā)明技術(shù)方案的實(shí)施步驟和效果。
本發(fā)明所提供的一種在時(shí)頻域中實(shí)現(xiàn)魯棒數(shù)字音頻水印嵌入和提取的方法主要可分為三部分:水印嵌入位置的確定;水印的產(chǎn)生和嵌入;水印的檢測和提取,具體流程如圖1所示。
首先,步驟1,水印嵌入位置的確定;
步驟1.1,對選取的包含N個(gè)樣本的音頻段x進(jìn)行非重疊分幀處理,得到每幀包含M0個(gè)樣本的xi,對每一幀進(jìn)行希爾伯特變換,以消除頻譜在2π范圍內(nèi)的對稱性,由于希爾伯特變換后的信號與原信號除了相位有所改變,其他的特性都不變,希爾伯特變換后的輸出值仍記為xi;
步驟1.2,對得到的音頻信號進(jìn)行非重疊短時(shí)傅立葉變換,得到信號的時(shí)頻表達(dá)式Y(jié);這一過程通過對信號每一幀xi做快速傅立葉變換實(shí)現(xiàn),快速傅立葉變換矩陣用H表示;
yi=Hxi,
步驟1.3,在信號的時(shí)頻域中選擇一段中低頻率區(qū)域作為可行的水印嵌入大范圍,頻率介于f1=60Hz和f2=2800Hz之間;
步驟1.4,對選定的水印嵌入大范圍進(jìn)行加窗操作,用W×W的窗將選定的時(shí)頻區(qū)域分成若干正方形小塊,定義每一小塊為Pj,計(jì)算每一小塊的平均能量Ej,m1,m2表示每一小塊內(nèi)單個(gè)元素的橫縱坐標(biāo)位置;
步驟1.5,根據(jù)能量從小到大的順序?qū)φ叫螇K進(jìn)行排序,在隊(duì)列的前50%能量塊中隨機(jī)選出P塊作為水印嵌入的具體位置,這些嵌入位置也叫特征能量塊,記錄特征能量塊在時(shí)頻圖中的具體下標(biāo)索引并保存,以便發(fā)送給可靠的水印提取者;
步驟2,水印的產(chǎn)生,嵌入;
步驟2.1,產(chǎn)生P位二進(jìn)制隨機(jī)水印w∈{0,1};
步驟2.2,將選定的每一個(gè)特征能量塊進(jìn)行矢量化,得到特征矢量i∈{0,1,...,P-1},產(chǎn)生一個(gè)偽隨機(jī)序列作為擴(kuò)展碼;
步驟2.3,利用改進(jìn)的擴(kuò)頻通信技術(shù)進(jìn)行水印的嵌入,按照特征能量塊在水印嵌入大范圍的位置從上至下,從左至右,每一個(gè)特征矢量中嵌入一位水??;當(dāng)水印取1時(shí),嵌入+p,當(dāng)水印取0時(shí),嵌入-p,改進(jìn)的擴(kuò)展頻譜通信技術(shù)(ISS)通過引入來消除主信號干擾,此時(shí)I取1,當(dāng)I取0時(shí)為擴(kuò)展頻譜通信技術(shù)(SS);
fw,i=fi+(αw(i)-IΦ)p
步驟2.4,通過參數(shù)0<α<1來控制水印嵌入強(qiáng)度,調(diào)節(jié)機(jī)制如圖2所示,給定初始值α=0.1,根據(jù)嵌入水印的不可感知性和魯棒性性能,按步長±0.01逐步調(diào)整α取值,直到水印的不可感知性和魯棒性得以權(quán)衡;
步驟3,水印的檢測和提?。?/p>
步驟3.1,一段嵌有水印的音頻信號經(jīng)過一定的攻擊,例如:加噪,幅度縮放,AAC編碼,濾波,MP3壓縮,水印依然要能夠很好的存在且能提取出來,水印提取的步驟的前幾個(gè)步驟和水印嵌入相同,將加有水印的音頻信號xw經(jīng)過和步驟1.1,步驟1.2,和步驟1.4的操作后,得到分成若干小塊的時(shí)頻區(qū)域;
步驟3.2,根據(jù)水印嵌入方提供的水印嵌入位置的下標(biāo)索引直接找到P塊嵌有水印的特征塊,對每一小塊進(jìn)行矢量化,按列從上至下排列,通過判斷加水印特征塊矢量與擴(kuò)頻碼的內(nèi)積關(guān)系恢復(fù)水印,得到恢復(fù)的水印序列
其中表示取實(shí)部。
數(shù)字水印技術(shù)方案優(yōu)劣的評價(jià)指標(biāo):一個(gè)好的數(shù)字音頻水印發(fā)明方法,需要能夠較好地權(quán)衡音頻信號對水印嵌入的不可感知性和嵌入水印的魯棒性。
不可感知性:是指數(shù)字音頻信號加入水印后質(zhì)量仍較好,人耳對音頻加水印前后基本不可感知,通??捎每陀^差異等級(ODG)來衡量,客觀差異等級分為5個(gè)等級:{-4,-3,-2,-1,0},當(dāng)ODG值為-4時(shí)表示主信號受到很大的干擾,十分嘈雜,當(dāng)ODG值為0時(shí)表示加入的水印對主信號基本無影響,具有很好的不可感知性,一般ODG的值在-1到0之間時(shí),表示此音頻加水印后有較好的不可感知性,符合標(biāo)準(zhǔn)。另一種不可感知性的衡量標(biāo)準(zhǔn)是將嵌入的水印視為加噪,用文檔水印比(DWR)來衡量,當(dāng)DWR大于30dB時(shí)表示不可感知性較好。
魯棒性:是指水印信息嵌入至音頻之后,隨著音頻的一些變化,受到一些攻擊之后,水印是否還能很好地檢測提取的能力,通常的衡量標(biāo)準(zhǔn)是水印的檢測率(DR),即經(jīng)過攻擊后檢測出的水印的正確位數(shù)與嵌入水印總數(shù)之比。
本發(fā)明的效果可通過以下仿真說明:
為了檢測本發(fā)明方案的魯棒性,仿真實(shí)驗(yàn)對本發(fā)明測試的加水印音頻信號進(jìn)行了一系列常規(guī)攻擊,例如:加高斯白噪聲,再量化,幅度縮放,AAC壓縮低通濾波等。
加高斯白噪聲:在加水印的音頻信號中加入高斯白噪聲,使得音頻信噪比為30dB;
再量化:將音頻信號從原來的16比特量化為8比特;
幅度縮放:數(shù)字音頻的幅度值被放大到120%和180%;
AAC壓縮:通過AAC壓縮將比特率變?yōu)?6kbps和160kbps;
低通濾波:采用截止頻率為4kHz的低通濾波;
仿真實(shí)驗(yàn)1:選取四種不同類型的10s音頻信號通過本發(fā)明方法在時(shí)頻域頻率介于60Hz到2800Hz的頻率段內(nèi)選取16塊尺度為32×32的低能量特征塊,圖3表示了音頻信號樣本1選取低能量特征塊的過程,利用擴(kuò)頻碼偽隨機(jī)序列將16位二進(jìn)制水印一一嵌入至16塊特征能量塊中,用嵌有水印的特征能量塊代替原有能量塊,通過短時(shí)傅立葉逆變換得到加水印信號,如圖4所示的音頻信號樣本1原波形與加水印后的波形對比可看出加水印后波形幾乎無變化,對加水印音頻信號每次實(shí)施一種以上攻擊,每一種攻擊后進(jìn)行水印檢測提取,計(jì)算水印檢測率,同時(shí)測試音頻信號加水印后的不可感知性。選取的四種音頻樣本分別進(jìn)行以上操作,經(jīng)過多次實(shí)驗(yàn),得到的每種加水印音頻信號的ODG值和DWR值如表1所示,與傳統(tǒng)的通過離散余弦變換(DCT)在頻域上嵌入水印的效果對比,可證明本發(fā)明具有更好的不可感知性。表2為四種音頻信號樣本經(jīng)過不同類型攻擊后的水印檢測率,可證明本發(fā)明方案對于抵抗常規(guī)攻擊具有很強(qiáng)的魯棒性。
仿真實(shí)驗(yàn)2:選取一段4分鐘的音頻信號作為主信號,將32×32位的二值圖像作為水印信息,利用本發(fā)明的音頻水印嵌入方案在音頻信號中低頻部分的時(shí)頻域中尋找32×32個(gè)特征能量塊,利用擴(kuò)頻通信技術(shù)將圖片信息嵌入主音頻信號中,選擇三幅具有不同信息量的二值圖像分別進(jìn)行實(shí)驗(yàn),圖5表示圖像水印原始圖像與嵌入后在無攻擊條件下提取得到的圖像的對比,可知在不加攻擊情況下圖像水印信息幾乎無任何損壞。對嵌有圖像水印的音頻信號施加常規(guī)攻擊,再提取出圖像水印,效果如圖6所示,本發(fā)明所提供的時(shí)頻域水印嵌入方案(STFT-ISS)相比于傳統(tǒng)頻域水印嵌入方案(DCT-ISS)有更好的效果,依然能夠保留圖片水印大部分信息,有好的辨識度。
通過以上兩種仿真實(shí)驗(yàn),本發(fā)明的效果得以證實(shí)。本文中所描述的具體實(shí)施例僅僅對本發(fā)明精神作舉例說明,本發(fā)明所屬技術(shù)領(lǐng)域的技術(shù)人員可通過對所描述的具體實(shí)施例中數(shù)據(jù)指標(biāo)進(jìn)行修改或用類似方法替代,例如修改選擇嵌入的頻率范圍、用其他方式實(shí)現(xiàn)時(shí)頻變換得到音頻信號的時(shí)頻表達(dá)式,這樣的修改替代并不會(huì)偏離本發(fā)明的精神或超越所附權(quán)利要求書所定義的范圍。
表1加水印音頻信號的不可感知性
表2本發(fā)明方案嵌入水印的檢測率(%)