本發(fā)明涉及計(jì)算機(jī)信息
技術(shù)領(lǐng)域:
,具體地涉及圖像壓縮傳輸領(lǐng)域。
背景技術(shù):
:圖像壓縮常常會(huì)伴隨著特有圖像質(zhì)量的損失。隨著基于web應(yīng)用的多媒體的增多,圖像壓縮顯得尤為重要。它可以用來有效的網(wǎng)絡(luò)傳輸,不僅如此圖像壓縮技術(shù)可以用來打印、數(shù)據(jù)存儲(chǔ)、電信產(chǎn)業(yè)、傳真?zhèn)鬏敗⑿l(wèi)星遠(yuǎn)程感應(yīng)和其他數(shù)字圖像應(yīng)用。在醫(yī)學(xué)上如MRI、X射線、CT透視。圖像壓縮技術(shù)被要求用來實(shí)現(xiàn)大容量圖像的存儲(chǔ)和分析。圖像壓縮被分為有損壓縮和無損壓縮。在無損壓縮技術(shù)里,壓縮圖像和原圖像相同,它減少了比特率而沒有任何圖像失真。無損壓縮技術(shù)被用在人造圖像、醫(yī)學(xué)、軍事領(lǐng)域。有損壓縮技術(shù)被用在為了節(jié)省帶寬和存儲(chǔ)空間的領(lǐng)域,會(huì)犧牲掉圖像一部分質(zhì)量。這種方法被用在傳輸和存儲(chǔ)數(shù)據(jù)上,允許圖像的部分失真。圖像壓縮方法不斷發(fā)展,包括預(yù)測(cè)編碼,轉(zhuǎn)換編碼,不規(guī)則壓縮,小波變換,向量量化等等。奇異值分解(SingularValueDecomposition,SVD)的基本概念就是拋棄低級(jí)圖像信息的奇異值。一個(gè)8點(diǎn)的離散余弦變換正交近似用來滿足低復(fù)合性需求,JPEG圖像壓縮通過離散余弦變換(DiscreteCosineTransform,DCT)實(shí)現(xiàn)。在離散小波變換(DiscreteWaveletTransform,DWT)圖像壓縮方法中,通過在一個(gè)確定的值內(nèi)估算DWT系數(shù)來減小圖像的大小?;旌咸幚砑夹g(shù)可以用在黑白和彩色圖像中。2D-DWT與SVD的組合理論,被用來減少圖像存儲(chǔ)的空間需求,保持圖像扭曲錯(cuò)誤在一個(gè)可以接受的范圍。目前,圖像壓縮領(lǐng)域里沒有SVD-DWT-DCT混合的技術(shù)。技術(shù)實(shí)現(xiàn)要素:針對(duì)上述不足之處,本發(fā)明引入了一個(gè)SVD、DWT、DCT混合的算法模型,用改良的壓縮率來保證圖像質(zhì)量。圖像會(huì)在其傳輸?shù)拿總€(gè)階段進(jìn)行壓縮?;旌霞夹g(shù)包括:奇異值分解(SVD),離散小波變換(DWT),離散余弦變換(DCT)。在第一階段,奇異值分解,低階矩陣的奇異值會(huì)從原始圖像中被拋棄。第二階段是從離散小波變換域獲得近似帶。最后一個(gè)階段則利用了離散余弦變換的性質(zhì)。在該算法中,SVD用來定義圖像的低級(jí)近似值。HaarDWT用來獲得圖像的粗略描述,而DCT用來關(guān)聯(lián)圖像的像素點(diǎn)來實(shí)現(xiàn)一個(gè)合適的壓縮率。本發(fā)明所采用的技術(shù)方案是:一種基于SVD-DWT-DCT的聯(lián)合圖像壓縮方法。該技術(shù)方案的執(zhí)行過程如下:1、對(duì)輸入圖像進(jìn)行奇異值分解,根據(jù)分解得到的對(duì)角矩陣,取矩陣的低階奇異值,最終得到圖像的近似;2、對(duì)SVD結(jié)果進(jìn)行Haar小波變換,在二級(jí)分解之后獲取近似圖像;3、將近似圖像分解成一個(gè)8x8的單元格,對(duì)每個(gè)單元應(yīng)用2D-DCT變換;4、通過量化因子量化圖像,然后通過熵編碼器編碼;5、取回解壓圖像,對(duì)每個(gè)單元進(jìn)行編碼、量化、反離散余弦變換(IDCT);6、最后,轉(zhuǎn)變每個(gè)單元為單個(gè)獨(dú)立的圖像。本發(fā)明的有益效果是:該混合處理技術(shù)不僅可以存儲(chǔ)可視化圖像,還能在較低復(fù)雜度的條件下提供一個(gè)良好的壓縮率得到高質(zhì)量的壓縮圖像。且該發(fā)明可解決如何在節(jié)約圖像存儲(chǔ)空間的基礎(chǔ)上,維持高質(zhì)量的壓縮圖像需求。附圖說明圖1:表示本發(fā)明的詳細(xì)流程圖圖2:表示小波變換的示例圖圖3:表示Zig-Zag掃描方式示例圖,將8x8的系數(shù)變?yōu)橐痪S序列圖4:表示DCT系數(shù)頻率分布示例圖具體實(shí)施方式本發(fā)明的混合壓縮技術(shù),將SVD奇異值分解、DWT離散小波變換,DCT離散余弦變換三種算法結(jié)合,大大提高了算法性能和圖像壓縮的質(zhì)量。本發(fā)明的混合壓縮技術(shù)流程如圖1所示,首先先對(duì)圖像進(jìn)行奇異值分解,接著小波變換最后進(jìn)行離散余弦變換。主要步驟結(jié)合圖1-圖4表示如下:步驟一、對(duì)輸入圖像進(jìn)行奇異值分解,根據(jù)分解得到的對(duì)角矩陣,取矩陣的低階奇異值,最終得到圖像的近似;步驟二、對(duì)SVD結(jié)果進(jìn)行Haar小波變換,在二級(jí)分解之后獲取近似圖像;步驟三、將近似圖像分解成一個(gè)8x8的單元格,對(duì)每個(gè)單元應(yīng)用2D-DCT變換;步驟四、通過量化因子量化圖像,然后通過熵編碼器編碼;步驟五、取回解壓圖像,對(duì)每個(gè)單元進(jìn)行編碼、量化、反離散余弦變換(IDCT);步驟六、最后,轉(zhuǎn)變每個(gè)單元為單個(gè)獨(dú)立的圖像。下面對(duì)每個(gè)步驟進(jìn)行詳細(xì)說明。一、對(duì)輸入圖像進(jìn)行奇異值分解(SVD)奇異值分解是一種線性的矩陣分解方法,它被用來解決許多數(shù)學(xué)問題比如圖像壓縮。SVD將一幅圖像分解成兩個(gè)正交矩陣和一個(gè)對(duì)角矩陣。設(shè)L是一個(gè)圖矩陣,那么SVD將其分解成三個(gè)矩陣:一個(gè)正交矩陣U,一個(gè)對(duì)角矩陣S,一個(gè)正交矩陣的轉(zhuǎn)置V,公式如下:奇異值在對(duì)角矩陣中以降序的順序排列,即S11>S22>…>Snn,這樣就可以把特別小的奇異值忽略,去掉一些低階的矩陣近似值來減小圖像的大小。選擇一個(gè)等級(jí)值k,基于這個(gè)較低的近似值k來壓縮圖像。奇異值分解是一個(gè)很重要的線性代數(shù)工具,在圖像壓縮和信號(hào)處理領(lǐng)域方面有很重要的應(yīng)用。如果從線性代數(shù)的角度來看,一幅數(shù)字圖像可以看成是由許多非負(fù)標(biāo)量組成的矩陣,因此,可以將各種矩陣處理的技術(shù)應(yīng)用到圖像處理中來,實(shí)現(xiàn)圖像大規(guī)模數(shù)據(jù)的快速處理。數(shù)字化的圖像文件在計(jì)算機(jī)內(nèi)是以矩陣形式存儲(chǔ)的。矩陣的每個(gè)元素表示了圖像中相應(yīng)坐標(biāo)像素的值。從線性代數(shù)的角度看,一副灰度圖像可以被看成一個(gè)非負(fù)矩陣,矩陣中元素類型都是8位無符號(hào)整型,可以表示0-255種不同的顏色。然而,要存儲(chǔ)一幅三通道RGB彩色圖像則需要三個(gè)與圖像尺寸相同的矩陣,圖像中的每個(gè)顏色通道都用一個(gè)矩陣來表示。因此,計(jì)算機(jī)對(duì)數(shù)字圖像的處理就是一系列對(duì)非負(fù)矩陣的運(yùn)算?;谄娈愔捣纸獾男再|(zhì),在數(shù)字圖像處理中應(yīng)用的主要理論依據(jù)是:第一,圖像奇異值的穩(wěn)定性非常好,即當(dāng)圖像被施加小的擾動(dòng)時(shí)圖像的奇異值不會(huì)有很大的變化。第二,奇異值所表現(xiàn)的是圖像的內(nèi)蘊(yùn)特性而非視覺特性,反映的是圖像矩陣元素之間的關(guān)系。由于奇異值具有轉(zhuǎn)置不變性、旋轉(zhuǎn)不變性、位移不變性以及鏡像變換不變性等重要性質(zhì)使得奇異值特征在描述圖像時(shí)更具穩(wěn)定性。二、SVD之后進(jìn)行離散小波變換(DWT)DWT結(jié)合圖2示例圖可以描述如下:它是一種轉(zhuǎn)換方法,捕獲頻率和位置信息,小波被離散采樣,Haar小波變換所特有的性質(zhì)使其成為圖像壓縮的有效方法。它將一幅圖像分成4個(gè)子帶:近似帶LL,水平帶HL,垂直帶LH,對(duì)角帶HH。近似帶LL包含了圖像的粗略描述信息,垂直帶LH包含了圖像的垂直信息,對(duì)應(yīng)于水平帶邊緣。水平帶HL表示了垂直邊緣中的水平細(xì)節(jié)信息,對(duì)角帶HH則包含了對(duì)角細(xì)節(jié)信息。LL子帶是原始圖像的副本,在沒有失真的情況下,通過獲取圖像的近似值來減少圖像所占的存儲(chǔ)空間大小。作為一種數(shù)學(xué)工具,小波變換是對(duì)人們熟知的傅里葉變換和窗口傅里葉變換的一個(gè)重大突破,為信號(hào)分析、圖像處理、量子物理及其他非線性科學(xué)的研究領(lǐng)域帶來革命性的影響。由多尺度分析、時(shí)頻分析、金字塔算法等發(fā)展起來的小波分析理論已經(jīng)成為數(shù)據(jù)壓縮、處理和分析最有用的工具。傅里葉變換是以在兩個(gè)方向上都無限伸展的正弦波作為正交基函數(shù)的,它適用于平穩(wěn)信號(hào)的分析。對(duì)非平穩(wěn)信號(hào)分析,簡(jiǎn)單的純時(shí)域分析或純頻域分析是不適用的,為了同時(shí)精確獲得信號(hào)的時(shí)域信息和頻域信息,時(shí)頻分析方法得到了發(fā)展。小波分析理論提供了一個(gè)可調(diào)的時(shí)頻窗,當(dāng)觀察高頻信號(hào)時(shí),時(shí)間窗自動(dòng)變窄當(dāng)研究低頻信號(hào)時(shí),時(shí)間窗自動(dòng)變寬,也就是具有變焦距的特點(diǎn)。小波函數(shù)擁有兩個(gè)重要的特性:震蕩性和衰減性。由于這兩個(gè)特性,使得小波變換具有時(shí)頻局部化特性。另外,小波分解是按照層次進(jìn)行的,每層小波分解中的尺度參數(shù)都是變化的,所以小波分解時(shí)在不同尺度上進(jìn)行的,稱為多分辨率分析。從多分辨率分析的角度上看,小波分解相當(dāng)于一個(gè)高通濾波器和一個(gè)低通濾波器的組合,每次分解總是把原信號(hào)分解到兩個(gè)時(shí)頻空間中?;谛〔ㄗ儞Q的圖像多分辨率分解特點(diǎn)表明,它具有良好的空間方向選擇性,與人的視覺特性十分吻合。近似部分LL集中了原始圖像的絕大多數(shù)能量,稱為原始圖像的逼近子圖。子帶圖像HL、LH和HH分別保持了原始圖像的水平邊緣細(xì)節(jié)、垂直邊緣細(xì)節(jié)和對(duì)焦邊緣細(xì)節(jié),他們刻畫了圖像的細(xì)節(jié)特性,稱為細(xì)節(jié)子圖。逼近子圖具有較強(qiáng)的抵抗外來影響的能力,穩(wěn)定性較好;邊緣細(xì)節(jié)子圖易受外來噪聲、圖像處理等攻擊的影響,穩(wěn)定性較差。三、離散余弦變換(DCT)DCT將信號(hào)從空間域轉(zhuǎn)換到頻域的過程。結(jié)合圖4DCT系數(shù)頻率分布示例圖表述如下:DCT用幾個(gè)DCT系數(shù)集中表現(xiàn)了圖像的可視化重要信息,系數(shù)提供了極佳的關(guān)聯(lián)屬性。這樣,DCT呈現(xiàn)出了圖像熵值的減少。從1D-DCT公式中可以發(fā)現(xiàn),如果u和N的值增加,給出增加頻率的波形。NXN輸入序列的2D-DCT公式為:P(x,y)是輸入圖像,x,y是矩陣元素的坐標(biāo),i,j是系數(shù)的坐標(biāo)。這個(gè)8x8的基本函數(shù)將一幅圖像分成了數(shù)個(gè)關(guān)聯(lián)的像素值塊,這樣在量化之后切去關(guān)聯(lián)像素值,高頻部分被忽略。離散余弦變換,是數(shù)字信號(hào)處理中最常用的線性變換之一,和離散傅里葉變換一樣,離散余弦變換也存在著快速算法。離散余弦變換是基于實(shí)數(shù)的正交變換,避免了傅里葉變換中的復(fù)數(shù)運(yùn)算,因此計(jì)算速度得到了大幅的提升,并且具有很好的能量壓縮能力和去相關(guān)能力,因此在數(shù)字音頻信號(hào)壓縮和圖像壓縮等領(lǐng)域得到廣泛的應(yīng)用。特別的,數(shù)字圖像的壓縮標(biāo)準(zhǔn)就是建立在離散余弦變換的基礎(chǔ)之上的。同時(shí),離散余弦變換變換后能量集中,算法復(fù)雜度適中,較易于在數(shù)字信號(hào)處理器中快速實(shí)現(xiàn)。二維離散余弦變換不但能夠?qū)⒆匀粓D像的主要信息集中到最少的低頻系數(shù)上,而且引起的圖像塊效應(yīng)最小,能夠?qū)崿F(xiàn)信息集中能力和計(jì)算復(fù)雜度的良好折中,因此在壓縮編碼中得到了廣泛的應(yīng)用,如JPEG壓縮標(biāo)準(zhǔn)。JPEG是一種基于分塊的DCT變換,這是目前比較常用的一種DCT變換。JPEG壓縮首先需要把圖像分為8x8的子塊,對(duì)所有子塊進(jìn)行二維DCT變換,得到8x8的DCT系數(shù),然后對(duì)DCT系數(shù)進(jìn)行量化,量化時(shí)先對(duì)所有的DCT系數(shù)除以一組量化值,并取最接近的整數(shù)。如表1所示坐標(biāo)01234567016111016244051611121214192658605521413162440576956314172229518780624182237566810910377524355564811041139264964788710312112010177292959811210010399表1壓縮中采用Zig-Zag掃描方式結(jié)合圖3示例圖所示,將8x8的系數(shù)變?yōu)橐痪S序列,這種掃描方式也表示了圖像的頻率成分:第一個(gè)為直流系數(shù),左上角部分為低頻系數(shù),右下角部分為高頻系數(shù),中間區(qū)域?yàn)橹蓄l系數(shù)。低頻系數(shù)的絕對(duì)值較大,代表圖像像素之間慢變化,而高頻系數(shù)的絕對(duì)值較小,代表像素之間的快變化。因此,低頻部分包含了圖像的大部分能量,也可以說,對(duì)人的視覺最重要的信息部分,都集中在圖像的中低頻部分。一般圖像的壓縮和處理,為了保持圖像的可視性,都保留了圖像的中低頻部分,低頻部分的改變有可能引起圖像的較大變動(dòng)。該算法的實(shí)施結(jié)果如下:均方誤差(MSE)和峰值信噪比(PSNR)用來描述壓縮圖像的質(zhì)量,壓縮比(CR)用來描述圖像壓縮程度。從測(cè)試結(jié)果中可以看出,輸入圖像大小42.6KB,輸出圖像大小13.4KB,該混合圖像壓縮算法發(fā)明可以在保證失真較少的情況下有效地壓縮圖像大小。表2均方誤差(MSE)是在原始圖像和壓縮圖像之間的累計(jì)誤差平方,MSE值越低,則誤差越小。它是所希望的響應(yīng)和實(shí)際輸出之間的差的平方的平均值。均方誤差的定義如下:其中L(x,y)表示原始圖像,F(xiàn)(x,y)表示重構(gòu)的圖像,m、n表示圖像的大小。峰值信噪比(PSNR)是原始圖像和重構(gòu)圖像誤差的比值,定義如下:壓縮比率(CR)是圖像壓縮表現(xiàn)的一個(gè)重要參數(shù),它度量了數(shù)據(jù)的壓縮程度,定義如下:盡管上面已經(jīng)示出和描述了本發(fā)明的實(shí)施例,可以理解的是,上述實(shí)施例是示例性的,不能理解為對(duì)本發(fā)明的限制,本領(lǐng)域的普通技術(shù)人員在本發(fā)明的范圍內(nèi)可以對(duì)上述實(shí)施例進(jìn)行變化、修改、替換和變型。因此,本發(fā)明的保護(hù)范圍應(yīng)當(dāng)由所附的權(quán)利要求書的內(nèi)容確定。當(dāng)前第1頁(yè)1 2 3