專利名稱:運(yùn)用子波變換的圖像壓縮法的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種運(yùn)用子波變換(WT)技術(shù)的壓縮編碼法,更確切地說(shuō),涉及一種量化法,其中量化誤差被減小,并涉及一種用來(lái)構(gòu)成有效樹(shù)形表的方法。
用于通信和數(shù)據(jù)存儲(chǔ)的數(shù)字圖像壓縮技術(shù)包括由運(yùn)動(dòng)圖像專家小組(MPEG)或聯(lián)合圖像專家組(JPEG)標(biāo)準(zhǔn)化的壓縮編碼法,其中運(yùn)用離散余弦變換(DCT)和霍夫曼編碼,還包括運(yùn)用向量量化或部分頻帶編碼的一些方法。
圖1是方塊圖,表示一種常規(guī)的壓縮編碼裝置,該裝置運(yùn)用例如基于DCT函數(shù)的一種MPEG或JPEG壓縮編碼法。這里,在量化時(shí),變換系數(shù)不是被均一的間隔細(xì)分,而是被一個(gè)運(yùn)用人類視覺(jué)系統(tǒng)(HVS)的空間頻率不同地細(xì)分。其中還使用了霍夫曼編碼,對(duì)基本變換系數(shù)壓縮,適當(dāng)?shù)乩靡粋€(gè)輸入圖像的統(tǒng)計(jì)學(xué)特性。
圖1中所示的DCT壓縮編碼法運(yùn)用,通過(guò)把一個(gè)圖像分割成許多均一的方塊并對(duì)每個(gè)方塊施加余弦函數(shù)抑制而得到的重疊圖像消除效應(yīng)和能量壓縮效應(yīng)。然而,在此方法中,雖然可以實(shí)現(xiàn)高壓縮,但產(chǎn)生嚴(yán)重的阻塞效應(yīng)。
向量量化法由高壓縮來(lái)看也是優(yōu)越的,但是由于它對(duì)于一個(gè)密碼本訓(xùn)練過(guò)程和數(shù)據(jù)壓縮/恢復(fù)需要過(guò)多的計(jì)算而無(wú)法用于實(shí)時(shí)系統(tǒng)。
另一方面,部分頻帶法緩和在高壓縮中的阻塞效應(yīng)而且比常規(guī)的DCT更高效,但是在低壓縮時(shí)不能得到高品質(zhì)圖像。
為了克服上述這些缺點(diǎn)和局限,引入了一種子波變換法。由于此方法針對(duì)時(shí)間和頻率二者,根據(jù)場(chǎng)所來(lái)表達(dá)圖像信號(hào),故它對(duì)分析非定常信號(hào)是有用的,并且其優(yōu)點(diǎn)在于它類似于人類視覺(jué)系統(tǒng)。
子波變換是部分頻帶編碼的多分辨率分析與一種其中圖像被表達(dá)成角錐形結(jié)構(gòu)的常規(guī)方法的綜合原理。每個(gè)所變換的子圖像都有從低頻段到高頻段的層次信息,以致能進(jìn)行更合適的編碼。
因此,本發(fā)明的一個(gè)目的在于,提供一種運(yùn)用子波變換技術(shù)的高效的圖像壓縮法。
本發(fā)明的另一個(gè)目的在于,提供一種量化法,其中以一種運(yùn)用成分波變換的圖像壓縮法把量化誤差減至最小。
本發(fā)明的再一個(gè)目的在于,提供一種構(gòu)成一種運(yùn)用子波變換的圖像壓縮法中的變換系數(shù)的有效樹(shù)形表的方法。
本發(fā)明的又一個(gè)目的在于,提供一種用來(lái)給以上樹(shù)形表編碼的方法。
本發(fā)明還有一個(gè)目的在于,提供一種用來(lái)給一種運(yùn)用子波變換的圖像壓縮法中的變換系數(shù)編碼的方法。
為了實(shí)現(xiàn)本發(fā)明的以上目的,提供一種圖像壓縮法,該方法包括步驟靠對(duì)輸入圖像進(jìn)行子波變換獲得變換系數(shù);根據(jù)諸輸入圖像的統(tǒng)計(jì)學(xué)特性,確定量化間隔,以便在給定的步長(zhǎng)下使量化誤差減至最??;運(yùn)用變換系數(shù)的統(tǒng)計(jì)學(xué)特性把樹(shù)形結(jié)構(gòu)修改成一種具有單調(diào)遞減函數(shù)的結(jié)構(gòu),然后限制親子節(jié)點(diǎn)之間的最大高度差,借此形成一個(gè)樹(shù)形表;根據(jù)該量化間隔對(duì)變換系數(shù)量化;以及給所修改的樹(shù)形表和所量化的變換系數(shù)進(jìn)行算術(shù)編碼。
為了實(shí)現(xiàn)本發(fā)明的另一個(gè)目的,提供了一種量化法,該方法包括步驟從得自該子波變換的變換系數(shù)的直方圖獲得輸出密度函數(shù)p(x);把所得到的p(x)近似成一個(gè)分段線性函數(shù);確定在用一個(gè)給定的步長(zhǎng)G量化該近似p(x)時(shí)量化誤差最小的量化間隔;以及用所確定的量化間隔來(lái)量化變換系數(shù)。
為了實(shí)現(xiàn)本發(fā)明的再一個(gè)目的,提供了一種構(gòu)成一種WT變換系數(shù)樹(shù)形表的方法,該方法包括步驟確定所有變換系數(shù)Cij的高度(height)h(Cij);針對(duì)變換,單調(diào)遞減在該確定步驟中所得到的變換系數(shù)Cij;以及構(gòu)成一個(gè)樹(shù)形表生成信息Diff(Cij),該信息寄存在該樹(shù)形表上,是由在該單調(diào)遞減步驟中所得到的樹(shù)形信息T(i,j)生成的。
為了實(shí)現(xiàn)本發(fā)明的又一個(gè)目的,提供了一種用來(lái)給一個(gè)樹(shù)形表編碼的方法,該方法包括步驟把樹(shù)形表中每個(gè)符號(hào)的集″S″分離成N個(gè)能獨(dú)立地編碼和解碼的子集;按先前的狀態(tài)確定該樹(shù)形表的每個(gè)符號(hào)屬于的子集;以及靠一個(gè)由屬于該所確定子集的諸符號(hào)形成的算術(shù)編碼器給該樹(shù)形表的每個(gè)符號(hào)編碼。
為了實(shí)現(xiàn)本發(fā)明的還有一個(gè)目的,提供了一種用來(lái)給所量化的變換系數(shù)編碼的方法,其中一個(gè)變換系數(shù)被分割成一個(gè)編碼部分和一個(gè)精細(xì)數(shù)值部分(fine size portion),然后每個(gè)部分被算術(shù)編碼。
通過(guò)參照諸附圖詳細(xì)地描述它的一個(gè)最佳實(shí)施例,本發(fā)明的以上諸目的和優(yōu)點(diǎn)將變得更明顯,這些附圖中圖1是表示一種常規(guī)的圖像壓縮裝置的方塊圖2A和2B是方塊圖,表示采用根據(jù)本發(fā)明的一種壓縮編碼法的一個(gè)編碼裝置和一個(gè)解碼裝置;圖3表示一個(gè)量化間隔和一個(gè)中心值;圖4表示一個(gè)近似成一個(gè)線性函數(shù)的概率密度函數(shù);圖5是表示變換系數(shù)的基本樹(shù)形結(jié)構(gòu)的圖;圖6是在一種JPEG壓縮法與一種根據(jù)本發(fā)明的壓縮編碼法之間比較性能的圖;以及圖7是用來(lái)在JPEG壓縮與一種根據(jù)本發(fā)明的壓縮編碼法之間比較性能的另一個(gè)圖。
圖2A是方塊圖,表示一個(gè)根據(jù)本發(fā)明的圖像壓縮編碼器。圖2A中所示的該裝置包括一個(gè)用來(lái)對(duì)所接收的輸入圖像進(jìn)行子波變換的成分波變換器10,一個(gè)用來(lái)高效地表達(dá)通過(guò)根據(jù)幾何學(xué)或統(tǒng)計(jì)學(xué)特性的子波變換而獲得的變換系數(shù)的樹(shù)形處理器12,一個(gè)用來(lái)給從樹(shù)形處理器12輸出的一個(gè)樹(shù)形表編碼的第一算術(shù)編碼器14,一個(gè)用來(lái)根據(jù)一個(gè)量化器步長(zhǎng)確定適當(dāng)?shù)牧炕g隔的量化間隔確定器16,一個(gè)用來(lái)根據(jù)該樹(shù)形表和所確定的量化間隔量化諸變換系數(shù)的量化器18,以及用來(lái)給來(lái)自量化器18的碼輸出和數(shù)值輸出算術(shù)編碼的第二和第三算術(shù)編碼器20和22。
樹(shù)形處理器12設(shè)有一個(gè)簡(jiǎn)單樹(shù)形處理器12a,一個(gè)單調(diào)遞減樹(shù)形處理器12b,一個(gè)差值限制樹(shù)形處理器12c,以及一個(gè)樹(shù)形表構(gòu)成器12d。
圖2B中所示的裝置包括一個(gè)用來(lái)給輸入的算術(shù)編碼的樹(shù)形信息解碼然后恢復(fù)WT變換系數(shù)的樹(shù)形表的第一算術(shù)解碼器30,一個(gè)用來(lái)給的接收的算術(shù)編碼的變換系數(shù)的碼信息解碼然后輸出WT變換系數(shù)的碼信息的第二算術(shù)解碼器32,一個(gè)用來(lái)給所接收的算術(shù)編碼的變換系數(shù)的數(shù)值信息解碼然后輸出WT變換系數(shù)的數(shù)值信息的第三算術(shù)解碼器34,以及一個(gè)用來(lái)接收該樹(shù)形表信息和該WT變換系數(shù)的碼信息及數(shù)值信息,從而復(fù)原該圖像信號(hào)的子波反變換器36。
參照?qǐng)D3,當(dāng)實(shí)數(shù)x被量化時(shí),變換系數(shù)x和量化值yi可如下表達(dá)x≈x=y(tǒng)i...(1)式中di≤x≤di+1代表量化間隔。這里,由該量化所產(chǎn)生的量化誤差Err(x)為Err(x)=x-x=x-yi...(2)這里,均方誤差如下E=E[(x-x-)2]=∫0∞(x-x-)2p(x)∫dx]]>=Σi=0di+1∫didi+1(x-yi)2p(x)dx···(3)]]>式中為了使E最小,yi可由下式獲得∂E∂yi=2∫didi+1(x-yi)p(x)dx=0]]>yi=∫didi+1xp(x)dx∫didi+1p(x)dx···(4)]]>在式(4)中,yi被表示成是x在〔di,di+1〕中的平均值,以便在給定的量化間隔下使E減至最小。
根據(jù)在本發(fā)明中所提出的最化法,當(dāng)用一個(gè)量化器步長(zhǎng)G進(jìn)行均一量化且量化間隔表達(dá)成〔KG-r,(K+1)G-r〕時(shí),輸入x表達(dá)成量化器步長(zhǎng)G的整數(shù)倍。因此,一個(gè)變換系數(shù)x可表達(dá)為x≈x=kG...(5)式中KG-r≤x<(k+1)G-r當(dāng)k∈Z。為了kG值變成一個(gè)代表值和為了均方誤差減至最小,必須滿足式(4)的條件。這里,r是一個(gè)由量化器步長(zhǎng)G和由圖像的統(tǒng)計(jì)學(xué)特性來(lái)確定的常數(shù)。就是說(shuō),通過(guò)對(duì)式(3)和式(4)積分可以達(dá)到設(shè)定代表值kG時(shí)的最理想的量化間隔,于是kG=∫kG-r(k+1)G-rxp(x)dx∫kG-r(k-1)G-rp(x)dx···(6)]]>為了得到滿足式(3)至式(6)的r,有兩種方法,一種方法中,獲得WT變換系數(shù)的直方圖,然后通過(guò)Kolmogorov-Smirniv(KS)檢查或x2檢查得到與從圖像獲得的直方圖最相似的p(x)。另一種方法中,利用從圖像獲得的直方圖,由一個(gè)分段線性函數(shù)來(lái)近似p(x)。當(dāng)通過(guò)KS測(cè)量或x2測(cè)量來(lái)計(jì)算p(x)時(shí),將會(huì)測(cè)量預(yù)測(cè)得各不相同的概率密度函數(shù),以致計(jì)算量很大。此外,當(dāng)該概率密度函數(shù)預(yù)測(cè)得不正確時(shí),量化的性能降低,以致KS測(cè)量或x2測(cè)量對(duì)于難以預(yù)測(cè)統(tǒng)計(jì)學(xué)特性的場(chǎng)合,例如圖像信號(hào)的場(chǎng)合,不是很有用。
因而,對(duì)于本發(fā)明而言,為了得到r值,采用一種用來(lái)近似一個(gè)分段線性函數(shù)的方法。
為了得到對(duì)于一個(gè)輸入圖像信號(hào)來(lái)說(shuō)最合適的r,圖像的p(x)被線性近似,如圖4中所示。這里,當(dāng)方程式中p(x)被近似表達(dá)為p(x)=ax+b時(shí),式中a和b是任意常數(shù),式(6)可表達(dá)如下kG=∫kG-r(k+1)G-rx(ax+b)dx∫kG-r(k-1)G-r(ax+b)dx···(7)]]>kG∫kG-x(k+1)G-r(ax+b)dx=∫kG-r(k-1)G-rx(ax+b)dx···(8)]]>從式(8)可以得到一個(gè)二次方程。ar2-aG+p(kG)r+aG2/3+Gp(kG)/2=0...(9)滿足式(9)的r2的兩個(gè)解(當(dāng)r>0)被用于針對(duì)代表值kG的量化間隔。
在本發(fā)明中,提出一種用來(lái)有效地表達(dá)變換系數(shù)的樹(shù)形編碼法及一種用來(lái)如上所述確定該量化間隔的方法,所提出的樹(shù)形編碼法是一種方法,其中由給定圖像的子波變換所得到的諸變換系數(shù)被表達(dá)成一種樹(shù)形結(jié)構(gòu),該結(jié)構(gòu)對(duì)于適當(dāng)?shù)乩米硬ㄗ儞Q系數(shù)的系統(tǒng)特性是有用的。子波變換的圖像信息與該樹(shù)形結(jié)構(gòu)之間的關(guān)系示于圖5中。
假設(shè)為把諸變換系數(shù)表達(dá)成一個(gè)給定的量化器步長(zhǎng)所需要的數(shù)字的數(shù)目被表達(dá)為“高度”。這里,諸變換系數(shù)的該高度被用一種樹(shù)形結(jié)構(gòu)來(lái)表達(dá)。由諸高度所表達(dá)的這樣表達(dá)的樹(shù)形結(jié)構(gòu)告知一個(gè)樹(shù)形表的該解碼器,該樹(shù)形表中當(dāng)傳送或記錄時(shí)僅構(gòu)成在親節(jié)點(diǎn)與當(dāng)前節(jié)點(diǎn)之間的高度差。
這里,由諸高度所代表的信息表示為恢復(fù)對(duì)應(yīng)的變換系數(shù)所需要的信息等級(jí)數(shù),然后該解碼器從一個(gè)量值表中作為諸變換系數(shù)的高度讀取必要的信息,以便借此恢復(fù)諸變換系數(shù)。
1)簡(jiǎn)單表達(dá)每個(gè)變換系數(shù)Cij的h(Cij)值定義為h(Cij)=log2|Cij+r|g···(10)]]>式中|Cij|≥G-r,在|Cij|<G-r和3mεDcij當(dāng)|m|≥G的場(chǎng)合為零,而在|Cij|>G-r和mεDcij當(dāng)|m|<G的場(chǎng)合為空值。在式(10)中,DCij項(xiàng)是變換系數(shù)Cij的所有子節(jié)點(diǎn)的集合;而T(i,j)項(xiàng)是變換系數(shù)Cijj的樹(shù)形信息。
該簡(jiǎn)單表達(dá)樹(shù)形T(i,j)根據(jù)式(10)把所有諸變換系數(shù)Cij表達(dá)為T(mén)(i,j)=h(Cij)。在式(10)中,在一個(gè)可選節(jié)點(diǎn)中一個(gè)空值h(Cij)意味著,變換系數(shù)Cij和子節(jié)點(diǎn)的所有值小于給定的量化器步長(zhǎng)G,而且并非所有的子節(jié)點(diǎn)值都被傳送。
h(Cij)的零值意味著,當(dāng)前變換系數(shù)Cij的值小于給定的量化器步長(zhǎng)G,以致所量化系數(shù)的值變?yōu)榱?,但某些子體有有效的系數(shù)。
當(dāng)采用如式(10)所簡(jiǎn)單表達(dá)的T(i,j)構(gòu)成一個(gè)樹(shù)形表時(shí),從為了傳送親和子T(i,j)中的差值而得到的諸差值中,可能產(chǎn)生一個(gè)負(fù)數(shù)。就是說(shuō),最好親和子的T(i,j)值具有單調(diào)遞減的形式,但是在實(shí)際圖像中卻有例外。因而,為了預(yù)測(cè)子節(jié)點(diǎn)的T(i,j)值,必須用該單調(diào)遞減的形式代替親和子T(i,j)值。
2)單調(diào)遞減樹(shù)在親節(jié)點(diǎn)與子節(jié)點(diǎn)之間T(i,j)值可能包括單調(diào)遞減形式以外的形式,以致用簡(jiǎn)單表達(dá)法所表達(dá)的樹(shù)形結(jié)構(gòu)不適于產(chǎn)生樹(shù)形表,而且所有諸變換系數(shù)Cij中的其他樹(shù)形信息被變換成如下的T(i,j)的形式如果m∈DcijMAXh(m)>h(Cij),]]>則T(i,j)=m∈DMAXcijh(m)···(11)]]>根據(jù)按式(11)的變換,所有諸變換系數(shù)具有從親節(jié)點(diǎn)至子節(jié)點(diǎn)單調(diào)遞減的T(i,j)形式的一種樹(shù)形結(jié)構(gòu)。此外,能從諸T(i,j)值中清除零值。
然而,這樣一種單調(diào)遞減式樹(shù)形結(jié)構(gòu)使得當(dāng)根據(jù)親節(jié)點(diǎn)與子節(jié)點(diǎn)之間T(i,j)的差值來(lái)形成一個(gè)樹(shù)形表時(shí)不可能預(yù)測(cè)該子節(jié)點(diǎn)的T(i,j)。
因此,為了更高效地給一個(gè)樹(shù)形表編碼,在一個(gè)當(dāng)前節(jié)點(diǎn)中的表達(dá)為一種單調(diào)遞減式的一種樹(shù)形結(jié)構(gòu)必須變換成可預(yù)測(cè)子節(jié)點(diǎn)T(i,j)的形式。
3)差值中的限制Diff(Cij)是當(dāng)用表達(dá)為單調(diào)遞減式的該樹(shù)形結(jié)構(gòu)來(lái)構(gòu)成一個(gè)樹(shù)形表時(shí),寄存在一個(gè)實(shí)際樹(shù)形表中的信息,于是Diff(Cij)=T(ip,jp)-T(i,j)...(12)然而,由于統(tǒng)計(jì)學(xué)特性隨輸入圖像而變化,難以預(yù)測(cè)該Diff(Cij)值。構(gòu)成一個(gè)適當(dāng)?shù)臉?shù)形表時(shí)該Diff(Cij)值由一個(gè)給定的Maxdiff(最大差值)來(lái)限制并用下式來(lái)有效預(yù)測(cè)。
T(i,j)=T(ip,jp)-Maxdiff...(13)如果T(ip,jp)-T(i,j)>Maxdiff.
Diff(Cij)受Maxdiff的限制,其中任意選擇輸入圖像的一種樹(shù)形結(jié)構(gòu),該結(jié)構(gòu)對(duì)構(gòu)成一個(gè)樹(shù)形表是有用的,因?yàn)楦鶕?jù)T(ip,jp)可以在一個(gè)較小的范圍內(nèi)預(yù)測(cè)T(i,j)。
4)樹(shù)形表的構(gòu)成每個(gè)節(jié)點(diǎn)被擴(kuò)展到所有諸子節(jié)點(diǎn),當(dāng)一個(gè)給定節(jié)點(diǎn)的T(.,.)值為NULL(空)時(shí)例外。如果該當(dāng)前節(jié)點(diǎn)的T(.,.)值為NULL,則諸子節(jié)點(diǎn)的所有諸系數(shù)值均小于或等于量化器步長(zhǎng)G,以致僅當(dāng)前節(jié)點(diǎn)的值NULL被記錄在該樹(shù)形表上,而沒(méi)有更低的節(jié)點(diǎn)被記錄。這里,一個(gè)最低頻帶的節(jié)點(diǎn),即一個(gè)代表直流分量的節(jié)點(diǎn),僅有三個(gè)子節(jié)點(diǎn)而除了最高頻帶外所有諸節(jié)點(diǎn)均有四個(gè)子節(jié)點(diǎn)(見(jiàn)圖5)。
最高頻帶,即有最高頻率分量的頻帶,不可能有一個(gè)子節(jié)點(diǎn),也不可能有該T(.,.)值的一個(gè)零值。最低頻帶,即代表最低頻率分量的頻帶,不可能有一個(gè)親節(jié)點(diǎn),并被看成每個(gè)樹(shù)的根。在樹(shù)形表構(gòu)成期間所寄存的信息是諸親節(jié)點(diǎn)和子節(jié)點(diǎn)的T(.,.),以致在一個(gè)親節(jié)點(diǎn)被記錄之后,該樹(shù)形結(jié)構(gòu)的所有諸子節(jié)點(diǎn)被加到一個(gè)樹(shù)形表上。
5)樹(shù)形表編碼為了傳送或記錄表達(dá)為一種所提出類型的樹(shù)形結(jié)構(gòu)的該樹(shù)形表,該樹(shù)形表將通過(guò)根據(jù)一種適當(dāng)方法的編碼來(lái)壓縮。關(guān)于編碼的性能和實(shí)現(xiàn),在用霍夫曼編碼進(jìn)行的方法與用算術(shù)編碼進(jìn)行的方法之間有所不同。就是說(shuō),一個(gè)霍夫曼碼具有最小的平均碼長(zhǎng)并且對(duì)立即解碼是有用的。然而,霍夫曼碼既需要用于整個(gè)樹(shù)形表的每個(gè)符號(hào)的給定概率又需要一個(gè)合適的概率模型。這里,最好確定一個(gè)適合給各種輸入圖像的樹(shù)形結(jié)構(gòu)編碼的概率模型,因?yàn)椴豢赡苁孪鹊玫秸麄€(gè)輸入圖像的符號(hào)概率。
然而,當(dāng)實(shí)際輸入圖像編碼的概率與一個(gè)預(yù)定概率模型的概率不同時(shí),壓縮效率明顯下降。當(dāng)一個(gè)符號(hào)具有一個(gè)很大的概率,比如說(shuō)接近于1時(shí),壓縮效率也明顯下降。
因而,根據(jù)本發(fā)明,提出一種采用一種自適應(yīng)模型的算術(shù)編碼法,該算術(shù)編碼法產(chǎn)生近似樹(shù)形表的平均信息量的壓縮。這里,由于采用一種自適應(yīng)模型,無(wú)須給出針對(duì)該樹(shù)形結(jié)構(gòu)的概率模型,而且每個(gè)碼的概率也是不必要的。
當(dāng)M個(gè)符號(hào)被編碼時(shí),即S={x1,x2,...xM},如果每個(gè)符號(hào)xj有概率p(xj),則符號(hào)xj的信息量I(xj)及其平均信息量H(S)將表達(dá)為I(xi)=log[1p(x1)]···(14)]]>H(s)=Σj=1Mp(xj)log[ip(xj)]]]>=Σj=1Mp(xj)I(XJ)...(15)]]>式中Σj=1M=1.]]>
如果該符號(hào)集S可分離成N個(gè)可以編碼和解碼的子集,則它可獨(dú)立地表達(dá)為S=S1∪S2...∪SN...(16)={x11,...,x1p}∪{x2p+1,...,x2q}...∪{xNr+1,...,xNM}每個(gè)子集Si可以獨(dú)立地編碼,以致每個(gè)子集Si的信息量I(xij)和平均信息量Ei(Si)可表達(dá)如下I(xij)=log[1p(xji)]···(17)]]>Ei(si)=Σ∀xi∈sip(xij)log[1p(xij)]]]>=Σ∀xi∈sip(xij)I(xij)...(18)]]>式中Σ∀xi∈sip(xij)=1.]]>為了比較當(dāng)S集的符號(hào)組成的數(shù)據(jù)被用算數(shù)編碼和用分離成子集Si來(lái)編碼時(shí)的效率,概率pi和pij(分別為xi的和xij∈Sixj的)可表達(dá)為p(xij)=p(xi)Σ∀xi∈sip(xj)]]>=p(xj)p(si)...(19)]]>因此,當(dāng)每個(gè)符號(hào)的集合S被分離成子集Si而一個(gè)任意符號(hào)xj被編碼時(shí),平均信息量E(S)如下E(S)=Σi=1Np(Si)Ei(Si)]]>=Σi=1NΣ∀xi∈sip(Si)p(Sij)I(xij)]]>=Σi=1NΣ∀xi∈sixjI(xij)]]>=Σi=1Np(xi)I(xij)...(20)]]>這里,同一符號(hào)xj和xij∈Sixj的信息量可表達(dá)如下p(xij)≤p(xj) ip(xij)≤ip(xi)···(21b)]]>而由于對(duì)數(shù)函數(shù)是單調(diào)遞減函數(shù)log[1p(xij)]≤log[1p(xj)]···(21c)]]>I(xij)=I(xj)...(21d)因而,根據(jù)一種編碼法的平均信息量E(S)和H(S)的關(guān)系如下E(S)≤H(S)...(22)p(xij)I(xij)≤p(xj)I(xj)當(dāng)給定符號(hào)的集合S時(shí),如果可以確定符號(hào)xj是哪個(gè)子集Si的元素,就是說(shuō),如果按先前的狀態(tài)能確定可以用哪個(gè)算術(shù)編碼器xj來(lái)算術(shù)編碼的話,則能更有效地給一個(gè)任意符號(hào)xj編碼。
圖像變換系數(shù)被表達(dá)為一種樹(shù)形樹(shù)構(gòu),該結(jié)構(gòu)作為一種單調(diào)遞減函數(shù)而出現(xiàn),而且親節(jié)點(diǎn)與子節(jié)點(diǎn)之間的最大高度差受Maxdiff的限制,借此產(chǎn)生最終形式的T(.,.)。親節(jié)點(diǎn)與當(dāng)前節(jié)點(diǎn)之間的高度差在準(zhǔn)備該樹(shù)形表中用來(lái)表達(dá)當(dāng)前節(jié)點(diǎn)的高度,以致能預(yù)測(cè)當(dāng)通過(guò)親節(jié)點(diǎn)T(.,.)給該當(dāng)前節(jié)點(diǎn)編碼時(shí)所用符號(hào)的種類。根據(jù)親節(jié)點(diǎn)的狀態(tài)的算術(shù)符號(hào)編碼示于表1中。
表1
該樹(shù)形表可以由如表1中所示的每個(gè)不同的算術(shù)編碼器根據(jù)親節(jié)點(diǎn)T(.,.)獨(dú)立地編碼。于是,用來(lái)壓縮該樹(shù)形結(jié)構(gòu)所需要的算術(shù)編碼器數(shù)為Maxdiff+1。
6)變換系數(shù)表達(dá)用來(lái)表達(dá)每個(gè)變換系數(shù)的位數(shù)作為給定的量化器步長(zhǎng)G可以由完整的樹(shù)形表來(lái)確定。雖然一般來(lái)說(shuō)為了表達(dá)一個(gè)數(shù)既需要符號(hào)位又需要數(shù)值位,但是當(dāng)已知該位數(shù)時(shí),該數(shù)可以表達(dá)為Cij≈Cij-=Σp=T(i,j)h(Cij)SpG2p+Σq=h(Cij)-10Sh(Cij)bqG2q···(23)]]> 在把一個(gè)任意數(shù)x表達(dá)成式(23)時(shí),x時(shí)符號(hào)可以放在最高位位置上,該符號(hào)可由h(x)決定,而不告知不一個(gè)bh(x)的解碼器,因?yàn)樽罡呶坏腷h(x)值始終為1,在表達(dá)寄存在該樹(shù)形表中的所有諸變換系數(shù)時(shí)可以省略1-位。
然而,一個(gè)編碼器一般告知一個(gè)解碼器的信息不是變換系數(shù)的h(Cim)而是T(i,j),借此產(chǎn)生條件T(i,j)≤h(Cij)。因此,在T(i,j)>h(Cij)的另一種情況下,一個(gè)空的符號(hào)被置于表達(dá)成一個(gè)量化器步長(zhǎng)G的該實(shí)系數(shù)值前,如式(23)中所示。于是,為了表達(dá)一個(gè)變換系數(shù),需要編碼器和精細(xì)數(shù)值部分,而這些是靠算術(shù)編碼獨(dú)立地壓縮的。
為了比較由本發(fā)明所提出的圖像編碼法與具有相同功用的不同編碼法的性能,使用具有不同的統(tǒng)計(jì)學(xué)特性的512×512Lena圖像和256段的Baboon圖像,而且靠針對(duì)一個(gè)編碼器/解碼器的精度從實(shí)際壓縮結(jié)果(包括標(biāo)題)復(fù)原的圖形得到所有結(jié)果。
為了推廣一種壓縮編碼法,使用一個(gè)算術(shù)符號(hào)和一種用于該算術(shù)符號(hào)的初始模型,一個(gè)14字節(jié)的標(biāo)題,一個(gè)固定模型和均一的概率。這里,14字節(jié)標(biāo)題中的四個(gè)字節(jié)是表達(dá)一個(gè)圖像的尺寸所必須的,一個(gè)字節(jié)用于層次,一個(gè)字節(jié)用于變換系數(shù)的最大高度,而八個(gè)字節(jié)用于量化器步長(zhǎng)。
用來(lái)確定一個(gè)量化間隔的概率密度函數(shù)由該變換系數(shù)的直方圖來(lái)確定,該直方圖被近似成一個(gè)分段線性函數(shù),借此根據(jù)量化器步長(zhǎng)G的值,確定一個(gè)高效量化間隔。
根據(jù)本發(fā)明,用一種Antonni 9-7雙正交子波濾波器作為子波濾波器,而且分析層次和Maxdiff值分別定成6和4。針對(duì)用于實(shí)現(xiàn)一個(gè)濾波器的邊界條件,使用一種對(duì)稱擴(kuò)展法。
在根據(jù)本發(fā)明的圖像壓縮編碼法中,根據(jù)量化器步長(zhǎng)G值的不同,可以得到各種壓縮比,這很像在JPEG中通過(guò)改變“品質(zhì)因數(shù)”而得到不同的壓縮比的方法。
在分別表示Lena和Baboonn圖像的結(jié)果的圖6和圖7中,與壓縮比的變化有關(guān)的畫(huà)面品質(zhì)(PSNR)的變化與JPEG壓縮作了比較。這里,本發(fā)明用實(shí)線表示,而采用常規(guī)圖像壓縮編碼法,即DCT編碼,的JPEG壓縮用虛線表示。
在表2中,按與Shapiro和Said編碼法中相同的位速率比較了Lena(512×512)圖像。Shapiro和Said法是靠依次逼近的編碼法,以致它們不能絕對(duì)地比較,而是在盡可能相同的條件下來(lái)比較。(這里,G表示量化器步長(zhǎng)。)表2
如上所述,在根據(jù)本發(fā)明的一種圖像壓縮編碼法中,子波變換系數(shù)的高度被表達(dá)為一種樹(shù)形結(jié)構(gòu),該樹(shù)形結(jié)構(gòu)被算術(shù)編碼高效地編碼,而且確定一個(gè)與給定的量化器步長(zhǎng)有關(guān)的理想的量化間隔,以致可以在很寬的范圍內(nèi),即從用于高壓縮低PSNR的壓縮到用于低壓縮高PSNR的壓縮,實(shí)現(xiàn)改進(jìn)的性能。
除了圖像壓縮領(lǐng)域,本發(fā)明還對(duì)各種需要聲壓縮的工業(yè)領(lǐng)域有用,并可用于圖像記錄所使用的任何類型的設(shè)備,如像高清晰度電視、無(wú)膠片攝像機(jī)、數(shù)字視頻盒式錄機(jī)和攝錄機(jī)、CD音頻設(shè)備、以及廣播設(shè)備。
權(quán)利要求
1.一種運(yùn)用子波變換的圖像壓縮法,該方法包括步驟(a)通過(guò)對(duì)諸輸入圖像進(jìn)行子波變換取得諸變換系數(shù);(b)根據(jù)諸輸入圖像的統(tǒng)計(jì)學(xué)特性,確定一個(gè)量化間隔,以便在給定的步長(zhǎng)下使量化誤差減至最小;(c)運(yùn)用諸變換系數(shù)的統(tǒng)計(jì)學(xué)特性,把一種樹(shù)形結(jié)構(gòu)修改成一種具有單調(diào)遞減函數(shù)的結(jié)構(gòu),然后限制親子節(jié)點(diǎn)之間的最大高度差,借此構(gòu)成一個(gè)修改的樹(shù)形表;(d)根據(jù)所述確定的量化間隔,對(duì)諸變換系數(shù)進(jìn)行量化,以及(e)給該修改的樹(shù)形表和量化的諸變換系數(shù)進(jìn)行算術(shù)編碼。
2.根據(jù)權(quán)利要求1中所述的圖像壓縮法,其中所述步驟(b)包括步驟從得自子波變換的諸變換系數(shù)的直方圖取得輸出密度函數(shù)p(x);把所述p(x)近似成分段線性函數(shù);確定在用一個(gè)給定的步長(zhǎng)G來(lái)量化所述近似的p(x)時(shí),具有最小的量化誤差的該量化間隔。
3.根據(jù)權(quán)利要求2中所述的圖像壓縮法,其中量化間隔可表達(dá)為kG=∫kG-r(k+1)G-rx(ax+b)dx∫kG(k-1)G-r(ax+b)dx]]>當(dāng)p(x)為ax+b時(shí)。
4.根據(jù)權(quán)利要求1中所述的圖像壓縮法,其中所述樹(shù)形表是通過(guò)以下步驟構(gòu)成的根據(jù)下式確定所有諸變換系數(shù)Cij的高度h(Cij)h(Cij)=log2|Cij+r|G]]>式中|Cij|≥G-r,h(Cij)=O式中|Cij|<G-r,和3mεDcij當(dāng)|m|≥G,以及h(Cij)=NULL式中|Cij|<G-r,和mεDcij當(dāng)|m|<G,其中DCij是變換系數(shù)Cij的所有諸子節(jié)點(diǎn)的集合;針對(duì)變換根據(jù)下式使在所述確定步驟里得到的變換系數(shù)Cij單調(diào)遞減如果m∈DcijMAXh(m)>h(Cij),thenT(i,j)m∈DcMAXij(m)]]>式中T(i,j)表示變換系數(shù)Cij的樹(shù)形信息;以及構(gòu)成一個(gè)樹(shù)形表,其中當(dāng)可以寄存在所述樹(shù)形表上的信息的Diff(Cij)=T(ip,jp)-T(i,j)是從在所述單調(diào)遞減步驟里得到的樹(shù)形信息T(i,j)產(chǎn)生時(shí),所述Diff(Cij)受下式限制T(i,j)=T(ip,jp)-Maxdiff當(dāng)T(ip,jp)-T(i,j)>Maxdiff時(shí)。
5.根據(jù)權(quán)利要求1中所述的圖像壓縮法,其中所述步驟(e)包括有以下步驟的對(duì)該樹(shù)形表的算術(shù)編碼把該樹(shù)形表中每個(gè)符號(hào)的集合S分離成能獨(dú)立地編碼和解碼的N個(gè)子集;按先前的狀態(tài)確定所述樹(shù)形表中每個(gè)符號(hào)屬于哪個(gè)子集;以及靠由屬于所述確定的子集的諸符號(hào)組成的一個(gè)算術(shù)編碼器來(lái)編碼,并且對(duì)變換系數(shù)進(jìn)行算數(shù)編碼,以便把量化的變換系數(shù)分割成一個(gè)編碼部分和一個(gè)精細(xì)數(shù)值部分,然后給每個(gè)部分算術(shù)編碼。
6.一種量化子波變換的變換系數(shù)的方法,該方法包括步驟從得自所述子波變換的諸變換系數(shù)的直方圖取得輸出密度函數(shù)p(x);把所述得到的p(x)近似成一個(gè)分段線性函數(shù);確定在用給定的均一量化器步長(zhǎng)的G值來(lái)量化所述近似的p(x)時(shí),具有最小的量化誤差的一個(gè)量化間隔;以及用所述確定的量化間隔量化諸變換系數(shù)。
7.根據(jù)權(quán)利要求6中所述的量化方法,其中當(dāng)p(x)=ax+b時(shí),所述具有最小的量化誤差的量化間隔可表達(dá)為kG=∫kG-r(k+1)G-rx(ax+b)dx∫kG-r(k-1)G-r(ax+b)dx]]>式中k表示一個(gè)實(shí)數(shù)而r表示一個(gè)正數(shù)。
8.一種在形成子波變換的變換系數(shù)的一種樹(shù)形結(jié)構(gòu)的方法中構(gòu)成一個(gè)樹(shù)形表的方法,此方法包括步驟根據(jù)下式確定所有諸變換系數(shù)Cij的高度h(Cij)h(Cij)=log2|Cij+r|G]]>式中|Cij|≥G-rh(Cij)=O式中|Cij|<G-r和3mεDcij當(dāng)|m|≥G以及h(i,j)=NULL式中|Cij|<G-r,和mεDcij當(dāng)|m|<G其中DCij是變換系數(shù)Cij的所有諸子節(jié)點(diǎn)的集合;針對(duì)變換根據(jù)下式使在所述確定步驟里得到的變換系數(shù)Cij單調(diào)遞減如果 則m∈DcijMAXh(m)>h(Cij),thenT(i,j)=m∈DcijMAXh(m)]]>式中T(i,j)表示變換系數(shù)Cij的樹(shù)形信息;以及構(gòu)成一個(gè)樹(shù)形表生成信息Diff(Cij)=T(ip,jp)-T(i,j)該信息寄存在來(lái)自樹(shù)形信息T(i,j)的樹(shù)形表上,該樹(shù)形信息是在所述單調(diào)遞減步驟里得到的,所述Diff(Cij)受下式中所示條件的限制T(i,j)=T(ip,jp)-Maxdiff當(dāng)T(ip,jp)-T(i,j)>Maxdiff時(shí)。
9.一種給子波變換的變換系數(shù)的一個(gè)樹(shù)形表編碼的方法中給一個(gè)樹(shù)形表編碼的方法,該方法包括步驟把所述樹(shù)形表中每個(gè)符號(hào)的集合S分割成能獨(dú)立地編碼和解碼的N個(gè)子集;按先前的狀態(tài)確定所述樹(shù)形表的每個(gè)符號(hào)屬于哪個(gè)子集;以及靠由屬于所確定諸子集的所述諸符號(hào)組成的一個(gè)算述編碼器給所述樹(shù)形表的每個(gè)符號(hào)編碼。
10.一種給在經(jīng)子波變換和量化的變換系數(shù)的編碼方法中給經(jīng)量化的變換系數(shù)諸碼的方法,其中把一個(gè)變換系數(shù)分割成一個(gè)編碼部分和一個(gè)精細(xì)數(shù)值部分,然后給每個(gè)部分算術(shù)編碼。
全文摘要
本發(fā)明為在運(yùn)用子波變換的圖像壓縮法中用來(lái)構(gòu)成一個(gè)具有很小的量化誤差的高效樹(shù)形表的壓縮編碼法,包括以下步驟通過(guò)對(duì)諸輸入圖像進(jìn)行成分波變換取得諸變換系數(shù);根據(jù)諸輸入圖像的統(tǒng)計(jì)學(xué)特性確定一個(gè)量化間隔;把樹(shù)形結(jié)構(gòu)修改成一種具有單調(diào)遞減函數(shù)的結(jié)構(gòu),然后限制親子節(jié)點(diǎn)之間的最大高度差,借此構(gòu)成一個(gè)修改的數(shù)形表;對(duì)諸變換系數(shù)進(jìn)行量化;以及給該修改的樹(shù)形表和量化的諸變換系數(shù)進(jìn)行算術(shù)編碼。
文檔編號(hào)G06T9/00GK1147746SQ9610137
公開(kāi)日1997年4月16日 申請(qǐng)日期1996年2月8日 優(yōu)先權(quán)日1995年5月29日
發(fā)明者金容奎, 樸圭泰, 李林建, 金宗植 申請(qǐng)人:三星電子株式會(huì)社