專利名稱:一種高壓縮比人像編解碼方法
技術領域:
本發(fā)明涉及一種高壓縮比人像編解碼方法,更確切地說,涉及一種全自動或者交互式人肩對象提取技術,屬于圖像壓縮技術領域。
背景技術:
目前國際上有很多高性能的圖像壓縮方法,比如聯(lián)合圖像專家組制定的國際標準JPEG2000、矢量量化等。但是用于網(wǎng)絡傳輸、檔案管理、電子證件、嵌入式系統(tǒng)等領域專門針對人像的高壓縮比編解碼方法并不多。
上個世紀90年代初期開始,隨著小波理論的發(fā)展與完善,針對小波變換的各種圖像壓縮算法逐漸發(fā)展起來。這些方法結合小波變換和嵌入式量化與熵編碼,獲得了更高的編碼效率以及圖像恢復質量。其中,利用小波零樹的嵌入式編碼方法(EZW)、層次樹的集分割算法(SPIHT)、最優(yōu)截斷的嵌入式塊編碼(EBCOT)等方法是其典型代表,并最終于本世紀初形成了新一代的靜止圖像壓縮國際標準JPEG2000。這些壓縮方法的原理是相同的,壓縮流程包括三個步驟,小波變換,嵌入式量化,熵編碼。JPEG2000主要通過小波變換、EBCOT量化方法、QM算術編碼器對靜止的彩色或者灰度圖像進行高效的壓縮。其中小波變換的作用是將時域的數(shù)據(jù)變換成變換域的數(shù)據(jù),使能量更加集中,利于壓縮。量化的作用在于降低數(shù)據(jù)的有效位數(shù),并利用數(shù)據(jù)之間的相關性進行處理,以便降低數(shù)據(jù)的信息量,獲得更大的壓縮潛力,熵編碼的作用是對量化后的信息做最有效的比特位表示,最終形成輸出碼流。SPIHT,EZW等和JPEG2000差不多,只不過是在量化方法上有所不同。
JPEG2000等算法,雖然具有很高的壓縮比,但都是通用的圖像壓縮方法,并不能針對具體的應用問題,比如人像等,獲得更高的壓縮比和壓縮質量。
矢量量化等方法,雖然能夠針對一些具體應用進行編碼,但是在編碼過程中需要通過大量的訓練獲得訓練碼書,解碼的時候還需要從訓練得到的碼書中提取碼字恢復圖像。因此,它通常要預存大量的訓練碼本,應用很不方便,實用性也比較差。
發(fā)明內(nèi)容
本發(fā)明的目的是提出高壓縮比人像編解碼方法,針對具體的應用需求,對圖像進行壓縮,以獲得更高的壓縮比,同時保持編解碼過程的方便性,靈活性和實用性。
本發(fā)明提出的高壓縮比人像編碼方法,包括以下各步驟
(1)從待壓縮彩色人臉圖像中獲取人肩對象的形狀信息和紋理信息;(2)對上述人肩對象的形狀信息進行鏈編碼,得到人肩對象形狀信息符號流,并進行算術編碼;(3)對上述待壓縮彩色人臉圖像中除人肩對象以外的背景區(qū)域進行插值編碼,得到背景圖像區(qū)域符號流,并進行算術編碼;(4)將上述待壓縮彩色人臉圖像從紅綠蘭即RGB空間變換到亮度色度色度即YUV空間,得到YUV空間上的人臉圖像;(5)根據(jù)上述第(1)步的人肩對象,分別對YUV三個分量上的人肩對象的形狀信息和紋理信息進行適形小波變換,獲得小波域上的人肩對象的紋理信息即小波系數(shù)以及小波域上的人肩對象的形狀信息;(6)對上述人肩對象小波系數(shù)和小波域上的人肩對象形狀信息進行基于對象的嵌入式編碼,得到小波系數(shù)的嵌入式編碼符號流,并進行算術編碼,完成彩色人臉圖像的壓縮。
本發(fā)明提出的高壓縮比人像解碼方法,包括以下各步驟(1)對輸入的彩色人臉圖像的壓縮碼流進行算術解碼,得到人肩對象形狀信息符號流和背景圖像區(qū)域符號流,并依次分別進行鏈解碼和插值解碼,得到人肩對象的形狀信息和背景圖像區(qū)域;(2)對上述人肩對象的形狀信息進行適形小波變換,得到小波域上的人肩對象形狀信息;(3)根據(jù)上述小波域上的人肩對象形狀信息,對輸入的彩色人臉圖像的壓縮碼流進行算術解碼,得到小波系數(shù)的嵌入式編碼符號流,并進行基于對象的嵌入式解碼,得到小波系數(shù)即小波域上的人肩對象紋理信息;(4)分別對上述小波域上的人肩對象形狀信息和紋理信息進行適形小波逆變換,依次得到YUV空間三個分量上的彩色人肩對象的圖像;(5)對上述YUV空間的彩色人肩對象的圖像進行顏色空間的反變換,獲得RGB空間上的人肩對象重構圖像;(6)將上述人肩對象重構圖像與背景圖像區(qū)域疊加,獲得重構的彩色人臉圖像。
上述編碼方法中,從人臉圖像中獲取人肩對象的形狀信息的方法,包括如下步驟(1)計算人臉圖像中各點的邊緣梯度向量 l→(x,y)={I(x,y)*∂G(x,y)∂x,I(x,y)*∂G(x,y)∂y}]]>并由此得到邊緣振幅|l→(x,y)|=(I(x,y)*∂G(x,y)∂x)2+(I(x,y)*∂G(x,y)∂x)2;]]>和邊緣梯度方向
∠l→(x,y)=arctg(I(x,y)*∂G(x,y)∂y/I(x,y)*∂G(x,y)∂x);]]>其中,I(x,y)為圖像函數(shù),G(x,y)=12πσex2+y22σ2,]]>其中的σ值為1~5,符號*為卷積;(2)根據(jù)圖像灰度,設定邊緣振幅的門限值,將上述各點的邊緣振幅與設定門限值進行比較,使邊緣振幅二值化,得到邊界為1,背景為0的圖像;(3)在上述圖像的左上角和右上角選取門限值為0的種子點,進行區(qū)域增長,獲得連通的背景區(qū)域,其余區(qū)域則為人肩對象區(qū)域;(4)在上述邊緣振幅圖中,根據(jù)上述人肩對象區(qū)域的邊界,沿邊緣梯度方向尋找邊緣振幅的局部最大點,作為人肩對象的邊界。
上述編碼方法中,對人肩對象的形狀信息進行編碼的方法,包括如下步驟(1)對人肩對象的形狀信息進行鏈碼跟蹤,得到表示人肩區(qū)域的鏈碼,該鏈碼為D
、D[1]…….D[i-1]、D[i]……D[n],其中的n為鏈碼長度,D為鏈碼方向,分別為0、1、2……7,共8個方向;(2)對鏈碼中每個D[i],依次進行差分運算,得到人肩對象形狀信息的編碼符號流;(3)對上述人肩對象形狀信息的編碼符號流進行算術編碼。
上述編碼方法中,對背景圖像區(qū)域進行編碼的方法為在背景區(qū)域中取多個圖像點,計算每個圖像點附近區(qū)域的背景圖像顏色的平均值,對平均值進行算術編碼,得到背景圖像區(qū)域碼流。
上述編碼方法中的嵌入式編碼的方法包括如下步驟(1)將人肩對象分成YUV三個分量,進行編碼,并根據(jù)圖像壓縮要求分配給每個顏色分量一個固定碼長;(2)將上述每個分量所對應的小波系數(shù),按照其振幅高低分成多個比特位面,從高位的比特位面至低位的比特位面依次進行編碼,具體過程為(a)設小波系數(shù)的域值為T,T=2V,其中V為當前比特面,建立小波系數(shù)重要性點列;(b)按照小波變換中的小波域子帶的順序LLn、HLn、LHn、HHn、HLn-1、LHn-1、HHn-1……、HL1、LH1、HH1,依次搜索小波變換域上與每個位置(r,c)相對應的小波系數(shù)C(r,c)以及相應的小波域的形狀信息掩碼M(r,c),其中(r,c)為小波域上各點的坐標,判斷小波系數(shù)C(r,c)是否屬于當前對象,若是,進一步判斷該坐標(r,c)是否已處于重要性點列中,若處于重要性點列中,則結束該點的編碼,若不處于重要性點列中,則分別對屬于最高層LLn子帶和最底層HL1、LH1、HH1子帶的小波系數(shù)進行三符號上下文算術編碼,對屬于其它各層子帶HLn-1、LHn-1、HHn-1、……、HL2、LH2、HH2的小波系數(shù),進行四符號上下文算術編碼;同時更新重要性點列,若小波系數(shù)C(r,c)不屬于當前對象,則最高層LLn子帶和最底層HL1、LH1、HH1子帶的小波系數(shù)不用編碼,對其它各層子帶HLn-1、LHn-1、HHn-1、……、HL2、LH2、HH2的小波系數(shù),進行二符號上下文算術編碼;(c)對于重要性點列的所有小波系數(shù)的當前比特位進行二符號上下文算術編碼,并對重要性點列中的小波系數(shù)進行重排。
(3)輸出碼流,當碼流長度達到上述固定碼長時,終止該對象的編碼。
上述解碼方法中,對人肩對象信息進行解碼的方法,包括如下步驟(1)對人肩對象的形狀信息的壓縮碼流進行算術解碼,得到人肩對象形狀信息的編碼符號流;(2)對上述人肩對象形狀信息的編碼符號流進行差分解碼,得到鏈碼D[i];(3)用輪廓填充法對鏈碼進行輪廓填充,得到人肩對象的形狀信息。
上述解碼方法中,對背景圖像區(qū)域進行解碼的方法為對背景圖像區(qū)域碼流進行算術解碼,得到多個圖像點附近區(qū)域的背景圖像顏色的平均值,對多個平均值進行雙線性插值,獲得整個背景圖像區(qū)域。
上述解碼方法中的嵌入式解碼的方法包括如下步驟(1)根據(jù)編碼過程中所分配的固定碼長,對所有人肩對象YUV三個分量依次進行解碼;(2)將上述每個分量所對應的小波系數(shù),從高位的比特位面至低位的比特位面依次進行解碼,具體過程為(a)設定小波系數(shù)域值T,T=2V,其中V為當前比特面,建立小波系數(shù)重要性點列;(b)按照小波變換中的小波域子帶的順序LLn、HLn、LHn、HHn、HLn-1、LHn-1、HHn-1……、HL1、LH1、HH1,依次搜索小波變換域上與每個位置(r,c)相對應的小波系數(shù)C(r,c),以及相應的小波域的輪廓信息掩碼M(r,c),其中(r,c)為小波域上各點的坐標,判斷小波系數(shù)C(r,c)是否屬于當前對象,若是,進一步判斷該坐標(r,c)是否已處于重要性點列中,若處于重要性點列中,則結束該點的解碼,若不處于重要性點列中,則分別對屬于最高層LLn子帶和最底層HL1、LH1、HH1子帶的小波系數(shù)進行三符號上下文算術解碼,對屬于其它各層子帶HLn-1、LHn-1、HHn-1、……、HL2、LH2、HH2的小波系數(shù),進行四符號上下文算術解碼;同時更新重要性點列,若小波系數(shù)C(r,c)不屬于當前對象,則屬于最高層LLn子帶和最底層HL1、LH1、HH1子帶的小波系數(shù)不用解碼,對屬于其它各層子帶HLn-1、LHn-1、HHn-1、……、HL2、LH2、HH2的小波系數(shù),進行二符號上下文算術解碼;(c)對于重要性點列的所有小波系數(shù)的當前比特位進行二符號上下文算術解碼,并對重要性點列中的小波系數(shù)進行重排;(3)當解碼的碼流長度達到上述固定碼長時,終止該對象的解碼。
本發(fā)明提出的高壓縮比人像編解碼方法,采用形狀信息的鏈碼表示,背景區(qū)域的雙線性插值,適形小波變換以及基于對象的嵌入式編碼等技術,可以對人肩對象的邊緣進行精確的提取和有效的分割,大大降低了邊緣在小波變換后所需要的信息表示量,從而在保持高視覺質量的前提下提高了壓縮比,并且編解碼方便實用。該方法可以廣泛應用于網(wǎng)絡傳輸,檔案管理,電子證件,嵌入式系統(tǒng)等需要對電子人像數(shù)據(jù)進行高壓縮比編碼的領域。
圖1為本發(fā)明方法中編碼的流程框圖。
圖2為本發(fā)明方法中解碼的流程框圖。
圖3(a)和圖3(b)分別為人臉圖像及其人肩對象的描述方式。
圖4(a)為人肩對象形狀信息的鏈碼表示方式,圖4(b)為鏈碼的8個方向示意圖。
圖5顯示了小波系數(shù)的不同子帶構成以及編碼掃描順序;此時使用了3層小波變換,LLi、HLi、LH1、HHi分別表示第i層的四個不同子帶。箭頭表明小波系數(shù)在基于對象的嵌入式編碼中的搜索順序。
圖6為單對象和雙對象時,M(r,c)時域取值以及經(jīng)過適形小波變換后頻域取值的形象示意圖。
圖7(a)基于對象的嵌入式編碼的第一輪編碼過程示意圖,圖7(b)基于對象的嵌入式編碼的第二輪編碼過程示意圖。
圖8是利用雙線性插值恢復背景區(qū)域。其中圖8(a)是所求背景點與多邊形不相交的情形,圖8(b)是所求背景點位于已知多邊形內(nèi)部的情形,圖8(c)是所求背景點位于已知多邊形外部,且與多邊形相交于兩點的情形。
圖9顯示了對一幅人臉彩色圖像的人肩提取過程和解碼效果,其中圖9(a)和圖9(b)給出了交互式人肩提取的過程,其中人肩提取的優(yōu)劣由下面的游標調(diào)整,將所提取出的背景用黑色標志,圖9(c)中左圖為一幅初始人臉圖像,右圖利用本發(fā)明的編解碼過程恢復的圖像。
圖1~圖9中,1是人肩對象,2是背景區(qū)域,3和4分別表示將一個對象拆分成兩個對象a和b,5是人肩對象形狀信息的鏈碼表示。
圖7中,code是算術編碼。其中code(0,m4),code(1,m4)code(2,m4)表示對正符號,負符號和零符號的算術編碼,m4是該三符號符號流的上下文標志。code(0,m3),code(1,m3),code(2,m3)和code(3,m3)表示對正符號,負符號,孤立零符號和零樹符號的算術編碼,m3是該四符號符號流的上下文標志。code(0,m2)和code(1,m2)表示非對象孤立零符號和非對象零樹符號的算術編碼,m2是該二符號符號流的上下文標志。code(0,m5),code(1,m5)表示對小波系數(shù)當前比特位的算術編碼,m5是該二符號符號流的上下文標志。
具體實施例方式
本發(fā)明提出的高壓縮比人像編碼方法,其流程如圖l所示,首先從待壓縮彩色人臉圖像中獲取人肩對象的形狀信息和紋理信息;對人肩對象的形狀信息進行鏈編碼,得到人肩對象形狀信息符號流,并進行算術編碼;對待壓縮彩色人臉圖像中除人肩對象以外的背景區(qū)域進行插值編碼,得到背景圖像區(qū)域符號流,并進行算術編碼;將待壓縮彩色人臉圖像從紅綠蘭即RGB空間變換到亮度色度色度即YUV空間,得到YUV空間上的人臉圖像根據(jù)人肩對象,分別對YUV三個分量上的人肩對象的形狀信息和紋理信息進行適形小波變換,獲得三個分量上的人肩對象的紋理信息即小波系數(shù)以及小波域上的人肩對象的形狀信息;對人肩對象小波系數(shù)和小波域上的人肩對象形狀信息進行基于對象的嵌入式編碼,得到小波系數(shù)的嵌入式編碼符號流,并進行算術編碼,完成彩色人臉圖像的壓縮編碼。
本發(fā)明提出的高壓縮比人像解碼方法,其流程如圖2所示,對輸入的彩色人臉圖像的壓縮碼流進行算術解碼,得到人肩對象形狀信息符號流和背景圖像區(qū)域符號流,并依次分別進行鏈解碼和插值解碼,得到人肩對象的形狀信息和背景圖像區(qū)域;對人肩對象的形狀信息進行適形小波變換,得到小波域上的人肩對象形狀信息;根據(jù)小波域上的人肩對象形狀信息,對輸入的彩色人臉圖像的壓縮碼流進行算術解碼,得到小波系數(shù)的嵌入式編碼符號流,并進行基于對象的嵌入式解碼,得到人肩對象小波系數(shù)即紋理信息;分別對小波域上的人肩對象形狀信息和紋理信息進行適形小波逆變換,依次得到YUV空間三個分量上的彩色人肩對象的圖像;對YUM空間的彩色人肩對象的圖像進行顏色空間的反變換,獲得RGB空間上的人肩對象重構圖像;將人肩對象重構圖像與背景圖像區(qū)域疊加,獲得重構的彩色人臉圖像。
上述編碼方法中,從人臉圖像中獲取人肩對象的形狀信息的方法,包括如下步驟獲取人肩對象的形狀信息(如圖3(五)所示)需要計算人臉圖像中各點的邊緣梯度向量 并由此得到邊緣振幅圖 和邊緣梯度方向圖 l→(x,y)={I(x,y)*∂G(x,y)∂x,I(x,y)*∂G(x,y)∂y}]]>|l→(x,y)|=(I(x,y)*∂G(x,y)∂x)2+(I(x,y)*∂G(x,y)∂x)2]]>∠l→(x,y)=arctg(I(x,y)*∂G(x,y)∂y/I(x,y)*∂G(x,y)∂x)]]>上式中,I(x,y)為圖像函數(shù),G(x,y)=12πσex2+y22σ2,]]>其中的σ值為l~5,符號*為卷積;具體計算的時候,先用∂G(x,y)∂x,∂G(x,y)∂y]]>生成兩個圖像模板,然后用模板和圖像函數(shù)I(x,y)做卷積得到邊緣梯度向量 取邊緣梯度向量的振幅獲得邊緣振幅圖 根據(jù)上述圖像函數(shù)I(x,y)的最大值,設定邊緣振幅的門限值,將上述各點的計算邊緣振幅與設定門限值進行比較,使邊緣振幅二值化,得到邊界為1,背景為0的二值圖像。在該二值圖像的左上角和右上角選取門限值為0的種子點,進行區(qū)域增長,獲得連通的背景區(qū)域,其余區(qū)域則為人肩對象區(qū)域;最后在上述邊緣振幅圖中,根據(jù)上述人肩對象區(qū)域的邊界,尋找邊緣振幅的局部最大點,作為人肩對象的邊界。邊緣振幅的門限值通常缺省設為邊緣振幅圖 的最大值的1/10,這時所完成的人肩對象提取不需要人為干預,因此是全自動的人肩對象提取方法,該方法對于一般的人臉圖像都能保證比較完全準確地提取人肩對象。在某些特殊情況下,對有些特殊的人像,缺省門限值并不能保證我們能夠完全準確地提取人肩對象,這個時候,可以在程序中加入控件,使用者可以通過對控件的操作,協(xié)助計算機在缺省門限值附近的一個區(qū)間選擇不同的門限值,計算機根據(jù)這個門限值進行人肩對象提取,并將提取結果動態(tài)的反饋給使用者。使用者通過計算機反饋的信息進行判斷,如果分割準確,使用者就接受目前的提取結果,如果不準確,就操作控件選擇下一個分割參數(shù),繼續(xù)提取。這種人肩對象提取方式,叫做交互式的人肩對象提取方法。如圖9(a)所示,使用者可以通過移動游標到不同的位置,來選擇不同的門限參數(shù),達到對人肩對象進行交互式提取的目的。由于該提取方法中控制只在一維方向上變化,因此交互工作非常簡單,分割提取準確。
一般地,整個人肩對象可以看成一個單一的對象;但是,有時為更好地利用小波變換進行有效編碼,也可以根據(jù)不同部位的特點及其重要性差異,將其分成若干對象,如圖3(b)給出了兩個對象的情形。
上述編碼方法中,對人肩對象的形狀信息進行編碼的方法,包括如下步驟首先對人肩對象的形狀信息進行鏈碼跟蹤,得到如圖4(a)所示的人肩區(qū)域的鏈碼D
、D[1]、…….D[i-1]、D[i]……D[n];其中n為鏈碼長度,D為鏈碼方向,分別可以在0、1、2……7共8個方向中的取值,如圖4(b)所示。然后對于鏈碼中的每個D[i],依次進行差分運算,得到人肩對象形狀信息的編碼符號流。最后對上述人肩對象形狀信息的編碼符號流進行算術編碼,形狀信息的編解碼主要利用了鏈碼中相鄰鏈碼方向的相關性,通過差分預測,有效地降低信息量,提高壓縮比。
上述編碼方法中,對背景圖像區(qū)域進行編碼的方法有以下兩種第一種為直接計算背景區(qū)域的每一個圖像點顏色平均值,對平均值進行算術編碼,得到背景圖像區(qū)域碼流;第二種為在背景區(qū)域中取多個圖像點(通常取為四個),計算每個圖像點附近區(qū)域的背景圖像顏色的平均值,對平均值進行算術編碼,得到背景圖像區(qū)域碼流。
上述編碼方法中的嵌入式編碼的方法包括如下步驟如前所述,人臉圖像經(jīng)過人肩提取后所產(chǎn)生的對象可以是單對象(人肩對象),也可以多對象(由人肩對象分成的若干不同對象)。本發(fā)明的目的是對這些對象依次實現(xiàn)嵌入式編碼。不同對象的編碼方法完全相同;但是每個對象,可以根據(jù)需要分配不同的碼長具有重要視覺信息的對象分配更多的碼長,反之分配較少的碼長。
同一對象通過顏色空間轉換具有YUV三個顏色分量,不同分量的編碼方法相同,但是所分配的碼長不同。通常,Y分量比較重要,分配碼長較多,U、V分量相對次要,分配較少。一般U、V分量所分配的碼長為Y分量的1/10。
一個對象的一個分量在經(jīng)過適形小波變換以后,形成了小波域上的紋理信息和形狀信息。紋理信息即小波系數(shù),用C(r,c)表示,形狀信息用M(r,c)表示;基于對象的嵌入式編碼就是利用M(r,c)對小波系數(shù)C(r,c)進行嵌入式編碼。所謂嵌入式編碼,就是將信息按照重要性的順序,依次編碼。重要性的信息在前,不重要的信息在后。對于小波系數(shù)而言,重要性的判定原則是1)高比特位比低比特位重要;2)振幅高的小波系數(shù),比振幅低的小波系數(shù)重要;3)高層子帶的小波系數(shù)比低層子帶的小波系數(shù)重要。
本發(fā)明方法中的嵌入式編碼過程如下1)按比特面由高到低依次編碼,所謂比特面就是所有系數(shù)所對應的相同比特位的值形成一個比特位面,2)對同一個比特面,按照小波系數(shù)振幅大小的順序,對相同比特位依次編碼。小波系數(shù)按照振幅順序由大到小排列就形成了重要性點列。反映在具體的編碼過程中就是將每一個比特面編碼分成兩輪過程,第一輪過程是不斷形成、更新重要性點列,并對點列中小波系數(shù)的位置進行編碼,第二輪過程是進一步按順序對重要性點列中小波系數(shù)的當前比特位進行編碼。
3)在第一輪編碼過程中,也就是重要性點列的形成過程中,按照高層子帶到低層子帶的順序依次搜索所有小波系數(shù),對小波系數(shù)的位置進行編碼,并產(chǎn)生重要性點列。具體如圖5所示,左上角為最高層子帶,沿著箭頭方向,即LL3,HL3,LH3,HH3,HL2,LH2,HH2,HL1,LH1,HH1的順序,子帶層數(shù)依次降低。
4)在對小波系數(shù)進行嵌入式編碼時,充分利用了小波變換有大量零樹的特點,達到最佳的編碼效果,其中M(r,c)表示當前小波系數(shù)C(r,c)屬于哪一個對象。圖6給出了單對象和雙對象時,M(r,c)時域取值以及經(jīng)過適形小波變換后頻域取值的形象表示。其中(a)是單對象形狀信息的掩碼表示,(b)是單對象形狀信息在小波域上的掩碼表示,(c)是多對象形狀信息的掩碼表示,(d)是多對象形狀信息在小波域上的掩碼表示,各圖中黑色點的掩碼為0,代表背景區(qū)域。不同的灰度掩碼代表不同的對象。
利用小波系數(shù)的特點進行編碼,需要引進下述概念對于當前比特位面V,設定閾值T=2V;重要性點若|C(r,c)|>=T,則該小波系數(shù)所對應的點(r,c)是重要性點;非重要性點若|C(r,c)|<T,則該小波系數(shù)所對應的點(r,c)是非重要性點;子節(jié)點(r,c)的子節(jié)點為(2r,2c),(2r+1,2c),(2r,2c+1),(2r+1,2c+1);父節(jié)點(2r,2c),(2r+1,2c),(2r,2c+1),(2r+1,2c+1)的父節(jié)點是(r,c);后代節(jié)點(r,c)的所有后代節(jié)點為{(x,y),其中x∈[2nr,2nr+2n-1],y∈[2nc,2nc+2n-1],n>0,并且(x,y)屬于當前的對象}當(r,c)屬于當前對象,可以將其分成下列幾類符號正符號若(r,c)是重要性點且C(r,c)>0;負符號若(r,c)是重要性點且C(r,c)<0;零符號若(r,c)是非重要性點,并且該點沒有后代節(jié)點;零樹符號若(r,c)是非重要性點,并且該點所有的后代節(jié)點都是非重要性點;孤立零符號如果該點所有的后代節(jié)點中存在節(jié)點為重要性點;當(r,c)不屬于當前對象,可以將其分成下列幾類符號非對象零樹符號若(r,c)不是當前對象,并且該點所有的屬于當前對象的后代節(jié)點都是非重要性點;非對象孤立零符號若(r,c)不是當前對象,如果該點所有的屬于當前對象的后代節(jié)點中存在節(jié)點為重要性點;具體的編碼過程如下(1)根據(jù)編碼過程中所分配的固定碼長,對所有人肩對象YUV三個分量依次進行解碼;(2)將上述每個分量所對應的小波系數(shù),從高位的比特位面至低位的比特位面依次進行解碼,具體過程為(a)設定小波系數(shù)域值T,T=2V,其中V為當前比特面,建立小波系數(shù)重要性點列;(b)按照小波變換中的小波域子帶的順序LLn、HLn、LHn、HHn、HLn-1、LHn-1、HHn-1……、HL1、LH1、HH1,依次搜索小波變換域上與每個位置(r,c)相對應的小波系數(shù)C(r,c),以及相應的小波域的輪廓信息掩碼M(r,c),其中(r,c)為小波域上各點的坐標,判斷小波系數(shù)C(r,c)是否屬于當前對象,若是,進一步判斷該坐標(r,c)是否已處于重要性點列中,若處于重要性點列中,則結束該點的解碼,若不處于重要性點列中,則分別對屬于最高層LLn子帶和最底層HL1、LH1、HH1子帶的小波系數(shù)進行三符號上下文算術解碼,對屬于其它各層子帶HLn-1、LHn-1、HHn-1、……、HL2、LH2、HH2的小波系數(shù),進行四符號上下文算術解碼;同時更新重要性點列,若小波系數(shù)C(r,c)不屬于當前對象,則屬于最高層LLn子帶和最底層HL1、LH1、HH1子帶的小波系數(shù)不用解碼,對屬于其它各層子帶HLn-1、LHn-1、HHn-1、……、HL2、LH2、HH2的小波系數(shù),進行二符號上下文算術解碼;(c)對于重要性點列的所有小波系數(shù)的當前比特位進行二符號上下文算術解碼,并對重要性點列中的小波系數(shù)進行重排;關于基于對象的嵌入式編碼所涉及的兩輪編碼,更詳細的流程圖如圖7所示。
上述解碼方法中,對人肩對象信息進行解碼的方法,包括如下步驟(1)對人肩對象的形狀信息的壓縮碼流進行算術解碼,得到人肩對象形狀信息的編碼符號流;(2)對上述人肩對象形狀信息的編碼符號流進行差分解碼,得到鏈碼D[i];(3)用輪廓填充法對鏈碼進行輪廓填充,得到人肩對象的形狀信息。
上述解碼方法中,對背景圖像區(qū)域進行解碼的方法有兩種針對第一種編碼,直接算術解碼得到一個顏色平均值,將該值直接賦給背景區(qū)域所有點上;針對第二種編碼,直接算術解碼得到若干個顏色平均值,分別賦給背景區(qū)域的相同數(shù)量的點上,然后對于背景區(qū)域的其它點的象素值,利用雙線性插值計算相應的顏色值(值得注意的是,每個點上的顏色值有三個顏色分量)。如圖8中,背景區(qū)域中A,B,C,D點的顏色矢量已知,分別為IA,IB,IC和ID。對于背景區(qū)域中的任意點E,沿水平方向作一掃描線。針對下列情形分別對點E賦值1)如該掃描線與多邊形的邊不相交或者交于一點(圖8(a)),則將距離該掃描線最短的點A的顏色矢量賦給E。
2)該水平線與多邊形的邊交于兩點F,G.。如果所要求的背景區(qū)域中的任意點E位于多邊形ABCD的內(nèi)部(圖8(b)),其顏色矢量IE可以按下列式子計算得到IF=lFClBCIB+lBFlBCIC]]>IG=lGDlCDIC+lCGlCDID]]>IE=lEGlFGIF+lFElFGIG]]>其中l(wèi)FC表示F、C兩點之間的距離,其它類似。
如果所要求的背景區(qū)域中的任意點E位于多邊形ABCD的外部(圖8(c)),則其顏色矢量IE取為距離該點最近的相交點F的顏色矢量的值,其中F的顏色矢量同上面的計算公式。
上述解碼方法中的嵌入式解碼的方法包括如下步驟(1)根據(jù)編碼過程中所分配的固定碼長,對所有人肩對象YUV三個分量依次進行解碼;(2)將上述每個分量所對應的小波系數(shù),從高位的比特位面至低位的比特位面依次進行解碼,具體過程為
(a)設定小波系數(shù)域值T,T=2v,其中V為當前比特面,建立小波系數(shù)重要性點列;(b)按照小波變換中的小波域子帶的順序LLn、HLn、LHn、HHn、HLn-1、LHn-1、HHn-1……、HL1、LH1、HH1,依次搜索小波變換域上與每個位置(r,c)相對應的小波系數(shù)C(r,c),以及相應的小波域的輪廓信息掩碼M(r,c),其中(r,c)為小波域上各點的坐標,判斷小波系數(shù)C(r,c)是否屬于當前對象,若是,進一步判斷該坐標(r,c)是否已處于重要性點列中,若處于重要性點列中,則結束該點的解碼,若不處于重要性點列中,則分別對屬于最高層LLn子帶和最底層HL1、LH1、HH1子帶的小波系數(shù)進行三符號上下文算術解碼,對屬于其它各層子帶HLn-1、LHn-1、HHN-1、……、HL2、LH2、HH2的小波系數(shù),進行四符號上下文算術解碼;同時更新重要性點列,若小波系數(shù)C(r,c)不屬于當前對象,則屬于最高層LLn子帶和最底層HL1、LH1、HH1子帶的小波系數(shù)不用解碼,對屬于其它各層子帶HLn-1、LHn-1、HHn-1、……、HL2、LH2、HH2的小波系數(shù),進行二符號上下文算術解碼;(c)對于重要性點列的所有小波系數(shù)的當前比特位進行二符號上下文算術解碼,并對重要性點列中的小波系數(shù)進行重排;(3)當解碼的碼流長度達到上述固定碼長時,終止該對象的解碼。
為了對本發(fā)明的實用效果有更形象的理解,圖9中的(a)和(b)給出了交互式人肩對象提取過程,其中黑色標注了提取出的背景;而(c)則顯示了對具體人臉圖像的處理結果。其中圖9(c)左圖初始人臉彩色圖像大小為644*788,占用的存儲空間為644*788*3比特;利用本發(fā)明所描述的編碼技術,將其壓縮為存儲空間為1000比特的文件;對于此壓縮文件,利用本發(fā)明的解碼過程進行恢復,其效果如圖9(c)中右邊圖像。
權利要求
1.一種高壓縮比人像編碼方法,其特征在于該方法包括以下各步驟(1)從待壓縮彩色人臉圖像中獲取人肩對象的形狀信息和紋理信息;(2)對上述人肩對象的形狀信息進行鏈編碼,得到人肩對象形狀信息符號流,并進行算術編碼;(3)對上述待壓縮彩色人臉圖像中除人肩對象以外的背景區(qū)域進行插值編碼,得到背景圖像區(qū)域符號流,并進行算術編碼;(4)將上述待壓縮彩色人臉圖像從紅綠蘭即RGB空間變換到亮度色度色度即YUV空間,得到YUV空間上的人臉圖像;(5)根據(jù)上述第(1)步的人肩對象,分別對YUV三個分量上的人肩對象的形狀信息和紋理信息進行適形小波變換,獲得小波域上的人肩對象的紋理信息即小波系數(shù)以及小波域上的人肩對象的形狀信息;(6)對上述人肩對象小波系數(shù)和小波域上的人肩對象形狀信息進行基于對象的嵌入式編碼,得到小波系數(shù)的嵌入式編碼符號流,并進行算術編碼,完成彩色人臉圖像的壓縮。
2.一種高壓縮比人像解碼方法,其特征在于該方法包括以下各步驟(1)對輸入的彩色人臉圖像的壓縮碼流進行算術解碼,得到人肩對象形狀信息符號流和背景圖像區(qū)域符號流,并依次分別進行鏈解碼和插值解碼,得到人肩對象的形狀信息和背景圖像區(qū)域;(2)對上述人肩對象的形狀信息進行適形小波變換,得到小波域上的人肩對象形狀信息;(3)根據(jù)上述小波域上的人肩對象形狀信息,對輸入的彩色人臉圖像的壓縮碼流進行算術解碼,得到小波系數(shù)的嵌入式編碼符號流,并進行基于對象的嵌入式解碼,得到小波系數(shù),即小波域上的人肩對象紋理信息;(4)分別對上述小波域上的人肩對象形狀信息和紋理信息進行適形小波逆變換,依次得到YUV空間三個分量上的彩色人肩對象的圖像;(5)對上述YUV空間的彩色人肩對象的圖像進行顏色空間的反變換,獲得RGB空間上的人肩對象重構圖像;(6)將上述人肩對象重構圖像與背景圖像區(qū)域疊加,獲得重構的彩色人臉圖像。
3.如權利要求1所述的方法,其特征在于其中從人臉圖像中獲取人肩對象的形狀信息的方法,包括如下步驟(1)計算人臉圖像中各點的邊緣梯度向量 l→(x,y)={I(x,y)*∂G(x,y)∂x,]]>I(x,y)*∂G(x,y)∂y}]]>并由此得到邊緣振幅|l→(x,y)|=(I(x,y)*∂G(x,y)∂x)2+(I(x,y)*∂G(x,y)∂x)2;]]>和邊緣梯度方向∠l→(x,y)=arctg(I(x,y)*∂G(x,y)∂y/I(x,y)*∂G(x,y)∂x);]]>其中,I(x,y)為圖像函數(shù),G(x,y)=12πσex2+y22σ2,]]>其中的σ值為1~5,符號*為卷積;(2)根據(jù)圖像灰度,設定邊緣振幅的門限值,將上述各點的邊緣振幅與設定門限值進行比較,使邊緣振幅二值化,得到邊界為1,背景為0的圖像;(3)在上述圖像的左上角和右上角選取門限值為0的種子點,進行區(qū)域增長,獲得連通的背景區(qū)域,其余區(qū)域則為人肩對象區(qū)域;(4)在上述邊緣振幅圖中,根據(jù)上述人肩對象區(qū)域的邊界,沿邊緣梯度方向尋找邊緣振幅的局部最大點,作為人肩對象的邊界。
4.如權利要求1所述的方法,其特征在于其中對人肩對象的形狀信息進行編碼的方法,包括如下步驟(1)對人肩對象的形狀信息進行鏈碼跟蹤,得到表示人肩區(qū)域的鏈碼,該鏈碼為D
、D[1]、…….D[i-1]、D[i]……D[n],其中的n為鏈碼長度,D為鏈碼方向,分別為0、1、2……7,共8個方向;(2)對鏈碼中每個D[i],依次進行差分運算,得到人肩對象形狀信息的編碼符號流(3)對上述人肩對象形狀信息的編碼符號流進行算術編碼。
5.如權利要求1所述的方法,其特征在于其中對背景圖像區(qū)域進行編碼的方法為在背景區(qū)域中取多個圖像點,計算每個圖像點附近區(qū)域的背景圖像顏色的平均值,對平均值進行算術編碼,得到背景圖像區(qū)域碼流。
6.如權利要求1所述的方法,其特征在于,所述的嵌入式編碼的方法包括如下步驟(1)將人肩對象分成YUV三個分量,進行編碼,并根據(jù)圖像壓縮要求分配給每個顏色分量一個固定碼長;(2)將上述每個分量所對應的小波系數(shù),按照其振幅高低分成多個比特位面,從高位的比特位面至低位的比特位面依次進行編碼;(3)輸出碼流,當碼流長度達到上述固定碼長時,終止該對象的編碼。
7.如權利要求6所述的方法,其特征在于其中對每個分量所對應的小波系數(shù)進行編碼的方法,包括如下步驟(1)設小波系數(shù)的域值為T,T=2V,其中V為當前比特面,建立小波系數(shù)重要性點列;(2)按照小波變換中的小波域子帶的順序LLn、HLn、LHn、HHn、HLn-1、LHn-1、HHn-1……、HL1、LH1、HH1,依次搜索小波變換域上與每個位置(r,c)相對應的小波系數(shù)C(r,c)以及相應的小波域的形狀信息掩碼M(r,c),(r,c)為小波域上各點的坐標,判斷小波系數(shù)C(r,c)是否屬于當前對象,若是,進一步判斷該坐標(r,c)是否已處于重要性點列中,若處于重要性點列中,則結束該點的編碼,若不處于重要性點列中,則分別對屬于最高層LLn子帶和最底層HL1、LH1、HH1子帶的小波系數(shù)進行三符號上下文算術編碼,對屬于其它各層子帶HLn-1、LHn-1、HHn-1、……、HL2、LH2、HH2的小波系數(shù),進行四符號上下文算術編碼;同時更新重要性點列,若小波系數(shù)C(r,c)不屬于當前對象,則最高層LLn子帶和最底層HL1、LH1、HH1子帶的小波系數(shù)不用編碼,對其它各層子帶HLn-1、LHn-1、HHn-1、……、HL2、LH2、HH2的小波系數(shù),進行二符號上下文算術編碼;(3)對于重要性點列的所有小波系數(shù)的當前比特位進行二符號上下文算術編碼,并對重要性點列中的小波系數(shù)進行重排。
8.如權利要求2所述的方法,其特征在于其中對人肩對象信息進行解碼的方法,包括如下步驟(1)對人肩對象的形狀信息的壓縮碼流進行算術解碼,得到人肩對象形狀信息的編碼符號流;(2)對上述人肩對象形狀信息的編碼符號流進行差分解碼,得到鏈碼D[i];(3)用輪廓填充法對鏈碼進行輪廓填充,得到人肩對象的形狀信息。
9.如權利要求2所述的方法,其特征在于其中對背景圖像區(qū)域進行解碼的方法為對背景圖像區(qū)域碼流進行算術解碼,得到多個圖像點附近區(qū)域的背景圖像顏色的平均值,對多個平均值進行雙線性插值,獲得整個背景圖像區(qū)域。
10.如權利要求2所述的方法,其特征在于所述的嵌入式解碼的方法包括如下步驟(1)根據(jù)編碼過程中所分配的固定碼長,對所有人肩對象YUV三個分量依次進行解碼;(2)將上述每個分量所對應的小波系數(shù),從高位的比特位面至低位的比特位面依次進行解碼;(3)當解碼的碼流長度達到上述固定碼長時,終止該對象的解碼。
11.如權利要求10所述的方法,其特征在于其中對對象的每個分量所對應的小波系數(shù)進行解碼的方法,包括如下步驟(1)設定小波系數(shù)域值T,T=2V,其中V為當前比特面,建立小波系數(shù)重要性點列;(2)按照小波變換中的小波域子帶的順序LLn、HLn、LHn、HHn、HLn-1、LHn-1、HHn-1……、HL1、LH1、HH1,依次搜索小波變換域上與每個位置(r,c)相對應的小波系數(shù)C(r,c),以及相應的小波域的輪廓信息掩碼M(r,c),其中(r,c)為小波域上各點的坐標,判斷小波系數(shù)C(r,c)是否屬于當前對象,若是,進一步判斷該坐標(r,c)是否已處于重要性點列中,若處于重要性點列中,則結束該點的解碼,若不處于重要性點列中,則分別對屬于最高層LLn子帶和最底層HL1、LH1、HH1子帶的小波系數(shù)進行三符號上下文算術解碼,對屬于其它各層子帶HLn-1、LHn-1、HHn-1、……、HL2、LH2、HH2的小波系數(shù),進行四符號上下文算術解碼;同時更新重要性點列,若小波系數(shù)C(r,c)不屬于當前對象,則屬于最高層LLn子帶和最底層HL1、LH1、HH1子帶的小波系數(shù)不用解碼,對屬于其它各層子帶HLn-1、LHn-1、HHn-1、……、HL2、LH2、HH2的小波系數(shù),進行二符號上下文算術解碼;(3)對于重要性點列的所有小波系數(shù)的當前比特位進行二符號上下文算術解碼,并對重要性點列中的小波系數(shù)進行重排。
全文摘要
本發(fā)明涉及一種高壓縮比人像編碼方法,屬圖像壓縮技術領域。首先從圖像中獲取人肩對象的形狀和紋理信息;分別對形狀信息進行鏈編碼以及對背景區(qū)域進行插值編碼所得符號流進行算術編碼;將人臉圖像進行顏色空間變換;對人肩對象的形狀信息和紋理信息進行適形小波變換,對變換結果進行基于對象的嵌入式編碼,將所得嵌入式編碼符號流進行算術編碼,完成彩色人臉圖像的壓縮。上述過程的逆過程即為解碼方法。本發(fā)明的方法,對人肩對象的邊緣進行全自動或交互式的精確分割,降低了邊緣在小波變換后所需的信息量,既保持了高視覺質量,又提高了壓縮比,可廣泛應用于網(wǎng)絡傳輸、檔案管理、電子證件、嵌入式系統(tǒng)等對電子人像數(shù)據(jù)進行高壓縮比編碼的領域。
文檔編號G06T9/00GK1595454SQ20041004971
公開日2005年3月16日 申請日期2004年6月25日 優(yōu)先權日2004年6月25日
發(fā)明者閆宇松 申請人:閆宇松