專利名稱:面向多媒體傳感網(wǎng)分布式編解碼的邊信息估計(jì)方法
技術(shù)領(lǐng)域:
本發(fā)明是一種針對無線多媒體傳感器網(wǎng)絡(luò)(Wireless Multimedia Sensor Networks, WMSN)中多媒體數(shù)據(jù)壓縮的技術(shù)方案。采用基于離散余弦變換低頻系數(shù)的邊信息估計(jì)方法,盡可能降低節(jié)點(diǎn)的能耗同時提高解碼圖像的質(zhì)量,屬于計(jì)算機(jī)無線通信技術(shù)領(lǐng)域。
背景技術(shù):
近年來,伴隨著無線多媒體通信技術(shù)的迅速發(fā)展,一些新的視頻應(yīng)用需求開始出現(xiàn),如無線PC攝像機(jī)、移動可視電話、無線視頻監(jiān)控、無線多媒體傳感器網(wǎng)絡(luò)等。在這些新的視頻應(yīng)用中,由于受限于電源電量、存儲容量、計(jì)算能力、通信能力,無線視頻終端不僅需要較低復(fù)雜度的編碼,而且需要視頻信號實(shí)時編碼和傳輸。傳統(tǒng)的視頻編碼標(biāo)準(zhǔn)(如 MPEG、H. 26X)都采用了混合編碼框架,編碼采用運(yùn)動估計(jì),充分挖掘視頻序列的時間和空間相關(guān)性信息,一般情況下,編碼復(fù)雜度是解碼復(fù)雜度的5 10倍,不再適用于這些新的視頻應(yīng)用場合中,必須尋找新的編碼壓縮方法。一種全新的視頻編解碼框架一分布式視頻編碼 (Distributed Video Coding,DVC)已經(jīng)受到了學(xué)者的廣泛關(guān)注,這種視頻編碼突破了傳統(tǒng)視頻編碼的束縛,采用幀內(nèi)編碼和幀間解碼技術(shù),通過在解碼端發(fā)掘視頻信號的相關(guān)性進(jìn)行幀間預(yù)測解碼,從而去掉了編碼端復(fù)雜的幀間預(yù)測,具有低復(fù)雜編碼的特性,并且具有很好的編碼魯棒性特點(diǎn),能較好地滿足這些新的視頻應(yīng)用需求。目前典型的分布式編解碼方法主要有斯坦福大學(xué)Girod和Aaron等提出的Wyner-Ziv視頻編碼,加州大學(xué)伯克利分校的Ramchandran等提出的PRISM (Power-efficient Robust high-compression Syndrome-base Multimedia)視步頁編石馬, Zixiang Xiong等提出的分層Wyner-Ziv視頻編碼,Sehgal等提出的state-free分布式視頻編碼,基于小波編碼的分布式視頻編碼以及多視角分布式視頻編碼等。由于在分布式視頻編解碼系統(tǒng)中的解碼端,進(jìn)行運(yùn)動估計(jì)開發(fā)時域相鄰幀的相關(guān)信息,因此系統(tǒng)中編碼器可以較為簡單,把計(jì)算量較大的幀間預(yù)測轉(zhuǎn)移到解碼端。Wyner-Ziv分布式視頻編碼由關(guān)鍵幀(Key幀)編碼器和Wyner-Ziv幀(W幀)編碼器兩部分組成,Key幀編碼器采用傳統(tǒng)的幀內(nèi)編解碼的方式,而W幀采用幀內(nèi)編碼和幀間解碼相結(jié)合的方式。W幀編碼時,先進(jìn)行基于塊的DCT變換和量化,然后采用Slepian-Wolf編碼器進(jìn)行編碼。編碼器將編碼生成的校驗(yàn)位存儲在編碼端的緩沖器中,根據(jù)解碼端的解碼反饋請求,發(fā)送校驗(yàn)位給解碼器進(jìn)行糾錯解碼。解碼時,Slepian-Wolf解碼器根據(jù)解碼邊信息和接收到的校驗(yàn)位進(jìn)行解碼,若根據(jù)當(dāng)前已接收的校驗(yàn)信息仍不能實(shí)現(xiàn)正確的解碼,則需要通過反饋信道請求編碼端緩存器繼續(xù)發(fā)送校驗(yàn)碼。解碼端再重新進(jìn)行解碼,直到能夠正確解碼為止。之后解碼后的系數(shù)進(jìn)行IDCT和反量化以及解碼重建。文獻(xiàn)基于turbo或LDPC對Wyner-Ziv幀的所有區(qū)域不加區(qū)別的編碼,這種方式的編碼處理,對于運(yùn)動比較劇烈的區(qū)域,運(yùn)動估計(jì)技術(shù)不能夠準(zhǔn)確預(yù)測,解碼時需要向編碼端請求較多的反饋信息,這樣不僅增加了碼率,而且解碼的部分圖像仍不夠準(zhǔn)確。針對此問題,本發(fā)明首先介紹了 Wyner-Ziv分布式視頻編碼的理論,在此基礎(chǔ)上提出了一種改進(jìn)的Wyner-Ziv分布式編碼方法,通過感興趣區(qū)域(Region of Interest,R0I)判定準(zhǔn)則得到運(yùn)動劇烈區(qū)域和非運(yùn)動劇烈區(qū)域。對于運(yùn)動運(yùn)動劇烈區(qū)域,提取其離散余弦變換(Discrete Cosine Transform, DCT)低頻系數(shù)作為DCT hash用來輔助解碼端進(jìn)行解碼,并對DCT低頻系數(shù)進(jìn)行Huffman解碼壓縮,解碼端利用已解碼的DCT低頻系數(shù)進(jìn)行雙向hash運(yùn)動估計(jì),采用基于DCT hash運(yùn)動內(nèi)插生成最佳邊信息。而對于非運(yùn)動劇烈區(qū)域則不提取DCT低頻系數(shù),不進(jìn)行DCT低頻系數(shù)壓縮傳送,采用傳統(tǒng)的運(yùn)動內(nèi)插方法生成邊信息,最終實(shí)現(xiàn)視頻的優(yōu)化傳輸。
發(fā)明內(nèi)容
技術(shù)問題本發(fā)明的目的是提出適合多媒體傳感器網(wǎng)的分布式視頻編碼中基于DCThash (離散余弦變換低頻系數(shù))的邊信息估計(jì)方法,解決視頻應(yīng)用中數(shù)據(jù)量大的問題。通過使用本發(fā)明提出的方法在降低碼率的同時可以得到最佳邊信息,進(jìn)而提高了解碼圖像的質(zhì)量,最終降低傳感器節(jié)點(diǎn)能耗,延長了無線傳感網(wǎng)絡(luò)生存周期。技術(shù)方案本發(fā)明的方法是一種改進(jìn)性的方法,該方法將非關(guān)鍵幀(Wyner-Zivframe,WZ)的ROI (Region of Interest,感興趣區(qū)域)宏塊中DCT (離散余弦變換)低頻系數(shù)提取出來進(jìn)行熵編解碼,對ROKRegion of Interest,感興趣區(qū)域)宏塊解碼端利用接收到的DCT (離散余弦變換)低頻系數(shù)進(jìn)行雙向運(yùn)動估計(jì)內(nèi)插生成ROI (Region of Interest,感興趣區(qū)域)宏塊邊信息,而對非ROI (Region of Interest,感興趣區(qū)域)區(qū)域使用解碼出的幀進(jìn)行運(yùn)動補(bǔ)償幀內(nèi)插(或外推)生成非ROI (Region of Interest,感興趣區(qū)域)宏塊邊信息,進(jìn)而生成最佳非關(guān)鍵幀邊信息。通過以上改進(jìn)可以降低碼率,提高解碼圖像的質(zhì)量,降低傳感器節(jié)點(diǎn)能耗,延長無線傳感器網(wǎng)絡(luò)生存周期。體系結(jié)構(gòu)
本方法在Wyner-Ziv分布式視頻編碼方案的基礎(chǔ)上,通過ROI判定準(zhǔn)則提取運(yùn)動劇烈區(qū)域并提取該區(qū)域的DCT低頻系數(shù)進(jìn)行Huffman解碼壓縮,解碼端利用已解碼的DCT低頻系數(shù)進(jìn)行雙向運(yùn)動估計(jì),進(jìn)行DCT hash (離散余弦變換低頻系數(shù))運(yùn)動內(nèi)插生成最佳邊信息,其余區(qū)域則基于LDPC分布式編解碼,進(jìn)而在降低碼率的同時提高解碼圖像質(zhì)量,降低節(jié)點(diǎn)的處理和傳輸能耗,實(shí)現(xiàn)視頻的優(yōu)化傳輸,延長整個網(wǎng)絡(luò)的生存周期。本方法基于Wyner-Ziv分布式視頻編碼方案,將視頻序列分為兩種不同的幀關(guān)鍵字(Key 儀1^,10和非關(guān)鍵幀(171161-2& frame,WZ)。對關(guān)鍵幀采用傳統(tǒng)的JPEG編碼方式,利用ROI區(qū)分方法將Wyner-Ziv幀分為ROI區(qū)域和非ROI區(qū)域,對Wyner-Ziv幀的ROI區(qū)域提取其DCT低頻系數(shù)采用熵編解碼的方式,ROI區(qū)域其余部分以及非ROI區(qū)域采用LPDC的編解碼方式。具體步驟如下(1)在編碼端a)幀分離器將編碼端輸入的視頻序列分為關(guān)鍵中貞(Key 中貞)禾口 Wyner-Ziv 中貞(WZ 中貞);b) DCT (Discrete Cosine Transform)變換對 W 中貞進(jìn)行基于塊的離散余弦變換(Discrete Cosine Transform, DCT) ;c)量化對每個DCT變換后的系數(shù)進(jìn)行量化;d)編碼使用傳統(tǒng)的JPEG技術(shù)編碼Key幀,利用ROI提取方法將Wyner-Ziv幀區(qū)分為ROI區(qū)域和非ROI區(qū)域?qū)OI區(qū)域提取其DCT低頻系數(shù)進(jìn)行Huffman解碼,對ROI的其余部分以及非ROI區(qū)域采用LDPC編碼;(2)在解碼端a)生成邊信息對于ROI區(qū)域,使用解碼出的幀采用基于DCT hash運(yùn)動估計(jì)內(nèi)插生成邊信息。而對非ROI區(qū)域使用解碼出的幀進(jìn)行運(yùn)動補(bǔ)償幀內(nèi)插(或外推)生成邊信息;b)相關(guān)噪聲模型WZ幀和邊信息之間對應(yīng)的DCT系數(shù)的殘差統(tǒng)計(jì)當(dāng)作一個拉普拉斯分布進(jìn)行建模;c)解碼對Key幀,使用傳統(tǒng)的JPEG技術(shù)解碼,對Wyner-Ziv幀的ROI區(qū)域的DCT低頻系數(shù)采用Huffman解碼,ROI區(qū)域其余部分以及非ROI區(qū)域采用LDPC解碼;d)重構(gòu)在邊信息的輔助下,重建所有的DCT系數(shù);e)反變換對重建后的系數(shù)執(zhí)行反離散余弦變換(Inverse Discrete CosineTransform, IDCT) ; (3)幀混合將解碼后的Key幀和WZ幀整合為視頻流。
二、方法流程
本方法包括以上所述4個步驟,詳細(xì)論述如下
基于離散余弦變換部分低頻系數(shù)的邊信息估計(jì)方法,加強(qiáng)對運(yùn)動劇烈區(qū)域編碼,進(jìn)一步提高解碼圖像的主觀質(zhì)量,該方法具體如下
1)在編碼端
a)幀分離器視頻序列被分為關(guān)鍵幀和非關(guān)鍵幀,其中關(guān)鍵幀周期性的插入,取決于圖像組的大小,幀分離器將視頻序列分為不同的幀,每兩個關(guān)鍵幀之間所分配的非關(guān)鍵幀的數(shù)目不同,關(guān)鍵幀采用幀內(nèi)編碼,非關(guān)鍵幀采用低密度奇偶校驗(yàn)碼編碼;
b)離散余弦變換基于塊的變換,特別地把離散余弦變換應(yīng)用到每個非關(guān)鍵幀上,非關(guān)鍵幀被劃分為互不重疊的塊,依據(jù)每個塊的離散余弦變換系數(shù)所處的位置,形成不同的離散余弦變換系數(shù)集;
c)量化每個離散余弦變換集被統(tǒng)一的量化,這些量化級依賴于所要得到圖像的質(zhì)量,對于一個給定的集合,量化信號的位流被一起分組,形成位平面,然后獨(dú)立地進(jìn)行編碼;
d)編碼對于關(guān)鍵幀,使用傳統(tǒng)的聯(lián)合圖像專家組進(jìn)行編碼,利用感興趣區(qū)域區(qū)分方法將非關(guān)鍵幀分為感興趣區(qū)域和非感興趣區(qū)域?qū)τ诟信d趣區(qū)域中的離散余弦變換低頻系數(shù)采用霍夫曼編碼,對于感興趣區(qū)域的其余部分以及非感興趣區(qū)域采用低密度奇偶校驗(yàn)碼編碼;
2)在解碼端
a)生成邊信息對于感興趣區(qū)域,使用解碼出的幀采用基于離散余弦變換低頻系數(shù)運(yùn)動內(nèi)插生成感興趣宏塊邊信息;而對非感興趣區(qū)域使用解碼出的幀進(jìn)行運(yùn)動補(bǔ)償幀內(nèi)插或外推生成非感興趣宏塊邊信息,進(jìn)而得到非關(guān)鍵幀的邊信息;每個非關(guān)鍵幀的邊信息被當(dāng)作原始非關(guān)鍵幀的估計(jì)值,估計(jì)值的質(zhì)量越好,低密度奇偶校驗(yàn)碼解碼端需要改正的“錯誤”越少,并且向緩沖器所請求的奇偶校驗(yàn)位或位流越少;
b)相關(guān)噪聲模型非關(guān)鍵幀和邊信息中對應(yīng)的離散余弦變換系數(shù)的殘差統(tǒng)計(jì)被假定為一個服從拉普拉斯分布的模型,其參數(shù)使用離線的訓(xùn)練模式進(jìn)行初始化估計(jì);
c)低密度奇偶校驗(yàn)碼解碼關(guān)鍵幀使用傳統(tǒng)的聯(lián)合圖像專家組技術(shù)進(jìn)行解碼;非關(guān)鍵幀的感興趣區(qū)域中離散余弦變換低頻系數(shù)使用霍夫曼進(jìn)行解碼復(fù)原;對于非關(guān)鍵幀感興趣其余部分以及非感興趣區(qū)域,只要得到邊信息離散余弦變換系數(shù)和一個給定離散余弦變換系數(shù)的殘差統(tǒng)計(jì),每個位平面可以進(jìn)行低密度奇偶校驗(yàn)碼解碼,從最重要的位平面開始解碼;在低密度奇偶校驗(yàn)碼解碼器的請求下,編碼器通過反饋信道發(fā)送一些奇偶校驗(yàn)消息,為了判定解碼某個特定的位平面是否需要更多的校驗(yàn)位,解碼器采用一個請求停止標(biāo)準(zhǔn),當(dāng)?shù)兔芏绕媾夹r?yàn)碼正確地解碼一個離散余弦變換集的最重要位平面之后,低密度奇偶校驗(yàn)碼解碼器將以統(tǒng)一的方式處理其余相關(guān)的集合,當(dāng)所有的離散余弦變換集合的位平面都被
6低密度奇偶校驗(yàn)碼正確地解碼時,解碼器則開始解碼下一個集合;
d)重構(gòu)在低密度奇偶校驗(yàn)碼解碼后,所有的位平面及每個離散余弦變換集合被一起分組,以形成解碼的量化信號流和集合,一旦可以獲得所有的解碼量化信號,在相應(yīng)的邊信息系數(shù)的輔助下,便可重構(gòu)所有的離散余弦變換系數(shù),對于所傳輸?shù)牟缓顷P(guān)鍵幀位流的離散余弦變換系數(shù)集合,由邊信息對應(yīng)的離散余弦變換集合來代替;
e)反變換當(dāng)所有的離散余弦變換集被重建以后,執(zhí)行反離散余弦變換,由此便可得到解碼的非關(guān)鍵幀;
3)幀混合
對于已經(jīng)正確解碼的各幀,即利用傳統(tǒng)的聯(lián)合圖像專家組編解碼的關(guān)鍵幀和利用低密度奇偶校驗(yàn)碼及霍夫曼混合編解碼的非關(guān)鍵幀,根據(jù)在編碼端所采用的編碼圖像組的大小,將關(guān)鍵幀和非關(guān)鍵幀按圖像組的相應(yīng)次序混合成視頻流,進(jìn)而恢復(fù)成解碼后的視頻序列,至此,視頻編解碼壓縮處理結(jié)束。所述感興趣區(qū)域中離散余弦變換低頻系數(shù)采用霍夫曼編碼的過程如下將待編碼的灰度級按出現(xiàn)的次數(shù)排序,出現(xiàn)次數(shù)多的在前面,次數(shù)少的在后面;取出現(xiàn)次數(shù)最少的兩個數(shù)的次數(shù)相加,之和作為一個新的出現(xiàn)次數(shù)的集合元素并重新排序,新出現(xiàn)的次數(shù)在新集合中仍遵循降序規(guī)則以確定所處的位置,相加的兩個次數(shù)最少所對應(yīng)的灰度級成為霍夫曼樹的一個葉結(jié)點(diǎn),這兩個結(jié)點(diǎn)構(gòu)造一個雙親結(jié)點(diǎn),重復(fù)該步驟,直到所有的灰度級都被用來構(gòu)造霍夫曼樹為止;設(shè)所有結(jié)點(diǎn)的左孩子為“0”,右孩子為“ 1”,則從根開始,經(jīng)各中間結(jié)點(diǎn)到葉結(jié)點(diǎn)的路徑代碼即是該葉結(jié)點(diǎn)的霍夫曼碼;對于非感興趣區(qū)域的每個離散余弦變換集合,從最重要的位平面進(jìn)行低密碼奇偶校驗(yàn)碼編碼;對于每個位平面,所生成的奇偶檢驗(yàn)信息被存儲在緩沖器中,在解碼端的請求下,通過反饋機(jī)制,不斷地發(fā)送校驗(yàn)信息。所述的關(guān)鍵幀,使用傳統(tǒng)的聯(lián)合圖像專家組進(jìn)行編碼,利用感興趣區(qū)域區(qū)分方法將非關(guān)鍵幀分為感興趣區(qū)域和非感興趣區(qū)域?qū)τ诟信d趣區(qū)域中離散余弦變換低頻系數(shù)采用霍夫曼編解碼,對于感興趣區(qū)域其余部分以及非感興趣區(qū)域采用低密度奇偶校驗(yàn)碼進(jìn)行編解碼,具體步驟如下
步驟1)將每幀分成大小相等且互不重疊的8X8宏塊;
步驟2)計(jì)算關(guān)鍵幀和非關(guān)鍵幀相同位置宏塊的絕對差值之和;
步驟3)根據(jù)感興趣區(qū)域宏塊的判定準(zhǔn)則,對非關(guān)鍵幀每個宏塊進(jìn)行感興趣區(qū)域區(qū)
分;
步驟4)提取非關(guān)鍵幀中感興趣宏塊的離散余弦變換低頻系數(shù)進(jìn)行霍夫曼編解碼壓
縮;
步驟5):對非關(guān)鍵幀中感興趣宏塊的其余部分以及非感興趣宏塊則采用低密度奇偶校驗(yàn)碼編解碼壓縮;
步驟6)在解碼端對非關(guān)鍵幀的感興趣宏塊利用已得到的離散余弦變換低頻系數(shù)進(jìn)行雙向運(yùn)動估計(jì)內(nèi)插生成感興趣宏塊邊信息;
步驟7)在解碼端對非關(guān)鍵幀的非感興趣宏塊進(jìn)行運(yùn)動補(bǔ)償幀內(nèi)插或外推生成非感興趣宏塊邊信息;
步驟8)利用生成的感興趣宏塊邊信息和非感興趣宏塊邊信息得到非關(guān)鍵幀的最佳邊信息,進(jìn)而對非關(guān)鍵幀進(jìn)行解碼。
有益效果本發(fā)明方法提出了一種改進(jìn)的Wyner-Ziv分布式視頻壓縮方法,主要是用來解決無線多媒體傳感器網(wǎng)絡(luò)中視頻數(shù)據(jù)量大所帶來的網(wǎng)絡(luò)節(jié)點(diǎn)能耗大,網(wǎng)絡(luò)生存周期短的問題,并滿足人們對解碼圖像質(zhì)量以及視頻實(shí)時性的需求。對應(yīng)實(shí)現(xiàn)方案有如下優(yōu)點(diǎn)1.編碼簡單相對于傳統(tǒng)的視頻編碼標(biāo)準(zhǔn)(如MPEG系列,H.26x),本發(fā)明由于采用Wyner-Ziv分布式視頻編碼方案,編碼端簡單,解碼端復(fù)雜。分布式視頻編碼將運(yùn)動估計(jì)和及運(yùn)動補(bǔ)償所帶來的編碼端的高復(fù)雜性、大計(jì)算量轉(zhuǎn)移到解碼端,而解碼端一般位于匯聚節(jié)點(diǎn)或網(wǎng)絡(luò)中心,充分利用匯聚節(jié)點(diǎn)和網(wǎng)絡(luò)中心計(jì)算能力強(qiáng)、存儲能力大、持續(xù)供電的優(yōu)點(diǎn),完成對視頻的壓縮編碼。2.低碼率本發(fā)明可以設(shè)置圖像的GOP的大小,并對WZ幀采用了 LDPC和Huffman相結(jié)合的編解碼方式生成最佳邊信息,向緩沖器所請求的奇偶校驗(yàn)位較少,從而大大降低了編碼的碼率。3.能耗低本發(fā)明由于可以改變Key幀之間WZ幀的數(shù)量,減少了待處理的視頻流的數(shù)據(jù)量,從而降低了每個傳感器節(jié)點(diǎn)的編碼處理能耗,進(jìn)而延長了整個網(wǎng)絡(luò)的生命周期。4.實(shí)時性本發(fā)明由于對視頻數(shù)據(jù)的壓縮率高,壓縮編碼后的數(shù)據(jù)量小,因此減少了傳輸?shù)臄?shù)據(jù)量,優(yōu)化了實(shí)時傳輸,進(jìn)而保證了視頻流傳輸?shù)膶?shí)時性。5.可靠性本發(fā)明由于采用了 ROI提取方法,將WZ幀分為ROI區(qū)域和非ROI區(qū)域,對ROI區(qū)域中的低頻系數(shù)采用Huffman編解碼方式,能更準(zhǔn)確的對ROI區(qū)域進(jìn)行解碼,提高了解碼的準(zhǔn)確性,進(jìn)而實(shí)現(xiàn)了對視頻編碼壓縮可靠性的要求。
圖1是分布式視頻編碼示意圖。如圖,分布式視頻編碼框架包括低復(fù)雜度編碼器和高復(fù)雜度解碼器。圖2是分布式編解碼示意圖。如圖,采用幀內(nèi)編碼和幀間解碼相結(jié)合的方式,在編碼端,采用幀內(nèi)編碼技術(shù)相互獨(dú)立地編碼兩個或者多個相關(guān)的信源,將編碼位流發(fā)送到接收端;在解碼端,利用各個信源間的相關(guān)性,進(jìn)行聯(lián)合預(yù)測解碼。圖3是本發(fā)明基于DCT hash (離散余弦變換低頻系數(shù))的Wyner-Ziv分布式視頻編碼示意圖。利用ROI區(qū)分方法將WZ幀區(qū)分為ROI區(qū)域和非ROI區(qū)域,然后對ROI區(qū)域的低頻系數(shù)進(jìn)行Huffman編解碼,ROI區(qū)域的其余部分以及非ROI區(qū)域進(jìn)行LDPC編解碼。圖4是本發(fā)明方法的整個流程圖。如圖所示,描述了基于DCT hash (離散余弦變換低頻系數(shù))的Wyner-Ziv分布式視頻編解碼的全過程。
具體實(shí)施例方式該方法在Wyner-Ziv分布式視頻編碼方案的基礎(chǔ)上,通過ROI判定準(zhǔn)則提取運(yùn)動劇烈區(qū)域并提取該區(qū)域的DCT低頻系數(shù)進(jìn)行Huffman解碼壓縮,解碼端利用已解碼的DCT低頻系數(shù)進(jìn)行雙向運(yùn)動估計(jì),進(jìn)行DCT hash (離散余弦變換低頻系數(shù))運(yùn)動內(nèi)插生成最佳邊信息,其余區(qū)域則基于LDPC分布式編解碼,進(jìn)而在降低碼率的同時提高解碼圖像質(zhì)量,降低節(jié)點(diǎn)的處理和傳輸能耗,實(shí)現(xiàn)視頻的優(yōu)化傳輸,延長整個網(wǎng)絡(luò)的生存周期。本方法基于Wyner-Ziv分布式視頻編碼方案,將視頻序列分為兩種不同的幀關(guān)鍵幀(Key Frame, K幀)和Wyner-Ziv幀(WZ幀)。對關(guān)鍵幀采用傳統(tǒng)的JPEG編碼方式,利用ROI區(qū)分方法將Wyner-Ziv幀分為ROI區(qū)域和非ROI區(qū)域,對于Wyner-Ziv幀的ROI區(qū)域中DCT低頻系數(shù)采用Huffman編解碼的方式,ROI區(qū)域的其余部分以及非ROI區(qū)域采用 LPDC的編解碼方式。本方法的實(shí)施分為4個階段i )在編碼端;ii )在解碼端;iii)幀混合,具體描述如下
第一階段在編碼端該階段分為以下幾個處理過程
a)幀分離器視頻序列被分為Wyner-Ziv幀(WZ幀)和關(guān)鍵幀(Key幀),其中關(guān)鍵幀周期性的插入,取決于GOP (Group of Pictures)大小。利用幀分離器將視頻序列分為不同的幀,對于每個不同的視頻序列,由于編碼結(jié)構(gòu)的不同,每幀的被賦予的屬性不同,因而,采用的編碼處理方式也不同。b)空間變換基于塊的變換,特別地把DCT變換應(yīng)用到每個WZ幀。依據(jù)每個塊的 DCT系數(shù)所處的位置,將整個WZ幀的DCT系數(shù)被分為不同的組,從而形成不同的DCT系數(shù)集。c)量化每個DCT集被統(tǒng)一的量化,這些量化級依賴于所要得到圖像的質(zhì)量。對于一個給定的集合,量化信號的位流被一起分組,形成位平面,然后獨(dú)立地進(jìn)行編碼。d)編碼對于Key幀,使用傳統(tǒng)的JPEG技術(shù)編碼,利用ROI區(qū)分方法將Wyner-Ziv 幀分為ROI區(qū)域和非ROI區(qū)域?qū)τ赗OI區(qū)域低頻系數(shù)采用Huffman編碼,對于ROI區(qū)域
其余以及非ROI區(qū)域采用LDPC編碼。ROI區(qū)域的DCT低頻系數(shù)采用Huffman編碼。對
于
ROI區(qū)域的其余部分以及非ROI區(qū)域的每個DCT集,從最重要的位平面(Most Significant Bit_plane,MSB)開始進(jìn)行LDPC編碼。對于每個位平面(bit-plane),所生成的奇偶檢驗(yàn)信息被存儲在緩沖器中,在解碼端的請求下,通過反饋機(jī)制,不斷地發(fā)送校驗(yàn)信肩、ο第二階段在解碼端
該階段分為以下幾個處理過程
a)生成邊信息對于ROI區(qū)域,使用解碼出的幀采用基于DCT hash運(yùn)動內(nèi)插生成ROI 宏塊邊信息。而對非ROI區(qū)域使用解碼出的幀進(jìn)行運(yùn)動補(bǔ)償幀內(nèi)插(或外推)生成非ROI宏塊邊信息。進(jìn)而得到每個WZ幀的邊信息(Side hformation,Si)。每個WZ幀的邊信息被當(dāng)作原始WZ幀的一種估計(jì)值。估計(jì)值的質(zhì)量越好,LDPC解碼端需要改正的“錯誤”越少,并且向緩沖器所請求的奇偶校驗(yàn)位(或位流)越少。b)相關(guān)噪聲模型在WZ幀和邊信息中對應(yīng)的DCT系數(shù)的殘差統(tǒng)計(jì)被假定當(dāng)作一個服從拉普拉斯分布的模型,其參數(shù)使用離線(off-line)的訓(xùn)練階段進(jìn)行初始化估計(jì)。c ) LDPC解碼關(guān)鍵幀使用傳統(tǒng)的JPEG技術(shù)進(jìn)行解碼;WZ幀的ROI區(qū)域使用 Huffman進(jìn)行解碼復(fù)原;對于WZ幀的非ROI區(qū)域,只要得到了邊信息DCT系數(shù)和一個給定 DCT系數(shù)的殘差統(tǒng)計(jì),每個位平面可以進(jìn)行LDPC解碼(從MSB解碼)。在LDPC解碼器的請求下,編碼器通過反饋信道發(fā)送一些奇偶校驗(yàn)消息。為了判定正確的解碼某個特定的位平面是否需要更多的校驗(yàn)位,解碼器采用一個請求停止標(biāo)準(zhǔn)。當(dāng)成功地LDPC解碼一個DCT集的 MSB位平面之后,LDPC解碼器以一個統(tǒng)一的的方式處理其余相關(guān)的集。一旦所有的DCT集的位平面被成功地LDPC解碼,LDPC解碼器開始解碼下一個集。d)重構(gòu)在LDPC解碼后,所有的位平面及每個DCT集被一起分組,以形成解碼的量化信號流和每個集。一旦可以獲得所有的解碼量化信號,在相應(yīng)的邊信息系數(shù)的輔助下,便可重構(gòu)所有的DCT系數(shù)。對于所傳輸?shù)牟缓琖Z位流的DCT系數(shù)集由邊信息對應(yīng)的DCT集來代替。e)反變換當(dāng)所有的DCT集被重建以后,執(zhí)行IDCT,由此便可得到解碼的WZ幀。通過以上幾個處理過程,完成了對Key幀和WZ幀的正確解碼。第四階段幀混合
最后,對于已經(jīng)正確解碼的各幀,即利用傳統(tǒng)JPEG編解碼Key幀和利用LDPC及Huffman混合編解碼的WZ幀,根據(jù)在編碼端所采用的編碼結(jié)構(gòu)GOP的大小,將Key幀和WZ幀按GOP次序混合成視頻流,恢復(fù)成解碼后的視頻序列。視頻編解碼壓縮處理結(jié)束。
權(quán)利要求
1. 一種面向多媒體傳感網(wǎng)分布式編解碼的邊信息估計(jì)方法,其特征是基于離散余弦變換部分低頻系數(shù)的邊信息估計(jì)方法,加強(qiáng)對運(yùn)動劇烈區(qū)域編碼,進(jìn)一步提高解碼圖像的主觀質(zhì)量,該方法具體如下1)在編碼端a)幀分離器視頻序列被分為關(guān)鍵幀和非關(guān)鍵幀,其中關(guān)鍵幀周期性的插入,取決于圖像組的大小,幀分離器將視頻序列分為不同的幀,每兩個關(guān)鍵幀之間所分配的非關(guān)鍵幀的數(shù)目不同,關(guān)鍵幀采用幀內(nèi)編碼,非關(guān)鍵幀采用低密度奇偶校驗(yàn)碼編碼;b)離散余弦變換基于塊的變換,特別地把離散余弦變換應(yīng)用到每個非關(guān)鍵幀上,非關(guān)鍵幀被劃分為互不重疊的塊,依據(jù)每個塊的離散余弦變換系數(shù)所處的位置,形成不同的離散余弦變換系數(shù)集;c)量化每個離散余弦變換集被統(tǒng)一的量化,這些量化級依賴于所要得到圖像的質(zhì)量,對于一個給定的集合,量化信號的位流被一起分組,形成位平面,然后獨(dú)立地進(jìn)行編碼;d)編碼對于關(guān)鍵幀,使用傳統(tǒng)的聯(lián)合圖像專家組進(jìn)行編碼,利用感興趣區(qū)域區(qū)分方法將非關(guān)鍵幀分為感興趣區(qū)域和非感興趣區(qū)域?qū)τ诟信d趣區(qū)域中的離散余弦變換低頻系數(shù)采用霍夫曼編碼,對于感興趣區(qū)域的其余部分以及非感興趣區(qū)域采用低密度奇偶校驗(yàn)碼編碼;2)在解碼端a)生成邊信息對于感興趣區(qū)域,使用解碼出的幀采用基于離散余弦變換低頻系數(shù)運(yùn)動內(nèi)插生成感興趣宏塊邊信息;而對非感興趣區(qū)域使用解碼出的幀進(jìn)行運(yùn)動補(bǔ)償幀內(nèi)插或外推生成非感興趣宏塊邊信息,進(jìn)而得到非關(guān)鍵幀的邊信息;每個非關(guān)鍵幀的邊信息被當(dāng)作原始非關(guān)鍵幀的估計(jì)值,估計(jì)值的質(zhì)量越好,低密度奇偶校驗(yàn)碼解碼端需要改正的“錯誤”越少,并且向緩沖器所請求的奇偶校驗(yàn)位或位流越少;b)相關(guān)噪聲模型非關(guān)鍵幀和邊信息中對應(yīng)的離散余弦變換系數(shù)的殘差統(tǒng)計(jì)被假定為一個服從拉普拉斯分布的模型,其參數(shù)使用離線的訓(xùn)練模式進(jìn)行初始化估計(jì);c)低密度奇偶校驗(yàn)碼解碼關(guān)鍵幀使用傳統(tǒng)的聯(lián)合圖像專家組技術(shù)進(jìn)行解碼;非關(guān)鍵幀的感興趣區(qū)域中離散余弦變換低頻系數(shù)使用霍夫曼進(jìn)行解碼復(fù)原;對于非關(guān)鍵幀感興趣其余部分以及非感興趣區(qū)域,只要得到邊信息離散余弦變換系數(shù)和一個給定離散余弦變換系數(shù)的殘差統(tǒng)計(jì),每個位平面可以進(jìn)行低密度奇偶校驗(yàn)碼解碼,從最重要的位平面開始解碼;在低密度奇偶校驗(yàn)碼解碼器的請求下,編碼器通過反饋信道發(fā)送一些奇偶校驗(yàn)消息,為了判定解碼某個特定的位平面是否需要更多的校驗(yàn)位,解碼器采用一個請求停止標(biāo)準(zhǔn),當(dāng)?shù)兔芏绕媾夹r?yàn)碼正確地解碼一個離散余弦變換集的最重要位平面之后,低密度奇偶校驗(yàn)碼解碼器將以統(tǒng)一的方式處理其余相關(guān)的集合,當(dāng)所有的離散余弦變換集合的位平面都被低密度奇偶校驗(yàn)碼正確地解碼時,解碼器則開始解碼下一個集合;d)重構(gòu)在低密度奇偶校驗(yàn)碼解碼后,所有的位平面及每個離散余弦變換集合被一起分組,以形成解碼的量化信號流和集合,一旦可以獲得所有的解碼量化信號,在相應(yīng)的邊信息系數(shù)的輔助下,便可重構(gòu)所有的離散余弦變換系數(shù),對于所傳輸?shù)牟缓顷P(guān)鍵幀位流的離散余弦變換系數(shù)集合,由邊信息對應(yīng)的離散余弦變換集合來代替;e)反變換當(dāng)所有的離散余弦變換集被重建以后,執(zhí)行反離散余弦變換,由此便可得到解碼的非關(guān)鍵幀;3)幀混合對于已經(jīng)正確解碼的各幀,即利用傳統(tǒng)的聯(lián)合圖像專家組編解碼的關(guān)鍵幀和利用低密度奇偶校驗(yàn)碼及霍夫曼混合編解碼的非關(guān)鍵幀,根據(jù)在編碼端所采用的編碼圖像組的大小,將關(guān)鍵幀和非關(guān)鍵幀按圖像組的相應(yīng)次序混合成視頻流,進(jìn)而恢復(fù)成解碼后的視頻序列,至此,視頻編解碼壓縮處理結(jié)束。
2.根據(jù)權(quán)利要求1所述的面向多媒體傳感網(wǎng)分布式編解碼的邊信息估計(jì)方法,其特征是所述感興趣區(qū)域中離散余弦變換低頻系數(shù)采用霍夫曼編碼的過程如下將待編碼的灰度級按出現(xiàn)的次數(shù)排序,出現(xiàn)次數(shù)多的在前面,次數(shù)少的在后面;取出現(xiàn)次數(shù)最少的兩個數(shù)的次數(shù)相加,之和作為一個新的出現(xiàn)次數(shù)的集合元素并重新排序,新出現(xiàn)的次數(shù)在新集合中仍遵循降序規(guī)則以確定所處的位置,相加的兩個次數(shù)最少所對應(yīng)的灰度級成為霍夫曼樹的一個葉結(jié)點(diǎn),這兩個結(jié)點(diǎn)構(gòu)造一個雙親結(jié)點(diǎn),重復(fù)該步驟,直到所有的灰度級都被用來構(gòu)造霍夫曼樹為止;設(shè)所有結(jié)點(diǎn)的左孩子為“0”,右孩子為“ 1”,則從根開始,經(jīng)各中間結(jié)點(diǎn)到葉結(jié)點(diǎn)的路徑代碼即是該葉結(jié)點(diǎn)的霍夫曼碼;對于非感興趣區(qū)域的每個離散余弦變換集合,從最重要的位平面進(jìn)行低密碼奇偶校驗(yàn)碼編碼;對于每個位平面,所生成的奇偶檢驗(yàn)信息被存儲在緩沖器中,在解碼端的請求下,通過反饋機(jī)制,不斷地發(fā)送校驗(yàn)信息。
3.根據(jù)權(quán)利要求1所述的面向無線多媒體傳感器網(wǎng)絡(luò)的視頻壓縮方法,其特征是對于關(guān)鍵幀,使用傳統(tǒng)的聯(lián)合圖像專家組進(jìn)行編碼,利用感興趣區(qū)域區(qū)分方法將非關(guān)鍵幀分為感興趣區(qū)域和非感興趣區(qū)域?qū)τ诟信d趣區(qū)域中離散余弦變換低頻系數(shù)采用霍夫曼編解碼,對于感興趣區(qū)域其余部分以及非感興趣區(qū)域采用低密度奇偶校驗(yàn)碼進(jìn)行編解碼,具體步驟如下步驟1)將每幀分成大小相等且互不重疊的8X8宏塊;步驟2)計(jì)算關(guān)鍵幀和非關(guān)鍵幀相同位置宏塊的絕對差值之和;步驟3):根據(jù)感興趣區(qū)域宏塊的判定準(zhǔn)則,對非關(guān)鍵幀每個宏塊進(jìn)行感興趣區(qū)域區(qū)分;步驟4)提取非關(guān)鍵幀中感興趣宏塊的離散余弦變換低頻系數(shù)進(jìn)行霍夫曼編解碼壓縮;步驟5):對非關(guān)鍵幀中感興趣宏塊的其余部分以及非感興趣宏塊則采用低密度奇偶校驗(yàn)碼編解碼壓縮;步驟6)在解碼端對非關(guān)鍵幀的感興趣宏塊利用已得到的離散余弦變換低頻系數(shù)進(jìn)行雙向運(yùn)動估計(jì)內(nèi)插生成感興趣宏塊邊信息;步驟7)在解碼端對非關(guān)鍵幀的非感興趣宏塊進(jìn)行運(yùn)動補(bǔ)償幀內(nèi)插或外推生成非感興趣宏塊邊信息;步驟8)利用生成的感興趣宏塊邊信息和非感興趣宏塊邊信息得到非關(guān)鍵幀的最佳邊信息,進(jìn)而對非關(guān)鍵幀進(jìn)行解碼。
全文摘要
本發(fā)明提出適合多媒體傳感器網(wǎng)的分布式視頻編碼中基于離散余弦變換低頻系數(shù)的邊信息估計(jì)方法,解決視頻應(yīng)用中數(shù)據(jù)量大的問題。該方法將非關(guān)鍵幀的ROI宏塊中DCT低頻系數(shù)提取出來進(jìn)行熵編解碼,對ROI宏塊解碼端利用接收到的DCT低頻系數(shù)進(jìn)行雙向運(yùn)動估計(jì)內(nèi)插生成ROI宏塊邊信息,而對非ROI區(qū)域使用解碼出的幀進(jìn)行運(yùn)動補(bǔ)償幀內(nèi)插(或外推)生成非ROI宏塊邊信息,進(jìn)而生成最佳非關(guān)鍵幀邊信息。通過以上改進(jìn)可以降低碼率,提高解碼圖像的質(zhì)量,降低傳感器節(jié)點(diǎn)能耗,延長無線傳感器網(wǎng)絡(luò)生存周期。通過使用本發(fā)明提出的方法在降低碼率的同時可以得到最佳邊信息,進(jìn)而提高了解碼圖像的質(zhì)量,最終降低傳感器節(jié)點(diǎn)能耗,延長了無線傳感網(wǎng)絡(luò)生存周期。
文檔編號H04N7/26GK102572428SQ20111044758
公開日2012年7月11日 申請日期2011年12月28日 優(yōu)先權(quán)日2011年12月28日
發(fā)明者劉金凱, 孫力娟, 沙超, 王汝傳, 肖甫, 蔣凌云, 郭劍, 黃海平 申請人:南京郵電大學(xué)