專利名稱:利用搜索網格對視頻信號編碼的裝置的制作方法
技術領域:
本發(fā)明涉及一種對視頻信號進行編碼的裝置,更具體地說,涉及一種利用運動預測技術對視頻信號進行編碼的裝置。
眾所周知,發(fā)送數字信號比發(fā)送模擬信號能獲得高得多的視頻圖象質量。當以數字形式來表示一個含有一系列圖象“幀”的圖象信號時,發(fā)送時會產生大量的數據,對于高清晰度電視系統(tǒng)而言則尤其如此。然而,由于普通發(fā)射信道可利用的頻帶寬度是有限的,因此為了在信道中發(fā)送大量的數字數據就不得不壓縮或減少發(fā)送數據的量。在各種視頻壓縮技術中,公認最為有效的技術是所謂的混合編碼技術,它將時間和空間壓縮技術與統(tǒng)計編碼技術結合在一起。
大多數混合編碼技術采用運動補償DPCM(差分脈沖編碼調制),二維DCT(離散余弦變換),DCT系數量化,以及VLC(可變長度編碼)。運動補償DPCM是這樣一種方法,它估算一個目標在當前幀和前一幀之間的運動,并根據該目標的運動流來預測當前幀,以及產生代表當前幀及其預測值之間的差異的差分信號。這一方法在例如下述文獻中已有說明Staffan Erisson的“Fixed and Adaptive Predictors for Hybrid Predictive/Transform Coding(混合預測/變換編碼的固定和自適應預測器)”,IEEE Transactions on Communications,COM-33,No.12(1985年12月);Ninomiya和Ohtsuka的“A Motion-Compensated Interframe Coding Scheme,for Television Pictures(一種電視圖象的運動補償幀間編碼方案)”,IEEE Transactionson Communications,COM-30,No.1(1982年1月)。
二維DCT可減少或利用圖象數據之間的空間冗余,把一個數字圖象數據塊,例如一個8×8象素的塊,轉換成一組變換系數數據。該技術在Chen和Pratt的,“Scene Adaptive Coder(景象自適應編碼器)”,IEEE Transactions on Communications,COM-32,No.3(1984年3月)中已有說明。通過借助于量化器、折線掃描、和VLC對這種變換系數數據進行處理,需要發(fā)送的數據量可以被有效地壓縮。
具體地說,在運動補償DPCM中,當前幀數據是根據對當前幀和前一幀之間的運動估算而從相應的前一幀數據預測出來的。這種估算的運動可以用代表象素在前一幀和當前幀之間的位移的二維運動矢量來描述。
對一目標的象素位移的估算主要有兩種基本方式??偟膩碚f,它們可被分成兩種類型一種是逐塊的估算,而另一種是逐象素趨近。
在逐象素趨近中,要對所有每一個象素的位移進行確定。這種技術可使象素值的估算更加精確并能夠較容易地處理大范圍的變化(例如,推拉攝影,垂直于象面的移動)。然而,在逐象素趨近中,由于要對所有每一個象素的運動矢量進行確定,所以根本不可能將所有的運動矢量發(fā)送給接收器。
另一方面,利用逐象素的運動估算,一當前幀被劃分為多個搜索塊。要確定當前幀中的一搜索塊的運動矢量,就要在當前幀的搜索塊同包含在前一幀中的通常較大的一個搜索區(qū)內的每個等大小的候選塊之間進行相似性計算。通過使用諸如平均絕對誤差或均方差的誤差函數,來完成在當前幀的搜索塊和上述搜索區(qū)的一候選塊之間的相似性計算。而一個運動矢量,按照定義,代表搜索塊同產生最小誤差或差異的一候選塊之間的位移。然而,在逐塊的運動估算中,如果塊中的所有象素不以同樣的方式運動,則會導致較差的估算結果,從而降低整個圖象的質量。
為此,本發(fā)明的首要目的就是要依據本發(fā)明,利用一種搜索網格,提供一種改進的預測技術。
依據本發(fā)明,提供了一種使用在運動補償視頻信號編碼器中的裝置,用于通過利用預定數目的同等大小的搜索網格,在數字視頻信號的當前幀和前一幀的基礎上,確定一預測當前幀,其中每一搜索網格都具有一組構成于當前幀中的搜索塊。該裝置包括用于測定每一搜索網格的一組運動矢量的裝置,其中每一個運動矢量都是通過計算每一搜索塊同在前一幀中形成的候選塊之間的誤差,并選擇產生最小誤差的候選塊而被確定的;用于對包含于每一搜索網格中的所有搜索塊的最小誤差進行累加,以提供每一搜索網格的累積最小誤差信號的裝置。
用于通過利用累積誤差信號對每一搜索網格進行比較,以提供一搜索網格選擇信號的裝置,其中搜索網格選擇信號指示出所選的產生最低累積最小誤差的搜索網格;用于響應搜索網格選擇信號,選擇一組與所選搜索網格相對應的運動矢量的裝置;以及用于將前一幀中的一個象素的值分配為當前幀中的所述的一個象素的值,該象素通過所選的一組運動矢量與當前幀中的一個象素相對應,以確定預測當前幀的裝置。
本發(fā)明的上述和其他目的將結合附圖通過對下面所給出的較佳實施例的說明而更加清楚,其中
圖1為根據本發(fā)明的具有當前幀預測模塊的圖象信號編碼裝置;圖2A至2C描述一定義搜索網格的示例幀;圖3示出圖1中的當前幀預測模塊的詳細方框圖;圖4示出圖3中的運動補償模塊的詳細方框圖。
圖1描述本發(fā)明的具有當前幀預測模塊的一個圖象信號編碼裝置的優(yōu)選實施例。如圖1所示,一當前幀信號被存于第一幀存儲器100中,該存儲器通線L11被連到減法器102,并通過線L10被連到當前幀預測模塊150。
在當前幀預測模塊150,線L10上的來自第一幀存儲器100的一當前幀信號和線L12上的來自第二幀存儲器124的重建的前一幀信號被進行處理,以產生一預測當前幀信號到線L30上;產生一組運動矢量到線L20上;以及一搜索網格的信息到線L21上。搜索網格的定義和當前幀預測模塊150的詳情將參照圖2A、2B、2C和圖3進行描述。
線L30上的預測當前幀信號在減法器102被線L11上的當前幀信號相減,其結果數據,即一表示差分象素值的誤差信號,被送到一圖象信號編碼器105,在此該誤差信號,例如通過使用DCT或任何已知的量化方法,被編碼成為一組量化變換系數。而后,該量化變換系數被傳送給一熵編碼器107和一圖象信號解碼器113。在熵編碼器107,來自圖象信號編碼器105的量化變換系數和通過線L20從當前幀預測模塊150傳來的運動矢量,通過使用例如可變長度編碼技術,被一起編碼。一多路復用器109將熵編碼器107的輸出信號和通過線L21從當前幀預測模塊150傳來的搜索網格的信息進行多路復用。而后經過多路復用的信號被提供給一發(fā)送器(未示出)進行發(fā)送。
與此同時,圖象信號解碼器113通過反量化和反離散余弦變換將來自圖象信號編碼器105的量化變換系數轉換回為一重建的誤差信號。
來自圖象信號解碼器113的重建誤差信號和線L30上的來自當前幀預測模塊150的預測當前幀信號在加法器115相加,從而提供一重建的當前幀信號,該信號作為前一幀被存儲在第二幀存儲器124中。
參見圖2A,其大致地示出了一示例幀用以定義搜索網格。搜索網格被定義為具有相同一大小的可移動的一組搜索塊。而搜索網格的每一小格即被視為一搜索塊。由于搜索網格在一邊界的范圍(來陰影區(qū)域)內是可移動的,因而存在著多個移動位置。例如,參見圖2B,對應N個分支,相應地就有N個移動位置,而每一個分支都是位于幀的左上角最遠處的象素同搜索網格的左上角最遠處的象素之間的距離。為便于說明,分支#1的移動位置被稱為第一搜索網格,分支#2的移動位置被稱為第二搜索網格,等等。
通過圖2C可以看出利用搜索網格的優(yōu)點。這就是,如果一運動目標(畫陰影的區(qū)域)小于一搜索塊的尺寸,并且如果一能夠將該目標充分地包含在其搜索塊中的搜索網格被選出來(例如,一具有分支#B的搜索網格),則該運動目標的位移就可以被精確地表示出來。
轉而見圖3,其用于說明示于圖1的當前幀預測模塊150的詳細情況。線L10上的當前幀信號和線L12上的前一幀信號被輸入到數個運動估算模塊312、314和316中。第一個運動估算模塊312確定包含于圖2B所示的第一搜索網格內的那些搜索塊的第一組運動矢量。通過使用為人們所熟知的塊匹配算法中的一種算法,就可以容易地確定形成于當前幀的第一搜索網格內的搜索塊的每一運動矢量。例如,要確定一搜索塊的運動矢量,可以在當前幀的搜索塊和包含在前一幀中的通常較大的搜索區(qū)內的每一具有同等大小的候選塊之間進行相似性計算。諸如平均絕對誤差(MAE)或均方差(MSE)的誤差函數可用來完成當前幀中的搜索塊與搜索區(qū)內的一候選塊之間的相似性測算。而后,上述搜索塊和產生最小誤差或差異的一候選塊之間的位移即被確定為該搜索塊的運動矢量。類似地,第二個運動估算模塊314和第N個運動估算模塊316分別用來確定包在第二搜索網格內的搜索塊的第二組運動矢量和包含在第N搜索網格內的搜索塊的第N組運動矢量。
對于包含在每一個搜索網格內的每一搜索塊,每個運動估算模塊312、314和316都分別生成兩個信號一個是搜索塊同產生最小誤差的候選塊的最小誤差;另一個是表示搜索塊同產生最小誤差的候選塊間的相對位置的運動矢量。
每個來自運動估算模塊312、314和316的誤差信號分別被提供給相應的數個誤差累積模塊318、322和326。并且每個來自運動估算模塊312、314和316的運動矢量被分別提供給相應的多個緩沖器320、324和328。在每一個誤差累積模塊318、322和326,每個網格內的所有搜索塊的輸入誤差信號被累加;而每個網格內的所有搜索塊的運動矢量則被儲存在相應的每一緩沖器320、324和328中。
來自誤差累積模塊318、322和326的每個輸出信號都被提供到一網格選擇模塊330。在該網格選擇模塊330中,一累積最小誤差值被選出以將一所選網格信息信號,如圖1所示,通過線L21、開關332以及運動補償模塊334,提供給多路復用器109。開關332響應所選網格信息信號,將存于相應的緩沖器中的運動矢量,如圖1所示,通過線L20提供給熵編碼器107和運動補償模塊334。
在運動補償模塊334,利用所選網格信息以及所選網格內的搜索塊的運動矢量,包含于預測當前幀信號中的每一個象素的值都能從第二幀存儲器124(示于圖1)中獲得。另一方面,利用零運動矢量,位于所選搜索網格之外的每一個象素的值就能從第二幀存儲器124中獲得。運動補償模塊334的輸出經線L30作為預測當前幀信號被提供給減法器102,如圖1所示。
參見圖4,下面將對運動估算模塊312的詳細運行過程進行說明。如圖4所示,線L10上的當前幀信號被提供給一搜索塊確定模塊402,在那里第一搜索網格內的一搜索塊被確定。模塊402的輸出信號通過線L36被提供給數個誤差估算模塊412,414和416。另一方面,線L12上的前一幀信號被提供給一搜索區(qū)確定模塊404,在那里,與在模塊402預先確定的搜索塊相對應的一搜索區(qū)被選出。模塊404的輸出信號被送到數個候選塊確定模塊406、408和410。模塊406從包含在搜索區(qū)內的所有可能的候選塊中確定第一候選塊。類似地,模塊408和410分別用來確定第二候選塊和第N候選塊。模塊406、408和410的每一個都在生成兩個信號一個是確定的候選塊信號;而另一個是代表該候選塊同所給出的搜索塊之間相對位置的信號,即一運動矢量。來自模塊406、408和410的每一運動矢量都分別通過L40、L42和L44被輸出到開關418。
在誤差估算模塊412、414和416,在模塊402確定給出的搜索塊同每一候選塊進行比較,以計算它們之間的相似性。一般地,要進行相似性測算,可使用諸如MAE或MSE的誤差函數。來自誤差估算模塊412、414和416的每一輸出信號被送到一最小誤差選擇模塊420。最小誤差選擇模塊420選出一最小誤差,以將所選的最小誤差和指示與所選最小誤差相對應的運動矢量的開關控制信號,分別提供到誤差累積模塊318(如圖3所示),以及開關418。開關418在由線L40、L42和L44所提供的運動矢量中選與上述開關控制信號相對應的運動矢量,并將該運動矢量提供給如圖3所示的緩沖器320。
盡管本發(fā)明是對特定的實施例進行說明和示出的,但對于熟悉本技術領域的人們來說,顯然可以在不偏離由所附的權利要求所規(guī)定的本發(fā)明精神和范疇的前提下做出許多變化和修改。
權利要求
1.一種使用在運動補償視頻信號編碼器中的裝置,用于通過利用具有預定數目的同等大小的搜索網格,根據數字視頻信號的當前幀和前一幀確定一預測當前幀,其中的每一搜索網格具有一組形成于所述當前幀中的搜索塊。該裝置包括用于測定每一搜索網格的一組運動矢量的裝置,其中每一個運動矢量都是通過計算每一搜索塊同在前一幀中形成的候選塊之間的誤差,并選擇產生最小誤差的候選塊而被確定的;用于對包含于每一搜索網格中的所有搜索塊的最小誤差進行累加,以提供每一搜索網格的累積最小誤差信號的裝置;用于利用上述累積誤差信號對搜索網格進行比較,以提供一搜索網格選擇信號,用于選擇一產生最低累積最小誤差的搜索網格的裝置;用于響應搜索網格選擇信號,選擇一組與所述搜索網格相對應的運動矢量的裝置;以及用于將前一幀中的一個象素的值,該象素通過所選的一組運動矢量與當前幀中的一個象素相對應,分配為當前幀中的相對應的所述的象素的值,以確定預測當前幀的裝置。
2.在權利要求1中的裝置,其中所述的分配裝置包括用于為位于所選搜索網格以外的象素分配零值運動矢量的裝置。
全文摘要
使用在運動補償視頻信號編碼器中的裝置,包括運動估算器,測定搜索網格的一組運動矢量;誤差累加器,對包含于每一搜索網格中的所有搜索塊的最小誤差進行累加以提供每一搜索網格的累積最小誤差信號;選擇器,通過利用累積誤差信號對搜索網格進行比較以提供一搜索網格選擇信號;開關,根據搜索網格選擇信號選擇一組對應于所選搜索網格的運動矢量;以及運動補償器,將前一幀中的一個象素的值分配為所述的當前幀中的所述象素的值。
文檔編號H04N7/26GK1131869SQ9510301
公開日1996年9月25日 申請日期1995年3月20日 優(yōu)先權日1995年3月20日
發(fā)明者丁海默 申請人:大宇電子株式會社