專利名稱:確定特征點(diǎn)的方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種用來確定特征點(diǎn)的方法,具體地涉及通過基于物體邊緣特征點(diǎn)的確定能有效地對視頻信號編碼的方法。
眾所周知,數(shù)字化視頻信號的傳輸可以傳送比模擬信號傳輸質(zhì)量好得多的視頻圖象。當(dāng)包括一個序列圖象“幀”的圖象信號以數(shù)字形式表達(dá)時,就產(chǎn)生出大量的用于傳輸?shù)臄?shù)字?jǐn)?shù)據(jù),尤其是在高清晰度電視系統(tǒng)中更是如此。但是,由于可得到的傳統(tǒng)傳輸頻道的頻帶寬度是有限的,因此為了通過有限的頻道帶寬傳輸大量的數(shù)字?jǐn)?shù)據(jù),就不可避免地要壓縮或減少傳輸數(shù)字?jǐn)?shù)據(jù)容量。在各種視頻信號壓縮技術(shù)中,其中所謂混合編碼的技術(shù)被認(rèn)為是最有效的,該技術(shù)將時間及空間壓縮技術(shù)與統(tǒng)計(jì)編碼技術(shù)結(jié)合在一起。
大多數(shù)混合編碼技術(shù)使用了移動補(bǔ)償DPCM(差分脈沖碼調(diào)制),二維DTC(離散余弦變換),DCT系數(shù)量化,及VLC(可變長度編碼)。移動補(bǔ)償DPCM是這樣一種方法評價(jià)當(dāng)前幀與在先幀之間物體的移動,并根據(jù)物體移動流預(yù)測當(dāng)前幀,以產(chǎn)生代表當(dāng)前幀與其預(yù)測幀之間差值的差分信號。這些方法譬如描述在Staffan Ericsson著的“用于混合預(yù)測/變換編碼的固定及自適應(yīng)預(yù)測器”,IEEE,通信會刊,COM-33,第12期(1985年12月)及Ninomiya和Ohtsuka著的“用于電視圖象的移動補(bǔ)償幀間編碼方案”IEEE,通信會刊,COM-30,第1期(1982年1月)中。
尤其是,在移動補(bǔ)償DPCM中,基于對當(dāng)前幀及在先幀之間物體移動的估算從相應(yīng)的在先幀數(shù)據(jù)中預(yù)測出當(dāng)前幀數(shù)據(jù)。這種被估算的移動可用代表在先及當(dāng)前幀中相應(yīng)象素之間的位移的二維移動矢量的措詞來描述。
對于估算物體象素的位移具有兩種基本方案一種是逐個塊地估算,另一種是逐個象素地方案。
在逐塊移動估算中,將當(dāng)前幀中的一個塊與在先幀中的各塊相比較直到確定出最佳適配為止。為此,對于被傳輸?shù)漠?dāng)前幀可以估算整個塊的幀間位移矢量(代表在幀之間已移動了多少象素塊)。但是,在逐塊移動估算中,如果在一塊中所有象素不以同一方式移動,會產(chǎn)生出差的估算,由此降低了整個圖象的質(zhì)量。
另一方面,使用逐個象素的方案,對于每一個象素確定出其位移。這種方案能得到更精確的象素值估算,并具有易于處理比例變化的能力(例如變焦,垂直圖象平面的移動)。但是,在逐象素的方案中,由于移動矢量是對每一個象素確定的,實(shí)際上不可能對一個接收機(jī)傳輸所有的移動矢量。
為了對由逐象素方案產(chǎn)生的過剩或多余傳輸數(shù)據(jù)處理問題作出改善而導(dǎo)入的一種技術(shù)是基于特征點(diǎn)的移動估算技術(shù)。在該基于特征點(diǎn)的移動估算技術(shù)中,在發(fā)送端的編碼器中確定出一組選擇象素,即特征點(diǎn),然后在接收端的解碼器中作反向處理,并且用于特征點(diǎn)的移動矢量被傳輸?shù)浇邮諜C(jī)而不具有它們位置數(shù)據(jù),其中特征點(diǎn)被規(guī)定為在先幀或當(dāng)前幀中能代表視頻信號中物體移動的象素,它使得對于當(dāng)前幀中所有象素的移動矢量能從接收機(jī)中的那些特征點(diǎn)被復(fù)原或由特征點(diǎn)的象素來近似。采用基于特征點(diǎn)移動估算的一種編碼器公開在一共享的相關(guān)申請US序列號08/367,520,名稱為“使用逐象素移動估算對視頻信號編碼的方法及裝置”中,在該編碼器中,首先對于包含于在先幀中的所有象素選擇多個特征點(diǎn)。然后對選擇出的特征點(diǎn)確定移動矢量,其中每個移動矢量代表在先幀中一個特征點(diǎn)與一個相應(yīng)適配點(diǎn)即當(dāng)前幀中最相似的象素之間的空間位移。尤其是,在當(dāng)前幀中的一個搜索區(qū)域中搜索出對于每個特征點(diǎn)的適配點(diǎn),其中搜索區(qū)域定義為包圍著相應(yīng)特征點(diǎn)的預(yù)定范圍的區(qū)域。在基于特征點(diǎn)的移動估算技術(shù)中,由于基于對于一組特征點(diǎn)的那些移動矢量從在先幀中預(yù)測出當(dāng)前幀,因此選擇能正確代表物體移動的特征點(diǎn)是很重要的。
典型地,在采用基于特征點(diǎn)的移動估算的編碼器及解碼器中,使用柵格(grid)技術(shù)來選擇多個特征點(diǎn)。
在使用各種類型柵格、例如矩形或六邊形柵格的柵格技術(shù)中,其節(jié)點(diǎn)即柵格的格線的交點(diǎn)或格點(diǎn)被確定為特征點(diǎn)。但是,該柵格點(diǎn)不總是能正確代表物體的移動,會產(chǎn)生差的物體移動評價(jià)。
因此,本發(fā)明的主要目的在于提供一種改善的特征點(diǎn)確定方法,它能有效地通過基于目標(biāo)邊緣確定特征點(diǎn)對視頻信號編碼。
根據(jù)本發(fā)明,提供一種用在采用基于特征點(diǎn)的移動補(bǔ)償技術(shù)的視頻信號處理器中用來確定特征點(diǎn)的方法,所述特征點(diǎn)是能夠代表視頻幀中目標(biāo)移動的象素,它包括以下步驟產(chǎn)生視頻幀上的一個柵格以提多個柵格點(diǎn),這些柵格點(diǎn)是位于柵格節(jié)點(diǎn)上的象素位置;產(chǎn)生多個搜索區(qū)域,每個搜索區(qū)域具有在其中心的一個柵格點(diǎn)并包括多個塊;檢測視頻幀中的邊緣點(diǎn);將在所述每個搜索區(qū)域中具有最大邊緣點(diǎn)數(shù)目的塊選擇為處理塊;將處理塊劃分成多個候選塊;及在處理塊中選擇具有最大數(shù)目邊緣點(diǎn)的候選塊并將選出的候選塊的中心象素確定為一個特征點(diǎn)。
通過以下結(jié)合附圖對優(yōu)選實(shí)施例的描述,將會使本發(fā)明的上述及另外目的及特征更加闡明,附圖為
圖1表示本發(fā)明的確定特征點(diǎn)設(shè)置的電路框圖;圖2表示通過使用矩形柵格產(chǎn)生的示范性柵格點(diǎn);圖3表示圖1中第一選擇單元的詳細(xì)電路框圖;圖4表示根據(jù)本發(fā)明的特征點(diǎn)選擇操作。
參見圖1,它表示一個用在適用于基于特征點(diǎn)移動補(bǔ)償技術(shù)的編碼器及解碼器中的裝置,它將根據(jù)本發(fā)明來確定特征點(diǎn),其中的特征點(diǎn)被定義為能夠代表視頻信號中目標(biāo)移動的象素。
視頻幀的數(shù)字視頻信號,例如在先幀或當(dāng)前幀的數(shù)字視頻信號被供給到邊緣檢測單元100。邊緣檢測單元100通過使用傳統(tǒng)的梯度算子,例如索貝爾算子(sobel operator)檢測視頻信號中的邊緣點(diǎn)。例如,方向梯度,如象素位置(x,y)上的水平及垂直梯度Gx(x、y)和Gy(x、y),使用水平及垂直索貝爾算子被計(jì)算出來,則在象素位置(x、y)上的梯度幅值g(x、y)可以如下地獲得g(x、y)=|Gx(x、 y)|+|Gy(x、 y)|然后通過對于視頻幀中每個象素將梯度幅值與一預(yù)定閾值Te相比較來檢測視頻幀的邊緣點(diǎn)。這就是,如果g(x、y)超過Te,象素位置(x、y)就是邊緣點(diǎn)。
因而,將代表邊緣點(diǎn)位置的邊緣信號eg(x、y)提供給第一及第二選擇單元130及150。
在此期間,柵點(diǎn)生成單元110產(chǎn)生柵格并將多個柵格點(diǎn)提供給第一選擇單元130,其中柵格點(diǎn)為位于柵格節(jié)點(diǎn)上的象素位置,如A至F,即為圖2中虛線表示的矩形柵格線的交點(diǎn)。
參見圖3,它表示圖1中所示第一選擇單元130的細(xì)節(jié)。如圖3所示,來自于柵格點(diǎn)生成單元110的線L12上的柵格點(diǎn)GP(x、y)被輸入到一個搜索區(qū)域形成單元10。
為響應(yīng)柵格點(diǎn)GP(x、y),搜索區(qū)域形成單元10形成一個(N+1)×(N+1)象素,如11×11象素(N為整偶數(shù))并在其中心具有柵格點(diǎn)GP(x、y)的搜索區(qū)域,其中搜索區(qū)域包括m個數(shù)目的(L+1)×(L+1)象素,如5×5象素(L為小于N的整偶數(shù))的處理單元。接著,搜索區(qū)域形成單元10將代表搜索區(qū)域位置的搜索區(qū)域地址提供給處理塊形成部分20-1至20-m。
每個處理塊形成單元20-1至20-m將代表搜索區(qū)域中每個處理塊位置的處理塊地址提供給邊緣點(diǎn)計(jì)數(shù)器40-1至40-m;及將代表每個處理塊中心象素位置的中心點(diǎn)經(jīng)由線L30-1至L30-m提供給多路器70。
在此期間,來自于邊緣檢測單元100的邊緣信號eg(x、y)被提供到邊緣點(diǎn)計(jì)數(shù)器40-1至40-m。
為響應(yīng)由處理塊形成部分20-1至20-m供給的處理塊地址,每個邊緣點(diǎn)計(jì)數(shù)器40-1至40-m對包括在每個處理塊中的邊緣點(diǎn)的數(shù)目進(jìn)行計(jì)數(shù),以產(chǎn)生出邊緣點(diǎn)計(jì)數(shù)值。
來自于邊緣點(diǎn)計(jì)數(shù)器40-1至40-m的所有邊緣點(diǎn)計(jì)數(shù)值被提供給最大值檢測器60,其中將所有的邊緣點(diǎn)計(jì)數(shù)值相互比較,并選擇一個最大邊緣點(diǎn)計(jì)數(shù)值,以將一選擇信號,即指示具有最大數(shù)目邊緣點(diǎn)的處理塊的選擇信號提供給多路器(MUX)70。如果不止一個具有相同最大邊緣點(diǎn)數(shù)目的處理塊,則選擇信號指示與柵格點(diǎn)最近的處理組。
為響應(yīng)選擇信號,MUX70選擇具有最大邊緣點(diǎn)數(shù)目的處理組的中心點(diǎn)并將它作為搜索區(qū)域的預(yù)特征點(diǎn)提供出來。
在第一選擇單元130中如上所述地獲得的預(yù)特征點(diǎn)被提供給第二選擇單元150。
第二選擇單元150的操作基本上與第一選擇單元130的操作相同,所不同的是,它將其搜索區(qū)域規(guī)定為在其中心上具有預(yù)特征點(diǎn)的處理塊,以取代在其中心具有輸入柵格點(diǎn)的搜索區(qū)域。這就是說,為了響應(yīng)預(yù)特征點(diǎn),第二選擇單元150將在其中心上具有預(yù)特征點(diǎn)的處理塊劃分成多個候選塊。以及,第二選擇單元150在處理塊中選擇一個具有最大邊緣點(diǎn)數(shù)目的候選塊,并將所選擇的候選塊的中心象素確定為在其中心上具有柵格點(diǎn)的搜索區(qū)域的特征點(diǎn),由此提供代表特征點(diǎn)位置的特征點(diǎn)信息。如果不止一個具有相同最大邊緣點(diǎn)數(shù)目的候選塊,則將與中心點(diǎn)最近的候選塊的中心象素選擇為特征點(diǎn)。并且,如果在搜索區(qū)域中未發(fā)現(xiàn)邊緣點(diǎn)時,則將包含在搜索區(qū)域中的柵格點(diǎn)本身選擇為特征點(diǎn)。
在圖4中,示范地表示出如上地選擇的特征點(diǎn),其中的點(diǎn)代表象素,及以X表示的點(diǎn)代表邊緣點(diǎn),塊SR表示具有星標(biāo)記柵格點(diǎn)G的搜索塊,子塊PB表示具有中心點(diǎn)C的處理塊,更小的子塊CB示例地表示具有特征點(diǎn)F的一個候選塊。
雖然本發(fā)明針對一個具體地實(shí)施例作出了描述,但對于熟悉該技術(shù)領(lǐng)域的人員來說,顯然地,在不偏離以下權(quán)利要求書所限定的本發(fā)明精神及范圍的情況下可以作出各種變化和改型。
權(quán)利要求
1.一種用在采用基于特征點(diǎn)的移動補(bǔ)償技術(shù)的視頻信號處理器中來確定特征點(diǎn)的方法,所述特征點(diǎn)是能夠代表視頻幀中目標(biāo)移動的象素,它包括以下步驟產(chǎn)生視頻幀上的一個柵格以提供多個柵格點(diǎn),這些柵格點(diǎn)是位于柵格節(jié)點(diǎn)上的象素位置;產(chǎn)生多個搜索區(qū)域,每個搜索區(qū)域具有在其中心上的一個柵格點(diǎn)并包括多個塊;檢測視頻幀中的邊緣點(diǎn);將在所述每個搜索區(qū)域中具有最大邊緣點(diǎn)數(shù)目的塊選擇為處理塊;將處理塊劃分成多個候選塊;及在處理塊中選擇具有最大數(shù)目邊緣點(diǎn)的候選塊并將選出的候選塊的中心象素確定為一個特征點(diǎn)。
2.根據(jù)權(quán)利要求1所述的方法,還包括當(dāng)包括所述柵格點(diǎn)的搜索區(qū)域在其中無節(jié)點(diǎn)時,選擇柵格點(diǎn)作為一個特征點(diǎn)的步驟。
3.根據(jù)權(quán)利要求1所述的方法,其中當(dāng)不止一個具有相同最大邊緣點(diǎn)數(shù)目的候選塊時,將與處理塊中心象素最近的候選塊的中心象素選擇為特征點(diǎn)。
全文摘要
一種用來確定特征點(diǎn)的新方法包括步驟檢測視頻幀中的邊緣點(diǎn),將在所述每個搜索區(qū)域中具有最大邊緣點(diǎn)數(shù)目的塊選擇為處理塊;將處理塊劃分成多個候選塊;及在處理塊中選擇具有最大數(shù)目邊緣點(diǎn)的候選塊并將選出的候選塊的中心象素確定為一個特征點(diǎn)。
文檔編號H04N7/32GK1137210SQ9610272
公開日1996年12月4日 申請日期1996年3月15日 優(yōu)先權(quán)日1995年3月15日
發(fā)明者丁海默 申請人:大宇電子株式會社