專利名稱:用于輪廓編碼系統(tǒng)中的多邊形逼近的方法和裝置的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及對于視頻信號進(jìn)行編碼的方法和裝置,而且,更具體地,涉及能夠?qū)Π谝粋€視頻信號中的物體的輪廓有效地進(jìn)行多邊形逼近的方法和裝置。
在象可視電話這樣的數(shù)字電視系統(tǒng)中,需要大量的數(shù)字?jǐn)?shù)據(jù)來確定每一個視頻幀信號,因為在視頻幀信號中的一個視頻行信號包括一序列的稱之為象素值的數(shù)字?jǐn)?shù)據(jù)。但是,由于受到傳統(tǒng)的發(fā)送頻道的可用帶寬的限制,為了通過其發(fā)送大量的數(shù)字?jǐn)?shù)據(jù),就不可避免地采用各種的數(shù)據(jù)壓縮技術(shù)來壓縮或降低數(shù)據(jù)量,尤其是在這種低比特速率的視頻信號編碼器的情況下,例如象可視電話或電話會議的情況下更是如此。
對于一個低比特速率的編碼系統(tǒng)的視頻信號進(jìn)行編碼所采用的技術(shù)是一種針對目標(biāo)的解析-合成編碼技術(shù),其中的輸入視頻圖象被分割成若干個目標(biāo),以及用于確定運(yùn)動的三套參數(shù),每一個目標(biāo)的輪廓和象素數(shù)據(jù)通過不同的編碼信道被處理。
在對于物體的輪廓進(jìn)行處理的過程中,對于該物體的形狀進(jìn)行解析與合成來說,輪廓信息是重要的。用于表示輪廓信息的典型的編碼方法是一種鏈?zhǔn)降木幋a方法。盡管這種方法不會招致在輪廓信息中的任何損失,但是,此鏈?zhǔn)降木幋a方法要求實際的表示該輪廓的數(shù)據(jù)量。
為了克服該缺陷,已經(jīng)提出了幾種方法編碼該輪廓信息。方法之一是采用一個多邊形逼近的輪廓編碼方法。在多邊形逼近的方法中,從構(gòu)成該輪廓的眾多的輪廓象素中檢測出一個輪廓的頂點。就是說,如果輪廓是開環(huán)的話,在輪廓上的兩個端點被確定為兩個起始的頂點。否則,在輪廓上的兩個最遠(yuǎn)的兩個點成為起始頂點。在確定兩個在輪廓上的兩個頂點之后,在兩個頂點之間畫出一條直線,且隨之確定從在輪廓上的象素到該直線的所連接的線段的垂直距離。在這些在輪廓段上的與該直線相對應(yīng)的輪廓象素當(dāng)中,如果最大的垂直距離是大于預(yù)定的門限值的話,該具有最大的垂直距離的輪廓象素就被檢測為下一個頂點。通過循環(huán)地執(zhí)行在圖2中示出的上述處理,檢測到輪廓上的若干個頂點,而且表示在輪廓上的所有的頂點的位置的頂點信息被編碼,并被隨即送到發(fā)射機(jī)(沒示出)從其發(fā)送。
在解碼器中,通過使用多邊逼近而重建目標(biāo)的輪廓,利用一些線設(shè)定該輪廓,這些線的每一條根據(jù)發(fā)送的頂點信息而經(jīng)過多個象素將相鄰的兩個頂點相連接,其中的這些連線的每一條是利用已知的線段產(chǎn)生算法確定的,例如一個玻司曼(Bresenham)算法(見Steven Harrington的"計算機(jī)圖形編程方法",第二版的17-20頁)。
但是,用于使用在檢測頂點的過程中的直線不同于通過象素的多樣性而對于兩個頂點進(jìn)行連接的線段,所以,可利用在直線和對應(yīng)于兩個相鄰頂點的線段之間的差異檢測到一個不必要的頂點;而且在結(jié)果上會出現(xiàn)將要通過發(fā)送機(jī)所發(fā)送的數(shù)據(jù)量的增加。
因此,本發(fā)明的首要目的是提供一個改進(jìn)的方法和裝置,它能夠利用改進(jìn)的頂點檢測技術(shù)對在視頻信號中的目標(biāo)的輪廓進(jìn)行有效的多邊形逼近,從而降低所要發(fā)送的數(shù)據(jù)量。
根據(jù)本發(fā)明的一個方面,提供了一種在對數(shù)字視頻信號中表示的目標(biāo)的輪廓進(jìn)行編碼的一個輪廓編碼器中的多邊形逼近方法,該方法包括以下的步驟(a)檢測在輪廓上的初始的頂點;(b)在被檢測的在輪廓上的這些頂點當(dāng)中選擇一對彼此相鄰的頂點;(c)通過利用象素的多樣性產(chǎn)生連接一對頂點的一條線段;(d)加寬該線段從而產(chǎn)生一個帶狀的線段;(e)從該輪廓中選擇對應(yīng)于該線段的輪廓段;(f)以這一對頂點、帶狀段和輪廓段為基礎(chǔ)檢測一個新的頂點;和(g)重復(fù)步驟(b)-(f),直到輪廓的頂點都被檢測,從而提供出表示輪廓的所有的頂點的位置的頂點信息。
根據(jù)本發(fā)明的另一個方面,提供了一種在對數(shù)字視頻信號表示的目標(biāo)的輪廓進(jìn)行編碼的一個輪廓編碼器中的多邊形逼近裝置,該方法包括一個初始頂點檢測裝置(block)用于檢測在輪廓上的初始的頂點;一個存儲裝置,用于存儲表示被測頂點的位置的頂點信息;一個選擇裝置,用于根據(jù)存儲的頂點信息,在這些頂點當(dāng)中選擇一對彼此相鄰的頂點;一個線段形成裝置,用于通過利用象素的多樣性產(chǎn)生連接一對頂點的一條線段;一個線段加寬裝置,用于加寬該線段從而產(chǎn)生一個帶狀的線段;一個輪廓段確定裝置,用于從該輪廓中選擇對應(yīng)于該線段的輪廓段;和一個新頂點確定裝置,用于以這一對頂點、帶狀段和輪廓段為基礎(chǔ)檢測一個新的頂點,并提供新的頂點到存儲裝置。
從結(jié)合附圖對于本發(fā)明的最佳實施例的描述中,本發(fā)明的上述的和其它的特征將變得顯見。其中
圖1示出根據(jù)本發(fā)明的用于編碼輪廓圖象數(shù)據(jù)的裝置的示意框圖;圖2A-2C示出一個目標(biāo)的輪廓的多邊形逼近過程的一個實例;圖3A和3B示出根據(jù)本發(fā)明加寬的象素;和圖4表示一個輪廓和一個用于兩個相鄰的頂點之間的帶狀段的匹配過程。
參考圖1,示出了一個根據(jù)本發(fā)明的用于對輸入的輪廓圖象數(shù)據(jù)進(jìn)行編碼的裝置的示意框圖。該輪廓圖象數(shù)據(jù)代表著輪廓象素的位置,構(gòu)成了由一個視頻信號所表示的目標(biāo)的輪廓。該輪廓圖象數(shù)據(jù)被提供到一個初始點檢測裝置100和一個輪廓段確定裝置500。
根據(jù)所耦合的輪廓圖象數(shù)據(jù),該初始點檢測裝置100找到該輪廓的兩個初始的頂點。若干輪廓圖象是開環(huán)的,例如由圖2A中的兩個端點A和B所示,就被選擇為兩個初始的頂點。另一方面,若干輪廓圖象是閉環(huán)的形式,在輪廓上的兩個最遠(yuǎn)的點被選擇為兩個初始的頂點。一旦這兩個初始的頂點被確定,表示這兩個初始的頂點的位置的頂點信息就被送到一個頂點控制裝置200。
該頂點控制裝置200存儲耦合的頂點信息,其中的頂點信息表示被檢測的在輪廓上的頂點的位置;在被測的頂點中選擇一對沿著輪廓彼此相鄰的相鄰頂點,例如兩個初始的頂點;并將它們的頂點信息送到輪廓段確定裝置500、一個線段形成裝置300和一個頂點確定裝置700。
通過采用傳統(tǒng)的線段產(chǎn)生算法,例如一個玻司曼算法,根據(jù)來自頂點控制裝置200的信息,該線段形成裝置300產(chǎn)生一個線段,經(jīng)過多個象素連接在頂點控制裝置200處選定的一對相鄰的頂點。該線段被送到一個線段加寬裝置400。
線段加寬裝置400產(chǎn)生一個沿著來自線段形成裝置300的線段所形成的一個帶狀段,其中的帶狀段包括圍繞著在該線段上的每一個象素的加寬的象素區(qū)域,該加寬的象素區(qū)域是通過采用其中利用了一個預(yù)定的門限值TH1的一個加寬處理而確定的。沿著每一個線段進(jìn)行的加寬處理是通過形成一個包括鄰近的象素的區(qū)域而實現(xiàn)的,對于在線段上的每一個象素來說,這些鄰近的象素滿足下面的公式。
|Xn-Xs|+|Yn-Ys|≤TH1等式1其中的Xs和Ys分別是在線段上的目標(biāo)象素的X和Y坐標(biāo);Xn和Yn分別是與該線段相鄰的每一個象素的X和Y坐標(biāo);而TH1是預(yù)定的門限值。
參考圖3A和3B,其中示出了根據(jù)本發(fā)明的圍繞目標(biāo)象素20的加寬的象素區(qū)。若干預(yù)定的門限值TH1是1,則對于目標(biāo)象素20的加寬過程是按照圖3A示出的過程實現(xiàn)的。當(dāng)預(yù)定的門限值TH1是2時,圖3B示出一個加寬的象素。
接下來,由滿足公式1的線段的相鄰象素和構(gòu)成該線段的目標(biāo)象素沿著線段形成帶狀段。以線段加寬裝置400得出的該帶狀段被耦合到匹配裝置600。
同時,輪廓段確定裝置500選擇對應(yīng)于由線段形成裝置300根據(jù)所提供的輪廓圖象數(shù)據(jù)和來自頂點控制裝置200的頂點信息而產(chǎn)生的線段的輪廓段,并將該線段提供到匹配裝置600。
在匹配裝置600,來自輪廓段確定裝置500的輪廓段和來自輪廓線段加寬裝置400的線段被彼此相匹配。就是說,如圖4所示,以一對相鄰的頂點,例如A和B為基礎(chǔ),沿著線段30的帶狀段50在同一個平面上與輪廓段40放在一起。隨后,匹配裝置600檢測非匹配的象素,它們是在例如輪廓段40上的、定位在例如帶狀段50之外的輪廓象素,并將表示非匹配象素的位置的匹配信息傳送到頂點確定裝置700。
根據(jù)來自頂點控制裝置200的頂點信息,頂點確定裝置700畫出一條在一對相鄰的頂點之間的直線;根據(jù)來自匹配裝置600的匹配信息計算從非匹配點的每一個到該直線的距離;確定一個具有比預(yù)定的門限值大的最大的垂直距離作為新的頂點;并將表示新的頂點的位置的新的位置信息送到頂點控制裝置200。參考圖2A,點C被確定為在一對頂點A和B之間的新頂點的定位,并將其頂點信息送到頂點控制裝置200。
如上所述,頂點控制裝置200存儲新的頂點信息;并將一對新的相鄰的頂點提供到隨后的線段形成裝置300、輪廓段確定裝置500和頂點確定裝置700。在第二個過程中,頂點A和C被選作一對新的相鄰頂點而它們的頂點信息被送到上述的隨后的裝置。如同上述的過程中描述的那樣,線段形成裝置300、線段加寬裝置400、輪廓段確定裝置500、匹配裝置600和頂點確定裝置700是分別地對來自頂點控制裝置200的頂點信息執(zhí)行其功能的。上述的過程的結(jié)果是,如果頂點D被確定為在頂點A和C之中的新的頂點時,要在頂點A和D之間重復(fù)上述的過程。但是,如果在以匹配裝置600進(jìn)行的匹配的過程中沒有找到任何非匹配的象素,即從頂點控制裝置200輸出的兩個頂點(例如)A和D的帶狀段完全覆蓋了對應(yīng)的輪廓段,則頂點確定裝置700將不能檢測到任何新的頂點,且沒有新的頂點信息傳送到頂點控制裝置200。在此情況中,頂點控制裝置200將新的一對相鄰的頂點D和C提供到下一個處理裝置。這一頂點的檢測過程被重復(fù)到輪廓10的所有的頂點,例如A到E都被確定為止,如圖2A-2C所示。
頂點的數(shù)目隨著預(yù)定的門限值TH1而改變。如從圖2A到2C中看到的那樣,以編碼的效率為代價,隨著預(yù)定門限值TH1的變小,通過線段對于輪廓10的逼近就變得更精細(xì)。
再來參考圖1,通過頂點的檢測過程,一旦確定了對于輪廓10的所有的頂點,表示所有的被測頂點的位置的信息,例如在輪廓10上的A到E的信息就被暫存在頂點控制裝置200中,并隨后送到頂點編碼器800。
利用傳統(tǒng)的語法算術(shù)碼或二進(jìn)制算術(shù)碼,頂點編碼器800對來自頂點控制裝置200的頂點信息編碼,并將編碼的頂點信息提供到發(fā)射機(jī)(未示出),從其發(fā)射。
在上述中,頂點檢測的過程是從初始的頂點A順時針方向進(jìn)行的,但是其最終的結(jié)果并不取決于處理的順序,只要將相鄰的所有的頂點對都覆蓋就行。
根據(jù)本發(fā)明的上述的頂點檢測技術(shù)可被用于在一個輪廓上根據(jù)頂點而進(jìn)行輪廓圖象的編碼。
雖然本發(fā)明是參照具體的實施例進(jìn)行的描述,但是本專業(yè)的技術(shù)人員顯見在不背離所附的權(quán)利要求的精神實質(zhì)的范圍內(nèi)能夠有各種的改進(jìn)和修正。
權(quán)利要求
1.一種多邊形逼近方法,用于對數(shù)字視頻信號中表示的目標(biāo)的輪廓進(jìn)行編碼的一種輪廓編碼器,該方法包括以下的步驟(a)檢測在輪廓上的兩個初始頂點;(b)在被檢測的輪廓上的這些頂點當(dāng)中選擇一對彼此相鄰的頂點;(c)產(chǎn)生經(jīng)過多個象素的連接此頂點的一條線段;(d)加寬該線段從而產(chǎn)生一個帶狀的線段;(e)從該輪廓中選擇對應(yīng)于該線段的輪廓段;(f)以這一對頂點、帶狀段和輪廓段為基礎(chǔ)檢測一個新的頂點;和(g)重復(fù)步驟(b)-(f),直到輪廓的頂點都被檢測,從而提供表示輪廓的所有頂點的位置的頂點信息。
2.根據(jù)權(quán)利要求1的方法,其中的線段是通過采用玻司曼(Bresenham)算法產(chǎn)生的。
3.根據(jù)權(quán)利要求1的方法,其中的帶狀段是通過利用一個預(yù)定的門限值加寬圍繞著在該線段上的每一個象素的象素區(qū)而得到的。
4.根據(jù)權(quán)利要求3的方法,其中的帶狀段包括在該線段上的每一個象素的鄰近象素,這些鄰近象素滿足下面的公式。|Xn-Xs|+|Yn-Ys|≤TH1其中的Xs和Ys分別是在線段上的目標(biāo)象素的X和Y坐標(biāo);Xn和Yn分別是與該線段相鄰的每一個象素的X和Y坐標(biāo);而TH1是預(yù)定的門限值。
5.根據(jù)權(quán)利要求1的方法,其中的步驟(f)包括步驟(f1)將帶狀段與輪廓段匹配,從而找到非匹配的象素;和(f2)根據(jù)非匹配的象素確定新的頂點和頂點對。
6.根據(jù)權(quán)利要求5的方法,其中的非匹配的象素的每一個是在輪廓段上并被定位在帶狀段之外。
7.根據(jù)權(quán)利要求6的方法,其中步驟(f2)包括步驟(f21)畫出連接一對頂點的一條直線;(f22)計算從非匹配象素的每一個到該直線的垂直距離;(f23)確定具有最大的垂直距離的一個非匹配象素為存在于一對頂點之間的新的頂點。
8.根據(jù)權(quán)利要求7的方法,其中在步驟(f23)中,當(dāng)最大的垂直距離是大于預(yù)定的門限值時,具有最大的垂直距離的非匹配象素被確定為新的頂點。
9.一種多邊形逼近裝置,用于對數(shù)字視頻信號中表示的目標(biāo)的輪廓進(jìn)行編碼的一個輪廓編碼器,該裝置包括裝置,用于檢測在輪廓上的兩個初始頂點;裝置,用于存儲表示被測頂點的位置的頂點信息;裝置,用于根據(jù)存儲的頂點信息,在這些頂點當(dāng)中選擇兩個相鄰的頂點;裝置,用于通過利用多個象素產(chǎn)生連接兩個相鄰頂點的一條線段;裝置,用于加寬該線段從而產(chǎn)生一個帶狀段;裝置,用于從該輪廓中選擇對應(yīng)于該線段的輪廓段;和裝置,以這兩個相鄰頂點、帶狀段和輪廓段為基礎(chǔ)檢測一個新的頂點,并提供新的頂點到存儲裝置。
10.根據(jù)權(quán)利要求9的裝置,其中的線段是通過采用玻司曼(Bresenham)算法產(chǎn)生的。
11.根據(jù)權(quán)利要求9的裝置,其中的帶狀段是通過利用一個預(yù)定的門限值加寬圍繞構(gòu)成該線段的每一個象素的象素區(qū)而得到的。
12.根據(jù)權(quán)利要求11的裝置,其中的帶狀段包括在該線段上的每一個象素的鄰近的象素,這些鄰近的象素滿足下面的公式。|Xn-Xs|+|Yn-Ys|≤TH1其中的Xs和Ys分別是在線段上的目標(biāo)象素的X和Y坐標(biāo);Xn和Yn分別是與該線段相鄰的一個象素的X和Y坐標(biāo);而TH1是預(yù)定的門限值。
13.根據(jù)權(quán)利要求11的裝置,其中的新頂點檢測裝置包括一個匹配裝置,用于將帶狀段與輪廓段匹配,從而找到非匹配的象素;和新頂點確定裝置,用于根據(jù)非匹配的象素檢測新的頂點和兩個相鄰頂點。
14.根據(jù)權(quán)利要求13的裝置,其中的非匹配的象素的每一個是在輪廓段上并被定位在帶狀段之外。
15.根據(jù)權(quán)利要求14的裝置,其中新頂點確定裝置包括裝置,用于產(chǎn)生出連接兩個相鄰頂點的一條直線;裝置,用于計算從非匹配象素的每一個到該直線的垂直距離;裝置,用于確定具有最大的垂直距離的一個非匹配象素為存在于兩個頂點之間的新的頂點。
16.根據(jù)權(quán)利要求15的裝置,其中當(dāng)最大的垂直距離是大于預(yù)定的門限值時,具有最大的垂直距離的非匹配象素被確定為新的頂點。
全文摘要
一個裝置在輪廓上確定一對頂點。隨后,產(chǎn)生連接這對頂點的線段并將其加寬從而產(chǎn)生一個帶狀段。對應(yīng)于該線段的輪廓段是根據(jù)該對頂點和該輪廓確定的。隨后,帶狀段和輪廓段被匹配,從而確定一個新的頂點。根據(jù)所確定的頂點,該裝置重復(fù)地執(zhí)行上述的頂點檢測過程,直到在輪廓上的所有的頂點都被確定為止。最終,表示在該輪廓上的全部的頂點位置的信息被編碼而由發(fā)射機(jī)發(fā)送。
文檔編號H04N7/26GK1189056SQ9710370
公開日1998年7月29日 申請日期1997年3月24日 優(yōu)先權(quán)日1997年3月24日
發(fā)明者金鎮(zhèn)憲 申請人:大宇電子株式會社