專利名稱:基于對(duì)象邊緣的形狀快速運(yùn)動(dòng)估值的方法
技術(shù)領(lǐng)域:
本發(fā)明涉及的是一種快速運(yùn)動(dòng)估值的方法,更具體地,是涉及一種基于對(duì)象邊緣的形狀快速運(yùn)動(dòng)估值的方法,屬于視頻編碼技術(shù)領(lǐng)域。
背景技術(shù):
針對(duì)視頻編碼技術(shù)的發(fā)展,運(yùn)動(dòng)圖像專家組(MPEG組織)制定了MPEG-4國(guó)際標(biāo)準(zhǔn),提供對(duì)任意形狀視頻對(duì)象的編碼功能。在基于對(duì)象編碼的MPEG-4標(biāo)準(zhǔn)中,每個(gè)視頻對(duì)象通常由三類信息描述形狀信息、運(yùn)動(dòng)信息和紋理信息,其中形狀編碼是MPEG-4基于對(duì)象視頻編碼的關(guān)鍵。形狀編碼的核心算法是基于上下文的算術(shù)編碼(CAE),分為幀內(nèi)CAE和幀間CAE,分別用于形狀信息的幀內(nèi)編碼和幀間編碼。當(dāng)進(jìn)行幀間形狀編碼時(shí),為了提高CAE的編碼效率,必須對(duì)對(duì)象的形狀信息進(jìn)行運(yùn)動(dòng)估值在參考形狀信息中找到當(dāng)前編碼二值α塊(BAB)的最佳匹配塊,這是決定CAE編碼效率的關(guān)鍵。MPEG-4驗(yàn)證模型中的形狀運(yùn)動(dòng)估值采用全局搜索(FS),通過匹配搜索區(qū)域內(nèi)的全部候選參考?jí)K,找到最佳匹配塊,實(shí)現(xiàn)了最精確的運(yùn)動(dòng)估值。但該方法要占用形狀編碼器90%以上的計(jì)算量,成為編碼器中計(jì)算復(fù)雜度最高的模塊。
經(jīng)對(duì)現(xiàn)有技術(shù)的文獻(xiàn)檢索發(fā)現(xiàn),Tsung-Han Tsai等人在IEEE視頻技術(shù)電路與系統(tǒng)匯刊(IEEE Transactions on Circuits and Systems for Video Technology),Vol.14,NO.6,pp.908-913,Jun.2004上發(fā)表的“一種MPEG-4形狀編碼的快速二值運(yùn)動(dòng)估值算法”(A Fast Binary Motion Estimation Algorithm for MPEG-4Shape Coding)中,提出基于邊界像素的形狀快速運(yùn)動(dòng)估值(BPB)方法,大大提高了形狀運(yùn)動(dòng)估值的速度,該方法的核心思想是利用視頻對(duì)象的邊界像素,有兩方面的改進(jìn)第一是用加權(quán)的差值絕對(duì)值和(WSAD)代替差值的絕對(duì)值和(SAD)來衡量匹配誤差,可以避免形狀運(yùn)動(dòng)向量殘差(MVDs)過大而導(dǎo)致編碼比特?cái)?shù)增加;該方法對(duì)SAD和MVDs同時(shí)進(jìn)行了加權(quán),用其加權(quán)和WSAD來衡量BAB塊的匹配誤差,為了得到最佳的加權(quán)效果,需要選取合適的加權(quán)系數(shù)W1和W2。但在衡量BAB塊的匹配誤差時(shí),SAD仍是最主要的決定因素,所以只應(yīng)該適當(dāng)考慮MVDs的大小,并且確定兩個(gè)加權(quán)系數(shù)比確定一個(gè)加權(quán)系數(shù)要困難。
第二,該方法認(rèn)為當(dāng)前BAB塊中的對(duì)象輪廓應(yīng)該和參考BAB塊中的對(duì)象輪廓相互重疊,因此在運(yùn)動(dòng)向量的搜索范圍內(nèi),可以跳過大量的搜索點(diǎn),這些跳過搜索點(diǎn)對(duì)應(yīng)的參考BAB塊中的對(duì)象輪廓和當(dāng)前BAB塊中的對(duì)象輪廓不重疊。但當(dāng)視頻對(duì)象平面(VOP)的邊界變化比較大時(shí),最佳匹配點(diǎn)往往不在VOP的邊界像素處,此時(shí)只在VOP的邊界像素處進(jìn)行BAB塊的匹配就不合適了,這也是該方法的弊端。
發(fā)明內(nèi)容
本發(fā)明針對(duì)現(xiàn)有技術(shù)的不足,提出了一種基于對(duì)象邊緣的形狀快速運(yùn)動(dòng)估值(OBB)的方法,使其可以實(shí)現(xiàn)形狀的實(shí)時(shí)編碼,大大提高了形狀運(yùn)動(dòng)估值的速度,而且形狀的編碼效率并沒有降低。
本發(fā)明是通過以下技術(shù)方案實(shí)現(xiàn)的,具體步驟如下(1)形狀運(yùn)動(dòng)向量預(yù)測(cè)值MVPs選取如果形狀運(yùn)動(dòng)向量預(yù)測(cè)值MVPs選取的越準(zhǔn)確,則MVPs距離最終的形狀運(yùn)動(dòng)向量MVs就越近,即MVDs=MVs-MVPs越小,因此MVDs的編碼比特?cái)?shù)就越少;而且在后面的運(yùn)動(dòng)估值過程中,可以MVPs為中心,用更小的搜索范圍來搜索MVs,這就可以大大減少搜索點(diǎn)數(shù),加快形狀運(yùn)動(dòng)估值的速度,而不會(huì)明顯增加VOP形狀的編碼比特?cái)?shù)。對(duì)于BAB塊,因?yàn)閷儆谕粋€(gè)對(duì)象,所以鄰近BAB塊之間的形狀運(yùn)動(dòng)向量MVs有很強(qiáng)的相關(guān)性。在現(xiàn)有的形狀運(yùn)動(dòng)估值方法中,均選取候選運(yùn)動(dòng)向量列表{MVs1,MVs2,MVs3,MV1,MV2,MV3}中第一個(gè)有效的運(yùn)動(dòng)向量作為當(dāng)前BAB塊的形狀運(yùn)動(dòng)向量預(yù)測(cè)值MVPs,但是這種方法并沒有充分利用多個(gè)鄰近BAB塊之間形狀運(yùn)動(dòng)向量的強(qiáng)相關(guān)性,而只是簡(jiǎn)單地利用了其中一個(gè)鄰近BAB塊的形狀運(yùn)動(dòng)向量信息。
因此,本發(fā)明中,用當(dāng)前BAB塊的鄰近BAB塊形狀運(yùn)動(dòng)向量{MVs1,MVs2,MVs3}的中值或者鄰近紋理塊運(yùn)動(dòng)向量{MV1,MV2,MV3}的中值作為當(dāng)前BAB塊的形狀運(yùn)動(dòng)向量預(yù)測(cè)值MVPs,從而使MVDs變得更小,MVDs的編碼比特?cái)?shù)也就相應(yīng)的減少,提高了VOP形狀的編碼性能。
(2)中間跳過方法確定MVPs以后,當(dāng)前BAB塊在參考Alpha平面中的初始運(yùn)動(dòng)補(bǔ)償塊MC-BAB也就確定了。在MPEG-4的驗(yàn)證模型中,如果BAB塊中每一個(gè)4×4子塊對(duì)應(yīng)的匹配誤差都小于等于16×AlphaTH,說明匹配精度滿足了要求,則跳過后面的搜索過程,形狀運(yùn)動(dòng)估值結(jié)束。但是這種方法跳過的BAB塊并不多,整個(gè)形狀運(yùn)動(dòng)估值的速度得不到明顯的提高。如果BAB塊被跳過,MVDs并不需要編碼,節(jié)約了VOP形狀的編碼比特?cái)?shù)。為了提高形狀運(yùn)動(dòng)估值的速度,在確保不明顯增加VOP形狀編碼比特?cái)?shù)的情況下,可以適當(dāng)降低匹配精度,使更多的BAB塊跳過后面的搜索過程。
因此,本發(fā)明方法將BAB塊跳過后面的搜索過程而結(jié)束形狀運(yùn)動(dòng)估值的條件改為如果當(dāng)前BAB塊與MC-BAB塊之間的匹配誤差小于等于閾值TH,則形狀運(yùn)動(dòng)估值過程結(jié)束,最終的MVs=MVPs。使用這種中間跳過方法,更多的BAB塊跳過了后面的運(yùn)動(dòng)估值過程,節(jié)約了大量的計(jì)算量;而VOP形狀的編碼比特?cái)?shù)并沒有增加,反而下降了。這種VOP形狀編碼比特?cái)?shù)的改善,可以用來彌補(bǔ)后面因快速運(yùn)動(dòng)估值時(shí)匹配精度不足而造成的編碼比特?cái)?shù)上升。
(3)匹配誤差函數(shù)的選取在形狀編碼過程中,需要編碼MVDs,因此MVDs的大小將直接影響VOP形狀的編碼比特?cái)?shù)。在MPEG-4驗(yàn)證模型的形狀運(yùn)動(dòng)估值算法中,用運(yùn)動(dòng)補(bǔ)償差值的絕對(duì)值和SAD作為匹配誤差函數(shù),即用SAD來衡量BAB塊的匹配誤差。當(dāng)通過SAD來得到最佳匹配時(shí),如果MVDs比較大,同樣會(huì)增加形狀的編碼比特?cái)?shù),因此在形狀運(yùn)動(dòng)估值過程中,也應(yīng)該考慮MVDs的大小。為了降低較大的MVDs對(duì)VOP形狀編碼的影響,本發(fā)明方法通過加權(quán)的SADweight來衡量BAB塊的匹配誤差,可以在SAD和MVDs之間保持一個(gè)平衡,在搜索最小SAD的同時(shí)確保MVDs不會(huì)很大,從而使VOP形狀的編碼比特?cái)?shù)盡量減少。
(4)搜索區(qū)域的確定當(dāng)確定了當(dāng)前BAB塊的形狀運(yùn)動(dòng)向量預(yù)測(cè)值MVPs以后,在參考Alpha平面內(nèi)以MVPs確定的位置為中心進(jìn)行搜索,得到最終的形狀運(yùn)動(dòng)向量MVs。為了加快形狀運(yùn)動(dòng)估值的速度,在本發(fā)明的方法中,以MVPs確定的位置為中心,±4范圍內(nèi)搜索MVs。因?yàn)镸VDs絕大部分都在±4的范圍內(nèi),所以該方法并不會(huì)明顯增加VOP形狀的編碼比特?cái)?shù)。對(duì)于BAB塊的三種類型來說,透明BAB塊不需要編碼,不透明BAB塊一般都匹配參考Alpha平面中的不透明BAB塊,其匹配誤差為0,在中斷方法中屬于跳過的BAB塊,無需繼續(xù)后面的搜索過程。因此,在搜索MVs的過程中,主要是進(jìn)行邊界BAB塊的匹配。
在本發(fā)明方法中,充分利用對(duì)象的邊界特性進(jìn)行邊界BAB塊的形狀運(yùn)動(dòng)估值。對(duì)于當(dāng)前的邊界BAB塊,在參考Alpha平面中對(duì)應(yīng)的參考BAB塊幾乎都是邊界塊?;谶@種考慮,在進(jìn)行邊界BAB塊的形狀運(yùn)動(dòng)估值時(shí),只需要在參考Alpha平面的VOP邊界附近進(jìn)行BAB塊的匹配,這樣在搜索范圍內(nèi)就可以大大減少匹配BAB塊的數(shù)目。并且對(duì)于非常關(guān)鍵的VOP邊界處搜索區(qū)域的確定,本發(fā)明采用了一種靈活的確定VOP邊界處搜索區(qū)域的寬度的方法,兼顧了運(yùn)動(dòng)估值的速度和編碼效率。
本發(fā)明方法更加充分地利用了鄰近形狀BAB塊之間形狀運(yùn)動(dòng)向量的相關(guān)性,提高了形狀運(yùn)動(dòng)向量預(yù)測(cè)值的精度,即形狀運(yùn)動(dòng)向量的預(yù)測(cè)值距離最終形狀運(yùn)動(dòng)向量更近,因此可以在更小的范圍內(nèi)搜索最終的形狀運(yùn)動(dòng)向量,從而大大提高了形狀運(yùn)動(dòng)估值的速度,而VOP形狀的編碼比特?cái)?shù)并沒有明顯的增加;該方法還充分利用了形狀運(yùn)動(dòng)估值時(shí)的邊界特性——這也是該方法的核心思想,把搜索區(qū)域設(shè)定在VOP的邊界附近,這樣大大提高了形狀運(yùn)動(dòng)估值的速度,而邊界BAB塊的匹配精度并沒有明顯的下降,因此VOP形狀的編碼比特?cái)?shù)也不會(huì)有明顯的增加。仿真結(jié)果表明,本發(fā)明優(yōu)于現(xiàn)有的形狀運(yùn)動(dòng)估值方法形狀運(yùn)動(dòng)估值速度大大超過現(xiàn)有算法的形狀運(yùn)動(dòng)估值速度,其平均搜索點(diǎn)數(shù)只有MPEG-4驗(yàn)證模型中算法搜索點(diǎn)數(shù)的0.82%,而形狀的編碼效率并沒有降低。
圖1本發(fā)明方法流程圖。
具體實(shí)施例方式
以下結(jié)合附圖和方法的內(nèi)容提供具體的實(shí)施例。
如圖所示,本發(fā)明可分為以下幾個(gè)步驟(1)形狀運(yùn)動(dòng)向量預(yù)測(cè)值MVPs的選取用當(dāng)前BAB塊的鄰近BAB塊形狀運(yùn)動(dòng)向量{MVs1,MVs2,MVs3}的中值或者鄰近紋理塊運(yùn)動(dòng)向量{MV1,MV2,MV3}的中值作為當(dāng)前BAB塊的形狀運(yùn)動(dòng)向量預(yù)測(cè)值MVPs。具體方法如下·如果鄰近BAB塊的{MVs1,MVs2,MVs3}中存在有效值,則(1)如果只有一個(gè)有效的MVs,MVPs等于該MVs;(2)如果只有兩個(gè)有效的MVs,則令第三個(gè)無效的MVs等于(0,0),MVPs=Median(MVs1,MVs2,MVs3);[注Median()表示取中值。](3)如果三個(gè)MVs都是有效的,則MVPs=Median(MVs1,MVs2,MVs3)。
·如果{MVs1,MVs2,MVs3}都是無效的,但鄰近紋理塊的{MV1,MV2,MV3}中存在有效值,則(1)如果只有一個(gè)有效的MV,MVPs等于該MV;(2)如果只有兩個(gè)有效的MV,則令第三個(gè)無效的MV等于(0,0),MVPs=Median(MV1,MV2,MV3);(3)如果三個(gè)MV都是有效的,則MVPs=Median(MV1,MV2,MV3);·如果{MVs1,MVs2,MVs3,MV1,MV2,MV3}都是無效的,則MVPs=(0,0)。
當(dāng)確定了MVPs以后,計(jì)算當(dāng)前BAB塊與MVPs確定的參考BAB塊之間的匹配誤差,如果該匹配誤差不大于預(yù)先設(shè)定的閾值,說明MVPs確定的參考BAB塊已經(jīng)達(dá)到了匹配精度,則跳過后面的運(yùn)動(dòng)估值過程,最終的MVs=MVPs,MVDs=0。如果MVPs確定的BAB塊不能達(dá)到要求的匹配精度,則需要繼續(xù)后面的運(yùn)動(dòng)估值過程,搜索最終的MVs,并編碼MVDs。
表1給出了分別采用MPEG-4驗(yàn)證模型中選取MVPs的方法和本發(fā)明改進(jìn)的中值預(yù)測(cè)方法時(shí),被跳過的BAB塊的數(shù)目。測(cè)試序列為300幀CIF格式的“Akiyo”,“Weather”和“Stefan”序列。從表中可以看出,采用本發(fā)明改進(jìn)的中值預(yù)測(cè)方法后,跳過的BAB塊增加了,說明使用鄰近BAB塊MVs的中值作為MVPs更加精確,從而使許多BAB塊對(duì)應(yīng)的匹配誤差都不大于預(yù)先設(shè)定的閾值。因?yàn)樘^的BAB塊不需要繼續(xù)后面的運(yùn)動(dòng)估值過程,所以跳過的BAB塊越多,形狀運(yùn)動(dòng)估值的速度就越快。表1同時(shí)給出了采用不同MVPs選取方法時(shí),VOP形狀的平均編碼比特?cái)?shù),用Bits/VOP表示。從表中可以看出,使用本發(fā)明方法,VOP形狀的編碼比特?cái)?shù)減少了,主要是因?yàn)?1)跳過的BAB塊增多,其對(duì)應(yīng)的MVDs為0,不需要編碼MVDs;(2)沒有跳過的BAB塊對(duì)應(yīng)的MVDs變小,更多的分布在(0,0)附近,因此MVDs的編碼比特?cái)?shù)減少。
表1采用MVPs不同選取方法時(shí)跳過的BAB塊以及形狀編碼比特?cái)?shù)的比較
在形狀運(yùn)動(dòng)向量的編碼過程中,只需要編碼傳輸MVDs,而不是編碼傳輸MVs;在解碼端,當(dāng)選取MVPs以及解碼MVDs以后,可以立即計(jì)算出MVs=MVPs+MVDs。由于MPEG-4已經(jīng)標(biāo)準(zhǔn)化,MPEG-4的標(biāo)準(zhǔn)解碼器是以鄰近BAB塊的第一個(gè)有效MVs作為MVPs,因此為了使標(biāo)準(zhǔn)解碼器能夠正確解碼,當(dāng)傳送MVDs給解碼器時(shí),應(yīng)該把鄰近BAB塊MVs的中值與第一個(gè)有效MVs之間的差值計(jì)算在MVDs中。即設(shè)采用本發(fā)明方法選取的MVPs=MVmedian,采用驗(yàn)證模型中的方法選取的MVPs=MVfirst,則計(jì)算得到的MVDs=MVDs+(MVmedian-MVfirst)。此時(shí)MVDs的編碼比特?cái)?shù)可能會(huì)有所增加,但增加的并不明顯,而且由于采用下面描述的算法也可以節(jié)約一些編碼比特?cái)?shù),所以采用整個(gè)方法后并不會(huì)明顯增加形狀編碼比特?cái)?shù),對(duì)于大部分測(cè)試序列,編碼比特?cái)?shù)還會(huì)減少。
(2)中間跳過方法確定MVPs以后,當(dāng)前BAB塊在參考Alpha平面中的初始運(yùn)動(dòng)補(bǔ)償塊MC-BAB也就確定了。BAB塊跳過后面的搜索過程而結(jié)束形狀運(yùn)動(dòng)估值的條件為如果當(dāng)前BAB塊與MC-BAB塊之間的匹配誤差小于等于閾值TH,則形狀運(yùn)動(dòng)估值過程結(jié)束,最終的MVs=MVPs。通過實(shí)驗(yàn)測(cè)試(測(cè)試序列300幀CIF格式的“Akiyo”,“Container”,“Coastguard”,“Weather”,“News”,“Stefan”),選取TH=255×10。通過仿真發(fā)現(xiàn),對(duì)于不同的測(cè)試序列,被跳過的BAB塊占全部BAB塊的比例為19.5~63%,這就可以明顯加快整個(gè)形狀運(yùn)動(dòng)估值的速度。表2給出了分別采用MPEG-4驗(yàn)證模型的中間跳過方法和本發(fā)明改進(jìn)的中間跳過方法時(shí),被跳過的BAB塊的數(shù)目以及VOP形狀的平均編碼比特?cái)?shù)。從表中可以看出,使用本發(fā)明中間跳過方法,更多的BAB塊跳過了后面的運(yùn)動(dòng)估值過程,節(jié)約了大量的計(jì)算量;而VOP形狀的編碼比特?cái)?shù)并沒有增加,反而下降了。
表2采用不同的中間跳過方法時(shí)跳過的BAB塊以及形狀編碼比特?cái)?shù)的比較
(3)匹配誤差函數(shù)的選取通過加權(quán)的SADweight來衡量BAB塊的匹配誤差,在SAD和MVDs之間保持一個(gè)平衡,在搜索最小SAD的同時(shí)確保MVDs不會(huì)很大,從而使VOP形狀的編碼比特?cái)?shù)盡量減少。采用下式來衡量BAB塊的匹配誤差SADweight=SAD+0.5×(|MVDs_x|+|MVDs_y|)式中MVDs_x和MVDs_y分別為MVDs的水平和垂直分量。
表3給出了分別采用基于邊界像素算法中的加權(quán)WSAD方法以及本發(fā)明加權(quán)SADweight方法時(shí),VOP形狀的平均編碼比特?cái)?shù)。本發(fā)明的方法與基于邊界像素算法中的加權(quán)WSAD方法的效果相近,本發(fā)明要好一些。另外本發(fā)明計(jì)算加權(quán)SADweight時(shí)只需要一個(gè)乘法,而基于邊界像素算法計(jì)算加權(quán)WSAD時(shí)卻需要兩個(gè)乘法,這在實(shí)時(shí)編碼中浪費(fèi)了一定的計(jì)算量。
表3選取不同的匹配誤差函數(shù)時(shí)形狀編碼比特?cái)?shù)的比較
(4)搜索區(qū)域的確定當(dāng)確定了當(dāng)前BAB塊的形狀運(yùn)動(dòng)向量預(yù)測(cè)值MVPs后,在參考Alpha平面內(nèi)以MVPs確定的位置為中心,±4范圍內(nèi)搜索MVs。
在本發(fā)明中,VOP邊界處搜索區(qū)域的寬度為8,其確定方法為在參考Alpha平面中,以每一個(gè)像素點(diǎn)為頂點(diǎn),形成一個(gè)8×8的塊,如果該塊為邊界塊,即塊中既有VOP內(nèi)的像素又有VOP外的像素,則該點(diǎn)在VOP的邊界搜索區(qū)域內(nèi);如果該塊是透明塊或者不透明塊,則該點(diǎn)不在VOP的邊界搜索區(qū)域內(nèi)。如果期望進(jìn)一步提高形狀運(yùn)動(dòng)估值的精度,可以把8×8塊放大,最大為16×16,但形狀運(yùn)動(dòng)估值的速度將會(huì)降低;如果期望進(jìn)一步提高形狀運(yùn)動(dòng)估值的速度,可以把8×8塊縮小,但形狀運(yùn)動(dòng)估值的精度將會(huì)降低,影響編碼效率。
確定MVPs以后,對(duì)于沒有跳過的BAB塊,需要繼續(xù)搜索最終的MVs,其搜索過程如下·在進(jìn)行BAB塊運(yùn)動(dòng)估值之前,在參考Alpha平面的VOP邊界附近確定邊界BAB塊的搜索區(qū)域;·當(dāng)進(jìn)行BAB塊的運(yùn)動(dòng)估值時(shí),在參考Alpha平面中,以MVPs確定的位置為中心,±4范圍內(nèi)搜索最終的MVs;·在±4范圍內(nèi)搜索MVs時(shí),如果搜索點(diǎn)不在預(yù)先確定的VOP邊界搜索區(qū)域內(nèi),則跳過該搜索點(diǎn),繼續(xù)下一個(gè)搜索點(diǎn)的匹配。
下面使用300幀不同的測(cè)試序列對(duì)MPEG-4驗(yàn)證模型中形狀運(yùn)動(dòng)估值算法、基于邊界像素的形狀快速運(yùn)動(dòng)估值算法和本發(fā)明方法這三種形狀運(yùn)動(dòng)估值算法進(jìn)行仿真,表4給出了仿真的統(tǒng)計(jì)結(jié)果。
從表4中可以得出本發(fā)明方法對(duì)各種運(yùn)動(dòng)類型的序列效果都很好,其形狀運(yùn)動(dòng)估值的速度大大超過驗(yàn)證模型中的算法和基于邊界像素算法的形狀運(yùn)動(dòng)估值速度,平均搜索點(diǎn)數(shù)只有MPEG-4驗(yàn)證模型中算法搜索點(diǎn)數(shù)的0.82%,而VOP形狀的編碼比特?cái)?shù)并沒有明顯增加,在許多序列中,VOP形狀的編碼比特?cái)?shù)還有所減少,即形狀的編碼效率并沒有降低。
表4各種形狀運(yùn)動(dòng)估值算法的執(zhí)行比較(測(cè)試序列為300幀)
綜上所述,本發(fā)明優(yōu)于其它方法,其優(yōu)點(diǎn)是(1)并不假設(shè)VOP的形狀是不變的,因此對(duì)各種序列的效果都很好;(2)避免了上述現(xiàn)有方法的不足;(3)更加充分地利用了鄰近形狀塊之間形狀運(yùn)動(dòng)向量的相關(guān)性,利用鄰近BAB塊的形狀運(yùn)動(dòng)向量的中值作為當(dāng)前BAB塊的形狀運(yùn)動(dòng)向量預(yù)測(cè)值,提高了預(yù)測(cè)值的精度,預(yù)測(cè)值的準(zhǔn)確性保證了在不明顯增加VOP形狀編碼比特?cái)?shù)的情況下,可以大大縮小搜索范圍;(4)充分利用了形狀運(yùn)動(dòng)估值時(shí)的邊界特性,把搜索區(qū)域設(shè)定在VOP的邊界附近,大大提高了形狀運(yùn)動(dòng)估值的速度,使VOP形狀編碼比特?cái)?shù)和形狀運(yùn)動(dòng)估值速度之間保持了平衡;(5)邊界形狀塊的匹配精度并不會(huì)有明顯的下降,VOP形狀編碼比特?cái)?shù)保持相近,在許多視頻序列中形狀編碼比特?cái)?shù)還會(huì)有所減少,即形狀的編碼效率并沒有降低。這種方法可以在保持形狀編碼效率的基礎(chǔ)上大大提高現(xiàn)有算法的形狀運(yùn)動(dòng)估值速度。
權(quán)利要求
1.一種基于對(duì)象邊緣的形狀快速運(yùn)動(dòng)估值的方法,其特征在于,步驟如下(1)形狀運(yùn)動(dòng)向量預(yù)測(cè)值MVPs選取用當(dāng)前BAB塊的鄰近BAB塊形狀運(yùn)動(dòng)向量{MVs1,MVs2,MVs3}的中值或者鄰近紋理塊運(yùn)動(dòng)向量{MV1,MV2,MV3}的中值作為當(dāng)前BAB塊的形狀運(yùn)動(dòng)向量預(yù)測(cè)值MVPs;(2)中間跳過方法確定MVPs以后,當(dāng)前BAB塊在參考Alpha平面中的初始運(yùn)動(dòng)補(bǔ)償塊MC-BAB也就確定了,BAB塊跳過后面的搜索過程而結(jié)束形狀運(yùn)動(dòng)估值的條件為如果當(dāng)前BAB塊與MC-BAB塊之間的匹配誤差小于等于閾值TH,則形狀運(yùn)動(dòng)估值過程結(jié)束,最終的MVs=MVPs;(3)匹配誤差函數(shù)的選取通過加權(quán)的SADweight來衡量BAB塊的匹配誤差,在SAD和MVDs之間保持一個(gè)平衡;(4)搜索區(qū)域的確定當(dāng)確定了當(dāng)前BAB塊的形狀運(yùn)動(dòng)向量預(yù)測(cè)值MVPs以后,在參考Alpha平面內(nèi)以MVPs確定的位置為中心,±4范圍內(nèi)進(jìn)行搜索,搜索區(qū)域設(shè)定為VOP邊界處,得到最終的形狀運(yùn)動(dòng)向量MVs。
2.根據(jù)權(quán)利要求1所述的基于對(duì)象邊緣的形狀快速運(yùn)動(dòng)估值的方法,其特征是,所述的步驟(1),形狀運(yùn)動(dòng)向量預(yù)測(cè)值MVPs選取具體方法如下·如果鄰近BAB塊的{MVs1,MVs2,MVs3}中存在有效值,則(1)如果只有一個(gè)有效的MVs,MVPs等于該MVs,(2)如果只有兩個(gè)有效的MVs,則令第三個(gè)無效的MVs等于(0,0),MVPs=Median(MVs1,MVs2,MVs3),(3)如果三個(gè)MVs都是有效的,則MVPs=Median(MVs1,MVs2,MVs3);·如果{MVs1,MVs2,MVs3}都是無效的,但鄰近紋理塊的{MV1,MV2,MV3}中存在有效值,則(1)如果只有一個(gè)有效的MV,MVPs等于該MV,(2)如果只有兩個(gè)有效的MV,則令第三個(gè)無效的MV等于(0,0),MVPs=Median(MV1,MV2,MV3),(3)如果三個(gè)MV都是有效的,則MVPs=Median(MV1,MV2,MV3);·如果{MVs1,MVs2,MVs3,MV1,MV2,MV3}都是無效的,則MVPs=(0,0);當(dāng)確定了MVPs以后,計(jì)算當(dāng)前BAB塊與MVPs確定的參考BAB塊之間的匹配誤差,如果該匹配誤差小于或者等于預(yù)先設(shè)定的閾值,說明MVPs確定的參考BAB塊已經(jīng)達(dá)到了匹配精度,則跳過后面的運(yùn)動(dòng)估值過程,最終的MVs=MVPs,MVDs=0;如果MVPs確定的BAB塊不能達(dá)到要求的匹配精度,則需要繼續(xù)后面的運(yùn)動(dòng)估值過程,搜索最終的MVs,并編碼MVDs。
3.根據(jù)權(quán)利要求1所述的基于對(duì)象邊緣的形狀快速運(yùn)動(dòng)估值的方法,其特征是,所述的步驟(3)中,采用下式來衡量BAB塊的匹配誤差SADweight=SAD+0.5×(|MVDs_x|+|MVDs_y|)式中MVDs_x和MVDs_y分別為MVDs的水平和垂直分量。
4.根據(jù)權(quán)利要求1所述的基于對(duì)象邊緣的形狀快速運(yùn)動(dòng)估值的方法,其特征是,所述的步驟(4)中,VOP邊界處搜索區(qū)域的寬度為8,搜索區(qū)域的確定方法為在參考Alpha平面中,以每一個(gè)像素點(diǎn)為頂點(diǎn),形成一個(gè)8×8的塊,如果該塊為邊界塊,即塊中既有VOP內(nèi)的像素又有VOP外的像素,則該點(diǎn)在VOP的邊界搜索區(qū)域內(nèi);如果該塊是透明塊或者不透明塊,則該點(diǎn)在VOP的邊界搜索區(qū)域外,通過把8×8塊放大進(jìn)一步提高形狀運(yùn)動(dòng)估值的精度,最大為16×16;通過把8×8塊縮小進(jìn)一步提高形狀運(yùn)動(dòng)估值的速度。
5.根據(jù)權(quán)利要求1所述的基于對(duì)象邊緣的形狀快速運(yùn)動(dòng)估值的方法,其特征是,確定MVPs以后,對(duì)于沒有跳過的BAB塊,需要繼續(xù)搜索最終的MVs,其搜索過程如下·在進(jìn)行BAB塊運(yùn)動(dòng)估值之前,在參考Alpha平面的VOP邊界附近確定邊界BAB塊的搜索區(qū)域;·當(dāng)進(jìn)行BAB塊的運(yùn)動(dòng)估值時(shí),在參考Alpha平面中,以MVPs確定的位置為中心,±4范圍內(nèi)搜索最終的MVs;·在±4范圍內(nèi)搜索MVs時(shí),如果搜索點(diǎn)在預(yù)先確定的VOP邊界搜索區(qū)域外,則跳過該搜索點(diǎn),繼續(xù)下一個(gè)搜索點(diǎn)的匹配。
全文摘要
一種視頻編碼技術(shù)領(lǐng)域的基于對(duì)象邊緣的形狀快速運(yùn)動(dòng)估值的方法,步驟如下(1)形狀運(yùn)動(dòng)向量預(yù)測(cè)值MVPs選取用當(dāng)前BAB塊的鄰近BAB塊形狀運(yùn)動(dòng)向量{MVs1,MVs2,MVs3}的中值或者鄰近紋理塊運(yùn)動(dòng)向量{MV1,MV2,MV3}的中值作為當(dāng)前BAB塊的形狀運(yùn)動(dòng)向量預(yù)測(cè)值MVPs;(2)中間跳過方法BAB塊跳過后面的搜索過程而結(jié)束形狀運(yùn)動(dòng)估值的條件為如果當(dāng)前BAB塊與MC-BAB塊之間的匹配誤差小于等于閾值TH,則形狀運(yùn)動(dòng)估值過程結(jié)束,最終的MVs=MVPs;(3)匹配誤差函數(shù)的選取通過加權(quán)的SADweight來衡量BAB塊的匹配誤差;(4)搜索區(qū)域的確定在參考Alpha平面內(nèi)以MVPs確定的位置為中心進(jìn)行搜索,搜索區(qū)域設(shè)定為VOP邊界附近。本發(fā)明大大超過現(xiàn)有方法的形狀運(yùn)動(dòng)估值速度,且形狀的編碼效率并沒有降低。
文檔編號(hào)H04N7/26GK1688164SQ20051002659
公開日2005年10月26日 申請(qǐng)日期2005年6月9日 優(yōu)先權(quán)日2005年6月9日
發(fā)明者解蓉, 王嘉, 周軍, 余松煜, 支琤 申請(qǐng)人:上海交通大學(xué)