專利名稱:用于視頻編碼的方法和設備的制作方法
技術領域:
本申請總體涉及用于對與視頻編碼有關的信息進行編碼和解碼的方法和設備。
背景技術:
視頻編碼可以以幀內模式和/或幀間模式執(zhí)行。幀內模式利用視頻幀內的冗余,幀間模式利用視頻幀之間的冗余。在幀間模式下,根據(jù)被稱為參考圖像的已編碼/解碼圖像來獲得像素亮度/色度預測。根據(jù)用于預測的參考圖像的數(shù)目,將幀間模式分類為單向預測模式(或單向模式)、雙向預測模式(B模式)、以及可能的三向預測模式等等,其中分別使用I個、2個和3個參考圖像。在本文中,將這些不同模式(即,單向預測、雙向預測等等)稱為“參考模式”。
高級視頻編碼(AVC)(也稱為H. 264和MPEG-4第10部分)是來自ITU-T (國際電信聯(lián)盟-電信標準組織)和MPEG(運動圖像專家組)的用于2D視頻編碼的現(xiàn)有標準。AVC編解碼器是一種混合編解碼器,利用了消除幀之間以及幀內的冗余。在AVC中,定義了兩個參考列表,其中相關參考圖像的標識符按照特定順序排列。在AVC中,這些指示符用參考索引表示,并且從0到N編號,例如(0,1,…,N)。第一列表(List O(LO))主要管理過去參考圖像(即,在時間上處于當前圖像之前的參考圖像),第二列表(List I(Ll))通常管理未來參考圖像(即,在時間上處于當前圖像之后的參考圖像)。對于低延遲視頻編碼,LI也可以管理過去參考圖像。每一個列表可以保持多達15個參考圖像的指示符,即,索引的數(shù)目N為N = 14。此外,在AVC中,在宏塊(MB)模式/子-MB模式中,利用分區(qū)結構將指定對參考圖像列表之一的選擇(例如,用于單向預測)或對兩個參考圖像列表的選擇(例如,用于雙向預測)的指示符或參考模式索引編碼在一起,而將指定各個列表中的所選參考圖像的指示符或參考圖像索引編碼為分離的語法元素?!胺謪^(qū)結構”指的是諸如16X16MB的16X16、16X8或8X16之類的分區(qū)。諸如16X16的分區(qū)在使用單向預測時通常與一個運動向量(MV)和一個參考索引相關聯(lián),而在使用雙向預測時通常與兩個MV和兩個參考索引相關聯(lián)。MV具有水平分量MVx和垂直分量MVy,描述如何從相應的參考圖像中產生當前分區(qū)的像素。與圖像或分區(qū)相關聯(lián)的參考圖像的數(shù)目取決于與同一個分區(qū)相關聯(lián)的參考模式,即,參考模式是單向預測或雙向預測等等。當在解碼器中解碼參考信息時,為了解碼器能夠正確地解碼出圖像或分區(qū),必須正確地解碼與圖像或分區(qū)相關聯(lián)的參考模式索引和一個或多個參考圖像索引。參考模式索引和一個或多個參考圖像索引之中任何一個的不正確解碼可能導致參考信息的錯誤解譯。當前的參考信息編碼方法(例如以上所描述的AVC方法)需要相對大量的比特,用以表達與每一個塊相關聯(lián)的參考信息。在編碼效率方面,這被認為是低效率的。
發(fā)明內容
希望針對參考信息(即,識別用于預測當前幀的一個或多個參考圖像的信息)實現(xiàn)改進的編碼效率。本發(fā)明的目的是實現(xiàn)針對參考信息的改進的編碼效率。此外,本發(fā)明的目的是提供一種用于實現(xiàn)針對參考信息的改進預測的方法和設備。這些目的可以通過根據(jù)所附獨立權利要求所述的方法和設備來實現(xiàn)。從屬權利要求限定了可選實施例。以下描述的預測、編碼和解碼可以在相同的實體或節(jié)點內執(zhí)行,或者可以在不同的實體或節(jié)點內執(zhí)行。
根據(jù)第一方面,提供了一種視頻解碼實體中的方法。該方法包括獲得編碼塊和編碼塊的相鄰塊的集合,每一個相鄰塊與一個或多個參考圖像相關聯(lián)。該方法還包括確定與相鄰塊的集合相關聯(lián)的參考圖像之中的多個參考圖像或參考圖像組合的出現(xiàn)頻率。該方法還包括選擇與相鄰塊相關聯(lián)的參考圖像之中所確定的出現(xiàn)頻率最聞的參考圖像或參考圖像組合,作為要在對編碼塊進行解碼時使用的參考圖像或參考圖像組合C的預測Cpred。該方法還包括獲得指定所述預測Cpred是否對應于C的指示。當指示所述預測Cpred對應于C時,基于所述預測Cpred對編碼塊Be進行解碼。由此,獲得解碼的像素塊B。根據(jù)第二方面,提供了一種視頻解碼實體中的設備。該設備包括一功能單元,適配為獲得編碼塊和編碼塊的相鄰塊的集合,每一個相鄰塊與一個或多個參考圖像相關聯(lián)。該設備還包括一功能單元,適配為確定與相鄰塊的集合相關聯(lián)的參考圖像之中的多個參考圖像或參考圖像組合的出現(xiàn)頻率。該設備還包括一功能單元,適配為選擇與相鄰塊相關聯(lián)的參考圖像之中所確定的出現(xiàn)頻率最高的參考圖像或參考圖像的組合,作為要在對編碼塊進行解碼時使用的參考圖像或參考圖像組合C的預測Cpred。該設備還包括一功能單元,適配為獲得指定所述預測Cpred是否對應于C的指示。該設備還包括一功能單元,適配為當指示所述預測Cpred對應于C時,基于所述預測Cpred對編碼塊Be進行解碼,由此提供解碼的像素塊B。根據(jù)第三方面,提供了一種視頻編碼實體中的方法。該方法包括確定與像素塊B的相鄰塊的集合相關聯(lián)的參考圖像之中的多個參考圖像或參考圖像組合的出現(xiàn)頻率。該方法還包括選擇與相鄰塊相關聯(lián)的參考圖像之中所確定的出現(xiàn)頻率最聞的參考圖像或參考圖像組合,作為在對塊B進行編碼時使用的參考圖像或參考圖像組合C的預測Cpred。該方法還包括確定所述預測Cpred是否對應于C,以及向該塊的解碼器提供指定所述確定的結果的指示。根據(jù)第四方面,提供了一種視頻編碼實體中的設備。該設備包括一功能單元,適配為對于塊B,確定與相鄰塊的集合相關聯(lián)的參考圖像之中的多個參考圖像或參考圖像組合的出現(xiàn)頻率,其中所述塊B具有編碼相鄰塊的集合,每一個相鄰塊與在對所述相鄰塊進行編碼時使用的一個或多個參考圖像相關聯(lián)。該設備還包括一功能單元,適配為選擇與相鄰塊相關聯(lián)的參考圖像之中所確定的出現(xiàn)頻率最高的參考圖像或參考圖像組合,作為在對塊B進行編碼時所使用的參考圖像或參考圖像組合C的預測Cpred。該設備還包括一功能單元,適配為確定所述預測Cpred是否對應于C。該設備還包括一功能單元,適配為向該塊的解碼器提供指定所述確定的結果的指示。上述方法和設備可以用于改進編碼效率。由于能夠使用較少的比特來識別用于預測當前幀的一個或多個參考圖像,因而可以改進編碼效率。上述方法和設備還可以實現(xiàn)改進的容錯性能。此外,上述方法和設備允許以簡單的方式來執(zhí)行參考圖像索引預測。上述方法和設備可以在不同實施例中實現(xiàn)。在一些實施例中,與相鄰塊相關聯(lián)的參考圖像由參考模式參數(shù)和一個或多個參考圖像參數(shù)的組合來識別。在其他實施例中,與相鄰塊相關聯(lián)的參考圖像由單個語法元素來識別。通過將參考模式與索引捆綁在一起以形成單個語法元素,可以簡單地處理參考索引編號。在一些實施例中,參考圖像和/或參考圖像組合的出現(xiàn)頻率包括與相鄰塊相關聯(lián)的參考圖像和/或參考圖像組合的計數(shù)。可以基于不同準則(例如,與相鄰塊相關聯(lián)的變換系數(shù)的數(shù)目,該相鄰塊與所考慮的出現(xiàn)相關聯(lián)),給參考圖像或參考圖像組合的不同出現(xiàn)分配不同的權重。 可以將關于Cpred是否對應于C的指示作為比特流中的語法元素發(fā)信號通知或者隱式地發(fā)信號通知。在指示所述預測Cpred不對應于C時,可以傳送進一步信息,以能夠確定要在對編碼塊Be進行解碼時使用哪個或哪些參考圖像。所確定的參考圖像和/或參考圖像組合的出現(xiàn)頻率可以用于將參考圖像或參考圖像組合的指示符映射到變長碼字。關于Cpred是否對應于C的指示可以是這種碼字。也可以使用這種碼字來發(fā)信號通知在指示Cpred不對應于C時所需要的進一步信息。因此,可以確保將最短的碼字用于最可能的備選。此外,在一些實施例中,可以基于隱式信息來識別與多向預測相關聯(lián)的某一塊的一個或多個子區(qū)域,對于所述一個或多個子區(qū)域,多向預測參考塊中的各個相應區(qū)域之間具有較對低的相關。針對所識別的子區(qū)域,可以使用備選預測代替該多向預測。該備選預測可以是單向預測或加權的多向預測。該備選預測可以是僅利用與所述多向預測相關聯(lián)的參考塊之一的預測。以上實施例主要是就方法進行描述的。然而,以上描述也旨在包括設備的實施例,該設備適于執(zhí)行以上描述的特征。上述示例實施例的不同特征可以根據(jù)需要、需求或偏好以不同方式合并。根據(jù)另一方面,提供了一種計算機程序,包括計算機可讀代碼裝置,所述計算機可讀代碼裝置在一個或多個處理單元上執(zhí)行時,使得以上描述的任意設備執(zhí)行根據(jù)以上描述的任意方法所述的相應過程。 根據(jù)另一方面,提供了一種計算機程序產品,包括上述計算機程序。
現(xiàn)在將借助于示例實施例并參照附圖來更加詳細地描述本發(fā)明,在附圖中圖I和2是示意了根據(jù)示例實施例的確定與當前塊的相鄰塊相關聯(lián)的參考模式和一個或多個參考圖像的不同組合的出現(xiàn)頻率的示意圖。圖3是示意了根據(jù)現(xiàn)有技術將指示符(碼字)分配給不同索引符號的示意圖。圖4是示意了根據(jù)示例實施例的對指示符(碼字)的分配的示意圖。圖5是根據(jù)示例實施例將碼字分配給參考信息的示意。圖6是示意了根據(jù)示例實施例的用于對與參考模式和一個或多個參考圖像相關的信息進行編碼的過程的流程圖。圖7是示意了根據(jù)示例實施例的視頻編碼實體中的適配為對與參考模式和一個或多個參考圖像相關的信息進行編碼的設備的框圖。圖8是示意了根據(jù)示例實施例的用于對與參考模式和一個或多個參考圖像相關的信息進行解碼的過程的流程圖。圖9是示意了根據(jù)示例實施例的視頻解碼實體中的適配為對與參考模式和一個或多個參考圖像進行解碼的設備的框圖。圖10是示意了根據(jù)示例實施例的視頻編碼/解碼實體中的設備的示意圖。圖11是示意了從根據(jù)現(xiàn)有技術的參考信息表示到根據(jù)示例實施例的參考信息表示的轉換的示意圖。圖12是示出了 AVC參考索引表示與根據(jù)示例實施例的參考索引表示之間的區(qū)別的表。 圖13是示意了根據(jù)示例實施例的對參考信息指示符的分配的示意圖。圖14是示意了根據(jù)示例實施例的基于隱式信息的分區(qū)的示意圖。
具體實施例方式已經認識到,現(xiàn)有視頻編碼技術的一個問題在于沒有定義或應用令人滿意的參考模式和/或參考圖像預測方案。已經認識到,在例如鏡頭切換/淡入/閃光場景中,使用相同的例如參考模式和參考圖像的組合來預測相鄰或鄰近的MB是極其常見的。此外,認識至IJ,當前的編碼方法沒有利用用于相鄰MB的參考模式/參考圖像之間的相關。在先前方案中,獨立地對識別MB參考信息的單獨分量進行編碼,并將其傳送至視頻解碼器。在本文中,假設將對在編碼像素塊時所使用的參考模式和一個或多個參考圖像的指示符進行聯(lián)合編碼,并且因此將由單個語法元素來表示對編碼塊進行解碼所必需的所有參考信息,例如表示為“參考指示符”、“參考索引”、“參考索引符號”或“RIS索引”,其中“RIS”代表“參考索引信令”或“參考信息指示符信令”,下面將對其進行詳細描述。這種聯(lián)合編碼提供了針對使用單個參考圖像的單向預測和使用多個參考圖像的預測(例如,雙向預測、三向預測等等)均執(zhí)行參考信息預測的有用可能性。然而,應當注意,以下描述的參考信息預測過程也可以用于現(xiàn)有的參考信息表示,例如在AVC中使用的參考模式索引和參考圖像列表索引。在本文中,使用術語“塊X的相鄰塊”來指代塊X的相鄰塊(即,位于與塊X相鄰的位置或鄰近塊X的位置的塊)。此外,在本文中,使用術語“塊”來指代像素單元。使用術語“參考圖像”或“參考塊”來指代先前編碼/解碼的圖像、塊、圖像中的區(qū)域(region)或區(qū)塊(area),其中該圖像、塊、區(qū)域等用作預測的參考。下面可以描述對于MB級的示例預測方案。該示例預測方案應用于編碼器和解碼器二者,并且可以應用于任何塊大小。與對當前MB的編碼/解碼相關聯(lián)地,編碼器/解碼器被布置用于對周圍的編碼MB(也稱為MB的“上下文”)的參考指示符進行分析。這些周圍塊也可以稱為當前塊的“相鄰塊”。編碼器/解碼器對候選指示符或索引的集合中的每一個在相鄰塊之中出現(xiàn)的次數(shù)進行計數(shù),并例如根據(jù)預定方案選擇具有最高計數(shù)的那一個作為預測或估計。所選參考指示符應當與幀間預測相關。將所選參考指示符設置為對適于在對當前MB進行編碼/解碼時使用的參考圖像(以及參考模式)的預測或估計。該預測是通過對與MB的編碼/解碼相鄰塊相關的信息進行分析(而不是對當前MB自身進行分析)而導出的。在編碼器中,由于在本示例中,預測不是要用于選擇在對當前MB進行編碼時使用的參考圖像(以及參考模式),因此在預測的選擇期間,MB可以是編碼的,也可以是未編碼的。在解碼器中,當前MB在預測期間處于編碼狀態(tài)。圖I示意了示例相鄰塊參考指示符分析和對估計的選擇。在圖I所示意的示例中,考慮了當前塊的4個相鄰塊。然而,該方法也可以應用于所考慮的相鄰塊的其他集合或子集。相鄰塊的示例集合可以由關于當前塊的左塊、左上方塊和正上方塊構成。另一示例集合可以只包括左塊和正上方塊。在圖I中,當前塊的相鄰塊與各個參考指示符或索引(1、1、2以及0)相關聯(lián)。因此,參考指示符“I”由于在相鄰塊之中出現(xiàn)兩次而具有最高計數(shù),即最高出現(xiàn)頻率。因此,選擇參考指示符“I”來表示在編碼當前塊時所使用(或要使用)的參考圖像(以及模式)的預測或估計,或者在該預測發(fā)生在解碼器中時,表示要在解碼當前塊 時使用的參考圖像(以及模式)的預測。圖2示意了通過對與當前塊的相鄰塊相關聯(lián)的參考指示符進行計數(shù)來確定當前塊的特定參考指示符的出現(xiàn)頻率的另一示例實施例。這里,當前塊是較大的MB,以及相鄰塊在大小上比當前塊要小。在一些情況下,可能對在上下文中具有相同數(shù)目的相鄰塊而無論所考慮的塊的塊大小的情況感興趣。當對特定參考指示符在相鄰塊之中的出現(xiàn)次數(shù)進行計數(shù)時,不止一個候選可能具有相同的最高計數(shù)數(shù)目。這在圖2中示出,其中參考指示符“I”和“2”均出現(xiàn)4次。這可以例如通過根據(jù)預定排序方案選擇參考指示符來解決。例如,當參考指示符由編號0 2來表示時,如圖I和2所示,可以選擇由最高或最低編號所表示的參考指示符作為預測。通過變換編碼(例如,DCT (離散余弦變換))來對預測像素值的塊與原始像素值(即,被編碼之前的源)的塊之間的差值進行編碼。變換的輸出包括變換系數(shù),然后變換系數(shù)被量化。針對給定量化,與某一個塊相關聯(lián)的變換系數(shù)的數(shù)目反映預測塊和原始塊之間的匹配程度。相對少的變換系數(shù)指示匹配良好。因此,可以認為與具有較少變換系數(shù)的相鄰塊相關聯(lián)的參考指示符更加可靠。因此,也可以根據(jù)例如與參考塊相關聯(lián)的編碼變換系數(shù)來對出現(xiàn)計數(shù)進行加權。如以上所述,與具有較少編碼變換系數(shù)的相鄰塊相關聯(lián)的參考索引可以被認為比與具有很多變換系數(shù)的相鄰塊相關聯(lián)的參考索引更加可靠,并且因而可以被分配有較大權重以用于參考索引預測。在另一示例中,具有編碼系數(shù)的塊的權重可以比不具有編碼系數(shù)的塊(即被跳過的塊)的權重更大。在另一示例中,與具有較大MV分區(qū)的相鄰塊(例如較大的MB)相關聯(lián)的參考索引可以被認為比具有較小MV分區(qū)的相鄰塊更加可靠,并且因此可以被分配有較大權重以用于參考索引預測。使用2的倍數(shù)的權重在復雜度方面是有益的。加權的計數(shù)也可以通過使用查找表來實現(xiàn)。與其他參考標識符相比,一些參考標識符可以更好地彼此相關。例如,當使用聯(lián)合編碼的參考信息時,與例如表示使用參考幀ref2的單向預測的參考指示符相比,表示使用參考幀refO和ref I的雙向預測的參考指示符將與表示使用refO和ref I之一的單向預測的參考指示符更為相關。因此,在對雙向預測指示符進行計數(shù)時,可以利用一些較小計數(shù)值(即,小于針對“完全匹配”的計數(shù)值)來對表示使用相同參考幀的單向預測的相應指示符進行更新。類似地,與其他雙向預測參考指示符相比,表示使用例如refO和refl的單向預測的參考指示符與表示使用refO和refl的雙向預測的相應參考指示符更加相關。因此,在對單向參考指示符進行計數(shù)時,也可以使用某個較小的值來對與使用所考慮的參考幀的多向預測相對應的參考指示符的計數(shù)進行更新。引入?yún)⒖贾甘痉A測或參考索引預測的一個好處是允許VLC(變長編碼)表的更有效的映射。通過將預測和VIC表一起考慮,可以獲得更大程度的壓縮。例如,當假設在不使用預測的情況下對3個索引(例如0、1、2)進行編碼時,可以如圖3所示意的來分配固定的VLC表。假設索引符號“2”出現(xiàn)得最為頻繁,則圖3所示的表具有次優(yōu)的設計,這是因為“2”是使用具有2個比特(即,“11”)的碼字來編碼的,而較不頻繁的“0”是使用I個比特(即,“0”)來編碼的。在添加了預測的情況下,能夠實現(xiàn)更好的VLC表設計。圖4示意了這種改進的VLC表設計的示例。在這種改進的VLC設計中,用于對參考指示符或索引符號進行編碼所花費的比特可以基于該預測(并因此基于當前塊的上下文)來適配。在圖4所示的表中,當前塊的上下文中的最頻繁出現(xiàn)的參考指示符使用單個比特的碼字(在本示例中為“0”)來編碼??梢詫?個比特的碼字“10”和“11”定義為分別識別例如具有次高出現(xiàn)頻率的參 考指示符和具有第三高出現(xiàn)頻率的參考指示符。參考指示符的編碼器和解碼器都應當知道并且同意如何執(zhí)行預測以及如何解譯碼字。以上所述的示例僅僅是一個簡單的示例,并且應當注意,可能的設計不局限于此。存在各種方式來給參考指示符或索引符號分配不同的VLC表,例如當包括更多參考指示符或索引符號時。一個示例方法可以是隨索引的出現(xiàn)概率而改變索引編制,以便給頻繁出現(xiàn)的參考指示符分配較低的索引編號,反之亦然,以及使得較低的索引編號比較高索引編號花費更少的比特來進行編碼?;谏舷挛牡淖赃m應二進制算術編碼(CABAC)可以用于實現(xiàn)改變的比特代價,以用于根據(jù)參考指示符或索引的概率來表示參考指示符或索引。例如,不同上下文的一些示例是如上所述的與相鄰塊相關聯(lián)的參考指示符、參考指示符的計數(shù)數(shù)目、或參考指示符的加權的計數(shù)數(shù)目。另一方法是在表示參考指示符的索引或編號出現(xiàn)時對該索引或編號采用所謂的“冒泡排序法”。在本示例中,VLC冒泡表是固定的VLC表,其中碼字的長度隨著VLC表索引(例如,在ALV UVLC(通用變長編碼)表中)的增大而增大,但是表示參考指示符的索引符號或編號與VLC表索引之間的映射是自適應的。該自適應是通過交換相鄰“映射位置”(很像冒泡排序中的機制)來完成。圖5示意了這種交換的一個示例,其中符號“A”映射到VLC表504a中的索引4,以及符號“B”映射到VLC表中的索引5。現(xiàn)在假設對VLC索引5(符號B)進行解碼。在對符號B進行解碼之后,符號A的索引映射(在表502中映射到VLC索引4)與符號B交換位置,以使得如表506所示的,符號A映射到VLC索引5,以及符號B映射到VLC索引4。利用這種相鄰索引交換策略,VLC表被適配,以使得最可能的符號最終映射到低VLC索引,并因此映射到短碼字,從而提供了改進的壓縮效率。現(xiàn)在將參照圖6來描述參考指示符預測過程中的編碼部分的實施例。該過程可以在視頻編碼實體中執(zhí)行,該視頻編碼實體可以是視頻編碼器,或者可以是除了視頻解碼器之外還包括其他功能單元的實體(例如,計算機、移動終端或視頻專用設備)。該過程將被描述為針對像素塊B來執(zhí)行,該塊B具有編碼的相鄰塊的集合,其中每一個相鄰塊與在對所述相鄰塊進行編碼時使用的一個或多個參考圖像相關聯(lián)。在動作602中確定與相鄰塊的集合相關聯(lián)的參考圖像之中的多個參考圖像或參考圖像組合的出現(xiàn)頻率。
然后,在動作604中選擇與相鄰塊相關聯(lián)的參考圖像之中所確定的出現(xiàn)頻率最高的參考圖像或參考圖像組合,作為在對塊B進行編碼時使用的參考圖像或參考圖像組合C的預測Cpred。塊B可以在這個階段是已編碼的,或者它仍然是待編碼的。
當塊B已被編碼時,例如在可以被當做或者不被當做上述過程的一部分的動作606中使用參考圖像或參考圖像組合C被編碼時,在動作608中確定預測Cpred是否對應于在通過對塊B進行編碼而提供編碼塊時使用的C。在動作610或612中,向塊的解碼器提供該確定動作的結果。例如,當確定Cpred對應于C時,可以將比特流中的預定比特設置為“0”,以及當確定Cpred不對應于C時,可以將預定比特設置為“I”。此外,在確定Cpred不對應于C的情況下,可以在動作614中向B6的解碼器提供識別C的進一步信息。下面,將參照圖7來描述示例設備700,設備700適配為能夠執(zhí)行參考指示符預測的上述過程。該設備被示意為位于視頻編碼實體701中,視頻編碼實體701可以是視頻編碼器,或者可以是除了視頻編碼器之外還包括其他功能單元的實體(例如,計算機、移動終端或視頻專用設備)。設備700還被示意為經由通信單元702與其他實體通信,通信單元702可以被認為包括用于任意類型的有線或無線通信的傳統(tǒng)裝置。假設由獲得單元704從通信單元702或存儲器中獲得待編碼的未編碼視頻,并且假設在編碼單元712中對視頻塊進行編碼,其中功能單元712使用傳統(tǒng)方法。設備700包括確定單元706,適配為對于從獲得單元704接收的塊B (塊B具有編碼的相鄰塊的集合,每一個相鄰塊與在對所述相鄰塊進行編碼時使用的一個或多個參考圖像相關聯(lián)),確定與相鄰塊的集合相關聯(lián)的參考圖像之中的多個參考圖像或參考圖像組合的出現(xiàn)頻率。設備700還包括選擇單元708,適配為選擇與相鄰塊相關聯(lián)的參考圖像之中所確定的出現(xiàn)頻率最高的參考圖像或參考圖像組合,作為在通過對塊B進行編碼來提供編碼塊時使用的參考圖像或參考圖像組合C的預測Cpred。確定單元706還適配為確定預測Cpred是否對應于C。該設備700還包括提供單元710,適配為向塊的解碼器提供指定所述確定的結果的指示?,F(xiàn)在將參照圖8來描述參考指示符預測的過程中的解碼部分的實施例。該過程可以在視頻解碼實體中執(zhí)行,該視頻解碼實體可以是視頻解碼器,或者可以是除了視頻解碼器之外還包括其他功能單元的實體。在動作802中獲得編碼塊和編碼塊的相鄰塊的集合。編碼塊Be已經由視頻編碼器例如采取上述方式在某一點編碼,并且例如通過使用適當傳輸協(xié)議的有線和/或無線傳輸提供給解碼實體。每一個相鄰塊與一個或多個參考圖像或幀相關聯(lián),所述一個或多個參考圖像或者幀在編碼器中對塊進行編碼時使用過。在動作804中確定與相鄰塊的集合相關聯(lián)的參考圖像之中的多個參考圖像的出現(xiàn)頻率。也可以是確定參考圖像組合(例如,用于雙向預測或三向預測的特定參考圖像的組合)的出現(xiàn)頻率。參考圖像可以由與相鄰塊相關聯(lián)的參考模式參數(shù)(例如參考模式索引)和一個或多個參考圖像參數(shù)(例如參考圖像索引)的組合來表示或識別。此外,可以對參考模式參數(shù)和一個或多個參考圖像參數(shù)的組合聯(lián)合編碼,例如聯(lián)合編碼為由單個語法元素表示或識別,例如如先前所描述的表示為“參考指示符”、“參考索引”或“參考索引符號”。在確定各個參考圖像或參考圖像組合(典型地由參考模式參數(shù)和一個或多個參考圖像參數(shù)來表示,也可能由參考指示符來表示)的出現(xiàn)頻率時,選擇出現(xiàn)頻率最高的參考圖像或參考圖像組合之一,作為或表示在編碼器中對塊進行編碼時使用的一個或多個參考圖像或幀C的預測Cpred,從而要在對塊Be進行解碼時使用。此外,在動作808中獲得指定預測Cpred是否對應于要在對塊Be進行解碼時使用的一個或多個實際參考圖像C的指示。動作808可以在動作802-806之前、期間或之后執(zhí)行。該指示可以例如作為比特流中的一個比特的碼字或標記來獲得。當指定了所述預測Cpred對應于C時(這可以例如通過預定位置的碼字“0”的到達(參見圖4)來表現(xiàn)),則在動作812中基于預測Cpred對編碼塊Be進行解碼。也就是說,Be是使用與相鄰塊相關聯(lián)的參考圖像之中出現(xiàn)頻率最高的、并且被選擇作為預測Cpred的一個或多個參考圖像來進行解碼的。通過對進行解碼,獲得或提供了解碼的像素塊B。指定Cpred是否對應于C的指示還可以是隱式的,例如通過省略執(zhí)行某個動作(例如,向計數(shù)器添加I)或者通過抑制某個標記的轉換來表現(xiàn)。當指示預測Cpred不對應于C時,可以在動作814中獲得進一步信息,以確定要在對編碼塊B6進行解碼時使用哪個或哪些參考圖像。在已經獲得了識別適當?shù)囊粋€或多個參考圖像的進一步信息時,在動作816中利用所述信息來對塊進行解碼。 下面將參照圖9來描述適配為能夠執(zhí)行參考指示符預測的上述過程的示例設備900。該設備被示意為位于視頻解碼實體901中,視頻編碼實體901可以是視頻解碼器,或者可以是除了視頻解碼器之外還包括其他功能單元的實體(例如,計算機、移動終端或視頻專用設備)。設備900還被示意為經由通信單元902與其他實體通信,通信單元902可以被認為包括用于任意類型的有線或無線通信的傳統(tǒng)裝置。設備900包括獲得單元904,適配為獲得待解碼的編碼塊Be和編碼塊Be的相鄰塊的集合,其中每一個相鄰塊與一個或多個參考圖像(即,在對該塊進行編碼時使用、也將在對該塊進行解碼時使用的圖像)相關聯(lián)。與相鄰塊相關聯(lián)的參考圖像可以基于與該塊相關聯(lián)的參考模式參數(shù)和一個或多個參考圖像參數(shù)的組合,或者備選地例如基于與該塊相關聯(lián)的單個語法元素,來識別。獲得單元904也可以被視為通信單元902的一部分。設備900還包括確定單元906,適配為確定與相鄰塊的集合相關聯(lián)的參考圖像之中的多個參考圖像或參考圖像組合的出現(xiàn)頻率。例如,通過對與例如參考圖像A和B 二者相關聯(lián)的、僅與D相關聯(lián)的、僅與A相關聯(lián)等等的相鄰塊的相應數(shù)目進行計數(shù)。這也可以描述為對與相鄰塊之中的特定參考圖像或參考圖像組合相關聯(lián)的出現(xiàn)次數(shù)進行計數(shù),或者描述為對相鄰塊的集合之中的例如某一參考圖像的出現(xiàn)次數(shù)進行計數(shù)??梢越o不同的關聯(lián)的參考圖像和組合分配不同的權重。例如,在對參考圖像A和B的組合的出現(xiàn)次數(shù)(或與參考圖像A和B的組合相關聯(lián)的出現(xiàn)次數(shù))進行計數(shù)時,僅與參考圖像B相關聯(lián)的出現(xiàn)可以被分配有低權重,并因此在較小程度上對“A+B”的出現(xiàn)總數(shù)作出貢獻。此外,可以給與參考圖像D相關聯(lián)的一次出現(xiàn)分配比與參考圖像D相關聯(lián)的另一次出現(xiàn)要高的權重,例如當在前一次出現(xiàn)時,D與具有例如較少數(shù)目的變換系數(shù)的塊相關聯(lián)。設備900還包括選擇單元908,適配為選擇與相鄰塊相關聯(lián)的參考圖像或參考圖像組合之中所確定的出現(xiàn)頻率最高的參考圖像或參考圖像組合,作為要在對編碼塊進行解碼時使用的參考圖像或參考圖像組合C的預測Cpred??赡苡腥舾蓚€參考圖像或參考圖像組合的出現(xiàn)頻率相同。在這種情形下,應當基于定義如何選擇參考圖像的預定方案或規(guī)則來選擇這些圖像或組合之一。
獲得單元904還適配為獲得指定預測Cpred是否對應于C的指示。例如,當Cpred對應于C時,從比特流中獲得的預定比特可以是“0”,以及當Cpred不對應于C時,預定比特可以是“I”。設備900還包括解碼單元910,適配為當指示預測Cpred對應于C時,基于預測Cpred對編碼塊Be進行解碼。解碼單元910由此提供了解碼的像素塊B,解碼塊可以例如存儲或顯示。設備900還可以適配為當指示預測Cpred不對應于C時(S卩,當需要進一步信息來識別真實C時),獲得進一步信息,以確定要在對編碼塊Be進行解碼時使用哪個或哪些參考圖像。這種信息可以例如采用VLC碼字的形式。圖10示意性地示出了視頻解碼實體中的設備1000的實施例,這也可以是公開圖9所示意的視頻解碼實體中的用于參考指示符預測的設備的實施例的備選方式。這里,設備1000包括處理單元1006,例如具有DSP (數(shù)字信號處理器)。處理單元1006可以是執(zhí)行這里所描述的過程中的不同動作的單個單元或多個單元。設備1000還可以包括輸入單元 1002,用于接收來自其他實體的信號;以及輸出單元1004,用于將信號提供給其他實體。輸入單元1002和輸出單元1004可以被布置為一個集成的實體。此外,設備1000包括至少一個計算機程序產品1008,采取非易失性存儲器的形式,例如EEPR0M(電可擦除只讀存儲器)、閃存以及硬盤驅動器。計算機程序產品1008包括計算機程序1010,計算機程序1010包括代碼裝置,代碼裝置在設備1000的處理單元1006中執(zhí)行時使得該設備和/或視頻解碼實體執(zhí)行早先結合圖8所描述的過程中的動作。計算機程序1010可以被配置為以計算機程序模塊構造的計算機程序代碼。因此,在所描述的示例實施例中,設備1000的計算機程序1010中的代碼裝置包括獲得模塊1010a,用于例如從源自數(shù)據(jù)發(fā)送實體或存儲設備(例如存儲器)的比特流中獲得編碼塊Be和編碼塊Be的相鄰塊的集合。獲得模塊IOlOa還用于獲得對比較結果的指示。計算機程序還包括確定模塊1010b,用于確定與相鄰塊的集合相關聯(lián)的參考圖像之中的多個參考圖像或參考圖像的組合的出現(xiàn)頻率。計算機程序1010還包括選擇模塊1010c,用于選擇與相鄰塊相關聯(lián)的參考圖像之中所確定的出現(xiàn)頻率最高的參考圖像或參考圖像組合,作為要在對編碼塊進行解碼時使用的參考圖像或參考圖像組合C的預測Cpred。計算機程序1010還包括解碼模塊IOlOd,用于在預測Cpred被指示為與C相對應時,基于預測Cpred對編碼塊Be進行解碼。模塊1010a-d本質上可以執(zhí)行圖8所示意的流程中的動作,以模擬圖9所示意的視頻解碼實體中的設備。換言之,當不同的模塊1010a-d在處理單元1006中執(zhí)行時,它們對應于圖9中的單元904-910。類似地,對于圖7所示意的設備的相應備選也是可能的。盡管以上結合圖10所描述的實施例中的代碼裝置被實現(xiàn)為計算機程序模塊,該計算機程序模塊在處理單元中執(zhí)行時使得該設備和/或視頻解碼實體執(zhí)行結合上述附圖所描述的動作,然而在備選實施例中,代碼裝置中的至少一個可以至少部分地實現(xiàn)為硬件電路。處理器可以是單個CPU (中央處理單元),但也可以包括兩個或多個處理單元。例如,處理器可以包括通用微處理器、指令集處理器和/或相關芯片集和/或專用微處理器(例如,ASIC(專用集成電路))。處理器還可以包括在板存儲器,例如用于高速緩存目的。計算機程序可以由與處理器相連的計算機程序產品來承載。計算機程序產品包括其上存儲有計算機程序的計算機可讀介質。例如,計算機程序產品可以是閃存、RAM(隨機存取存儲器)、ROM(只讀存儲器)或EEPROM,以及在備選實施例中,可以將以上所描述的計算機程序模塊分布在解碼實體內的采取存儲器形式的不同的計算機程序產品上。如先前所描述的,在本公開中假設對在編碼像素塊時所使用的參考模式的指示符和一個或多個參考圖像進行聯(lián)合編碼,并且因此將由單個語法元素表示對編碼塊進行解碼所必需的所有參考信息,例如可以表示為“參考指示符”、“參考索引”、“參考索引符號”、或“RIS索引”?,F(xiàn)在將對聯(lián)合編碼進行進一步的描述。聯(lián)合編碼是用于表示和傳達要用于幀間預測編碼和解碼的參考信息(即,參考模式和參考圖像)的過程。該過程可以稱為參考索引信令或參考信息指示符信令(RIS)。當使用RIS時,將參考模式的指示符以及與編碼塊相關聯(lián)的參考圖像的指示符“一起捆綁在一個位置”(即,聯(lián)合編碼),而不是例如象在AVC中那樣地,獨立地例如對與分區(qū)結構的指示符密切關聯(lián)的參考模式(即,MB/子MB模式)的指示符進行編碼以及對參考圖像的指示符進行編碼。對參考模式和參考圖像的指示符(即,參考信息)的聯(lián)合編碼導致單個語法元素或指示符表示關于所需的參考模式和參考圖像的所有信息,以便以符合要求的方式對編碼塊進行解碼。也就是說,一旦針對編碼塊給出了單個語法元素,則解碼器應當能夠識別解碼塊所需要的參考圖像?!罢Z法元素”也可以表示為例如“語法單元”、“聯(lián)合指示單元”或“聯(lián)合識別單元”。對這種語法元素的使用可以為語法元素所識別的參考信息提供增強的容錯性。進一步地,對這種語法元素的使用將使得參考索引和參考模式的一些組合能夠比其他組合更有可能被利用(通過使得能夠更有效地對這些組合進行編碼)。例如,可以給參考索引和參考模式的更有可能的組合分配較短的碼字。描述RIS的一種方式是描述從傳統(tǒng)表不(例如,使用兩個分離列表的參考信息的AVC表示)到根據(jù)RIS的參考信息的示意表示的“轉換”或映射。到RIS表示的這種轉換基本上可以按照如圖11所示意的3個步驟來進行。第一步驟1102可以是由多個索引列表構成單個參考索引列表。例如,代替如在AVC中那樣地管理兩個參考索引列表,可以按照特定順序將所有參考圖像索引整理到單個聯(lián)合列表中,作為對AVC的兩個列表的備選或補充。這在圖11中示意,在圖11中,圖像參考索引列表LO和LI以交叉的方式合并或復用到新的列表Lkis中。進一步地,在第二步驟1104中,可以相應地重新分配索引編號,以遵循連續(xù)順序,即新列表Lkis中的0-5。步驟1104之后的列表Lkis中的索引編號或條目表示與參考模式(后向或前向的單向預測)和參考圖像二者有關的信息。Lkis中的條目的索引可以表示為例如“RIS索引”或“RIS參數(shù)”。在本示例中的步驟1104之后,Leis中的RIS索引編號0-5表示根據(jù)四個過去圖像(最初在LO = (0,1,2,3))和兩個未來圖像(最初在LI = (0,1))的單向預測。進一步地,可以例如通過插入或附加來向Lkis添加表示雙向預測的一個或多個列表條目。因此,指示表示雙向預測的條目的RIS索引不是指向單個參考圖像,而是指向兩個參考圖像。因此,RIS索引可以識別參考模式和一個或多個參考圖像的組合。 因此,在最后步驟1106中,可以將與雙向預測模式(其中,使用兩個參考圖像進行預測)有關的條目連續(xù)地添加到Lkis,并且可以由RIS索引來指示或表示。例如,可以將RIS索引編號為7的條目設置用于發(fā)信號通知或暗示當前圖像正在使用O號圖像和I號圖像作為雙向預測參考。因此,該信息是RIS索引7中固有的??梢砸灶愃频姆绞綄?號索引設置用于暗示當前圖像正在使用O號圖像和2號圖像作為雙向預測參考。類似地,列表Lkis還可以利用表示三向預測、識別三個參考圖像等的條目來擴展。備選地,步驟1104和1106可以按照反向順序執(zhí)行,以便首先添加(即,插入或附加)與雙向預測模式有關的條目,然后相應地重新分配索引編號。如先前所描述的,作為步驟1104的補充或備選,還可以例如在與單向預測有關的條目之間插入與雙向預測模式有關的條目,這可能需要在插入之后執(zhí)行對索引編號的重新分配。在本示例中,映射由單個參考列表表不,在該參考列表中,不同條目的索引表不參考模式和一個或多個參考圖像。應注意,這只是一個可選的示例,映射可以涉及若干個步驟,并且不需要示例類型的顯式列表或記錄來執(zhí)行映射。在圖12的表中示出了 AVC參考索引表示與根據(jù)示例實施例的RIS索引表示之間 的差別的示例。在本示例中,假設有4個參考圖像可用于對當前圖像進行編碼,其中兩個參考圖像是過去參考圖像,兩個參考圖像是未來的參考圖像。在本示例的RIS表示中,索弓I 0、1、3和4被設置為指示根據(jù)4個參考圖像中的相應一個的單向預測。索引2和5被設置為指示根據(jù)4個參考圖像中的相應兩個參考圖像的雙向預測。應注意,參考索引的AVC信令還可以包括與分區(qū)相關的信息,這是因為該信息是與參考模式索引一同編碼的,例如“INTER_16xl6_L0”。然而,這沒有在圖12中示出。在圖12的表中所示的示例中,指示或表示雙向預測的一些RIS索引緊跟在“最近的”單向預測RIS索引之后,S卩,與表示單向預測的索引交叉。該RIS索引表示在圖13中進一步示意,圖13示出了所謂的7B分層的圖像組(BGOP)。在該圖中,所謂的“當前幀”(即,待編碼的幀)是7B GOP中的幀3。圖13中所示的RIS索引對應于圖12的表中的RIS索引0_7。如圖11所不意的不例中的那樣,備選RIS表不可以是使得RIS索引0_3指不單向預測,并且接著的RIS索引指示雙向預測。在例如使用H. 264的現(xiàn)有技術中,使用兩個MV/參考圖像、塊或區(qū)塊產生雙向預測塊包括在兩個參考區(qū)塊上求平均。當MV指向參考區(qū)塊中的子像素位置時,在求平均之前需要先產生子像素位置像素值。子像素位置像素值的產生稱為“空間濾波”,即,該產生過程包括對各個參考區(qū)塊進行空間濾波。因此,現(xiàn)有技術中使用兩個參考區(qū)塊來產生雙向預測塊的過程包括對第一區(qū)塊進行空間濾波;對第二區(qū)塊進行空間濾波;以及最后在經濾波的區(qū)塊上求平均??臻g濾波在計算復雜度方面的要求相對較高。發(fā)明人認識到該計算復雜度可以降低,下面將對此進行描述。為了降低復雜度,可以首先基于整體化動作,例如通過將兩個參考塊(在不執(zhí)行空間濾波的情況下)相加,來構建塊。相加是在計算復雜度方面代價相對較低的操作。然后,可以對所產生的塊進行濾波,例如內插,以便獲得例如一半或四分之一的像素分辨率。子像素調整可以根據(jù)MV之一或基于例如單獨編碼/解碼的附加信息來執(zhí)行。當某一個塊與多于一個MV和參考索引相關聯(lián)時(這里稱為“多向預測”),可以確定多向預測的各個單向預測分量。單向預測可以稱為“單一預測”,也可以稱為例如幀內預測。認識到可以基于這些單向預測之間的絕對差值來導出分區(qū)信息。為了避免在傳達細粒度的分區(qū)信息時的開銷,在編碼器和解碼器中均可以導出分區(qū)信息。
在單向預測之間的絕對差值相對較大的區(qū)域中,可以使用單個單向預測或特定雙向預測??梢愿鶕?jù)針對雙向預測(或多向預測)的單向預測分量之一的比特流中所指示的參考索引和MV來進行單個單向預測。在塊中的其他區(qū)域中(其中單向預測之間的絕對差值相對較小),可以如針對該塊的比特流中所指示地使用雙向預測。關于針對某一區(qū)域使用單個雙向預測/特定雙向預測還是使用比特流中指示的雙向預測的判定可以基于例如與該區(qū)域相關聯(lián)的單向預測之間的絕對差值與預定閾值的比較。假設與2個MV和2個參考區(qū)域相關聯(lián)的雙向預測塊。在這一階段,該塊通常不會進一步劃分,而是依現(xiàn)狀加以編碼。然而,應當認識到,在編碼器和解碼器中均可以使用根據(jù)分析絕對差值或“差值圖”所獲得的“隱式”信息來將該塊劃分為進一步的分區(qū)。在計算2個參考區(qū)塊或預測的絕對差值時,在差值圖中有一些區(qū)域的絕對值較高,而有一些的絕對值較低。區(qū)域中的絕對差值的較低值通常表示在兩個參考區(qū)塊中在該區(qū)域中描繪相同的對象。如果在各個參考區(qū)塊中在該區(qū)域中描繪不同的對象,則絕對差值可能相對較大。如果在各個參考領域中的相應區(qū)域中描繪相同對象,則對該區(qū)域進行平均是適當?shù)?。如果相應的區(qū)域描繪不同的對象,則對其進行平均沒有意義。 例如,可以定義閾值,其中高于閾值的差值表示“不同的對象區(qū)域”,以及低于閾值的差值表示“相同的對象區(qū)域”??梢愿鶕?jù)預定方案,依照這些區(qū)域來對塊進行分區(qū)。如先前所闡述的,分區(qū)可以基于隱式信息(即,不具有描述分區(qū)的顯式信令)來執(zhí)行。這樣做的另一個好處在于可以支持“非方形分區(qū)”。例如,當在一個塊中描繪球的一半時,對該塊的分區(qū)可以非常精確地在球的輪廓線或輪廓周圍。編碼器可以發(fā)信號通知解碼器是否應當使用以上所描述的分區(qū)方案。在已經發(fā)信號通知了應當使用分區(qū)方案時,針對具有相對高的絕對差值的區(qū)域,編碼器可以可選地發(fā)信號通知使用哪一種單向預測或使用哪一種特定的雙向預測。例如,可以使用加權的雙向預測(而不是平均的,且可能具有DC偏移)。在一些情況下,可能需要對某些附加信息進行編碼/解碼,以確定能夠產生特定的雙向預測的局部參數(shù)。所獲得的分區(qū)信息還可以用于預測分區(qū)信息,以及編碼器可以對與要由解碼器解碼并使用的經預測的分區(qū)相比的改變進行編碼?;趨⒖紖^(qū)塊之間的差異來導出分區(qū)信息可以提供對于應當如何進行分區(qū)的大致指示。還可以通過發(fā)送經預測的分區(qū)信息的細化來實現(xiàn)進一步的細化。如何獲得分區(qū)信息的一個示例是將塊劃分為例如4個同樣大小的子塊。然后,如果子塊的歸一化SAD(絕對差值和(除以所計算的像素的數(shù)目))例如等于或大于“母”塊4倍大的歸一化SAD,則可以迭代地將具有最大歸一化SAD的子塊劃分為4個同樣大小的區(qū)域。歸一化SAD指代每一像素的SAD或者每一特定子塊大小的SAD??梢詡溥x地使用像素差值的其他度量來代替SAD。一個示例是關于強局部圖像結構(例如,邊緣/線)具有更大權重的度量。然后,將沒有進一步劃分的剩余的子塊設置為應當使用例如雙向預測或多向預測的某一修改的分區(qū)。圖14示出了分區(qū)方案的示例實施例。左側的塊(1402 a)是雙向預測的。執(zhí)行SAD計算,并且識別、選出以及相應地處理高SAD區(qū)塊。在本示例中,高SAD區(qū)塊通過改變?yōu)閮H具有后向MV的單向預測來處理。因此,原始塊可以劃分為兩個分區(qū),其中一個使用在比特流中指示的雙向預測,而一個(示意為包括圓圈)使用單向預測(雙向預測的一個分量)??梢允褂盟俾适д孀顑?yōu)化(RDO)來選擇最佳單向預測(雙向預測的分量)。
如何獲得分區(qū)信息的另一示例是將例如雙向預測塊劃分為若干個例如相同大小的子塊,確定所考慮的子塊大小的最大SAD,并選擇SAD接近該最大值(例如,與該最大值相距特定間隔內)的子塊,作為要使用某一修改版本的雙向預測或單向預測的區(qū)域中的部分。
除了分區(qū)之外,在使用雙向預測模式時,還可以使用該方案,例如以確定先前所描述的Ris索引或現(xiàn)有的參考索引。例如,某一區(qū)域的光滑的差值圖可以說明并且可以被解譯為該區(qū)域可能與“bi-RIS索引”相關聯(lián)。該方案還可以進一步用作備選的預測,或者與先前所描述的參考指示符索引預測相結合。在編碼器和解碼器中均可以基于雙向預測的可能候選之間的SAD來進行選擇,以選擇具有最小SAD的組合。應當注意,利用以上所描述的基于多向預測的分區(qū)方案,在編碼器和解碼器處均可以導出其他類型的分區(qū),而不是導出基于塊的分區(qū)。這包括例如根據(jù)非線性圖像處理方法(例如,邊緣檢測和/或分割)將塊線性地(例如,水平、垂直或對角線)或非線性地劃分為兩個或多個分區(qū)。例如,可以根據(jù)圖像分割方法(例如,邊緣檢測和/或區(qū)域增長)來分割多向預測差值信號,然后基于分割的差值信號來導出塊分區(qū)。子分區(qū)的數(shù)目可以通過圖像處理方法(例如圖像分割)來導出,或者可以從編碼器發(fā)信號通知給解碼器。作為線性或非線性分區(qū)的備選,也可以應用基于像素的分區(qū)。一個變型可以是從編碼器向解碼器發(fā)信號通知使用哪種分區(qū)方法,另一種變型可以是通過其他信令手段在編碼器與解碼器之間就分區(qū)方案達成一致?;诙嘞蝾A測的方法的優(yōu)點在于,可以基于已經在編碼器和解碼器處可用的信息來導出分區(qū)信息,即,不需要顯式地發(fā)信號通知分區(qū)信息,從而減小了用于編碼的比特數(shù)目。應當注意,根據(jù)基于多向預測的分區(qū),而不是從雙向預測切換到具有從用于雙向預測的MV中導出的單向MV的單向預測,還可以發(fā)信號通知針對子分區(qū)的附加MV和/或預測模式(單向圖像間預測、雙向圖像間預測、或圖像內預測)。換言之,某一個塊的分區(qū)的數(shù)目和形狀可以顯式地發(fā)信號通知,和/或可以基于例如分割方案而從隱式信息中導出。此夕卜,針對所產生的子分區(qū)中的一些或全部,可以發(fā)信號通知MV和/或預測模式。盡管已經參照被提供作為示例的特定實施例對以上所提出的過程進行了描述,然而該描述大體上僅僅旨在示意發(fā)明思想,而不應被認為是限制了所提出的由所附權利要求所限定的方案和設備的范圍。盡管利用一般術語進行描述,然而方法和設備可以應用于例如使用通??捎玫耐ㄐ偶夹g(例如,GSM/EDGE、WCDMA、或LTE或基于衛(wèi)星、陸地或電纜的廣播技術(例如DVB-S、DVB-T或DVB-C))的不同類型的通信系統(tǒng),但是也可以應用于將視頻存儲到存儲器中/將視頻從存儲器中取出。還應理解,對于交互單元或模塊的選擇以及對于單元的命名僅僅是為了示例的目的,并且適用于執(zhí)行以上所描述的任意方案的視頻處理實體可以利用多個備選方式來配置,以便能夠執(zhí)行所提出的過程動作。應當注意,本公開中所描述的單元或模塊應被視為邏輯實體,并且不必是單獨的物理實體??s略語AVC高級視頻編碼CABAC 上下文自適應二進制算術編碼
GOP圖像組MB宏塊 MV運動向量RIS參考索引信令/參考信息指示符信令SAD絕對差值和VLC變長編碼
權利要求
1.一種視頻解碼實體中的方法,所述方法包括 -獲得(802)編碼塊和編碼塊的相鄰塊的集合,每一個相鄰塊與一個或多個參考圖像相關聯(lián), -確定(804)與相鄰塊的集合相關聯(lián)的參考圖像之中的多個參考圖像或多個參考圖像組合的出現(xiàn)頻率, _選擇(806)與相鄰塊相關聯(lián)的參考圖像之中所確定的出現(xiàn)頻率最聞的參考圖像或參考圖像組合,作為要在對編碼塊進行解碼時使用的參考圖像或參考圖像組合C的預測Cpred, -獲得(808)指定所述預測Cpred是否對應于C的指示,以及 當指示所述預測Cpred對應于C時, -基于所述預測Cpred對編碼塊Be進行解碼(812),由此提供解碼的像素塊B。
2.根據(jù)權利要求I所述的方法,其中,與每一個相鄰塊相關聯(lián)的一個或多個參考圖像由與該相鄰塊相關聯(lián)的參考模式參數(shù)和一個或多個參考圖像參數(shù)的組合識別。
3.根據(jù)權利要求I或2所述的方法,其中,每一個相鄰塊與一個語法元素相關聯(lián),所述語法元素識別與該相鄰塊相關聯(lián)的一個或多個參考圖像。
4.根據(jù)權利要求1-3中任一項所述的方法,其中,確定參考圖像和/或參考圖像組合的出現(xiàn)頻率包括對與相鄰塊相關聯(lián)的參考圖像和/或參考圖像組合進行計數(shù)。
5.根據(jù)權利要求4所述的方法,其中,給參考圖像或參考圖像組合的至少一次出現(xiàn)分配比參考圖像或參考圖像組合的另一次出現(xiàn)更高的權重,因而所述至少一次出現(xiàn)對于計數(shù)的貢獻更大。
6.根據(jù)權利要求5所述的方法,其中,對權重的分配基于以下至少一項 -與相鄰塊相關聯(lián)的參考圖像或參考圖像組合和出現(xiàn)頻率已確定的參考圖像或參考圖像組合的匹配, -與相鄰塊相關聯(lián)的變換系數(shù)的數(shù)目, -與相鄰塊相關聯(lián)的運動向量分區(qū)的幅度。
7.根據(jù)前述任一權利要求所述的方法,其中,所獲得的指示是接收到的比特流中的語法元素。
8.根據(jù)權利要求1-6中任一項所述的方法,其中,所獲得的指示是隱式的。
9.根據(jù)前述任一權利要求所述的方法,還包括 在指示所述預測Cpred不對應于C時 -獲得(814)進一步信息,以確定要在對編碼塊B6進行解碼時使用哪個或哪些參考圖像。
10.根據(jù)前述任一權利要求所述的方法,其中,所確定的參考圖像和/或參考圖像組合的出現(xiàn)頻率用于將參考圖像或參考圖像組合的指示符映射到變長碼字,以便將出現(xiàn)頻率比另一參考圖像的出現(xiàn)頻率高的參考圖像映射到比所述另一參考圖像的變長碼字短的變長碼字。
11.根據(jù)權利要求10所述的方法,其中,所獲得的指示是所述碼字之一。
12.根據(jù)權利要求9所述的方法,其中,所確定的參考圖像和/或參考圖像組合的出現(xiàn)頻率用于將參考圖像或參考圖像組合的指示符映射到變長碼字,以便將出現(xiàn)頻率比另一參考圖像的出現(xiàn)頻率高的參考圖像映射到比所述另一參考圖像的變長碼字短的變長碼字,以及,所獲得的用于確定C的信息是所述碼字之一。
13.根據(jù)前述任一權利要求所述的方法,還包括 -識別與多向預測相關聯(lián)的某一塊的一個或多個子區(qū)域,對于所述一個或多個子區(qū)域,多向預測參考塊中的各個相應區(qū)域之間具有較對低的相關,以及 -針對所述塊中所識別的一個或多個子區(qū)域,使用備選預測代替所述多向預測。
14.根據(jù)權利要求13所述的方法,其中,所述備選預測是單向預測或加權的多向預測。
15.根據(jù)權利要求13或14所述的方法,其中,所述備選預測是利用與所述多向預測相關聯(lián)的參考塊之一的預測。
16.一種視頻解碼實體中的設備(900),所述設備包括 -獲得單元(904),適配為獲得編碼塊和編碼塊的相鄰塊的集合,每一個相鄰塊與一個或多個參考圖像相關聯(lián), -確定單元(906),適配為確定與相鄰塊的集合相關聯(lián)的參考圖像之中的多個參考圖像或多個參考圖像組合的出現(xiàn)頻率, -選擇單元(908),適配為選擇與相鄰塊相關聯(lián)的參考圖像之中所確定的出現(xiàn)頻率最高的參考圖像或參考圖像組合,作為要在對編碼塊進行解碼時使用的參考圖像或參考圖像組合C的預測Cpred, -所述獲得單元(904)還適配為獲得指定所述預測Cpred是否對應于C的指示,以及-解碼單元(910),適配為當指示所述預測Cpred對應于C時,基于所述預測Cpred對編碼塊進行解碼,由此提供解碼的像素塊B。
17.根據(jù)權利要求16所述的設備,適配為基于與相鄰塊相關聯(lián)的參考模式參數(shù)和一個或多個參考圖像參數(shù)的組合來識別與每一個相鄰塊相關聯(lián)的一個或多個參考圖像。
18.根據(jù)權利要求16或17所述的設備,還適配為每一個相鄰塊與一個語法元素相關聯(lián),所述語法元素識別與該相鄰塊相關聯(lián)的一個或多個參考圖像。
19.根據(jù)權利要求16-18中任一項所述的設備,還適配為通過對與相鄰塊相關聯(lián)的參考圖像和/或參考圖像組合進行計數(shù),來確定參考圖像和/或參考圖像組合的出現(xiàn)頻率。
20.根據(jù)權利要求19所述的設備,還適配為給參考圖像或參考圖像組合的至少一次出現(xiàn)分配比參考圖像或參考圖像組合的另一次出現(xiàn)更高的權重,因而權重更高的參考圖像或參考圖像組合對于計數(shù)的貢獻更大。
21.根據(jù)權利要求20所述的設備,適配為基于以下至少一項來分配權重 -與相鄰塊相關聯(lián)的參考圖像或參考圖像組合和出現(xiàn)頻率已確定的參考圖像或參考圖像組合的匹配, -與相鄰塊相關聯(lián)的變換系數(shù)的數(shù)目, -與相鄰塊相關聯(lián)的運動向量分區(qū)的幅度。
22.根據(jù)權利要求16-21中任一項所述的設備,適配為通過對比特流中的語法元素進行解碼來獲得所述指示。
23.根據(jù)權利要求16-21中任一項所述的設備,適配為通過解譯隱式信息來獲得所述指示。
24.根據(jù)權利要求16-23中任一項所述的設備,還適配為在指示所述預測Cpred不對應于C時,獲得進一步信息,以確定要在對編碼塊進行解碼時使用哪個或哪些參考圖像。
25.根據(jù)權利要求16-24中任一項所述的設備,還適配為將參考圖像或參考圖像組合的指示符映射到變長碼字,以便將出現(xiàn)頻率比另一參考圖像或參考圖像組合的出現(xiàn)頻率高的參考圖像或參考圖像組合映射到比所述另一參考圖像或參考圖像組合的變長碼字短的變長碼字。
26.根據(jù)權利要求25所述的設備,還適配為獲得所述碼字之一作為指定所述預測Cpred是否對應于C的指示。
27.根據(jù)權利要求24所述的設備,其中,還適配為將參考圖像或參考圖像組合的指示符映射到變長碼字,以便將出現(xiàn)頻率比另一參考圖像或參考圖像組合的出現(xiàn)頻率高的參考圖像或參考圖像組合映射到比所述另一參考圖像或參考圖像組合的變長碼字短的變長碼字;以及還適配為獲得所述碼字之一作為要用于確定C的信息。
28.根據(jù)權利要求16-27中任一項所述的設備,還包括 識別單元,適配為識別與多向預測相關聯(lián)的某一塊的一個或多個子區(qū)域,對于所述一個或多個子區(qū)域,多向預測參考塊中的各個相應區(qū)域之間具有較對低的相關,以及 所述設備還適配為針對所述塊中所識別的一個或多個子區(qū)域,使用備選預測代替所述多向預測。
29.根據(jù)權利要求28所述的設備,其中,所述備選預測是單向預測或加權的多向預測。
30.根據(jù)權利要求28或29所述的設備,其中,所述備選預測是利用與所述多向預測相關聯(lián)的參考塊之一的預測。
31.一種視頻編碼實體中的方法,所述方法包括 對于像素塊B,所述塊B具有編碼的相鄰塊的集合,每一個相鄰塊與在對所述相鄰塊進行編碼時使用的一個或多個參考圖像相關聯(lián) -確定(602)與相鄰塊的集合相關聯(lián)的參考圖像之中的多個參考圖像或多個參考圖像組合的出現(xiàn)頻率, -選擇(604)與相鄰塊相關聯(lián)的參考圖像之中所確定的出現(xiàn)頻率最高的參考圖像或參考圖像組合,作為在對塊B進行編碼時使用的參考圖像或參考圖像組合C的預測Cpred, -確定(608)所述預測Cpred是否對應于在通過對塊B進行編碼而提供編碼塊B6時所使用的C,以及 -向塊的解碼器提供(610,612)指定所述確定的結果的指示。
32.根據(jù)權利要求31所述的方法,其中,與每一個相鄰塊相關聯(lián)的一個或多個參考圖像由與相鄰塊相關聯(lián)的參考模式參數(shù)和一個或多個參考圖像參數(shù)的組合識別。
33.根據(jù)權利要求31或32所述的方法,其中,每一個相鄰塊與一個語法元素相關聯(lián),所述語法元素識別與該相鄰塊相關聯(lián)的一個或多個參考圖像。
34.根據(jù)權利要求31-33中任一項所述的方法,其中,確定參考圖像和/或參考圖像組合的出現(xiàn)頻率包括對與相鄰塊相關聯(lián)的參考圖像和/或參考圖像組合進行計數(shù)。
35.根據(jù)權利要求34所述的方法,其中,給參考圖像或參考圖像組合的至少一次出現(xiàn)分配比參考圖像或參考圖像組合的另一次出現(xiàn)更高的權重,因而所述至少一次出現(xiàn)對于計數(shù)的貢獻更大。
36.根據(jù)權利要求35所述的方法,其中,對權重的分配基于以下至少一項-與相鄰塊相關聯(lián)的參考圖像或參考圖像組合和出現(xiàn)頻率已確定的參考圖像或參考圖像組合的匹配, -與相鄰塊相關聯(lián)的變換系數(shù)的數(shù)目, -與相鄰塊相關聯(lián)的運動向量分區(qū)的幅度。
37.根據(jù)權利要求31-36中任一項所述的方法,其中,通過單個語法元素來向塊勺解碼器指示確定所述預測Cpred是否對應于C的結果。
38.根據(jù)權利要求31-36中任一項所述的方法,其中,通過隱式信令來向塊的解碼器指示確定所述預測Cpred是否對應于C的結果。
39.根據(jù)權利要求31-38中任一項所述的方法,還包括 在確定所述預測Cpred不對應于C時 -向塊的解碼器提供識別C的進一步信息。
40.根據(jù)權利要求31-39中任一項所述的方法,其中,所確定的參考圖像和/或參考圖像組合的出現(xiàn)頻率用于將參考圖像或參考圖像組合的指示符映射到變長碼字,以便將出現(xiàn)頻率比另一參考圖像的出現(xiàn)頻率高的參考圖像映射到比所述另一參考圖像的變長碼字短的變長碼字。
41.根據(jù)權利要求40所述的方法,其中,采用所述碼字之一的形式來向塊的解碼器提供所述指示。
42.根據(jù)權利要求39所述的方法,其中,所確定的參考圖像和/或參考圖像組合的出現(xiàn)頻率用于將參考圖像或參考圖像組合的指示符映射到變長碼字,以便將出現(xiàn)頻率比另一參考圖像的出現(xiàn)頻率高的參考圖像映射到比所述另一參考圖像的變長碼字短的變長碼字,以及,采取所述碼字之一的形式來向塊的解碼器提供識別C的進一步信息。
43.根據(jù)權利要求31-42中任一項所述的方法,還包括 -識別與多向預測相關聯(lián)的某一塊的一個或多個子區(qū)域,對于所述一個或多個子區(qū)域,多向預測參考塊中的各個相應區(qū)域之間具有較對低的相關,以及 -針對所述塊中所識別的一個或多個子區(qū)域,使用備選預測代替所述多向預測。
44.根據(jù)權利要求43所述的方法,其中,所述備選預測是單向預測或加權的多向預測。
45.根據(jù)權利要求43或44所述的方法,其中,所述備選預測是利用與所述多向預測相關聯(lián)的參考塊之一的預測。
46.一種視頻編碼實體中的設備,所述設備包括 -確定單元(706),適配為對于像素塊B,確定與相鄰塊的集合相關聯(lián)的參考圖像之中的多個參考圖像或多個參考圖像組合的出現(xiàn)頻率,所述塊B具有編碼的相鄰塊的集合,每一個相鄰塊與在對所述相鄰塊進行編碼時使用的一個或多個參考圖像相關聯(lián), -選擇單元(708),適配為選擇與相鄰塊相關聯(lián)的參考圖像之中所確定的出現(xiàn)頻率最高的參考圖像或參考圖像組合,作為在通過對塊B進行編碼來提供編碼塊時所使用的參考圖像或參考圖像組合C的預測Cpred,以及 其中,所述確定單元(706)還適配為確定所述預測Cpred是否對應于C,以及所述設備還包括 -提供單元(710),適配為向塊的解碼器提供指定所述確定的結果的指示。
47.根據(jù)權利要求46所述的設備,適配為基于與相鄰塊相關聯(lián)的參考模式參數(shù)和一個或多個參考圖像參數(shù)的組合來識別與每一個相鄰塊相關聯(lián)的一個或多個參考圖像。
48.根據(jù)權利要求46或47所述的設備,還適配為每一個相鄰塊與一個語法元素相關聯(lián),所述語法元素識別與該相鄰塊相關聯(lián)的一個或多個參考圖像。
49.根據(jù)權利要求46-48中任一項所述的設備,還適配為通過對與相鄰塊相關聯(lián)的參考圖像和/或參考圖像組合進行計數(shù),來確定參考圖像和/或參考圖像組合的出現(xiàn)頻率。
50.根據(jù)權利要求49所述的設備,還適配為給參考圖像或參考圖像組合的至少一次出現(xiàn)分配比參考圖像或參考圖像組合的另一次出現(xiàn)更高的權重,因而權重更高的參考圖像或參考圖像組合對于計數(shù)的貢獻更大。
51.根據(jù)權利要求50所述的設備,適配為基于以下至少一項來分配權重 -與相鄰塊相關聯(lián)的參考圖像或參考圖像組合和出現(xiàn)頻率已確定的參考圖像或參考圖像組合的匹配, -與相鄰塊相關聯(lián)的變換系數(shù)的數(shù)目, -與相鄰塊相關聯(lián)的運動向量分區(qū)的幅度。
52.根據(jù)權利要求46-51中任一項所述的設備,適配為通過單個語法元素來指示確定所述預測Cpred是否對應于C的結果。
53.根據(jù)權利要求46-51中任一項所述的設備,適配為通過隱式信令來指示確定所述預測Cpred是否對應于C的結果。
54.根據(jù)權利要求46-53中任一項所述的設備,還適配為在確定所述預測Cpred不對應于C時,向塊的解碼器提供識別C的進一步信息。
55.根據(jù)權利要求46-54中任一項所述的設備,還適配為將參考圖像或參考圖像組合的指示符映射到變長碼字,以便將出現(xiàn)頻率比另一參考圖像或參考圖像組合的出現(xiàn)頻率高的參考圖像或參考圖像組合映射到比所述另一參考圖像或參考圖像組合的變長碼字短的變長碼字。
56.根據(jù)權利要求55所述的設備,還適配為提供所述碼字之一作為指定所述預測Cpred是否對應于C的指示。
57.根據(jù)權利要求54所述的設備,其中,還適配為將參考圖像或參考圖像組合的指示符映射到變長碼字,以便將出現(xiàn)頻率比另一參考圖像或參考圖像組合的出現(xiàn)頻率高的參考圖像或參考圖像組合映射到比所述另一參考圖像或參考圖像組合的變長碼字短的變長碼字,以及還適配為提供所述碼字之一作為要用于確定C的信息。
58.根據(jù)權利要求46-57中任一項所述的設備,還包括 識別單元,適配為識別與多向預測相關聯(lián)的某一塊的一個或多個子區(qū)域,對于所述一個或多個子區(qū)域,多向預測參考塊中的各個相應區(qū)域之間具有較對低的相關,以及 所述設備還適配為針對所述塊中所識別的一個或多個子區(qū)域,使用備選預測代替所述多向預測。
59.根據(jù)權利要求58所述的設備,其中,所述備選預測是單向預測或加權的多向預測。
60.根據(jù)權利要求58或59所述的設備,其中,所述備選預測是利用與所述多向預測相關聯(lián)的參考塊之一的預測。
61.一種計算機程序(1010),包括計算機可讀代碼裝置,所述計算機可讀代碼裝置在一個或多個處理單兀上執(zhí)行時,使得根據(jù)權利要求16-30或46-60中任一項所述的設備執(zhí)行根據(jù)權利要求1_15或31-45中任一項所述的相應處理。
62.—種計算機程序產品(1008),包括根據(jù)權利要求61所述的計算機程序。
全文摘要
本申請?zhí)峁┝艘曨l編碼和解碼實體中的方法和設備。該方法和設備包括確定(804)與所獲得(802)的塊B的相鄰塊的集合相關聯(lián)的參考圖像之中的多個參考圖像或參考圖像組合的出現(xiàn)頻率。該方法和設備還包括選擇(806)所確定的出現(xiàn)頻率最高的參考圖像或參考圖像組合,作為在對塊B進行編碼/解碼時使用的參考圖像或參考圖像組合C的預測Cpred。該方法和設備還包括提供/獲得(610,612,808)指定該預測Cpred是否對應于C的指示,以及當指示預測Cpred對應于C時,基于預測Cpred對編碼塊Be進行解碼(812)。
文檔編號H04N7/36GK102656890SQ201080057251
公開日2012年9月5日 申請日期2010年12月17日 優(yōu)先權日2009年12月17日
發(fā)明者克林頓·普里德爾, 巫壯飛, 托馬斯·盧瑟, 理查德·肖伯格, 肯尼思·安德森 申請人:瑞典愛立信有限公司