通過使用任意分區(qū)進行運動預測來對視頻進行編碼的方法和設備，以及通過使用任意分...的制作方法

文檔序號：7915710閱讀：139來源：國知局

專利名稱：通過使用任意分區(qū)進行運動預測來對視頻進行編碼的方法和設備，以及通過使用任意分 ...的制作方法
技術領域：
示例性實施例涉及對視頻進行編碼和解碼。
背景技術：
隨著用于再現(xiàn)和存儲高分辨率或高質量視頻內(nèi)容的硬件的發(fā)展和提供，對有效地對高分辨率或高質量視頻內(nèi)容進行編碼或解碼的視頻編解碼器的需求正在增加。在傳統(tǒng)的視頻編解碼器中，基于具有預定大小的宏塊，根據(jù)受限的編碼方法對視頻進行編碼。由所述視頻編解碼器執(zhí)行的現(xiàn)有的幀間預測來估計運動矢量，并通過使用2NX 2N大小的宏塊的具有2NX2N、2NXN、NX2N和NXN的大小的分區(qū)來估計所述宏塊的運動。

發(fā)明內(nèi)容
技術問題示例性實施例提供通過使用任意形狀的分區(qū)執(zhí)行幀間預測來對視頻進行編碼和解碼。技術方案根據(jù)示例性實施例的一方面，提供了一種對視頻進行編碼的方法，所述方法包括將視頻數(shù)據(jù)劃分為最大編碼單元；基于根據(jù)最大編碼單元的至少一個劃分的區(qū)域的分層結構的較深層編碼單元，對最大編碼單元的視頻數(shù)據(jù)進行編碼，確定編碼的結果將被輸出的編碼深度，其中，在分層結構中，隨著深度的加深，上層深度的編碼單元被劃分，所述確定包括使用通過根據(jù)任意比例劃分上層深度的編碼單元而獲得的分區(qū)執(zhí)行幀間預測；輸出比特流，所述比特流包括與針對最大編碼單元的至少一個劃分的區(qū)域的編碼深度相應的編碼視頻數(shù)據(jù)以及關于編碼深度和編碼模式的信息。有益效果根據(jù)示例性實施例，由于在考慮圖像的大小的同時增大了編碼單元的最大大小，同時在考慮圖像的特征時調(diào)整編碼單元，因此可提高圖像壓縮效率。即使圖像數(shù)據(jù)具有高分辨率和大數(shù)據(jù)量，也可通過使用編碼單元的大小和編碼模式來有效地解碼和恢復圖像數(shù)據(jù)，其中，通過使用從編碼器接收的關于最佳編碼模式的信息根據(jù)圖像數(shù)據(jù)的特征自適應地確定所述編碼單元的大小和編碼模式。

圖I是根據(jù)示例性實施例的用于對視頻進行編碼的設備的框圖；圖2是根據(jù)示例性實施例的用于對視頻進行解碼的設備的框圖；圖3是用于描述根據(jù)示例性實施例的編碼單元的概念的示圖；圖4是根據(jù)示例性實施例的基于編碼單元的圖像編碼器的框圖5是根據(jù)示例性實施例的基于編碼單元的圖像解碼器的框圖；圖6是示出根據(jù)示例性實施例的根據(jù)深度的較深層編碼單元以及分區(qū)的示圖；圖7是用于描述根據(jù)示例性實施例的編碼單元和變換單元之間的關系的示圖；圖8是用于描述根據(jù)示例性實施例的與編碼深度相應的編碼單元的編碼信息的示圖；圖9是根據(jù)示例性實施例的根據(jù)深度的較深層編碼單元的示圖；圖10至圖12是用于描述根據(jù)示例性實施例的編碼單元、預測單元和變換單元之間的關系的不圖；圖13是用于描述根據(jù)表I的編碼模式信息的編碼單元、預測單元或分區(qū)以及變換單元之間的關系的示圖；圖14是示出根據(jù)示例性實施例的對視頻進行編碼的方法的流程圖；圖15是示出根據(jù)示例性實施例的對視頻進行解碼的方法的流程圖；圖16是根據(jù)另一示例性實施例的關于使用根據(jù)任意比例劃分的分區(qū)進行的幀間預測的視頻編碼設備的框圖；圖17是根據(jù)另一示例性實施例的關于使用根據(jù)任意比例劃分的分區(qū)進行的幀間預測的視頻解碼設備的框圖；圖18是根據(jù)示例性實施例的通過根據(jù)任意比例劃分編碼單元而獲得的示例性分區(qū)的框圖；圖19示出根據(jù)示例性實施例的序列參數(shù)集的語法，其中，序列參數(shù)集包括關于用于幀間預測的分區(qū)類型是否包括通過根據(jù)任意比例劃分編碼單元而獲得的分區(qū)的信息；圖20是示出根據(jù)另一示例性實施例的關于使用根據(jù)任意比例劃分的分區(qū)進行的幀間預測的視頻編碼方法的流程圖；圖21是示出根據(jù)另一示例性實施例的關于使用根據(jù)任意比例劃分的分區(qū)進行的幀間預測的視頻編碼方法的流程圖。最佳實施方式根據(jù)示例性實施例的一方面，提供了一種對視頻進行編碼的方法，所述方法包括將視頻數(shù)據(jù)劃分為最大編碼單元；基于根據(jù)最大編碼單元的至少一個劃分的區(qū)域的分層結構的較深層編碼單元，對最大編碼單元的視頻數(shù)據(jù)進行編碼，確定編碼的結果將被輸出的編碼深度，其中，在分層結構中，隨著深度加深，上層深度的編碼單元被劃分，所述確定包括使用通過根據(jù)任意比例劃分編碼單元而獲得的分區(qū)執(zhí)行幀間預測；輸出比特流，所述比特流包括與針對根據(jù)最大編碼單元的至少一個劃分的區(qū)域的編碼深度相應的編碼視頻數(shù)據(jù)以及關于編碼深度和編碼模式的信息。深度表示編碼單元被分層劃分的次數(shù)，隨著深度加深，根據(jù)深度的較深層編碼單元可從最大編碼單元被劃分以獲得最小編碼單元。深度從上層深度被加深到下層深度。隨著深度加深，最大編碼單元被劃分的次數(shù)增加，最大編碼單元被劃分的可能次數(shù)的總數(shù)相應于最大深度。編碼單元的最大大小和最大深度可被預先確定。確定編碼深度的步驟可包括選擇性地確定是否使用通過根據(jù)任意比例劃分編碼單元而獲得的分區(qū)執(zhí)行幀間預測。輸出比特流的步驟可包括包括指示用于幀間預測的分區(qū)類型是否包括通過根據(jù)任意比例劃分編碼單元而獲得的分區(qū)的信息。通過根據(jù)任意比例劃分編碼單元而獲得的分區(qū)可以是通過根據(jù)I :3或3 :1的比例劃分編碼單元的高和寬而獲得的分區(qū)。最大編碼單元可被選擇性地設置為大小為16X16、32X32、64X64、128X128和256X256的塊中的至少一個。編碼深度可被確定為根據(jù)相應劃分的區(qū)域的分層結構的較深層編碼單元的編碼結果中具有最高編碼效率的較深層編碼單元的深度，并針對最大編碼單元內(nèi)的所述至少一個劃分的區(qū)域被獨立地確定。根據(jù)示例性實施例的另一方面，提供了一種對視頻進行解碼的方法，所述方法包括接收并解析編碼視頻數(shù)據(jù)的比特流；從比特流提取根據(jù)最大編碼單元的編碼視頻數(shù)據(jù)以及關于根據(jù)最大編碼單元的編碼深度和編碼模式的信息；基于關于根據(jù)最大編碼單元的編碼深度和編碼模式的信息，針對根據(jù)最大編碼單元的至少一個編碼深度的編碼單元，執(zhí)行解碼，所述解碼包括使用通過根據(jù)任意比例劃分編碼單元而獲得的分區(qū)進行的運動補償，其中，所述至少一個編碼深度的編碼單元被確定為最大編碼單元的至少一個劃分的區(qū)域的分層結構的較深層編碼單元的深度之一。提取編碼視頻數(shù)據(jù)的步驟可包括進一步從比特流提取指示用于幀間預測的分區(qū)類型和通過根據(jù)任意比例劃分編碼單元而獲得的分區(qū)的信息。執(zhí)行解碼的步驟可包括基于從比特流提取的指示用于幀間預測的分區(qū)類型和通過根據(jù)任意比例劃分編碼單元而獲得的分區(qū)的信息，選擇性地確定是否使用通過根據(jù)任意比例劃分編碼單元而獲得的分區(qū)執(zhí)行運動補償。根據(jù)示例性實施例的另一方面，提供了一種用于對視頻進行編碼的設備，所述設備包括最大編碼單元劃分器，將視頻數(shù)據(jù)劃分為最大編碼單元；編碼器，基于根據(jù)最大編碼單元的至少一個劃分的區(qū)域的分層結構的較深層編碼單元，對最大編碼單元的視頻數(shù)據(jù)進行編碼，確定編碼的結果將被輸出的編碼深度，其中，在分層結構中，隨著深度加深，上層深度的編碼單元被劃分，所述確定包括使用通過根據(jù)任意比例劃分編碼單元而獲得的分區(qū)執(zhí)行幀間預測；輸出單元，輸出比特流，所述比特流包括與針對根據(jù)最大編碼單元的至少一個劃分的區(qū)域的編碼深度相應的編碼視頻數(shù)據(jù)以及關于編碼深度和編碼模式的信息。根據(jù)示例性實施例的另一方面，提供了一種用于對視頻進行解碼的設備，所述設備包括解析器，接收并解析編碼視頻數(shù)據(jù)的比特流；提取器，從比特流提取根據(jù)最大編碼單元的編碼視頻數(shù)據(jù)以及關于根據(jù)最大編碼單元的編碼深度和編碼模式的信息；解碼器，基于關于根據(jù)最大編碼單元的編碼深度和編碼模式的信息，針對根據(jù)最大編碼單元的至少一個編碼深度的編碼單元，執(zhí)行解碼，所述解碼包括使用通過根據(jù)任意比例劃分編碼單元而獲得的分區(qū)進行的運動補償，其中，所述至少一個編碼深度的編碼單元被確定為最大編碼單元的至少一個劃分的區(qū)域的分層結構的較深層編碼單元的深度之一。根據(jù)示例性實施例的另一方面，提供了一種計算機可讀記錄介質，所述計算機可讀記錄介質記錄有用于執(zhí)行對視頻進行編碼的方法的程序。根據(jù)示例性實施例的另一方面，提供了一種計算機可讀記錄介質，所述計算機可讀記錄介質記錄有用于執(zhí)行對視頻進行解碼的方法的程序。
具體實施例方式以下，將參照附圖更充分地描述示例性實施例，其中，示例性實施例顯示在附圖中。在示例性實施例中，“單元”根據(jù)其上下文可表示大小的單位或可不表示大小的單位。以下，根據(jù)示例性實施例，“編碼單元”是進行編碼的數(shù)據(jù)單元以及被編碼后的數(shù)據(jù)單元，其中，按照所述進行編碼的數(shù)據(jù)單元，圖像數(shù)據(jù)在編碼器端被編碼，按照所述被編碼后的數(shù)據(jù)單元，編碼圖像數(shù)據(jù)在解碼器端被解碼。此外，“編碼深度”表示編碼單元被編碼的深度。以下，“圖像”可表示視頻的靜止圖像或者運動圖像(即，視頻本身)。將參照圖I至圖15描述根據(jù)示例性實施例的基于空間分層的數(shù)據(jù)單元對視頻進行的編碼和解碼，將參照圖16至圖21描述根據(jù)示例性實施例的通過使用按照任意比例劃分的分區(qū)進行幀間預測來對視頻進行的編碼和解碼。圖I是根據(jù)示例性實施例的視頻編碼設備100的框圖。視頻編碼設備100包括最大編碼單元劃分器110、編碼單元確定器120和輸出單元130。最大編碼單元劃分器110可基于圖像的當前畫面的最大編碼單元對當前畫面進行劃分。如果當前畫面大于最大編碼單元，則當前畫面的圖像數(shù)據(jù)可被劃分為至少一個最大編碼單元。根據(jù)示例性實施例的最大編碼單元可以是具有32X32,64X64,128X 128、256 X 256等大小的數(shù)據(jù)單元，其中，數(shù)據(jù)單元的形狀是寬和高為2的平方的方形。圖像數(shù)據(jù)可根據(jù)所述至少一個最大編碼單元被輸出到編碼單元確定器120。根據(jù)示例性實施例的編碼單元可由最大大小以及深度來表征。深度表示編碼單元從最大編碼單元被空間劃分的次數(shù)，并且隨著深度加深或增加，根據(jù)深度的較深層編碼單元可從最大編碼單元被劃分為最小編碼單元。最大編碼單元的深度是最上層深度，最小編碼單元的深度是最下層深度。由于與每個深度相應的編碼單元的大小隨著最大編碼單元的深度加深而減小，因此，與上層深度相應的編碼單元可包括多個與下層深度相應的編碼單
J Li o如上所述，當前畫面的圖像數(shù)據(jù)根據(jù)編碼單元的最大大小而被劃分為最大編碼單元，所述最大編碼單元中的每一個可包括根據(jù)深度被劃分的較深層編碼單元。由于根據(jù)示例性實施例的最大編碼單元根據(jù)深度被劃分，因此包括在最大編碼單元中的空間域的圖像數(shù)據(jù)可根據(jù)深度被分層劃分。可預定編碼單元的最大深度和最大大小,所述最大深度和最大大小限定最大編碼單元的高和寬被分層劃分的總次數(shù)。編碼單元確定器120對通過根據(jù)深度劃分最大編碼單元的區(qū)域而獲得的至少一個劃分的區(qū)域進行編碼，并根據(jù)所述至少一個劃分的區(qū)域確定用于輸出最終編碼的圖像數(shù)據(jù)的深度。換句話說，編碼單元確定器120通過根據(jù)當前畫面的最大編碼單元按照根據(jù)深度的較深層編碼單元對圖像數(shù)據(jù)進行編碼，并選擇具有最小編碼誤差的深度，來確定編碼深度。因此，與確定的編碼深度相應的編碼單元的編碼圖像數(shù)據(jù)被最終輸出。此外，與編碼深度相應的編碼單元可被視為被編碼的編碼單元。確定的編碼深度和根據(jù)確定的編碼深度的編碼圖像數(shù)據(jù)被輸出到輸出單元130?；谂c等于或低于最大深度的至少一個深度相應的較深層編碼單元對最大編碼單元中的圖像數(shù)據(jù)進行編碼，基于較深層編碼單元中的每一個來比較對圖像數(shù)據(jù)進行編碼的結果。在比較較深層編碼單元的編碼誤差之后，可選擇具有最小編碼誤差的深度?？舍槍γ總€最大編碼單元選擇至少一個編碼深度。隨著編碼單元根據(jù)深度而被分層劃分，并且隨著編碼單元的數(shù)量增加，最大編碼單元的大小被劃分。此外，即使在一個最大編碼單元中編碼單元相應于相同深度，也通過分別測量每個編碼單元的圖像數(shù)據(jù)的編碼誤差來確定是否將與相同深度相應的編碼單元中的每一個劃分到下層深度。因此，即使當圖像數(shù)據(jù)被包括在一個最大編碼單元中時，圖像數(shù)據(jù)也根據(jù)多個深度被劃分為多個區(qū)域，并且在所述一個最大編碼單元中，編碼誤差可根據(jù)區(qū)域而不同，因此，編碼深度可根據(jù)圖像數(shù)據(jù)中的區(qū)域而不同。因此，在一個最大編碼單元中可確定一個或多個編碼深度，可根據(jù)至少一個編碼深度的編碼單元來劃分最大編碼單元的圖像數(shù)據(jù)。因此，編碼單元確定器120可確定包括在最大編碼單元中的具有樹結構的編碼單元。根據(jù)示例性實施例的“具有樹結構的編碼單元”包括在最大編碼單元中包括的所有較深層編碼單元中與被確定為編碼深度的深度相應的編碼單元。在最大編碼單元的相同區(qū)域中，編碼深度的編碼單元可根據(jù)深度被分層確定，在不同的區(qū)域中，編碼深度的編碼單元可被獨立地確定。類似地，當前區(qū)域中的編碼深度可獨立于另一區(qū)域中的編碼深度被確定。根據(jù)示例性實施例的最大深度是關于從最大編碼單元到最小編碼單元的劃分次數(shù)的索引，即，關于最大編碼單元被劃分到最小編碼單元的次數(shù)的索引。根據(jù)示例性實施例的第一最大深度可表示從最大編碼單元到最小編碼單元的總劃分次數(shù)。根據(jù)示例性實施例的第二最大深度可表示從最大編碼單元到最小編碼單元的深度級的總數(shù)。例如，當最大編碼單元的深度為0時，最大編碼單元被劃分一次的編碼單元的深度可被設置為1，最大編碼單元被劃分兩次的編碼單元的深度可被設置為2。這里，如果最小編碼單元是最大編碼單元被劃分四次的編碼單元，則存在深度0、1、2、3和4這5個深度級，因此，第一最大深度可被設置為4,第二最大深度可被設置為5?？筛鶕?jù)最大編碼單元執(zhí)行預測編碼和變換。還可根據(jù)最大編碼單元，基于根據(jù)等于最大深度的深度或小于最大深度的深度的較深層編碼單元來執(zhí)行預測編碼和變換。可根據(jù)正交變換或整數(shù)變換的方法來執(zhí)行變換。由于每當最大編碼單元根據(jù)深度被劃分時較深層編碼單元的數(shù)量增加，因此可針對隨著深度加深而產(chǎn)生的所有較深層編碼單元執(zhí)行包括預測編碼和變換的編碼。為了便于描述，現(xiàn)在將基于最大編碼單元中的當前深度的編碼單元來描述預測編碼和變換。視頻編碼設備100可變化地選擇用于對圖像數(shù)據(jù)進行編碼的數(shù)據(jù)單元的大小或形狀。為了對圖像數(shù)據(jù)進行編碼，執(zhí)行諸如預測編碼、變換和熵編碼的操作，此時，可針對所有操作使用相同的數(shù)據(jù)單元，或者可針對每個操作使用不同的數(shù)據(jù)單元。例如，視頻編碼設備100不僅可選擇用于對圖像數(shù)據(jù)進行編碼的編碼單元，還可選擇與編碼單元不同的數(shù)據(jù)單元，以便對編碼單元中的圖像數(shù)據(jù)執(zhí)行預測編碼。為了在最大編碼單元中執(zhí)行預測編碼，可基于與編碼深度相應的編碼單元(S卩，基于不再被劃分為與下層深度相應的編碼單元的編碼單元)執(zhí)行預測編碼。以下，現(xiàn)將不再被劃分并且變成用于預測編碼的基本單元的編碼單元稱為“預測單元”。通過對預測單元進行劃分所獲得的分區(qū)可包括通過對預測單元的高和寬中的至少一個進行劃分所獲得的預測單元或數(shù)據(jù)單元。例如，當2NX2N (其中，N是正整數(shù))的編碼單元不再被劃分，并且變成2NX2N的預測單元時，分區(qū)的大小可以是2NX 2N、2NX N、NX 2N或NX N。分區(qū)類型的示例包括通過對預測單元的高或寬進行對稱劃分所獲得的對稱分區(qū)、通過對預測單元的高或寬進行不對稱劃分(諸如l:n或n: I)所獲得的分區(qū)、通過對預測單元進行幾何劃分所獲得的分區(qū)以及具有任意形狀的分區(qū)。預測單元的預測模式可以是幀內(nèi)模式、幀間模式和跳過模式中的至少一個。例如，可針對2NX 2N、2NX N、NX 2N或NX N的分區(qū)執(zhí)行幀內(nèi)模式或幀間模式。此外，可僅針對2NX2N的分區(qū)執(zhí)行跳過模式。針對編碼單元中的一個預測單元獨立地執(zhí)行編碼，從而選擇具有最小編碼誤差的預測模式。視頻編碼設備100還可不僅基于用于對圖像數(shù)據(jù)進行編碼的編碼單元，還基于不同于編碼單元的數(shù)據(jù)單元，對編碼單元中的圖像數(shù)據(jù)執(zhí)行變換。為了在編碼單元中執(zhí)行變換，可基于具有小于或等于編碼單元的大小的數(shù)據(jù)單元來執(zhí)行變換。例如，用于變換的數(shù)據(jù)單元可包括用于幀內(nèi)模式的數(shù)據(jù)單元和用于幀間模式·的數(shù)據(jù)單元?，F(xiàn)將用作變換的基礎的數(shù)據(jù)單元稱為“變換單元”。還可在變換單元中設置指示通過對編碼單元的高和寬進行劃分來達到變換單元的劃分次數(shù)的變換深度。例如，在2NX 2N的當前編碼單元中，當變換單元的大小也為2NX2N時，變換深度可以是0，當所述當前編碼單元的高和寬中的每一個被劃分為兩等份，總共被劃分為4~1個變換單元，從而變換單元的大小是NXN時，變換深度可以是1，當所述當前編碼單元的高和寬的每一個被劃分為四等份，總共被劃分為4~2個變換單元，從而變換單元的大小是N/2XN/2時，變換深度可以是
2。例如，可根據(jù)分層樹結構來設置變換單元，其中，根據(jù)變換深度的分層特性，上層變換深度的變換單元被劃分為下層變換深度的四個變換單元。與編碼單元類似，編碼單元中的變換單元可被遞歸地劃分為大小更小的區(qū)域，從而可以以區(qū)域為單位獨立地確定變換單元。因此，可根據(jù)具有根據(jù)變換深度的樹結構的變換，來劃分編碼單元中的殘差數(shù)據(jù)。根據(jù)與編碼深度相應的編碼單元的編碼信息不僅需要關于編碼深度的信息，還需要關于與預測編碼和變換有關的信息的信息。因此，編碼單元確定器120不僅確定具有最小編碼誤差的編碼深度，還確定預測單元中的分區(qū)類型、根據(jù)預測單元的預測模式和用于變換的變換單元的大小。稍后將參照圖3至圖12詳細描述根據(jù)示例性實施例的根據(jù)最大編碼單元中的樹結構的編碼單元以及確定分區(qū)的方法。編碼單元確定器120可通過使用基于拉格朗日乘子的率失真優(yōu)化來測量根據(jù)深度的較深層編碼單元的編碼誤差。輸出單元130在比特流中輸出最大編碼單元的圖像數(shù)據(jù)以及關于根據(jù)編碼深度的編碼模式的信息，其中，所述圖像數(shù)據(jù)基于由編碼單元確定器120確定的至少一個編碼深度被編碼。通過對圖像的殘差數(shù)據(jù)進行編碼來獲得編碼圖像數(shù)據(jù)。關于根據(jù)編碼深度的編碼模式的信息可包括關于編碼深度的信息、關于預測單元中的分區(qū)類型的信息、預測模式以及變換單元的大小。可通過使用根據(jù)深度的劃分信息來定義關于編碼深度的信息，關于編碼深度的信息指示是否針對下層深度而不是當前深度的編碼單元來執(zhí)行編碼。如果當前編碼單元的當前深度是編碼深度，則當前編碼單元中的圖像數(shù)據(jù)被編碼并被輸出，因此劃分信息可被定義為不將當前編碼單元劃分到下層深度?？蛇x地，如果當前編碼單元的當前深度不是編碼深度，則針對下層深度的編碼單元來執(zhí)行編碼，因此，劃分信息可被定義為劃分當前編碼單元以獲得下層深度的編碼單元。如果當前深度不是編碼深度，則針對被劃分為下層深度的至少一個編碼單元的編碼單元來執(zhí)行編碼。由于在當前深度的一個編碼單元中存在下層深度的至少一個編碼單元，因此針對下層深度的每個編碼單元重復執(zhí)行編碼，因此，可針對具有相同深度的編碼單元遞歸地執(zhí)行編碼。由于針對一個最大編碼單元確定具有樹結構的編碼單元，并且針對編碼深度的編碼單元確定關于至少一個編碼模式的信息，因此，可針對一個最大編碼單元確定關于至少一個編碼模式的信息。此外，由于圖像數(shù)據(jù)根據(jù)深度被分層劃分，因此，最大編碼單元的圖像數(shù)據(jù)的編碼深度可根據(jù)位置而不同，因此，可針對圖像數(shù)據(jù)設置關于編碼深度和編碼模式的信息。因此，輸出單元130可將關于相應的編碼深度和編碼模式的編碼信息分配給包括在最大編碼單元中的編碼單元、預測單元和最小單元中的至少一個。根據(jù)示例性實施例的最小單元是通過將具有最低深度的最小編碼單元劃分4次所獲得的矩形數(shù)據(jù)單元?？蛇x地，最小單元可以是最大矩形數(shù)據(jù)單元，所述最大矩形數(shù)據(jù)單元可包括在最大編碼單元中所包括的所有編碼單元、預測單元、分區(qū)單元和變換單元中。例如，通過輸出單元130輸出的編碼信息可被分為根據(jù)編碼單元的編碼信息和根據(jù)預測單元的編碼信息。根據(jù)編碼單元的編碼信息可包括關于預測模式的信息和關于分區(qū)大小的信息。根據(jù)預測單元的編碼信息可包括關于幀間模式的估計方向的信息、關于幀間模式的參考圖像索引的信息、關于運動矢量的信息、關于幀內(nèi)模式的色度分量的信息和關于幀內(nèi)模式的插值方法的信息。此外，關于根據(jù)畫面、像條或GOP定義的編碼單元的最大大小的信息以及關于最大深度的信息可被插入比特流的SPS (序列參數(shù)集)或頭中。在視頻編碼設備100中，較深層編碼單元可以是通過將作為上一層的上層深度的編碼單元的高或寬劃分兩次所獲得的編碼單元。換句話說，當當前深度的編碼單元的大小為2NX 2N時，下層深度的編碼單元的大小可以是NX N。此外，大小為2NX 2N的當前深度的編碼單元可最多包括下層深度的4個編碼單元。因此，視頻編碼設備100可通過基于考慮當前畫面的特征所確定的最大編碼單元的大小和最大深度，針對每個最大編碼單元確定具有最佳形狀和最佳大小的編碼單元，來形成具有樹結構的編碼單元。此外，由于可通過使用各種預測模式和變換中的任何一個來針對每個最大編碼單元執(zhí)行編碼，因此可考慮各種圖像大小的編碼單元的特征來確定最佳編碼模式。因此，如果以傳統(tǒng)的宏塊對具有高分辨率或大數(shù)據(jù)量的圖像進行編碼，則每個畫面的宏塊數(shù)量過度增加。因此，針對每個宏塊產(chǎn)生的壓縮信息的條數(shù)增加，因此難以發(fā)送壓縮信息，數(shù)據(jù)壓縮效率降低。然而，通過使用視頻編碼設備100，由于在考慮圖像大小的同時增加編碼單元的最大大小，同時在考慮圖像特征的同時調(diào)整編碼單元，因此可提高圖像壓縮效率。圖2是根據(jù)示例性實施例的視頻解碼設備200的框圖。視頻解碼設備200包括接收器210、圖像數(shù)據(jù)和編碼信息提取器220和圖像數(shù)據(jù)解碼器230。用于視頻解碼設備200的各種操作的各種術語(諸如編碼單元、深度、預測單元、變換單元和關于各種編碼模式的信息)的定義與以上參照圖I和視頻編碼設備100描述的那些術語相同。接收器210接收并解析編碼視頻的比特流。圖像數(shù)據(jù)和編碼信息提取器220從解析的比特流提取每個編碼單元的編碼圖像數(shù)據(jù)，并將提取的圖像數(shù)據(jù)輸出到圖像數(shù)據(jù)解碼器230，其中，編碼單元具有根據(jù)每個最大編碼單元的樹結構。圖像數(shù)據(jù)和編碼信息提取器220可從關于當前畫面的頭或SPS提取關于當前畫面的編碼單元的最大大小的信息。此外，圖像數(shù)據(jù)和編碼信息提取器220從解析的比特流提取關于根據(jù)每個最大編碼單元的具有樹結構的編碼單元的編碼深度和編碼模式的信息。提取的關于編碼深度和編碼模式的信息被輸出到圖像數(shù)據(jù)解碼器230。換句話說，比特流中的圖像數(shù)據(jù)被劃分為最大編碼單元，從而圖像數(shù)據(jù)解碼器230對每個最大編碼單元的圖像數(shù)據(jù)進行解碼?？舍槍﹃P于與編碼深度相應的至少一個編碼單元的信息，來設置關于根據(jù)最大編碼單元的編碼深度和編碼模式的信息，關于編碼模式的信息可包括關于與編碼深度相應的相應編碼單元的分區(qū)類型的信息、關于預測模式的信息和變換單元的大小。此外，根據(jù)深度的劃分信息可被提取作為關于編碼深度的信息。由圖像數(shù)據(jù)和編碼信息提取器220提取的關于根據(jù)每個最大編碼單元的編碼深度和編碼模式的信息是關于編碼深度和編碼模式的信息，其中，所述編碼深度和編碼模式被確定為用于當編碼器(諸如視頻編碼設備100)根據(jù)每個最大編碼單元對每個根據(jù)深度的較深層編碼單元重復執(zhí)行編碼時產(chǎn)生最小編碼誤差。因此，視頻解碼設備200可通過根據(jù)產(chǎn)生最小編碼誤差的編碼深度和編碼模式對圖像數(shù)據(jù)進行解碼來恢復圖像。由于關于編碼深度和編碼模式的編碼信息可被分配給相應編碼單元、預測單元和最小單元中的預定數(shù)據(jù)單元，因此圖像數(shù)據(jù)和編碼信息提取器220可提取關于根據(jù)預定數(shù)據(jù)單元的編碼深度和編碼模式的信息。被分配關于編碼深度和編碼模式的相同信息的預定數(shù)據(jù)單元可被推斷為包括在相同最大編碼單元中的數(shù)據(jù)單元。圖像數(shù)據(jù)解碼器230通過基于關于根據(jù)最大編碼單元的編碼深度和編碼模式的信息對每個最大編碼單元中的圖像數(shù)據(jù)進行解碼，來恢復當前畫面。換句話說，圖像數(shù)據(jù)解碼器230可基于提取的關于包括在每個最大編碼單元中的具有樹結構的編碼單元中的每個編碼單元的分區(qū)類型、預測模式和變換單元的信息，來對編碼圖像數(shù)據(jù)進行解碼。解碼處理可包括預測(包括幀內(nèi)預測和運動補償)和反變換?？筛鶕?jù)反正交變換或反整數(shù)變換的方法來執(zhí)行反變換。圖像數(shù)據(jù)解碼器230可基于關于根據(jù)編碼深度的編碼單元的預測單元的分區(qū)類型和預測模式的信息，根據(jù)每個編碼單元的分區(qū)和預測模式執(zhí)行幀內(nèi)預測或運動補償。此外，圖像數(shù)據(jù)解碼器230可基于關于根據(jù)編碼深度的編碼單元的變換單元的大小的信息，根據(jù)編碼單元中的每個變換單元執(zhí)行反變換，從而根據(jù)最大編碼單元執(zhí)行反變換。
圖像數(shù)據(jù)解碼器230可通過使用根據(jù)深度的劃分信息來確定當前最大編碼單元的至少一個編碼深度。如果劃分信息指示圖像數(shù)據(jù)在當前深度下不再被劃分，則當前深度是編碼深度。因此，圖像數(shù)據(jù)解碼器230可通過使用與編碼深度相應的每個編碼單元的關于預測單元的分區(qū)類型、預測模式和變換單元大小的信息，對當前最大編碼單元中與每個編碼深度相應的至少一個編碼單元的編碼數(shù)據(jù)進行解碼，并輸出當前最大編碼單元的圖像數(shù)據(jù)。換句話說，可通過觀察為編碼單元、預測單元和最小單元中的預定數(shù)據(jù)單元分配的編碼信息集來收集包括編碼信息(包括相同劃分信息)的數(shù)據(jù)單元，收集的數(shù)據(jù)單元可被視為將由圖像數(shù)據(jù)解碼器230以相同的編碼模式進行解碼的一個數(shù)據(jù)單元。視頻解碼設備200可獲得關于當針對每個最大編碼單元遞歸執(zhí)行編碼時產(chǎn)生最小編碼誤差的至少一個編碼單元的信息，并可使用所述信息來對當前畫面進行解碼。換句話說，可對每個最大編碼單元中被確定為最佳編碼單元的具有樹結構的編碼單元進行解碼。此外，可在考慮分辨率和圖像數(shù)據(jù)量的同時來確定編碼單元的最大大小。
因此，即使圖像數(shù)據(jù)具有高分辨率和大數(shù)據(jù)量，也可通過使用編碼單元的大小和編碼模式來有效地對圖像數(shù)據(jù)進行解碼和恢復，其中，通過使用從編碼器接收的關于最佳編碼模式的信息，根據(jù)圖像數(shù)據(jù)的特征來適應性地確定所述編碼單元的大小和所述編碼模式?，F(xiàn)在將參照圖3至圖13描述根據(jù)示例性實施例的確定具有樹結構的編碼單元、預測單元和變換單元的方法。圖3是用于描述根據(jù)示例性實施例的編碼單元的概念的示圖。編碼單元的大小可被表示為寬X高，可以是64X64、32X32、16X16和8X8。64X64的編碼單元可被劃分為64X64、64X32、32X64或32X32的分區(qū)，32X32的編碼單元可被劃分為32X32、32X16、16X32或16X16的分區(qū)，16X16的編碼單元可被劃分為16X16、16X8、8X16或8X8的分區(qū)，8X8的編碼單元可被劃分為8X8、8X4、4X8或4X4的分區(qū)。在視頻數(shù)據(jù)310中，分辨率為1920X1080，編碼單元的最大大小為64X64，最大深度為2。在視頻數(shù)據(jù)320中，分辨率為1920X1080，編碼單元的最大大小為64X64，最大深度為3。在視頻數(shù)據(jù)330中，分辨率為352 X 288，編碼單元的最大大小為16 X 16，最大深度為I。圖3中示出的最大深度指示從最大編碼單元到最小解碼單元的總劃分次數(shù)。如果分辨率高或數(shù)據(jù)量大，則編碼單元的最大大小可較大，從而不僅提高了編碼效率還精確地反映出圖像的特征。因此，分辨率高于視頻數(shù)據(jù)330的視頻數(shù)據(jù)310和視頻數(shù)據(jù)320的編碼單元的最大大小可以是64。由于視頻數(shù)據(jù)310的最大深度是2，因此，由于通過將最大編碼單元劃分兩次，深度被加深兩層，因此視頻數(shù)據(jù)310的編碼單元315可包括長軸大小為64的最大編碼單元以及長軸大小為32和16的編碼單元。同時，由于視頻數(shù)據(jù)330的最大深度是1，因此，由于通過將最大編碼單元劃分一次，深度被加深一層，因此視頻數(shù)據(jù)330的編碼單元335可包括長軸大小為16的最大編碼單元以及長軸大小為8的編碼單元。由于視頻數(shù)據(jù)320的最大深度為3，因此，由于通過將最大編碼單元劃分三次，深度被加深3層，因此視頻數(shù)據(jù)320的編碼單元325可包括長軸大小為64的最大編碼單元以及長軸大小為32、16和8的編碼單元。隨著深度加深，可精確地表達詳細信息。圖4是根據(jù)示例性實施例的基于編碼單元的圖像編碼器400的框圖。圖像編碼器400執(zhí)行視頻編碼設備100的編碼單元確定器120的操作以對圖像數(shù)據(jù)進行編碼。換句話說，幀內(nèi)預測器410在幀內(nèi)模式下對當前幀405中的編碼單元執(zhí)行幀內(nèi)預測，運動估計器420和運動補償器425在幀間模式下通過使用當前幀405和參考幀495，對當前幀405中的編碼單元分別執(zhí)行幀間估計和運動補償。從幀內(nèi)預測器410、運動估計器420和運動補償器425輸出的數(shù)據(jù)通過變換器430和量化器440被輸出作為量化的變換系數(shù)。量化的變換系數(shù)通過反量化器460和反變換器470被恢復為空間域中的數(shù)據(jù)，恢復的空間域中的數(shù)據(jù)在通過去塊單元480和環(huán)路濾波單元490進行后處理之后被輸出為參考幀495。量化的變換系數(shù)可通過熵編碼器450被輸出為比特流455。
為了將圖像編碼器400應用在視頻編碼設備100中，圖像編碼器400的所有元件(即，幀內(nèi)預測器410、運動估計器420、運動補償器425、變換器430、量化器440、熵編碼器450、反量化器460、反變換器470、去塊單元480和環(huán)路濾波單元490)在考慮每個最大編碼單元的最大深度的同時，基于具有樹結構的編碼單元中的每個編碼單元來執(zhí)行操作。具體地，幀內(nèi)預測器410、運動估計器420和運動補償器425在考慮當前最大編碼單元的最大大小和最大深度的同時確定具有樹結構的編碼單元中的每個編碼單元的分區(qū)和預測模式，變換器430確定具有樹結構的編碼單元中的每個編碼單元中的變換單元的大小。圖5是根據(jù)示例性實施例的基于編碼單元的圖像解碼器500的框圖。解析器510從比特流505解析將被解碼的編碼圖像數(shù)據(jù)以及解碼所需的關于編碼的信息。編碼圖像數(shù)據(jù)通過熵解碼器520和反量化器530被輸出為反量化的數(shù)據(jù)，反量化的數(shù)據(jù)通過反變換器540被恢復為空間域中的圖像數(shù)據(jù)。幀內(nèi)預測器550針對空間域中的圖像數(shù)據(jù)，在幀內(nèi)模式下對編碼單元執(zhí)行幀內(nèi)預測，運動補償器560通過使用參考幀585在幀間模式下對編碼單元執(zhí)行運動補償。通過幀內(nèi)預測器550和運動補償器560的空間域中的圖像數(shù)據(jù)可在通過去塊單元570和環(huán)路濾波器單元580進行后處理之后被輸出為恢復幀595。此外，通過去塊單元570和環(huán)路濾波器單元580進行后處理的圖像數(shù)據(jù)可被輸出為參考幀585。為了在視頻解碼設備200的圖像數(shù)據(jù)解碼器230中對圖像數(shù)據(jù)進行解碼，圖像解碼器500可執(zhí)行在解析器510之后執(zhí)行的操作。為了將圖像解碼器500應用在視頻解碼設備200中，圖像解碼器500的所有元件(即，解析器510、熵解碼器520、反量化器530、反變換器540、幀內(nèi)預測器550、運動補償器560、去塊單元570和環(huán)路濾波單元580)針對每個最大編碼單元基于具有樹結構的編碼單元執(zhí)行操作。具體地，幀內(nèi)預測器550和運動補償器560基于每個具有樹結構的編碼單元的分區(qū)和預測模式執(zhí)行操作，反變換器540基于每個編碼單元的變換單元的大小執(zhí)行操作。圖6是示出根據(jù)示例性實施例的根據(jù)深度的較深層編碼單元以及分區(qū)的示圖。視頻編碼設備100和視頻解碼設備200使用分層編碼單元以考慮圖像的特征?？筛鶕?jù)圖像的特征自適應地確定編碼單元的最大高度、最大寬度和最大深度，或可由用戶不同地設置編碼單元的最大高度、最大寬度和最大深度?？筛鶕?jù)編碼單元的預定最大大小來確定根據(jù)深度的較深層編碼單元的大小。在根據(jù)示例性實施例的編碼單元的分層結構600中，編碼單元的最大高度和最大寬度均為64，最大深度為4。由于深度沿分層結構600的縱軸加深，因此較深層編碼單元的高度和寬度均被劃分。此外，沿分層結構600的橫軸示出作為每個較深層編碼單元的預測編碼的基礎的預測單元和分區(qū)。換句話說，編碼單元610是分層結構600中的最大編碼單元，其中，深度為0，大小(即，高度乘寬度)為64X64。深度沿縱軸加深，從而存在大小為32X32且深度為I的編碼單元620、大小為16X16且深度為2的編碼單元630、大小為8X8且深度為3的編碼單元640以及大小為4X4且深度為4的編碼單元650。大小為4X4且深度為4的編碼單元650
是最小編碼單元。編碼單元的預測單元和分區(qū)根據(jù)每個深度沿橫軸排列。換句話說，如果大小為 64X64且深度為0的編碼單元610是預測單元，則預測單元可被劃分為包括在編碼單元610中的分區(qū)，即，大小為64X64的分區(qū)610、大小為64X32的分區(qū)612、大小為32X64的分區(qū)614或大小為32X32的分區(qū)616。類似地，大小為32X32且深度為I的編碼單元620的預測單元可被劃分為包括在編碼單元620中的分區(qū)，即，大小為32X32的分區(qū)620、大小為32X16的分區(qū)622、大小為16X32的分區(qū)624和大小為16X16的分區(qū)626。類似地，大小為16X16且深度為2的編碼單元630的預測單元可被劃分為包括在編碼單元630中的分區(qū)，即，包括在編碼單元630中的大小為16X16的分區(qū)630、大小為16X8的分區(qū)632、大小為8X16的分區(qū)634和大小為8X8的分區(qū)636。類似地，大小為8X8且深度為3的編碼單元640的預測單元可被劃分為包括在編碼單元640中的分區(qū)，即，包括在編碼單元640中的大小為8X8的分區(qū)640、大小為8 X 4的分區(qū)642、大小為4X8的分區(qū)644或大小為4X4的分區(qū)646。大小為4X4且深度為4的編碼單元650是最小編碼單元和最下層深度的編碼單元。編碼單元650的預測單元僅被分配給大小為4X4的分區(qū)。為了確定組成最大編碼單元610的編碼單元的至少一個編碼深度，視頻編碼設備100的編碼單元確定器120針對包括在最大編碼單元610中的與每個深度相應的編碼單元執(zhí)行編碼。隨著深度加深，以相同范圍和相同大小包括數(shù)據(jù)的根據(jù)深度的較深層編碼單元的數(shù)量增加。例如，需要四個與深度2相應的編碼單元，以覆蓋包括在與深度I相應的一個編碼單元中的數(shù)據(jù)。因此，為了比較相同數(shù)據(jù)根據(jù)深度的編碼結果，與深度I相應的編碼單元和四個與深度2相應的編碼單元各自被編碼。為了針對深度中的當前深度執(zhí)行編碼，可通過沿分層結構600的橫軸，針對與當前深度相應的編碼單元中的每個預測單元執(zhí)行編碼，來針對當前深度選擇最小編碼誤差?？蛇x地，可通過隨著深度沿分層結構600的縱軸加深針對每個深度執(zhí)行編碼來比較根據(jù)深度的最小編碼誤差，從而搜索最小編碼誤差。編碼單元610中具有最小編碼誤差的深度和分區(qū)可被選為編碼單元610的編碼深度和分區(qū)類型。圖7是用于描述根據(jù)示例性實施例的編碼單元710和變換單元720之間的關系的示圖。視頻編碼設備100或視頻解碼設備200針對每個最大編碼單元，根據(jù)具有小于或等于最大編碼單元的大小的編碼單元來對圖像進行編碼或解碼?？苫诓淮笥谙鄳幋a單元的數(shù)據(jù)單元來選擇編碼期間用于變換的變換單元的大小。例如，在視頻編碼設備100或視頻解碼設備200中，如果編碼單元710的大小是64 X 64，則可通過使用大小為32X32的變換單元720來執(zhí)行變換。此外，可通過對小于64X64的大小為32X32、16X 16、8X8和4X4的變換單元中的每一個執(zhí)行變換，來對大小為64X64的編碼單元710的數(shù)據(jù)進行編碼，隨后可選擇具有最小編碼誤差的變換單元。圖8是用于描述根據(jù)示例性實施例的與編碼深度相應的編碼單元的編碼信息的示圖。視頻編碼設備100的輸出單元130可對與編碼深度相應的每個編碼單元的關于分區(qū)類型的信息800、關于預測模式的信息810和關于變換單元的大小的信息820進行編碼和發(fā)送，以作為關于編碼模式的信息。信息800指示關于通過對當前編碼單元的預測單元進行劃分而獲得的分區(qū)的形狀的信息，其中，所述分區(qū)是用于對當前編碼單元進行預測編碼的數(shù)據(jù)單元。例如，大小為2NX2N的當前編碼單元CU_0可被劃分為大小為2NX2N的分區(qū)802、大小為2NXN的分區(qū)804、大小為NX 2N的分區(qū)806和大小為NXN的分區(qū)808中的任意一個。這里，關于分區(qū)類型的信息800被設置為指示大小為2NXN的分區(qū)804、大小為NX2N的分區(qū)806和大小為NXN的大小的分區(qū)808之一。信息810指示每個分區(qū)的預測模式。例如，信息810可指示對由信息800指示的分區(qū)執(zhí)行的預測編碼的模式，即，幀內(nèi)模式812、幀間模式814或跳過模式816。信息820指示當針對當前編碼單元執(zhí)行變換時所基于的變換單元。例如，變換單元可以是第一幀內(nèi)變換單元822、第二幀內(nèi)變換單元824、第一幀間變換單元826或第二幀內(nèi)變換單元828。視頻解碼設備200的圖像數(shù)據(jù)和編碼信息提取器220可根據(jù)每個較深層編碼單元提取和使用用于解碼的信息800、810和820。圖9是根據(jù)示例性實施例的根據(jù)深度的較深層編碼單元的示圖。劃分信息可被用于指示深度的改變。劃分信息指示當前深度的編碼單元是否被劃分為下層深度的編碼單元。用于對深度為0且大小為2N_0X2N_0的編碼單元900進行預測編碼的預測單元910可包括以下分區(qū)類型的分區(qū)大小為2N_0X2N_0的分區(qū)類型912、大小為2N_0XN_0的分區(qū)類型914、大小為N_0X2N_0的分區(qū)類型916、大小為N_0XN_0的分區(qū)類型918。圖9僅示出通過對預測單元910進行對稱劃分而獲得的分區(qū)類型912至918，但應理解分區(qū)類型不限于此，預測單元910的分區(qū)可包括不對稱分區(qū)、具有預定形狀的分區(qū)和具有幾何形狀的分區(qū)。根據(jù)每個分區(qū)類型，對一個大小為2N_0X2N_0的分區(qū)、兩個大小為2N_0XN_0的分區(qū)、兩個大小為N_0X2N_0的分區(qū)和四個大小為N_0XN_0的分區(qū)重復執(zhí)行預測編碼?？蓪Υ笮?N_0 X 2N_0、N_0 X 2N_0、2N_0 X N_0和N_0 X N_0的分區(qū)執(zhí)行幀內(nèi)模式和幀間模式下的預測編碼?？蓛H對大小為2N_0X2N_0的分區(qū)執(zhí)行跳過模式下的預測編碼。比較包括分區(qū)類型912至918中的預測編碼的編碼的誤差，在分區(qū)類型中確定最小編碼誤差。如果在分區(qū)類型912至916之一中編碼誤差最小，則預測單元910可不被劃分到下層深度。如果在分區(qū)類型918中編碼誤差最小，則深度從0改變到I以在操作920對分區(qū)類型918進行劃分，對深度為2且大小為N_0XN_0的編碼單元930重復執(zhí)行編碼，以搜索
最小編碼誤差。用于對深度為I且大小為2N_1X2N_1 (= N_0XN_0)的編碼單元930進行預測編碼的預測單元940可包括以下分區(qū)類型的分區(qū)大小為2N_1X2N_1的分區(qū)類型942、大小為2N_1XN_1的分區(qū)類型944、大小為N_1X2N_1的分區(qū)類型946、大小為N_1 XN_1的分區(qū)類型948。
如果在分區(qū)類型948中編碼誤差最小，則深度從I改變到2以在操作950對分區(qū)類型948進行劃分，對深度為2且大小為N_2XN_2的編碼單元960重復執(zhí)行編碼，以搜索
最小編碼誤差。當最大深度為d時，可執(zhí)行根據(jù)每個深度的劃分操作，直到深度變?yōu)閐-1，劃分信息可被編碼直到深度為0到d-2中的一個。換句話說，當編碼被執(zhí)行直到在操作970與深度d-2相應的編碼單元被劃分之后深度為d-1時，用于對深度為d-1且大小為2N_(d-l) X2N_(d-1)的編碼單元980進行預測編碼的預測單元990可包括以下分區(qū)類型的分區(qū)大小為2N_(d-l) X2N_(d-l)的分區(qū)類型992、大小為2N_(d_l) XN_(d_l)的分區(qū)類型994、大小為N_(d-1) X2N_(d-l)的分區(qū)類型996、大小為N_(d-1) XN_(d-l)的分區(qū)類型998?？稍诜謪^(qū)類型992至998中對一個大小為2N_(d_l) X2N_(d_l)的分區(qū)、兩個大小為2N_(d-l) XN_(d-l)的分區(qū)、兩個大小為N_(d-1) X2N_(d-l)的分區(qū)、四個大小為N_(d-1) XN_(d-l)的分區(qū)重復執(zhí)行預測編碼，以搜索具有最小編碼誤差的分區(qū)類型。即使當分區(qū)類型998具有最小編碼誤差時，但由于最大深度為d，因此深度為d-1的編碼單元cu_(d-l)不再被劃分到下層深度，用于組成當前最大編碼單元900的編碼單元的編碼深度被確定為d-1，當前最大編碼單元900的分區(qū)類型可被確定為N_(d-1) XN_(d-1)。此外，由于最大深度為d并且具有最下層深度d-1的最小編碼單元980不再被劃分到下層深度，因此不設置最小編碼單元980的劃分信息。數(shù)據(jù)單元999可以為當前最大編碼單元的‘最小單元’。根據(jù)示例性實施例的最小單元可以是通過將最小編碼單元980劃分4次而獲得的矩形數(shù)據(jù)單元。通過重復執(zhí)行編碼，視頻編碼設備100可通過比較根據(jù)編碼單元900的深度的編碼誤差來選擇具有最小編碼誤差的深度以確定編碼深度，將相應的分區(qū)類型和預測模式設置為編碼深度的編碼模式。這樣，在I至d的所有深度中比較根據(jù)深度的最小編碼誤差，具有最小編碼誤差的深度可被確定為編碼深度。編碼深度、預測單元的分區(qū)類型和預測模式可被編碼和發(fā)送，作為關于編碼模式的信息。此外，由于編碼單元從深度0被劃分到編碼深度，因此僅編碼深度的劃分信息被設置為0，除了編碼深度之外的深度的劃分信息被設置為I。視頻解碼設備200的圖像數(shù)據(jù)和編碼信息提取器220可提取并使用關于編碼單元900的編碼深度和預測單元的信息以對分區(qū)912進行解碼。視頻解碼設備200可通過使用根據(jù)深度的劃分信息將劃分信息為0的深度確定為編碼深度，并使用關于相應深度的編碼模式的信息以進行解碼。圖10至圖12是用于描述根據(jù)示例性實施例的編碼單元1010、預測單元1060和變換單元1070之間的關系的示圖。編碼單元1010是最大編碼單元中與由視頻編碼設備100確定的編碼深度相應的具有樹結構的編碼單元。預測單元1060是編碼單元1010中的每一個的預測單元的分區(qū)，變換單元1070是編碼單元1010中的每一個的變換單元。當編碼單元1010中的最大編碼單元的深度是0時，編碼單元1012和1054的深度是 1，編碼單元 1014、1016、1018、1028、1050 和 1052 的深度是 2，編碼單元 1020、1022、1024、1026、1030、1032和1048的深度是3，編碼單元1040、1042、1044和1046的深度是4。在預測單元1060中，通過對編碼單元1010中的編碼單元進行劃分來獲得某些編碼單元 1014、1016、1022、1032、1048、1050、1052 和 1054。換句話說，編碼單元 1014、1022、1050和1054中的分區(qū)類型具有2NXN的大小，編碼單元1016、1048和1052中的分區(qū)類型具有NX2N的大小，編碼單元1032的分區(qū)類型具有NXN的大小。編碼單元1010的預測單元和分區(qū)小于或等于每個編碼單元。對小于編碼單元1052的數(shù)據(jù)單元中的變換單元1070中的編碼單元1052的圖像數(shù)據(jù)執(zhí)行變換或反變換。此外，變換單元1070中的編碼單元1014、1016、1022、1032、1048、1050和1052在大小和形狀方面與預測單元1060中的編碼單元1014、1016、1022、1032、1048,1050和1052不同。換句話說，視頻編碼設備100和視頻解碼設備200可對相同編碼單元中的數(shù)據(jù)單元分別執(zhí)行幀內(nèi)預測、運動估計、運動補償、變換和反變換。因此，對最大編碼單元的每個區(qū)域中具有分層結構的編碼單元中的每一個遞歸地執(zhí)行編碼，以確定最佳編碼單元，從而可獲得具有遞歸樹結構的編碼單元。編碼信息可包括關于編碼單元的劃分信息、關于分區(qū)類型的信息、關于預測模式的信息和關于變換單元的大小的信息中。表I示出可由視頻編碼設備100和視頻解碼設備200設置的編碼信息。表I
劃分信息0 (對大小為2NX2N且當前深度為d的編碼單元進行劃分信息I
編碼) ___
預測模式j分區(qū)類型j變換單元的大小 —對具有下
幀內(nèi)對稱分區(qū)不對稱分變換單元變換單元層深度d+1
幀間類型區(qū)類型的劃分信的劃分信的編碼單
跳過(僅__息0息I元進行重
2NX2N) 2NX2N 2NXnU 2NX2N NXN (對稱復編碼 2NXN 2NXnD類型)
NX2NnLX2NN/2XN/2
NXNnRX2N(不對稱
____I 類型) _
視頻編碼設備100的輸出單元130可輸出關于具有樹結構的編碼單元的編碼信息，視頻解碼設備200的圖像數(shù)據(jù)和編碼信息提取器220可從接收的比特流提取關于具有樹結構的編碼單元的編碼信息。劃分信息指示當前編碼單元是否被劃分為下層深度的編碼單元。如果當前深度d的劃分信息為0，則當前編碼單元不再被劃分到下層深度的深度是編碼深度，因此可針對編碼深度定義關于分區(qū)類型、預測模式和變換單元的大小的信息。如果當前編碼單元根據(jù)劃分信息被進一步劃分，則對下層深度的四個劃分的編碼單元獨立地執(zhí)行編碼。預測模式可以是幀內(nèi)模式、幀間模式和跳過模式中的一個。可在所有分區(qū)類型下定義幀內(nèi)模式和幀間模式，僅在大小為2NX2N的分區(qū)類型中定義跳過模式。關于分區(qū)類型的信息可指示通過對預測單元的高或寬進行對稱劃分而獲得的大小為2NX2N、2NXN、NX2N和NXN的對稱分區(qū)類型，以及通過對預測單元的高或寬進行不對稱劃分而獲得的大小為2NXnU、2NXnD、nLX2N和nRX2N的不對稱分區(qū)類型?？赏ㄟ^按照1:3和3:1對預測單元的高進行劃分來分別獲得大小為2NXnU和2NXnD的不對稱分區(qū)類型，可通過按照1:3和3:1對預測單元的寬進行劃分來分別獲得大小為nLX 2N和nRX 2N·的不對稱分區(qū)類型。變換單元的大小可被設置為幀內(nèi)模式下的兩種類型和幀間模式下的兩種類型。換句話說，如果變換單元的劃分信息是0，則變換單元的大小可以是2NX 2N，這是當前編碼單元的大小。如果變換單元的劃分信息是1，則可通過對當前編碼單元進行劃分來獲得變換單元。此外，如果大小為2NX2N的當前編碼單元的分區(qū)類型是對稱分區(qū)類型，則變換單元的大小可以是NXN，如果當前編碼單元的分區(qū)類型是不對稱分區(qū)類型，則變換單元的大小可以是 N/2XN/2。關于具有樹結構的編碼單元的編碼信息可包括與編碼深度相應的編碼單元、預測單元和最小單元中的至少一個。與編碼深度相應的編碼單元可包括包括相同編碼信息的預測單元和最小單元中的至少一個。因此，通過比較鄰近數(shù)據(jù)單元的編碼信息來確定鄰近數(shù)據(jù)單元是否包括在與編碼深度相應的相同編碼單元中。此外，通過使用數(shù)據(jù)單元的編碼信息來確定與編碼深度相應的相應編碼單元，從而可確定最大編碼單元中的編碼深度的分布。因此，如果基于鄰近數(shù)據(jù)單元的編碼信息來預測當前編碼單元，則可直接參考和使用與當前編碼單元鄰近的較深層編碼單元中的數(shù)據(jù)單元的編碼信息?？蛇x地，如果基于鄰近數(shù)據(jù)單元的編碼信息來預測當前編碼單元，則使用數(shù)據(jù)單元的編碼信息來搜索與當前編碼單元鄰近的數(shù)據(jù)單元，并且可參考搜索到的鄰近編碼單元來預測當前編碼單元。圖13是用于描述根據(jù)表I的編碼模式信息的編碼單元、預測單元或分區(qū)、變換單元之間的關系的示圖。最大編碼單元1300包括多個編碼深度的編碼單元1302、1304、1306、1312、1314、1316和1318。這里，由于編碼單元1318是編碼深度的編碼單元，因此劃分信息可被設置為
O。關于大小為2NX2N的編碼單元1318的分區(qū)類型的信息可被設置為以下分區(qū)類型之一大小為2NX2N的分區(qū)類型1322、大小為2NXN的分區(qū)類型1324、大小為NX2N的分區(qū)類型1326、大小為NXN的分區(qū)類型1328、大小為2NXnU的分區(qū)類型1332、大小為2NXnD的分區(qū)類型1334、大小為nLX2N的分區(qū)類型1336和大小為nRX2N的分區(qū)類型1338。當分區(qū)類型被設置為對稱(S卩，分區(qū)類型1322、1324、1326或1328)時，如果變換單元的劃分信息(TU大小標記)為0，則設置大小為2NX2N的變換單元1342，如果TU大小標記為I，則設置大小為NXN的變換單元1344。當分區(qū)類型被設置為不對稱(即，分區(qū)類型1332、1334、1336或1338)時，如果TU大小標記為0，則設置大小為2NX 2N的變換單元1352，如果TU大小標記為I,則設置大小為N/2XN/2的變換單元1354。參照圖13, TU大小標記是具有值0或I的標記,但是TU大小標記不限于I比特，在TU大小標記從0增加的同時，變換單元可被分層劃分以具有樹結構。在這種情況下，根據(jù)示例性實施例，可通過使用變換單元的TU大小標記以及變換單元的最大大小和最小大小來表示實際上已使用的變換單元的大小。根據(jù)示例性實施例，視頻編碼設備100能夠對最大變換單元大小信息、最小變換單元大小信息和最大TU大小標記進行編碼。對最大變換單元大小信息、最小變換單元大小信息和最大TU大小標記進行編碼的結果可被插入SPS。根據(jù)示例性實施例，視頻解碼設備200可通過使用最大變換單元大小信息、最小變換單元大小信息和最大TU大小標記來對視頻進行解碼。例如，如果當前編碼單元的大小是64X 64并且最大變換單元大小是32 X 32，則當TU大小標記為0時，變換單元的大小可以是32X32，當TU大小標記為I時，變換單元的大小可以是16X16，當TU大小標記為2時，變換單元的大小可以是8X8。作為另一示例，如果當前編碼單元的大小是32X32并且最小變換單元大小是32 X 32，則當TU大小標記為0時，變換單元的大小可以是32X32。這里，由于變換單元的大小不能夠小于32X32，因此TU大小標記不能夠被設置為除了 0以外的值。作為另一示例，如果當前編碼單元的大小是64X64并且最大TU大小標記為1，則TU大小標記可以是0或I。這里，TU大小標記不能夠被設置為除了 0或I以外的值。因此，如果定義當TU大小標記為0時最大TU大小標記為“MaxTransformSizeIndex”,最小變換單兀大小為“MinTransformSize”,變換單兀大小為“RootTuSize”,則可通過等式(I)來定義可在當前編碼單元中確定的當前最小變換單元大小 “CurrMinTuSize” CurrMinTuSize=max (MinTransformSize, RootTuSize/(2'MaxTransformSizeIndex))... (I )。與可在當前編碼單元中確定的當前最小變換單元大小“CurrMinTuSize”相t匕，當TU大小標記為0時，變換單元大小“RootTuSize”可指示可在系統(tǒng)中選擇的最大變換單兀大小。在等式(I)中，“RootTuSize/(2~MaxTransformSizeIndex) ” 指不當TU大小標記為0時，變換單元大小“RootTuSize”被劃分了與最大TU大小相應的次數(shù)時的變換單元大小，^MinTransformSi ze”指示最小變換大小。因此，“RootTuSize/(2'MaxTransformSizeIndex) ”和“MinTransformSize”中較小的值可以是可在當前編碼單元中確定的當前最小變換單元大小“CurrMinTuSize”。根據(jù)示例性實施例，最大變換單元大小RootTuSize可根據(jù)預測模式的類型而改變。例如，如果當前預測模式是幀間模式，則可通過使用以下的等式(2)來確定“RootTuSize”。在等式(2)中，“MaxTransformSize”指不最大變換單兀大小，“PUSize”指示當前預測單元大小。RootTuSize = min(MaxTransformSize, PUSize)...... (2)。也就是說，如果當前預測模式是幀間模式，則當TU大小標記為0時的變換單元大小“RootTuSize”可以是最大變換單元大小和當前預測單元大小中較小的值。如果當前分區(qū)單元的預測模式是幀內(nèi)模式，則可通過使用以下的等式(3)來確定“RootTuSize”。在等式(3)中，“PartitionSize”指示當前分區(qū)單元的大小。RootTuSize = min(MaxTransformSize, PartitionSize)...... (3)。也就是說，如果當前預測模式是幀內(nèi)模式，則當TU大小標記為0時的變換單元大小“RootTuSize”可以是最大變換單元大小和當前分區(qū)單元的大小之中的較小的值。然而，根據(jù)分區(qū)單元中的預測模式的類型而改變的當前最大變換單元大小“RootTuSize”僅是示例，并不限于此。圖14是示出根據(jù)示例性實施例的對視頻進行編碼的方法的流程圖。在操作1210，當前畫面被劃分為至少一個最大編碼單元?？深A先確定指示可能劃分的次數(shù)的總數(shù)的最大深度。在操作1220，通過對至少一個劃分的區(qū)域進行編碼來確定根據(jù)所述至少一個劃分的區(qū)域的用于輸出最終編碼結果的編碼深度，并且根據(jù)樹結構的編碼單元被確定，其中，通過對根據(jù)深度的每個最大編碼單元的區(qū)域進行劃分來獲得所述至少一個劃分的區(qū)域。每當深度加深時，最大編碼單元被空間劃分，從而最大編碼單元被劃分為下層深度的編碼單元。每個編碼單元可通過獨立于鄰近編碼單元被空間劃分而被劃分為另一下層深度的編碼單元。對根據(jù)深度的每個編碼單元重復執(zhí)行編碼。此外，針對每個較深層編碼單元確定具有最小編碼誤差的根據(jù)分區(qū)類型的變換單元。為了確定每個最大編碼單元中的具有最小編碼誤差的編碼深度，可在所有根據(jù)深度的較深層編碼單元中測量和比較編碼誤差。在操作1230，針對每個最大編碼單元輸出組成根據(jù)編碼深度的最終編碼結果的編碼圖像數(shù)據(jù)以及關于編碼深度和編碼模式的編碼信息。關于編碼模式的信息可包括關于編碼深度或劃分信息的信息、關于預測單元的分區(qū)類型、預測模式和變換單元的大小的信息。關于編碼模式的編碼信息可與編碼圖像數(shù)據(jù)一起被發(fā)送到解碼器。圖15是示出根據(jù)示例性實施例的對視頻進行解碼的方法的流程圖。在操作1310，編碼視頻的比特流被接收和解析。在操作1320，從解析的比特流提取被分配給最大編碼單元的當前畫面的編碼圖像數(shù)據(jù)以及關于根據(jù)最大編碼單元的編碼深度和編碼模式的編碼信息。每個最大編碼單元的編碼深度是每個最大編碼單元中具有最小編碼誤差的深度。在對每個最大編碼單元進行編碼中，基于通過根據(jù)深度對每個最大編碼單元進行分層劃分而獲得的至少一個數(shù)據(jù)單元來對圖像數(shù)據(jù)進行編碼。根據(jù)關于編碼深度和編碼模式的信息，最大編碼單元可被劃分為具有樹結構的編碼單元。每個具有樹結構的編碼單元被確定為與編碼深度相應的編碼單元，并被最佳編碼以輸出最小編碼誤差。因此，可通過在確定根據(jù)編碼單元的至少一個編碼深度之后對編碼單元中的每條編碼圖像數(shù)據(jù)進行解碼來提高圖像的編碼和解碼效率。
在操作1330，基于關于根據(jù)最大編碼單元的編碼深度和編碼模式的編碼信息來對每個最大編碼單元的圖像數(shù)據(jù)進行解碼。解碼圖像數(shù)據(jù)可通過再現(xiàn)設備被再現(xiàn)，可被存儲在存儲介質中，或可通過網(wǎng)絡被發(fā)送。圖16是根據(jù)另一示例性實施例的關于使用根據(jù)任意比例劃分的分區(qū)進行的幀間預測的視頻編碼設備1400的框圖。視頻編碼設備1400包括最大編碼單元劃分器1410、編碼器1420和輸出單元1430。最大編碼單元劃分器1410可將視頻數(shù)據(jù)劃分為最大編碼單元。被劃分為最大編碼單元的最大視頻數(shù)據(jù)被輸出到輸出單元1430?？稍跀?shù)據(jù)單元(諸如幀序列、幀、像條、編碼單元等)中預先設置最大編碼單元。最大視頻數(shù)據(jù)可被選擇性地設置為大小分別為16 X 16、32 X 32、64 X 64、128 X 128和256X256的塊中的至少一個。編碼器1420對由最大編碼單元劃分器1410劃分的最大編碼單元的視頻數(shù)據(jù)進行編碼。編碼器1420基于分層結構的較深層編碼單元針對最大編碼單元的至少一個劃分的區(qū)域對視頻數(shù)據(jù)進行編碼。在較深層編碼單元的編碼操作期間，執(zhí)行幀間預測以通過使用包括在較深層編碼單元中的分區(qū)來搜索相似的區(qū)域并估計分區(qū)的運動信息。幀間預測可使用通過根據(jù)任意比例對編碼單元進行劃分而獲得的分區(qū)。在圖3至圖13所示的預測單元和分區(qū)的示例包括從大小為2NX2N的編碼單元劃分的大小為2NX2N、2NXN、NX2N、NXN的分區(qū)。編碼器1420可根據(jù)分區(qū)類型執(zhí)行幀間預測，所述分區(qū)類型包括根據(jù)任意比例或根據(jù)不對稱比例劃分的分區(qū)以及通過以I :1的比例對編碼單元的寬或高進行劃分而獲得的分區(qū)。例如，可通過以I :3或3 :1的比例對編碼單元的寬或高進行劃分來獲得通過根據(jù)任意比例對編碼單元進行劃分而獲得的分區(qū)。可以以任意比例(諸如I :2、2 :1、1 :3、3 :1、2
3、3 :2、1 :4、4 1等)對分區(qū)進行劃分。分區(qū)類型可包括通過對編碼單元進行不對稱劃分而獲得的分區(qū)以及通過根據(jù)任意比例對編碼單元進行劃分而獲得的分區(qū)。用于編碼單元的幀間預測的分區(qū)類型可不被限制為包括根據(jù)任意比例按確定方向劃分的分區(qū)，并且可包括具有任意形狀的分區(qū)。編碼器1420可選擇性地確定是否通過使用通過根據(jù)任意比例對編碼單元進行劃分而獲得的分區(qū)來執(zhí)行幀間預測。指示是否通過使用通過根據(jù)任意比例對編碼單元進行劃分而獲得的分區(qū)來執(zhí)行幀間預測的信息可被單獨編碼并包括在比特流中。編碼器1420基于根據(jù)分結構的較深層編碼單元，對根據(jù)劃分的區(qū)域的最大編碼單元的視頻數(shù)據(jù)進行編碼，選擇根據(jù)深度進行編碼的結果，并選擇具有最高編碼效率的深度。選擇的深度是用于相應最大編碼單元的劃分的區(qū)域的編碼深度。關于編碼深度的信息被編碼為相應編碼單元的編碼結果。用于最大編碼單元內(nèi)的至少一個劃分的區(qū)域的編碼深度被獨立地確定，從而可針對單個最大編碼單元確定至少一個編碼深度。輸出單元1430輸出包括關于與根據(jù)最大編碼單元和劃分的區(qū)域的編碼深度相應的編碼視頻數(shù)據(jù)、編碼深度、和編碼模式的信息的比特流。輸出單元1430可輸出包括關于用于幀間預測的分區(qū)類型是否包括通過根據(jù)任意比例對編碼單元進行劃分而獲得的分區(qū)的信息的比特流。關于用于幀間預測的分區(qū)類型是否包括通過根據(jù)任意比例對編碼單元進行劃分而獲得的分區(qū)的信息可根據(jù)數(shù)據(jù)單元(諸如幀序列、像條、編碼單元等)被設置，并可被包括在比特流的序列參數(shù)集、像條頭和根據(jù)編碼單元的編碼信息中。編碼單元可記錄比給定宏塊的數(shù)據(jù)量更大得多的數(shù)據(jù)量，因此單個編碼單元可包括具有不同圖像特征的區(qū)域。為了執(zhí)行編碼單元的預測編碼，優(yōu)選的是將編碼單元劃分為根據(jù)圖像特征的區(qū)域，并通過將具有相同圖像特征的鄰近區(qū)域聚集為一個分區(qū)來產(chǎn)生用于對編碼單元進行預測編碼的分區(qū)。雖然視頻數(shù)據(jù)可被劃分為關于編碼單元的中心的不同圖像特征的區(qū)域，但是編碼單元的大小越大，不同區(qū)域之間的邊界是任何一側(左、右、上或下)的可能性就越大。如果僅使用通過以I :1的比例對編碼單元的寬和高進行劃分而獲得的分區(qū)來對不同區(qū)域之間的邊界是一側的編碼單元精確地執(zhí)行預測編碼，則當前編碼單元必須被劃分為下層深度的編碼單元，從而產(chǎn)生包括單個獨立區(qū)域的小分區(qū)。然而，如果通過使用根據(jù)任意比例劃分的區(qū)域來執(zhí)行幀間預測，則像根據(jù)本實施例的視頻編碼設備1400，通過使用在當前深度下被劃分為一側的分區(qū)而不必將當前較深層編碼單元進一步劃分為更低深度，來執(zhí)行幀間預測。因此，如果編碼單元的分區(qū)包括根據(jù)任意比例劃分的分區(qū)或具有任意形狀的分區(qū)以及通過以I :1的比例對編碼單元的寬或高進行劃分而獲得的分區(qū)，則可對大小較大的編碼單元執(zhí)行更有效更精確的預測編碼。此外，可根據(jù)視頻編碼器/解碼器的硬件性能、接收視頻編碼/解碼服務的用戶需求和關于編碼視頻的比特流的傳輸環(huán)境，選擇性地執(zhí)行使用通過根據(jù)任意比例對編碼單元進行劃分而獲得的分區(qū)或具有任意形狀的分區(qū)的預測編碼。圖17是根據(jù)另一示例性實施例的關于使用根據(jù)任意比例劃分的分區(qū)進行的幀間預測的視頻解碼設備1500的框圖。參照圖17，視頻解碼設備1500包括解析器1510、提取器1520和解碼器1530。解析器1510接收關于編碼視頻的比特流并解析接收的比特流的碼元。提取器1520從解析的比特流提取根據(jù)最大編碼單元編碼的視頻數(shù)據(jù)和關于根據(jù)最大編碼單元的編碼深度和編碼模式的信息。提取器1520還可從比特流提取關于用于幀內(nèi)預測的分區(qū)類型是否包括通過對根據(jù)任意比例對編碼單元進行劃分而獲得的分區(qū)的信息?？蓮谋忍亓鞯男蛄袇?shù)集、像條頭、編碼單元的編碼信息等提取關于用于幀內(nèi)預測的分區(qū)類型是否包括通過對根據(jù)任意比例對編碼單元進行劃分而獲得的分區(qū)的信息。解碼器1530接收從提取器1520提取的視頻數(shù)據(jù)和編碼信息，并基于編碼信息對視頻數(shù)據(jù)進行解碼。更具體地，解碼器1530基于關于根據(jù)最大編碼單元的編碼深度和編碼模式的信息，對根據(jù)最大編碼單元的至少一個編碼深度的編碼單元的視頻數(shù)據(jù)進行解碼。具體地，解碼器1530可根據(jù)由提取器1520提取的關于用于幀間預測的分區(qū)類型是否包括通過根據(jù)任意比例對編碼單元進行劃分而獲得的分區(qū)的信息，通過使用通過根據(jù)任意比例對編碼單元進行劃分而獲得的分區(qū)選擇性地執(zhí)行運動補償。也就是說，解碼器1530可通過使用根據(jù)分區(qū)類型預測的運動矢量執(zhí)行運動補償，其中，所述分區(qū)類型包括通過根據(jù)任意比例(諸如I :2、2 :1、1 :3、3 :1、2 :3、3 :2、1 :4、4 1等)對編碼單元進行不對稱劃分而獲得的分區(qū)以及通過以I :1的任意比例對編碼單元進行劃分而獲得的分區(qū)。此外，解碼器1530可通過使用具有任意形狀的分區(qū)以及通過按方向對編碼單元進行劃分而獲得的分區(qū)執(zhí)行運動補償。解碼器1530可通過確定是否通過使用通過根據(jù)任意比例對編碼單元進行劃分而獲得的分區(qū)來編碼幀內(nèi)預測，根據(jù)具有任意比例的寬和高的分區(qū)來選擇性地執(zhí)行運動補償，從而精確地恢復針對具有圖像的各種特征的區(qū)域而區(qū)分的編碼單元。視頻解碼設備1500可恢復和再現(xiàn)根據(jù)最大編碼單元解碼的視頻數(shù)據(jù)。因此，如果像視頻編碼設備1400和視頻解碼設備1500 —樣執(zhí)行使用根據(jù)任意比例劃分的分區(qū)進行的預測編碼/解碼，則通過使用在當前深度被劃分到一側的分區(qū)而不必進一步將當前較深層編碼單元劃分到下層深度來執(zhí)行幀間預測。因此，根據(jù)任意比例劃分的分區(qū)可被用于更有效并更精確地對大小較大的編碼單元執(zhí)行預測編碼或解碼。圖18是根據(jù)示例性實施例的通過根據(jù)任意比例劃分編碼單元而獲得的示例性分區(qū)的示圖。
參照圖18，用于編碼單元的預測編碼的分區(qū)類型可包括通過根據(jù)任意比例劃分編碼單元的高和寬而獲得的分區(qū)。例如，大小為64X64的編碼單元1600的分區(qū)類型可包括通過根據(jù)I :3或3 :1的比例劃分編碼單元1600而獲得的分區(qū)以及通過根據(jù)I :1的比例劃分編碼單元1600的高或寬而獲得的大小為64X32、32X64和32X32的分區(qū)。更具體地說，大小為64X64的編碼單元1600的分區(qū)類型可包括通過根據(jù)I :3或
31的比例劃分編碼單元1600的高而獲得的大小分別為64X 16和64X48的分區(qū)1610和1620。此外，大小為64X64的編碼單元1600的分區(qū)類型可包括通過根據(jù)I :3或3 :1的比例劃分編碼單元1600的寬而獲得的大小分別為64X 16和64X48的分區(qū)1630和1640。圖19示出根據(jù)示例性實施例的序列參數(shù)集1700的語法,其中，序列參數(shù)集1700包括關于用于幀間預測的分區(qū)類型是否包括通過根據(jù)任意比例劃分編碼單元而獲得的分區(qū)的信息。參照圖19, sequence_parameter_set是當前圖像像條的序列參數(shù)集1700的語法。關于用于幀間預測的分區(qū)類型是否包括通過根據(jù)任意比例劃分編碼單元而獲得的分區(qū)的信息被插入當前圖像像條的序列參數(shù)集1700的語法。picture_width是輸入圖像的寬度的語法。picture_height是輸入圖像的高度的語法。max_coding_unit_size是最大編碼單元的大小的語法。 max_coding_unit_depth 是最大深度的語法。序列參數(shù)的示例可定義指示編碼單元級是否被獨立解碼的信息(S卩，use—independent—cu—decode—flag)、指示編碼單元級是否被獨立解析的信息(即，use—independent—cu—parse—flag)、運動矢量精確控制操作的可用性(S卩，use—mv—accuracy—control—flag)、任意方向巾貞內(nèi)預測操作的可用性(SP，use—arbitrary—direction—intra—flag)、針對根據(jù)頻率變換的頻域的預測編碼/解碼操作的可用性(S卩，use—frequency—domain—prediction—flag)、轉動變換操作的可用性(艮P， use_rotational_transform—flag)、使用樹重要性圖的編碼/解碼的可用性(即，use—tree—significant—map—flag)、使用多參數(shù)的巾貞內(nèi)預測編碼操作的可用性(即，use—multi—parameter—intra—prediction—flag)、改進的運動矢量預測編碼操作的可用性(S卩，use—advanced—motion—vector—prediction—flag)、自適應環(huán)路濾波操作的可用性(即，use—adaptive—loop—filter—flag)、四叉樹結構的自適應環(huán)路濾波操作的可用性(即，use—quadtree—adaptive_loop_filter_flag)、使用量化參數(shù)的delta值的量化操作的可用性(即，use_delta_qp_f lag)、隨機噪聲產(chǎn)生操作的可用性(S卩，use_random_noise_generation_flag)、指示具有用于編碼單元的幀間預測的任意分區(qū)的分區(qū)是否被允許的信息(S卩，use_arbitrary_motition_partition_flag)。具體地，根據(jù)自適應環(huán)路濾波操作的可用性(即，use_adaptive_loop_filter_flag)和四叉樹結構的自適應環(huán)路濾波操作的可用性(即，use_quadtree_adaptive_loop_filter_flag),序列參數(shù)集1700可定義自適應環(huán)路濾波器的濾波器長度(即，alf_f ilter_length)、自適應環(huán)路濾波器的類型(即，alf_filter_type)、用于自適應環(huán)路濾波器系數(shù)的量化的參考值(即，alf_qbits)以及自適應環(huán)路濾波的彩色分量的數(shù)量(即，alf_num_color)。關于在視頻編碼設備1400和視頻解碼設備1500中使用的編碼單元的深度、編碼工具和操作模式之間的相關性的信息可包括與編碼單元的深度UiDepth相應的幀間預測的操作模式mhp_mode [uiDepth]以及指示樹重要性圖中的重要性圖的類型的操作模式significant_map_mode [uiDepth]。更具體地,序列參數(shù)集1700可設置根據(jù)編碼單元的深度的幀間預測和相應操作模式之間的相關性或者使用樹重要性圖的編碼/解碼和相應操作模式之間的相關性。序列參數(shù)集1700還可設置輸入樣點的位深度input_sample_bit_depth和內(nèi)部樣點的位深度 internal_sample_bit_depth。視頻解碼設備1500可讀取序列參數(shù)，從讀取的序列參數(shù)中提取指示用于具有編碼單元的巾貞間預測的任意分區(qū)的分區(qū)是否被允許的信息(即，u s e_arb i trary_mo tion_partition_flag),確定是否使用通過根據(jù)任意比例劃分相應序列的編碼單元而獲得的分區(qū)執(zhí)行幀間預測。由視頻編碼設備1400和視頻解碼設備1500使用的指示具有用于編碼單元的幀間預測的任意分區(qū)的分區(qū)是否被允許的信息(即，use_arbitrary_motion_partition_flag)不限于圖22的序列參數(shù)集1700，并可以以最大編碼單元、像條、幀、畫面、GOP等為單位進行
編碼/解碼。如果指示用于具有編碼單元的幀間預測的任意分區(qū)的分區(qū)是否被允許的信息(即，use_arbitrary_motion_partition_f lag)在像條頭中具有真值,則使用通過在相應像條中根據(jù)任意比例劃分編碼單元而獲得的分區(qū)執(zhí)行幀間預測。如果所述信息具有假值，則使用通過在相應像條中根據(jù)I :1的比例劃分編碼單元的寬或高而獲得的分區(qū)執(zhí)行幀間預測。圖20是示出根據(jù)另一示例性實施例的關于使用根據(jù)任意比例劃分的分區(qū)進行的幀間預測的視頻編碼方法的流程圖。參照圖20，在操作1810，視頻數(shù)據(jù)被劃分為最大編碼單元。在操作1820，基于根據(jù)最大編碼單元的至少一個劃分的區(qū)域的分層結構的較深層編碼單元，對最大編碼單元的視頻數(shù)據(jù)進行編碼，確定編碼結果將被輸出的編碼深度。幀間預測可選擇性地使用通過根據(jù)任意比例劃分編碼單元而獲得的分區(qū)。可根據(jù)數(shù)據(jù)單元(諸如幀序列、幀、像條、編碼單元等)設置是否使用通過根據(jù)任意比例劃分編碼單元而獲得的分區(qū)執(zhí)行幀間預測。
在操作1830，包括與根據(jù)最大編碼單元的劃分區(qū)域的編碼深度相應的編碼視頻數(shù)據(jù)以及關于編碼深度和編碼模式的編碼信息的比特流被輸出。指示是否通過使用通過根據(jù)任意比例劃分編碼單元而獲得的分區(qū)執(zhí)行幀間預測的信息可被編碼，并可被插入比特流，隨后比特流可被輸出。圖21是示出根據(jù)另一示例性實施例的關于使用根據(jù)任意比例劃分的分區(qū)進行的幀間預測的視頻解碼方法的流程圖。參照圖21，在操作1910，關于編碼視頻數(shù)據(jù)的比特流被接收，比特流的碼元被解析。在操作1920，從比特流提取根據(jù)最大編碼單元的編碼視頻數(shù)據(jù)以及關于根據(jù)最大編碼單元的編碼深度和編碼模式的編碼信息。可從比特流提取指示是否使用通過根據(jù)任意比例劃分編碼單元而獲得的分區(qū)執(zhí)行幀間預測的信息?？蓮男蛄袇?shù)集、像條頭、編碼單元的編碼信息等提取指示是否使用通過根據(jù)任意比例劃分編碼單元而獲得的分區(qū)執(zhí)行幀間預測的信息。在操作1930，可基于關于根據(jù)最大編碼單元的編碼深度和編碼模式的信息，針對根據(jù)最大編碼單元的至少一個編碼深度的編碼單元執(zhí)行解碼，所述解碼包括使用通過根據(jù)任意比例劃分編碼單元而獲得的分區(qū)進行的運動補償?？筛鶕?jù)從比特流提取的指示使用通過根據(jù)任意比例劃分編碼單元而獲得的分區(qū)執(zhí)行幀間預測的信息選擇性地執(zhí)行是否執(zhí)行解碼，所述解碼包括使用通過根據(jù)任意比例劃分編碼單元而獲得的分區(qū)進行的運動補償。如果像本實施例的視頻編碼方法和視頻解碼方法一樣執(zhí)行使用根據(jù)任意比例劃分的分區(qū)的幀間預測，則通過使用在當前深度被劃分到一側的分區(qū)而不必進一步將當前較深層編碼單元劃分到下層深度來執(zhí)行幀間預測。此外，編碼單元的分區(qū)是否包括根據(jù)任意比例劃分的分區(qū)或具有任意形狀的分區(qū)以及通過根據(jù)I :1的比例劃分編碼單元的寬或高而獲得的分區(qū)可被選擇，從而不支持根據(jù)任意比例劃分的分區(qū)的傳統(tǒng)編碼/解碼系統(tǒng)可使用本實施例的視頻編碼方法和視頻解碼方法。因此，可根據(jù)本實施例的視頻編碼和解碼方法選擇性地執(zhí)行更有效和更精確的預測編碼。示例性實施例可被寫為計算機程序，并可在使用計算機可讀記錄介質執(zhí)行所述程序的通用數(shù)字計算機中實現(xiàn)。計算機可讀記錄介質的示例包括磁存儲介質(例如，ROM、軟盤、硬盤等)和光記錄介質(例如，⑶-ROM或DVD)。示例性實施例還可被實現(xiàn)為計算機處理器和硬件裝置。雖然已參照本發(fā)明的示例性實施例具體示出和描述了本發(fā)明，但是本領域的普通技術人員將理解，在不脫離由權利要求限定的本發(fā)明的精神和范圍的情況下，可進行形式和細節(jié)上的各種改變。示例性實施例應該被視為僅是描述性的，而非為了限制的目的。因此，本發(fā)明的范圍不由本發(fā)明的詳細描述限定而是由權利要求限定，在所述范圍內(nèi)的所有差別將被視為包括在本發(fā)明中。
權利要求
1.一種對視頻進行編碼的方法，所述方法包括將視頻數(shù)據(jù)劃分為最大編碼單元；基于根據(jù)最大編碼單元的至少一個劃分的區(qū)域的分層結構的較深層編碼單元，對最大編碼單元的視頻數(shù)據(jù)進行編碼，確定編碼的結果將被輸出的編碼深度，其中，在分層結構中，上層深度的編碼單元被劃分到下層深度，所述確定步驟包括使用通過根據(jù)任意比例劃分上層深度的編碼單元而獲得的分區(qū)執(zhí)行幀間預測；輸出比特流，所述比特流包括與針對最大編碼單元的至少一個劃分的區(qū)域的編碼深度相應的編碼視頻數(shù)據(jù)以及關于編碼深度和編碼模式的信息。
2.如權利要求I所述的方法，其中，確定編碼深度的步驟包括選擇性地確定是否使用通過根據(jù)任意比例劃分上層深度的編碼單元而獲得的分區(qū)執(zhí)行幀間預測。
3.如權利要求2所述的方法，其中，輸出比特流的步驟包括將指示用于幀間預測的分區(qū)類型是否包括通過根據(jù)任意比例劃分上層深度的編碼單元而獲得的分區(qū)的信息包括在比特流中。
4.如權利要求I所述的方法，其中，通過根據(jù)任意比例劃分上層深度的編碼單元而獲得的分區(qū)是通過根據(jù)I :3或3 :1的比例劃分上層深度的編碼單元的高和寬而獲得的分區(qū)。
5.如權利要求I所述的方法，其中，最大編碼單元被選擇性地設置為大小為16X16、32X32,64X64,128X128 和 256X256 的塊中的至少一個。
6.如權利要求I所述的方法，其中，編碼深度被確定為根據(jù)相應劃分的區(qū)域的分層結構的較深層編碼單元的編碼結果中具有最高編碼效率的較深層編碼單元的深度，并針對最大編碼單元的所述至少一個劃分的區(qū)域被獨立地確定。
7.—種對視頻進行解碼的方法，所述方法包括接收并解析編碼視頻數(shù)據(jù)的比特流；從比特流提取根據(jù)最大編碼單元的編碼視頻數(shù)據(jù)以及關于編碼深度和編碼模式的信息；基于關于編碼深度和編碼模式的信息，針對根據(jù)最大編碼單元的至少一個編碼深度的編碼單元，執(zhí)行解碼，所述解碼包括使用通過根據(jù)任意比例劃分編碼單元而獲得的分區(qū)進行的運動補償，其中，所述至少一個編碼深度的編碼單元被確定為最大編碼單元的至少一個劃分的區(qū)域的分層結構的較深層編碼單元的深度之一。
8.如權利要求7所述的方法，其中，提取編碼視頻數(shù)據(jù)的步驟包括從比特流提取指示用于幀間預測的分區(qū)類型和通過根據(jù)任意比例劃分上層深度的編碼單元而獲得的分區(qū)的信息。
9.如權利要求8所述的方法，其中，執(zhí)行解碼的步驟包括基于從比特流提取的指示用于幀間預測的分區(qū)類型和通過根據(jù)任意比例劃分上層深度的編碼單元而獲得的分區(qū)的信息，選擇性地確定是否使用通過根據(jù)任意比例劃分編碼單元而獲得的分區(qū)執(zhí)行運動補償。
10.如權利要求7所述的方法，其中，通過根據(jù)任意比例劃分編碼單元而獲得的分區(qū)是通過根據(jù)I :3或3 :1的比例劃分編碼單元的高和寬而獲得的分區(qū)。
11.如權利要求7所述的方法，其中，最大編碼單元被選擇性地設置為大小為16X16、32X32,64X64,128X128 和 256X256 的塊中的至少一個。
12.如權利要求7所述的方法，其中，編碼深度被確定為根據(jù)相應劃分的區(qū)域的分層結構的較深層編碼單元的編碼結果中具有最高編碼效率的較深層編碼單元的深度，并針對最大編碼單元的所述至少一個劃分的區(qū)域被獨立地確定。
13.一種用于對視頻進行編碼的設備，所述設備包括最大編碼單元劃分器，將視頻數(shù)據(jù)劃分為最大編碼單元；編碼器，基于根據(jù)最大編碼單元的至少一個劃分的區(qū)域的分層結構的較深層編碼單元，對最大編碼單元的視頻數(shù)據(jù)進行編碼，確定編碼的結果將被輸出的編碼深度，其中，在分層結構中，上層深度的編碼單元被劃分到下層深度，所述確定步驟包括使用通過根據(jù)任意比例劃分上層深度的編碼單元而獲得的分區(qū)執(zhí)行幀間預測；輸出單元，輸出比特流，所述比特流包括與針對最大編碼單元的至少一個劃分的區(qū)域的編碼深度相應的編碼視頻數(shù)據(jù)以及關于編碼深度和編碼模式的信息。
14.一種用于對視頻進行解碼的設備，所述設備包括解析器，接收并解析編碼視頻數(shù)據(jù)的比特流；提取器，從比特流提取根據(jù)最大編碼單元的編碼視頻數(shù)據(jù)以及關于編碼深度和編碼模式的信息；解碼器，基于關于編碼深度和編碼模式的信息，針對根據(jù)最大編碼單元的至少一個編碼深度的編碼單元，執(zhí)行解碼，所述解碼包括使用通過根據(jù)任意比例劃分編碼單元而獲得的分區(qū)進行的運動補償，其中，所述至少一個編碼深度的編碼單元被確定為最大編碼單元的至少一個劃分的區(qū)域的分層結構的較深層編碼單元的深度之一。
15.—種計算機可讀記錄介質,所述計算機可讀記錄介質記錄有用于執(zhí)行如權利要求I和7所述的任何一種方法的程序。
全文摘要
公開了一種對視頻進行編碼的方法和設備，所述方法包括基于根據(jù)最大編碼單元的至少一個劃分的區(qū)域的分層結構的較深層編碼單元，對最大編碼單元的視頻數(shù)據(jù)進行編碼，并使用通過根據(jù)任意比例劃分編碼單元而獲得的分區(qū)執(zhí)行幀間預測，來確定編碼深度；輸出比特流，所述比特流包括與根據(jù)最大編碼單元的編碼深度相應的編碼視頻數(shù)據(jù)以及關于編碼深度和編碼模式的信息。
文檔編號H04N7/50GK102771124SQ201080063102
公開日2012年11月7日申請日期2010年12月8日優(yōu)先權日2009年12月8日
發(fā)明者千岷洙, 李善一, 韓宇鎮(zhèn) 申請人:三星電子株式會社

完整全部詳細技術資料下載

該技術已申請專利。僅供學習研究，如用于商業(yè)用途，請聯(lián)系技術所有人。
技術研發(fā)人員：李善一;千岷洙;韓宇鎮(zhèn)
技術所有人：三星電子株式會社
我是此專利的發(fā)明人

上一篇：用于在共享介質上傳送數(shù)據(jù)的方法和設備的制作方法
上一篇：去塊濾波控制的制作方法

該領域下的技術專家
如您需求助技術專家，請點此查看客服電話進行咨詢。
1、王老師：1.數(shù)字信號處理 2.傳感器技術及應用 3.機電一體化產(chǎn)品開發(fā) 4.機械工程測試技術 5.逆向工程技術研究
2、王老師：1.機器人 2.嵌入式控制系統(tǒng)開發(fā)
3、孫老師：1.振動信號時頻分析理論與測試系統(tǒng)設計 2.汽車檢測系統(tǒng)設計 3.汽車電子控制系統(tǒng)設計
4、畢老師：機構動力學與控制
5、袁老師：1.計算機視覺 2.無線網(wǎng)絡及物聯(lián)網(wǎng)
如您是高校老師，可以點此聯(lián)系我們加入專家?guī)臁?/a>

相關技術

網(wǎng)友詢問留言已有0條留言

還沒有人留言評論。精彩留言會獲得點贊！

精彩留言，會給你點贊！

国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

通過使用任意分區(qū)進行運動預測來對視頻進行編碼的方法和設備，以及通過使用任意分...的制作方法

通過使用任意分區(qū)進行運動預測來對視頻進行編碼的方法和設備，以及通過使用任意分...的制作方法