本原理涉及視頻壓縮領(lǐng)域。
背景技術(shù):
1、在hevc視頻壓縮標(biāo)準(zhǔn)(國際電信聯(lián)盟,itu-t?h.265高效視頻編碼)中,圖片被劃分為所謂的編碼樹單元(ctu),其尺寸通常為64x64、128x128或256x256像素。
2、每個ctu由壓縮域中的編碼樹表示。這是ctu的四叉樹劃分,其中每個葉片稱為編碼單元(cu),如圖1所示。
3、然后,為每個cu提供一些幀內(nèi)或幀間預(yù)測參數(shù)(預(yù)測信息)。為此,將其在空間上分區(qū)為一個或多個預(yù)測單元(pu),每個pu均被分配有一些預(yù)測信息。幀內(nèi)或幀間編碼模式在cu級別分配,參見圖2。
4、根據(jù)在位流中用信號通知的分區(qū)類型將編碼單元分區(qū)為(一個或多個)預(yù)測單元。對于幀內(nèi)編碼單元,僅使用圖3中所示的分區(qū)類型2nx2n和nxn。這意味著在幀內(nèi)編碼單元中僅使用正方形預(yù)測單元。
5、相反,幀間編碼單元可以使用圖3所示的所有分區(qū)類型。
6、根據(jù)hevc標(biāo)準(zhǔn),在“變換樹”之后,編碼單元也以遞歸的方式被劃分為所謂的變換單元。因此,變換樹是編碼單元的四叉樹劃分,并且變換單元是變換樹的葉片。變換單元封裝與所考慮的正方形空間區(qū)域?qū)?yīng)的每個圖片分量的正方形變換塊。變換塊是單個分量中樣本的正方形塊,其中應(yīng)用相同的變換。
7、新興的視頻壓縮工具包括壓縮域中的編碼樹單元表示,為了在壓縮域中以更靈活的方式表示圖片數(shù)據(jù)而提出。編碼樹的這種靈活表示的優(yōu)勢在于,與hevc標(biāo)準(zhǔn)的cu/pu/tu布置相比,它提供了更高的壓縮效率。
8、四叉樹加二叉樹(qtbt)編碼工具提供了這種增加的靈活性。它包含在編碼樹中,其中編碼單元可以以四叉樹和二叉樹的方式進(jìn)行分割。圖4中圖示了編碼樹單元的這種編碼樹表示。塊上的qtbt表示在圖5中示出。
9、通過率失真優(yōu)化過程在編碼器側(cè)決定編碼單元的分割,該過程包括以最小的率失真成本確定ctu的qtbt表示。
10、在qtbt技術(shù)中,cu具有正方形或矩形形狀。編碼單元的尺寸始終為2的冪,通常從4到256。
11、除了用于編碼單元的各種矩形形狀之外,與hevc相比,這種新的ctu表示具有以下不同的特點(diǎn)。
12、首先,ctu的qtbt分解分兩個階段進(jìn)行:首先以四叉樹的方式分割ctu,然后可以以二元方式進(jìn)一步劃分每個四叉樹的葉片。這在圖4的右側(cè)進(jìn)行了圖示,其中實(shí)線表示四叉樹分解階段,虛線表示空間分解嵌入四叉樹葉片的二元分解。
13、其次,在幀內(nèi)條帶中,亮度和色度塊分區(qū)結(jié)構(gòu)被分開,并且是獨(dú)立決定的。
14、接下來,不再采用cu分區(qū)成預(yù)測單元或變換單元。換句話說,每個編碼單元系統(tǒng)地由單個預(yù)測單元(以前是2nx2n個預(yù)測單元劃分類型)和單個變換單元(不劃分成變換樹)組成。
15、但是,qtbt技術(shù)需要進(jìn)一步提高壓縮效率。
技術(shù)實(shí)現(xiàn)思路
1、所描述的實(shí)施例中的至少一個解決了現(xiàn)有技術(shù)的這些和其它缺點(diǎn)和不足,這些實(shí)施例針對用于編碼或解碼視頻數(shù)據(jù)塊的方法和裝置。在至少一個實(shí)施例中,提出使用基于紋理的技術(shù)來生成分割的分區(qū)概率的集合。
2、根據(jù)本文所述的至少一個一般實(shí)施例,提供了一種方法,包括:至少基于神經(jīng)網(wǎng)絡(luò)確定與圖像數(shù)據(jù)塊相關(guān)聯(lián)的分區(qū)概率的集合;至少基于所確定的分區(qū)概率的集合將所述圖像數(shù)據(jù)塊分區(qū)為兩個或更多個更小的預(yù)測單元;以及至少基于所述分區(qū)對所述圖像數(shù)據(jù)塊進(jìn)行編碼。
3、根據(jù)本文所述的另一個一般實(shí)施例,提供了一種用于對圖像數(shù)據(jù)塊進(jìn)行編碼的裝置,包括:存儲器,以及處理器,被配置為:至少基于神經(jīng)網(wǎng)絡(luò)確定與所述圖像數(shù)據(jù)塊相關(guān)聯(lián)的分區(qū)概率的集合;至少基于所確定的分區(qū)概率的集合將所述圖像數(shù)據(jù)塊分區(qū)為兩個或更多個更小的預(yù)測單元;以及至少基于所述分區(qū)對所述圖像數(shù)據(jù)塊進(jìn)行編碼。
4、根據(jù)本文所述的另一方面,提供了一種非暫態(tài)計(jì)算機(jī)可讀存儲介質(zhì),其上存儲有計(jì)算機(jī)程序,所述計(jì)算機(jī)程序在由處理器執(zhí)行時,使得所述處理器執(zhí)行上述方法實(shí)施例。
5、通過以下結(jié)合附圖對示例性實(shí)施例的詳細(xì)描述的閱讀,本原理的這些和其它方面、特征和優(yōu)點(diǎn)將變得明顯。
1.一種方法,包括:
2.根據(jù)權(quán)利要求1所述的方法,其中,所述神經(jīng)網(wǎng)絡(luò)被配置為進(jìn)一步基于所述圖像數(shù)據(jù)塊和與所述圖像數(shù)據(jù)塊相鄰的一個或多個因果像素來確定所述分區(qū)概率的集合。
3.根據(jù)權(quán)利要求1所述的方法,其中,所述神經(jīng)網(wǎng)絡(luò)被配置為進(jìn)一步基于指示所述圖像數(shù)據(jù)塊的鄰近塊如何被分區(qū)的信息來確定所述分區(qū)概率的集合。
4.根據(jù)權(quán)利要求1所述的方法,其中,確定與所述圖像數(shù)據(jù)塊相關(guān)聯(lián)的分區(qū)概率的集合包括基于所述神經(jīng)網(wǎng)絡(luò)確定與所述分區(qū)概率的集合相關(guān)聯(lián)的相應(yīng)概率分?jǐn)?shù)。
5.根據(jù)權(quán)利要求4所述的方法,其中,通過將與所述分區(qū)概率的集合相關(guān)聯(lián)的所述相應(yīng)概率分?jǐn)?shù)與預(yù)定閾值進(jìn)行比較來確定所述分區(qū)概率的集合。
6.根據(jù)權(quán)利要求5所述的方法,其中,所述預(yù)定閾值取決于量化參數(shù)。
7.根據(jù)權(quán)利要求5所述的方法,其中,所述預(yù)定閾值取決于樹深度。
8.一種用于對圖像數(shù)據(jù)塊進(jìn)行編碼的裝置,包括:
9.根據(jù)權(quán)利要求8所述的裝置,其中,所述神經(jīng)網(wǎng)絡(luò)被配置為進(jìn)一步基于所述圖像數(shù)據(jù)塊和與所述圖像數(shù)據(jù)塊相鄰的一個或多個因果像素來確定所述分區(qū)概率的集合。
10.根據(jù)權(quán)利要求8所述的裝置,其中,所述神經(jīng)網(wǎng)絡(luò)被配置為進(jìn)一步基于指示所述圖像數(shù)據(jù)塊的鄰近塊如何被分區(qū)的信息來確定所述分區(qū)概率的集合。
11.根據(jù)權(quán)利要求8所述的裝置,其中,所述處理器被配置為確定與所述圖像數(shù)據(jù)塊相關(guān)聯(lián)的分區(qū)概率的集合包括所述處理器被配置為基于所述神經(jīng)網(wǎng)絡(luò)確定與所述分區(qū)概率的集合相關(guān)聯(lián)的相應(yīng)概率分?jǐn)?shù)。
12.根據(jù)權(quán)利要求11所述的裝置,其中,通過將與所述分區(qū)概率的集合相關(guān)聯(lián)的所述相應(yīng)概率分?jǐn)?shù)與預(yù)定閾值進(jìn)行比較來確定所述分區(qū)概率的集合。
13.根據(jù)權(quán)利要求12所述的裝置,其中,所述預(yù)定閾值取決于量化參數(shù)。
14.根據(jù)權(quán)利要求12所述的裝置,其中,所述預(yù)定閾值取決于與所述圖像數(shù)據(jù)塊相關(guān)聯(lián)的樹深度、塊尺寸、塊形狀或條帶類型。
15.一種非暫態(tài)計(jì)算機(jī)可讀介質(zhì),其上存儲有計(jì)算機(jī)程序,所述計(jì)算機(jī)程序在由處理器執(zhí)行時,使得所述處理器執(zhí)行根據(jù)權(quán)利要求1至7中的任一項(xiàng)所述的方法。