圖像解碼方法及使用其的裝置制造方法
【專利摘要】本發(fā)明包括一種圖像信息解碼方法,該方法包括:接收比特流的步驟,該比特流包括網(wǎng)絡(luò)抽象層(NAL)單元,網(wǎng)絡(luò)抽象層(NAL)單元包括與編碼的圖像相關(guān)的信息;和解析NAL單元的NAL單元報(bào)頭的步驟。NAL單元報(bào)頭包括層信息,該層信息包含用于在擴(kuò)展的比特流中識(shí)別擴(kuò)展層的reserved_one_5bits和用于識(shí)別比特流的時(shí)間層的temporal_id。在層信息的temporal_id之前接收層信息的reserved_one_5bits。從而,提供了一種用于在分層的比特流中描述可擴(kuò)展性信息的方法。
【專利說(shuō)明】圖像解碼方法及使用其的裝置
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及一種視頻壓縮技術(shù),并且更具體地,涉及一種用于解碼比特流中的視頻信息的方法和裝置。
【背景技術(shù)】
[0002]近來(lái),對(duì)高分辨率和高質(zhì)量圖像的需求已經(jīng)在各種應(yīng)用領(lǐng)域中增長(zhǎng)。由于圖像具有較高的分辨率和較高的質(zhì)量,所以有關(guān)圖像的信息量同樣增長(zhǎng)。
[0003]隨著信息量增長(zhǎng),引入具有各種環(huán)境的多功能設(shè)備和網(wǎng)絡(luò)。因此,相同的內(nèi)容可以以不同等級(jí)的質(zhì)量使用。
[0004]特別地,由于終端能夠支持不同質(zhì)量的視頻并且建立了各種網(wǎng)絡(luò)環(huán)境,在一個(gè)環(huán)境下啟用具有一般質(zhì)量的視頻,同時(shí)高質(zhì)量視頻在另一個(gè)環(huán)境下是可用的。
[0005]例如,用戶可以在家里在具有更高分辨率的大屏幕顯示器上欣賞通過(guò)便攜式終端購(gòu)買的視頻內(nèi)容。
[0006]近年來(lái),由于高清晰度(HD)廣播服務(wù)是可用的,所以大量的用戶習(xí)慣于高分辨率和高質(zhì)量視頻,并且服務(wù)提供商和服務(wù)用戶也關(guān)注具有比HDTV高四倍分辨率的超高清晰度(UHD)服務(wù)。
[0007]因此,存在基于對(duì)大容量視頻的高效率編碼和解碼方法,對(duì)視頻質(zhì)量,例如,圖像質(zhì)量、分辨率、視頻的大小和幀速率提供可擴(kuò)展性,以便在對(duì)于用戶需求的不同的環(huán)境下提供不同質(zhì)量的視頻服務(wù)的需要。
【發(fā)明內(nèi)容】
[0008]技術(shù)問題
[0009]本發(fā)明的方面是提供一種用于描述在可擴(kuò)展的比特流中的可擴(kuò)展性信息的方法和裝置。
[0010]本發(fā)明的另一個(gè)方面是提供一種用于以靈活的方式表示有關(guān)比特流的可擴(kuò)展性信息的方法和裝置。
[0011]本發(fā)明的再一個(gè)方面是提供一種用于簡(jiǎn)化在比特流中的視頻編譯層類型的方法和裝置。
[0012]技術(shù)方案
[0013]本發(fā)明的實(shí)施例提供一種解碼視頻信息的方法,該方法包括:接收包括網(wǎng)絡(luò)抽象層(NAL)單元的比特流,網(wǎng)絡(luò)抽象層(NAL)單元包括有關(guān)編碼的視頻的信息;和解析NAL單元的NAL單元報(bào)頭,其中,NAL單元報(bào)頭包括層信息,層信息包括在擴(kuò)展的比特流中識(shí)別擴(kuò)展層的預(yù)留_ 一個(gè)_5比特(reserved_one_5bits),和識(shí)別比特流的時(shí)間層的時(shí)間_id(temporal_id),以及在 termporal_id 之前接收 reserved_one_5bits。
[0014]reserved_one_5bits 和 termporal_id 可以被同時(shí)地解析。
[0015]本發(fā)明的另一個(gè)實(shí)施例提供一種解碼視頻信息的方法,該方法包括:接收包括網(wǎng)絡(luò)抽象層(NAL)單元的比特流,網(wǎng)絡(luò)抽象層(NAL)單元包括有關(guān)編碼的視頻的信息,和解析NAL單元的NAL單元報(bào)頭,其中,NAL單元報(bào)頭包括對(duì)應(yīng)于NAL單元類型的NAL單元類型信息,NAL單元類型包括當(dāng)圖片組(圖片的組)具有開放結(jié)構(gòu)時(shí),作為隨機(jī)接入點(diǎn)圖片的純隨機(jī)接入(CRA)圖片,和當(dāng)編碼的圖片被拼接或者比特流在中間斷開時(shí),存在于作為隨機(jī)接入點(diǎn)的比特流的中間的斷鏈接入(BLA)圖片。
[0016]CRA圖片可以具有一個(gè)NAL單元類型,而不管引導(dǎo)圖片如何,引導(dǎo)圖片在作為隨機(jī)接入點(diǎn)的圖片之前被輸出,并且在作為隨機(jī)接入點(diǎn)的圖片之后被解碼。
[0017]在作為隨機(jī)接入點(diǎn)的圖片之前被輸出,并且在作為隨機(jī)接入點(diǎn)的圖片之后被解碼的引導(dǎo)圖片在BLA圖片之后不存在。
[0018]在作為隨機(jī)接入點(diǎn)的圖片之前輸出并且在作為隨機(jī)接入點(diǎn)的圖片之后被解碼的引導(dǎo)圖片之中的沒有被解碼但是被去除的引導(dǎo)圖片在BLA圖片之后不存在。
[0019]有益效果
[0020]本發(fā)明的實(shí)施例提供用于描述在可擴(kuò)展的比特流中的可擴(kuò)展性信息的方法和裝置。
[0021]本發(fā)明的另一個(gè)實(shí)施例提供一種用于以靈活的方式表示有關(guān)比特流的可擴(kuò)展性信息的方法和裝置。
[0022]本發(fā)明的再一個(gè)實(shí)施例提供一種用于簡(jiǎn)化在比特流中的視頻編譯層類型的方法和裝置。
【專利附圖】
【附圖說(shuō)明】
[0023]圖1是示意地圖示根據(jù)本發(fā)明的示例性實(shí)施例的視頻編碼裝置的框圖。
[0024]圖2是示意地圖示根據(jù)本發(fā)明的示例性實(shí)施例的視頻解碼裝置的框圖。
[0025]圖3示意地圖示根據(jù)本發(fā)明的示例性實(shí)施例使用多層的可擴(kuò)展視頻編碼結(jié)構(gòu)。
[0026]圖4圖示由解碼裝置處理的編碼視頻的分層結(jié)構(gòu)。
[0027]圖5圖示隨機(jī)接入圖片。
[0028]圖6圖示IDR圖片。
[0029]圖7圖示CRA圖片。
[0030]圖8圖示根據(jù)本發(fā)明的示例性實(shí)施例的CRA圖片到BLA圖片的變化。
[0031]圖9是圖示根據(jù)本發(fā)明的編碼視頻信息的方法的流程圖。
[0032]圖10是圖示根據(jù)本發(fā)明的解碼視頻信息的方法的流程圖。
【具體實(shí)施方式】
[0033]本發(fā)明可以不同地變化和修改,并且參考不同的示例性實(shí)施例圖示,其中一些將詳細(xì)描述和在附圖中示出。但是,這些實(shí)施例不意欲限制本發(fā)明。在此處使用的術(shù)語(yǔ)僅僅是為了描述特定的實(shí)施例的目的,并且不意欲限制本發(fā)明的技術(shù)想法。作為在此處使用的,單個(gè)形式“一”、“一個(gè)”和“該”意欲也包括多個(gè)形式,除非上下文中以別的方式清楚地表示。應(yīng)該進(jìn)一步理解,當(dāng)在本說(shuō)明書中使用時(shí),該術(shù)語(yǔ)“包括”和/或“具有”指定陳述的特征、整數(shù)、步驟、操作、要素、部件和/或其組合的存在,但是,不排除一個(gè)或多個(gè)其它的特征、整數(shù)、步驟、操作、要素、部件和/或其組合的存在或者增加。[0034]雖然為了描述在視頻編碼裝置/解碼裝置中不同的區(qū)別的功能的方便起見,在附圖中圖示的要素被獨(dú)立地示出,但是這樣的配置不表示每個(gè)要素由單獨(dú)的硬件組件或者軟件組件構(gòu)成。即,至少二個(gè)要素可以被組合為單個(gè)要素,或者單個(gè)要素可以被分成多個(gè)要素去執(zhí)行功能。應(yīng)當(dāng)注意,不脫離本發(fā)明的本質(zhì)的情況下,某些要素被集成為一個(gè)組合要素,和/或一個(gè)要素被分成多個(gè)單獨(dú)的要素的實(shí)施例包括在本發(fā)明的范圍中。
[0035]在下文中,本發(fā)明示例性實(shí)施例將參考附圖詳細(xì)描述。在附圖中相同的附圖標(biāo)記自始至終表示相同的要素,并且相同的要素的冗余描述在此處將被省略。
[0036]圖1是示意地圖示根據(jù)本發(fā)明的示例性實(shí)施例的視頻編碼裝置的框圖??蓴U(kuò)展的視頻編碼/解碼方法或者裝置可以通過(guò)沒有提供可擴(kuò)展性的一般視頻編碼/解碼方法或者裝置的擴(kuò)展實(shí)現(xiàn),并且圖1圖示作為可擴(kuò)展的視頻編碼裝置基礎(chǔ)的視頻編碼裝置的示例。
[0037]參考圖1,該視頻編碼裝置100包括圖片分割模塊105、預(yù)測(cè)模塊110、變換模塊115、量化模塊120、重排模塊125、熵編碼模塊130、去量化模塊135、逆變換模塊140、濾波模塊145,和存儲(chǔ)器150。
[0038]該圖片分割模塊105可以將輸入圖片劃分為至少一個(gè)塊作為處理單元。在這里,作為處理單元的塊可以是預(yù)測(cè)單元(PU)、變換單元(TU),或者編碼單元(⑶)。
[0039]由圖片分割模塊105劃分的處理單元塊可以具有四樹結(jié)構(gòu)。
[0040]該預(yù)測(cè)模塊110可以包括將描述的執(zhí)行幀間預(yù)測(cè)的幀間預(yù)測(cè)模塊,和執(zhí)行幀內(nèi)預(yù)測(cè)的幀內(nèi)預(yù)測(cè)模塊。該預(yù)測(cè)模塊110通過(guò)對(duì)來(lái)自分割模塊105的圖片的處理單元執(zhí)行預(yù)測(cè)生成預(yù)測(cè)塊。在預(yù)測(cè)模塊110中的圖片的處理單元可以是⑶、TU或者PU。此外,該預(yù)測(cè)模塊110可以確定是否對(duì)處理單元執(zhí)行的預(yù)測(cè)是幀間預(yù)測(cè)或者幀內(nèi)預(yù)測(cè),并且可以確定每個(gè)預(yù)測(cè)方法的細(xì)節(jié)(例如,預(yù)測(cè)模式)。在這里,對(duì)其執(zhí)行預(yù)測(cè)的處理單元可以不同于預(yù)測(cè)方法和有關(guān)預(yù)測(cè)方法的細(xì)節(jié)為其確定的處理單元。例如,預(yù)測(cè)方法和預(yù)測(cè)模式可以對(duì)于每個(gè)PU被確定,同時(shí)可以對(duì)每個(gè)TU執(zhí)行預(yù)測(cè)。
[0041]在幀間預(yù)測(cè)中,基于有關(guān)當(dāng)前圖片的先前的和/或后續(xù)的圖片的至少一個(gè)的信息預(yù)測(cè)塊可以通過(guò)執(zhí)行預(yù)測(cè)被生成。此外,在幀內(nèi)預(yù)測(cè)中,基于有關(guān)在當(dāng)前圖片內(nèi)像素的信息預(yù)測(cè)塊可以通過(guò)執(zhí)行預(yù)測(cè)被生成。
[0042]跳躍模式、合并模式和運(yùn)動(dòng)矢量預(yù)測(cè)(MVP)模式可以用作幀間預(yù)測(cè)方法。在幀間預(yù)測(cè)中,可以選擇用于PU的參考圖片,并且對(duì)應(yīng)于的參考?jí)K可以被選擇。參考?jí)K可以以幀間像素單元被選擇。隨后,生成具有相對(duì)于當(dāng)前PU最小殘留信號(hào)和具有最小大小運(yùn)動(dòng)矢量的預(yù)測(cè)塊。
[0043]該預(yù)測(cè)塊可以以整數(shù)采樣單元,或者以小于整數(shù)像素,諸如1/2像素單元和1/4像素單元的像素單元被生成。在這里,該運(yùn)動(dòng)矢量可以以小于整數(shù)像素的單元表示。
[0044]有關(guān)在幀間預(yù)測(cè)中選擇的參考像素的信息,諸如索引、運(yùn)動(dòng)矢量(例如,運(yùn)動(dòng)矢量預(yù)測(cè)器)和參考圖片的殘留信號(hào)經(jīng)歷熵編碼,并且傳送給解碼裝置。在跳躍模式中,由于預(yù)測(cè)塊可以是重建的塊,所以該殘留不能被生成、變換、量化和傳送。
[0045]在幀內(nèi)預(yù)測(cè)中,預(yù)測(cè)模式由確定,并且預(yù)測(cè)可以由執(zhí)行。替選地,預(yù)測(cè)模式可以由PU確定,并且?guī)瑑?nèi)預(yù)測(cè)可以在TU中執(zhí)行。
[0046]幀內(nèi)預(yù)測(cè)模式可以具有33個(gè)方向的預(yù)測(cè)模式,和兩個(gè)或更多個(gè)無(wú)方向的模式。無(wú)方向的模式可以包括DC預(yù)測(cè)模式和平面模式。[0047]在幀內(nèi)預(yù)測(cè)中,該預(yù)測(cè)塊可以在將濾波器施加于參考采樣之后被生成。在這里,是否將濾波器施加于參考采樣可以關(guān)于幀內(nèi)預(yù)測(cè)模式和/或當(dāng)前塊的大小被確定。
[0048]I3U可以具有不同的大小和形式。例如,在幀間預(yù)測(cè)中,I3U可以是2NX2N、2NXN、NX 2N或者NXN ±夾(N是整數(shù))。在幀內(nèi)預(yù)測(cè)中,I3U可以是2NX 2N或者NXN ±夾(N是整數(shù))。在這里,具有NX N塊大小的PU可以僅僅應(yīng)用于特定的情形。例如,具有NX N塊大小的PU僅僅可用于最小大小的CU,或者僅僅用于幀內(nèi)預(yù)測(cè)。除了具有先前大小的之外,PU可以包括 NXmN、mNXN、2NXmN 和 mNX2N塊(m〈l)。
[0049]在生成的預(yù)測(cè)塊和初始?jí)K之間的殘留值(或者,殘留塊或者殘留信號(hào))可以被輸入給變換模塊115。此外,有關(guān)預(yù)測(cè)模式的信息,和有關(guān)用于預(yù)測(cè)的運(yùn)動(dòng)矢量的信息與殘留值一起由熵編碼模塊130編碼,并且傳送給解碼裝置。
[0050]該變換模塊115通過(guò)TU變換殘留塊,并且生成變換系數(shù)。
[0051 ] 變換塊是采樣的矩形塊,相同的變換被應(yīng)用于其。該變換塊可以是TU,并且具有四樹結(jié)構(gòu)。
[0052]基于應(yīng)用于殘留塊的預(yù)測(cè)模式和塊的大小該變換模塊115可以執(zhí)行變換。
[0053]例如,當(dāng)幀內(nèi)預(yù)測(cè)應(yīng)用于殘留塊,并且該塊具有4X4殘留陣列時(shí),該變換模塊115可以使用離散余弦變換(DCT)變換殘留塊。另外,該變換模塊115可以使用離散正弦變換(DST)變換殘留塊。
[0054]該變換模塊115可以通過(guò)變換生成變換系數(shù)的變換塊。
[0055]該量化模塊120可以通過(guò)量化由變換模塊115變換的殘留值(即,變換系數(shù))生成量化的變換系數(shù)。由量化模塊120推導(dǎo)出的系數(shù)被提供給去量化模塊135和重排模塊125。
[0056]該重排模塊125重排由量化模塊120提供的量化的變換系數(shù)。重排量化的變換系數(shù)可以在熵編碼模塊130中提高編碼效率。
[0057]該重排模塊125可以使用系數(shù)掃描將量化的變換系數(shù)的二維(2D)塊重排為一維(ID)矢量。
[0058]該熵編碼模塊130可以對(duì)由重排模塊125重排的量化變換系數(shù)執(zhí)行熵編碼。諸如指數(shù)Golomb、上下文自適應(yīng)的可變長(zhǎng)度編碼(CAVLC),和上下文自適應(yīng)二進(jìn)制運(yùn)算編碼(CABAC)的各種編碼方法可以在熵編碼中使用。該熵編碼模塊130可以編碼各種類型的信息,諸如從重排模塊125和預(yù)測(cè)模塊110接收的濾波信息和塊內(nèi)插信息、關(guān)于量化的變換系數(shù)和CU的塊類型的信息、預(yù)測(cè)模式信息、分割單元信息、PU信息、傳送單元信息、運(yùn)動(dòng)矢量信息、參考圖片信息。
[0059]此外,該熵編碼模塊130可以根據(jù)需要將變化應(yīng)用給接收到的參數(shù)集或者語(yǔ)法。
[0060]該去量化模塊135對(duì)由量化模塊120量化的值(變換系數(shù))執(zhí)行去量化,并且該逆變換模塊140對(duì)由去量化模塊135去量化的值執(zhí)行逆變換。
[0061]經(jīng)由去量化模塊135和逆變換模塊140生成的殘留值被與由預(yù)測(cè)模塊110預(yù)測(cè)的預(yù)測(cè)塊合并,從而生成重建的塊。
[0062]圖1圖示重建的塊通過(guò)經(jīng)由加法器將殘留塊與預(yù)測(cè)塊合并生成。在這里,加法器可以被認(rèn)為是用于生成重建的塊(重建的塊生成模塊)的單獨(dú)的模塊。
[0063]該濾波器145可以將去塊濾波器、自適應(yīng)循環(huán)濾波器(ALF)和采樣自適應(yīng)偏移(SAO)應(yīng)用于重建的圖片。[0064]該去塊濾波器可以在重建的圖片中去除在塊之間的邊界上生成的塊失真?;谕ㄟ^(guò)將具有通過(guò)去塊濾波器濾波的塊的重建的圖片與原始圖片比較獲得的值,ALF可以執(zhí)行濾波。可以僅僅為了高效率采用ALF。SAO通過(guò)其中使用頻帶偏移或者邊緣偏移的像素單元,重建在去塊濾波器已經(jīng)被應(yīng)用到的殘留塊和原始圖片之間的偏移差。
[0065]同時(shí),該濾波器145可以不將濾波應(yīng)用于在幀間預(yù)測(cè)中使用的重建的塊。
[0066]該存儲(chǔ)器150可以存儲(chǔ)經(jīng)由濾波器145推導(dǎo)出的圖片或者重建的塊。存儲(chǔ)在存儲(chǔ)器150中的該重建的塊或者圖片可以提供給執(zhí)行幀間預(yù)測(cè)的預(yù)測(cè)模塊110。
[0067]圖2是根據(jù)本發(fā)明的示例性實(shí)施例示意地示出視頻解碼裝置的框圖。如上圖1所述,可擴(kuò)展的視頻編碼/解碼方法或者裝置可以通過(guò)擴(kuò)展沒有提供可擴(kuò)展性的一般的視頻編碼/解碼方法或者裝置實(shí)現(xiàn),和圖2圖示作為可擴(kuò)展的視頻解碼裝置基礎(chǔ)的視頻解碼裝置的示例。
[0068]參考圖2,該視頻解碼裝置200可以包括熵解碼模塊210、重排模塊215、去量化模塊220、逆變換模塊225、預(yù)測(cè)模塊230、濾波器235,和存儲(chǔ)器240。
[0069]當(dāng)視頻比特流被從視頻編碼裝置輸入時(shí),該輸入的比特流可以根據(jù)視頻編碼裝置處理視頻信息的反過(guò)程被解碼。
[0070]例如,如果視頻編碼裝置使用可變長(zhǎng)度編碼(VLC),諸如CAVLC,去執(zhí)行熵編碼,則該熵解碼模塊210可以通過(guò)實(shí)現(xiàn)與在編碼裝置中使用的相同的VLC表執(zhí)行熵解碼。此外,如果該視頻編碼裝置使用CABAC去執(zhí)行熵編碼,則該熵解碼模塊210也可以使用CABAC執(zhí)行熵解碼。
[0071]在由熵解碼模塊210解碼的信息片之中用于生成預(yù)測(cè)塊的信息可以提供給預(yù)測(cè)模塊230。由熵解碼模塊210熵解碼的殘留值(即,量化的變換系數(shù))可以輸入給重排模塊215。
[0072]基于在編碼裝置中使用的重排方法,該重排模塊215可以重排關(guān)于由熵解碼模塊210熵解碼的比特流(即,量化的變換系數(shù))的信息。
[0073]該重排模塊215可以將以ID矢量形式表示的系數(shù)重建和重排為以2D塊的系數(shù)。基于預(yù)測(cè)模式和應(yīng)用于當(dāng)前塊(變換塊)的變換塊的大小該重排模塊215可以通過(guò)掃描系數(shù)生成以2D塊(量化的變換系數(shù))的系數(shù)。
[0074]基于從編碼裝置提供的量化參數(shù)和重排的塊系數(shù)去量化模塊220可以執(zhí)行去量化。
[0075]該逆變換模塊225可以對(duì)已經(jīng)經(jīng)歷由編碼裝置的變換模塊執(zhí)行的DCT和DST的、由視頻編碼裝置執(zhí)行的量化結(jié)果執(zhí)行逆DCT和/或逆DST。
[0076]基于由視頻編碼裝置確定的圖片的傳輸單元或者分割單元可以執(zhí)行逆變換。該視頻編碼裝置的變換模塊可以取決于多個(gè)信息元素,諸如,預(yù)測(cè)方法、當(dāng)前塊的大小和預(yù)測(cè)方向有選擇地執(zhí)行DCT和/或DST,并且基于有關(guān)由視頻編碼裝置的變換模塊執(zhí)行的變換的信息該視頻解碼裝置的逆變換模塊225可以執(zhí)行逆變換。
[0077]基于有關(guān)從熵解碼模塊210提供的預(yù)測(cè)塊的生成的信息和有關(guān)由存儲(chǔ)器240提供的預(yù)先地解碼的塊和/或圖片的信息,該預(yù)測(cè)模塊230可以生成預(yù)測(cè)塊。
[0078]如果用于當(dāng)前的預(yù)測(cè)模式是幀內(nèi)預(yù)測(cè)模式,則基于有關(guān)在當(dāng)前圖片中的像素的信息幀內(nèi)預(yù)測(cè)可以被執(zhí)行以生成預(yù)測(cè)塊。[0079]如果用于當(dāng)前的預(yù)測(cè)模式是幀間預(yù)測(cè)模式,則基于包括在當(dāng)前圖片的先前的和后續(xù)的圖片的至少一個(gè)中的信息用于當(dāng)前的幀間預(yù)測(cè)可以被執(zhí)行。在這里,用于由視頻編碼裝置提供的當(dāng)前PU的幀間預(yù)測(cè)所必需的運(yùn)動(dòng)信息,例如,關(guān)于運(yùn)動(dòng)矢量和參考圖片的索引的信息可以通過(guò)檢查從編碼裝置接收的跳越標(biāo)記和合并標(biāo)記推導(dǎo)出。
[0080]重建塊可以使用由預(yù)測(cè)模塊230生成的預(yù)測(cè)塊和由逆變換模塊225提供的殘留塊生成。圖2圖示重建的塊通過(guò)由加法器將預(yù)測(cè)塊與殘留塊合并來(lái)生成。在這里,加法器可以被認(rèn)為是用于生成重建塊(重建塊生成模塊)的單獨(dú)的模塊。
[0081]當(dāng)使用跳躍模式時(shí),不發(fā)送殘留塊,并且預(yù)測(cè)塊是重建塊。
[0082]該重建塊和/或圖片可以提供給濾波器235。該濾波器235可以將去塊濾波、SAO和/或AFL應(yīng)用于重建塊和/或圖片。
[0083]該存儲(chǔ)器240可以存儲(chǔ)要作為參考圖片或者參考?jí)K使用的重建的圖片或者塊,并且將重建的圖片供應(yīng)給輸出單元。
[0084]在解碼裝置200的熵解碼模塊210、重排模塊215、去量化模塊220、逆變換模塊225、預(yù)測(cè)模塊230、濾波器235和存儲(chǔ)器240之中直接與視頻解碼相關(guān)的組件,例如,熵解碼模塊210、重排模塊215、去量化模塊220、逆變換模塊225、預(yù)測(cè)模塊230和濾波器235可以定義為與其它的組件分開地解碼器或者解碼單元。
[0085]此外,該解碼裝置200可以進(jìn)一步包括解析模塊(未示出),以解析關(guān)于包括在比特流中的編碼的視頻的信息。該解析模塊可以包括熵解碼模塊210或者被包括在熵解碼模塊210中。該解析模塊可以作為解碼單元的一個(gè)組件提供。
[0086]圖3示意地圖示根據(jù)本發(fā)明的示例性實(shí)施例使用多層的可擴(kuò)展的視頻編碼結(jié)構(gòu)。在圖3中,圖片組(GOP)表示圖片組,S卩,一組圖片。
[0087]需要傳輸介質(zhì)去發(fā)送視頻數(shù)據(jù),并且每個(gè)傳輸介質(zhì)可以取決于各種網(wǎng)絡(luò)環(huán)境呈現(xiàn)不同的性能??蓴U(kuò)展的視頻編碼方法被提供用于各種傳輸介質(zhì)和網(wǎng)絡(luò)環(huán)境。
[0088]可擴(kuò)展的視頻編碼方法是通過(guò)利用在層之間的紋理信息、運(yùn)動(dòng)信息和殘留信號(hào)去除在層之間冗余,以提高編碼和解碼性能的編碼方案。該可擴(kuò)展的視頻編碼方法可以根據(jù)諸如傳輸比特速率、傳輸差錯(cuò)率和系統(tǒng)資源的周圍的條件,在空間、時(shí)間和質(zhì)量方面提供各種可擴(kuò)展性。
[0089]可擴(kuò)展的視頻編碼可以使用多層結(jié)構(gòu)被執(zhí)行,以便提供可應(yīng)用于不同網(wǎng)絡(luò)情形的比特流。例如,可擴(kuò)展的視頻編碼結(jié)構(gòu)可以包括用于使用一般的視頻解碼方法壓縮視頻數(shù)據(jù)的基礎(chǔ)層,和用于使用基礎(chǔ)層的解碼信息和一般視頻解碼方法壓縮視頻數(shù)據(jù)的增強(qiáng)層。
[0090]在這里,層是根據(jù)空間方面(例如,視頻大小)、時(shí)間方面(例如,解碼順序、視頻輸出順序和幀速率)、質(zhì)量或者復(fù)雜度分類的視頻和比特流的集合。此外,基礎(chǔ)層可以表示參考層或者基本層,而增強(qiáng)層可以表示增強(qiáng)層。多個(gè)層可以相互具有相關(guān)性。
[0091]例如,參考圖3,基礎(chǔ)層可以由標(biāo)準(zhǔn)定義(SD),由高分辨率(HD) 15Hz的幀速率和IMbps的比特速率、第一增強(qiáng)層、由超高分辨率(4K-UHD) 30Hz的幀速率和3.9Mbps的比特速率和第二增強(qiáng)層,60Hz的幀速率和27.2Mbps的比特速率限定。前面提到的格式、幀速率和比特速率僅僅是為了說(shuō)明性的目的提供的,并且可以根據(jù)需要變化和修改。此外,不同的層數(shù)可以取決于情形使用。
[0092]例如,當(dāng)傳輸帶寬是40Mbps時(shí),第一增強(qiáng)層可以通過(guò)降低HD幀速率以15Hz或者更小的幀速率發(fā)送??蓴U(kuò)展的視頻編碼方法可以使用如上參考圖3所述的方法在時(shí)間、空間和質(zhì)量方面提供可擴(kuò)展性。
[0093]在下文中可擴(kuò)展的視頻編碼可以指的是從編碼視角可擴(kuò)展的視頻編碼,和從解碼視角可擴(kuò)展的視頻解碼。
[0094]如上所述,由于不同種類的通信網(wǎng)絡(luò)和各種類型的終端,可擴(kuò)展性是當(dāng)前視頻格式的重要功能。
[0095]同時(shí),包括多層的比特流由網(wǎng)絡(luò)抽象層(NAL)單元形成,其便于經(jīng)由分組交換網(wǎng)絡(luò)的視頻適配傳輸。類似于多層的情形,在包括多個(gè)多圖視頻的多圖視頻編碼中,在多圖之間的關(guān)系類似于在包括多層的視頻中在空間層之間的關(guān)系。
[0096]圖4圖示由解碼裝置處理的編碼視頻的層狀結(jié)構(gòu)。
[0097]該編碼的視頻被分成用于解碼視頻,和處理視頻本身以及位于VCL和下層系統(tǒng)之間的NAL的視頻編譯層(VCL),該下層系統(tǒng)發(fā)送和存儲(chǔ)編碼信息。
[0098]作為NAL的基本單元的NAL單元用來(lái)根據(jù)預(yù)置的標(biāo)準(zhǔn)、實(shí)時(shí)傳輸協(xié)議(RTP)和傳輸流(TS)將編碼的視頻映射到下層系統(tǒng)的比特串上,諸如,文件格式。
[0099]同時(shí),對(duì)于VLC、對(duì)應(yīng)于序列和圖片的報(bào)頭的參數(shù)集(圖片參數(shù)集、序列參數(shù)集和視頻參數(shù)集)和對(duì)視頻解碼處理另外需要的輔助的增強(qiáng)信息(SEI)消息與關(guān)于視頻(片段數(shù)據(jù))的信息分離。存儲(chǔ)關(guān)于視頻信息的VCL包括片段數(shù)據(jù)和片段報(bào)頭。
[0100]如圖4所示,NAL單元包括NAL單元報(bào)頭和在VCL中生成的原始的字節(jié)序列有效載荷(RBSP,從視頻壓縮產(chǎn)生的數(shù)據(jù))的二個(gè)部分。NAL單元報(bào)頭包括關(guān)于NAL單元類型的信息。
[0101]NAL單元取決于在VCL中生成的RBSP被分成VCL NAL單元和非VCL NAL單元。VCLNAL單元是包括關(guān)于視頻的信息的NAL單元,并且非VCL NAL單元是包括用于解碼視頻需要的信息(參數(shù)集或者SEI消息)的NAL單元。
[0102]VCL NAL單元可以根據(jù)包括在NAL單元中圖片的屬性和類型被分成不同的類型。
[0103]同時(shí),關(guān)于比特流的可擴(kuò)展性信息是非常至關(guān)緊要的,以便有效地和高效地在內(nèi)容傳送路徑的每個(gè)節(jié)點(diǎn)上變換比特流。在作為用于單個(gè)層的視頻編碼規(guī)范的高效率視頻編碼中,NAL單元報(bào)頭包括有關(guān)與可擴(kuò)展性信息相關(guān)的二個(gè)字段,temporal_id和reserved_one_5bits的信息。具有3比特長(zhǎng)度的temporal_id表示時(shí)間層,并且reserved_one_5bits是用于表示隨后另一層信息的區(qū)域。時(shí)間層表示由VCL NAL單元形成并且臨時(shí)可擴(kuò)展的比特流的層,并且具有特定的temporal_id值。
[0104]本發(fā)明提出有效地描述在支持多層的比特流中關(guān)于視頻的抽象信息和可擴(kuò)展性信息,并且公開用于信令傳送這樣的信息的方法和裝置。
[0105]為了描述方便,比特流在下文中被分成二個(gè)類型。支持時(shí)間可擴(kuò)展性的比特流僅僅表示為基礎(chǔ)類型,而支持時(shí)間、空間、質(zhì)量和視點(diǎn)可擴(kuò)展性的比特流被表示為擴(kuò)展類型。
[0106]表I圖示根據(jù)本發(fā)明的示例性實(shí)施例由編碼裝置編碼和由解碼裝置解碼的NAL單元報(bào)頭的語(yǔ)法。
[0107][表I][0108]
【權(quán)利要求】
1.一種解碼視頻信息的方法,所述方法包括: 接收包括網(wǎng)絡(luò)抽象層(NAL)單元的比特流,所述網(wǎng)絡(luò)抽象層(NAL)單元包括有關(guān)編碼的視頻的信息;以及 解析所述NAL單元的NAL單元報(bào)頭, 其中,所述NAL單元報(bào)頭包括層信息,所述層信息包括在擴(kuò)展的比特流中識(shí)別擴(kuò)展層的reserved_one_5bits和識(shí)別比特流的時(shí)間層的temporal_id,以及 在 termporal_id 之前接收 reserved_one_5bits。
2.根據(jù)權(quán)利要求1所述的方法,其中,reserved_one_5bits和termporal_id被同時(shí)地解析。
3.一種解碼視頻信息的方法,所述方法包括: 接收包括網(wǎng)絡(luò)抽象層(NAL)單元的比特流,所述網(wǎng)絡(luò)抽象層(NAL)單元包括有關(guān)編碼的視頻的信息;以及 解析所述NAL單元的NAL單元報(bào)頭, 其中,所述NAL單元報(bào)頭包括對(duì)應(yīng)于NAL單元類型的NAL單元類型信息,以及 所述NAL單元類型包括純隨機(jī)接入(CRA)圖片和斷鏈接入(BLA)圖片,所述純隨機(jī)接A(CRA)圖片是當(dāng)圖片組(圖片的組)具有開放結(jié)構(gòu)時(shí)作為隨機(jī)接入點(diǎn)的圖片,和所述斷鏈接入(BLA)圖片當(dāng)編譯的圖片被拼接或者所述比特流在中間斷開時(shí)存在于作為隨機(jī)接入點(diǎn)的比特流的中間。
4.根據(jù)權(quán)利要求3所述的方法,其中,所述CRA圖片具有一個(gè)NAL單元類型,而不管引導(dǎo)圖片如何,所述引導(dǎo)圖片在作為隨機(jī)接入點(diǎn)的圖片之前被輸出并且在作為所述隨機(jī)接入點(diǎn)的圖片之后被解碼。
5.根據(jù)權(quán)利要求3所述的方法,其中,在作為隨機(jī)接入點(diǎn)的圖片之前被輸出并且在作為所述隨機(jī)接入點(diǎn)的圖片之后被解碼的引導(dǎo)圖片在所述BLA圖片之后不存在。
6.根據(jù)權(quán)利要求3所述的方法,其中,在作為隨機(jī)接入點(diǎn)的圖片之前被輸出并且在作為所述隨機(jī)接入點(diǎn)的圖片之后被解碼的引導(dǎo)圖片之中的沒有被解碼但是被去除的引導(dǎo)圖片在所述BLA圖片之后不存在。
【文檔編號(hào)】H04N19/31GK103843342SQ201380003197
【公開日】2014年6月4日 申請(qǐng)日期:2013年6月12日 優(yōu)先權(quán)日:2012年6月12日
【發(fā)明者】亨得利·亨得利, 金廷宣, 金哲瑾, 全柄文, 丁商五 申請(qǐng)人:Lg電子株式會(huì)社