視頻解碼裝置、視頻解碼方法以及程序的制作方法
【專利說明】視頻解碼裝置、視頻解碼方法以及程序
[0001 ] 本申請是申請日為2011年7月8日、申請?zhí)枮?01180034498.8、發(fā)明名稱為“視頻編碼裝置、視頻解碼裝置、視頻編碼方法、視頻解碼方法以及程序”的發(fā)明專利申請的分案申請。
技術領域
[0002]本發(fā)明涉及使用像素比特長度增加和非壓縮編碼的視頻編碼裝置和視頻解碼裝置。
【背景技術】
[0003]作為旨在用于視頻信息的高效傳輸和積累的視頻編碼方案,在非專利文獻(NPL)2中描述了 IS0/IEC 14496-10高級視頻編碼(AVC)標準的編碼方案。此外,NPL 1通過在視頻編碼之后擴展(增加)輸入圖像的像素比特長度以增強幀內預測和運動補償預測(幀間預測)的運算精度,提出了對視頻編碼的壓縮效率的改進。
[0004]專利文獻(PTL)l提出了每個預定的編碼單元在熵編碼與非壓縮編碼(PCM編碼)之間切換,以保證用于視頻編碼裝置或視頻解碼裝置的固定處理時間。
[0005]引用列表
[0006]專利文獻
[0007]PTL 1:日本專利申請公開N0.2004-135251
[0008]非專利文獻
[0009]NPL 1:2006年,J-009,F(xiàn)orum on Informat1n Technology 2006,Reiko Noda、Takeshi Chujoh的“Improving Video Coding Efficiency by Pixel Bit-depthIncrease,,
[0010]NPL 2:IS0/IEC 14496-10高級視頻編碼
【發(fā)明內容】
[0011]技術問題
[0012]圖16是顯示了通過簡單地組合NPL1中所述的技術和PTL 1中所述的技術獲得的視頻編碼裝置的方框圖。在下文中,圖16中所示的視頻編碼裝置被稱為典型視頻編碼裝置。
[0013]下面參考圖16來描述接收數(shù)字化視頻的每個幀的輸入并且輸出比特流的典型視頻編碼裝置的結構和操作。
[0014]圖16中所示的視頻編碼裝置包括像素比特長度增加單元101、變換器/量化器102、熵編碼器103、逆變換器/逆量化器104、緩沖器105、預測器106、PCM編碼器107、PCM解碼器108、復用的數(shù)據(jù)選擇器109、復用器110、開關121和開關122。
[0015]圖16中所示的視頻編碼裝置將每個幀分割成被稱為宏塊(MB)的16X16像素大小的塊,并且從幀的左上角開始順序地對每個MB進行編碼。在NPL 2中所述的AVC中,進一步將每個MB分割成4 X 4像素大小的塊,并且對每個4 X 4像素大小的塊進行編碼。
[0016]圖17是顯示了在幀具有QCIF(四分之一通用中間格式)的空間分辨率的情況下塊分割的示例的說明圖。為了簡化起見,以下通過僅關注于亮度的像素值來描述每個組件的操作。
[0017]像素比特長度增加單元101基于從外部設置的像素比特長度增加信息,增加經塊分割的輸入視頻的像素比特長度。將bit_depth_luma作為輸入視頻的像素比特長度,并且將increased_bit_depth_luma作為像素比特長度增加信息(增加的像素比特長度)。像素比特長度增加單元101將輸入視頻的每個像素值向左移increased_bit_depth_luma個比特。結果,像素比特長度增加單元101的輸出數(shù)據(jù)具有bit_depth_luma+increased_bit_depth_luma個比特的像素比特長度。
[0018]從像素比特長度增加單元101輸出的像素比特長度已增加的圖像中減去從預測器106提供的預測信號,并且將結果圖像輸入到變換器/量化器102。存在兩種類型的預測信號,即幀內預測信號和幀間預測信號。下面描述每種預測信號。
[0019]幀內預測信號是基于與當前畫面具有相同顯示時間的重構畫面的圖像創(chuàng)建的預測信號,并且存儲在緩沖器105中。參考NPL2中亮度樣本的8.3.1 Intra_4 X 4預測過程,亮度樣本的8.3.2Intra_8 X 8預測過程,亮度樣本的8.3.3Intra_16 X 16預測過程,三種塊大小(即,Intra_4 X 4、Intra_8 X 8和Intra_16 X 16)的幀內預測模式可用于幀內預測。
[0020]如根據(jù)圖18(A)和18(C)可以理解的,Intra_4X4和Intra_8X8分別是4X4塊大小和8X8塊大小的幀內預測。圖18(A)和18(C)中的每個圓圈(ο)指示用于幀內預測的參考像素,即與當前畫面具有相同顯示時間的重構畫面的像素。
[0021]在Intra_4X4的幀內預測中,直接將重構的周邊像素設置為參考像素,并且用于在圖18(B)中所示的9個方向中進行填充(外插)以形成預測信號。在Intra_8X8的幀內預測中,將通過圖18(C)中的右箭頭下方顯示的低通濾波器(1/2、1/4、1/2)對重構畫面的圖像的周邊像素進行平滑而獲得的像素設置為參考信號,并且用于在圖18(B)中所示的9個方向中進行外插以形成預測信號。
[0022]如圖19(A)中所示,Intra_16X16是16X16塊大小的幀內預測。如圖18(A)、18(B)和18(C)中所示的示例,圖19(A)中的每個圓圈(ο)指示用于幀內預測的參考像素,即與當前畫面具有相同顯示時間的重構畫面的像素。在Intra_16X 16的幀內預測中,直接將重構圖像的周邊像素設置為參考像素,并且用于在圖19(B)中所示的4個方向中進行外插以形成預測信號。
[0023 ]在下文中,使用幀內預測信號編碼的MB被稱為幀內MB,幀內預測的塊大小被稱為幀內預測模式,并且外插的方向被稱為幀內預測方向。
[0024]幀間預測信號是根據(jù)與當前畫面具有不同顯示時間的重構畫面的圖像創(chuàng)建的預測信號,并且存儲在緩沖器105中。在下文中,使用幀間預測信號編碼的MB被稱為幀間MB??梢詮睦?6X16、16X8、8X16、8X8、8X4、4X8和4X4中選擇幀間MB的塊大小。
[0025]圖20是顯示了使用16X16塊大小作為示例的幀間預測的示例的說明圖。在圖20中顯示的運動向量MV=(mvx,mvy)是幀間預測的一個預測參數(shù),其指示與要編碼的塊相關的參考畫面的幀間預測塊(幀間預測信號)的轉換量。在AVC中,幀間預測的預測參數(shù)不僅包括表示與要編碼的塊的要編碼的畫面相關的幀間預測信號的參考畫面的方向的幀間預測方向,而且還包括標識要編碼的塊的幀間預測的參考畫面的參考畫面索引。這是因為,在AVC中,存儲在緩沖器105中的多個參考畫面可用于幀間預測。
[0026]在NPL2中的8.4幀間預測過程中更詳細地描述了幀間預測。
[0027]在下文中,使用幀間預測信號編碼的MB被稱為幀間MB,幀間預測的塊大小被稱為幀間預測模式,并且?guī)g預測的方向被稱為幀間預測方向。
[0028]僅包括幀內MB的編碼畫面被稱為I畫面。不僅包括幀內MB而且還包括幀間MB的編碼畫面被稱為P畫面。包括不是使用一個參考畫面而是同時使用兩個參考畫面用于幀間預測的幀間MB的編碼畫面被稱為B畫面。在B畫面中,與要編碼的塊的要編碼的畫面相關的幀間預測信號的參考畫面的方向指向過去的幀間預測被稱為前向預測,與要編碼的塊的要編碼的畫面相關的幀間預測信號的參考畫面的方向指向未來的幀間預測被稱為后向預測,并且涉及過去和未來二者的幀間預測被稱為雙向預測。
[0029]變換器/量化器102對已減去預測信號的像素比特長度已增加的圖像(預測誤差圖像)進行頻率變換。
[0030]變換器/量化器102利用根據(jù)像素比特長度增加單元101的增加的像素比特長度increased_bit_depth_luma的量化步長Qs,進一步量化經頻率變換的預測誤差圖像(頻率變換系數(shù))。將Qsi_作為正常量化步長。然后,作為示例,。在下文中,經量化的頻率變換系數(shù)被稱為變換量化值。
[0031]熵編碼器103對預測參數(shù)和變換量化值進行熵編碼。預測參數(shù)是與MB預測相關的信息,如上述幀內MB/幀間MB、幀內預測模式、幀內預測方向、幀間MB塊大小和運動向量。
[0032]逆變換器/逆量化器104利用根據(jù)像素比特長度增加單元101的增加的像素比特長度increased_bi t_depth_luma的量化步長,對變換量化值進行逆量化。逆變換器/逆量化器104進一步對通過逆量化獲得的頻率變換系數(shù)進行逆頻率變換。將預測信號添加到通過逆頻率變換獲得的重構預測誤差圖像中,并且將結果圖像提供給開關122。
[0033]復用的數(shù)據(jù)選擇器109監(jiān)視到熵編碼器103的每個預定編碼單元(例如宏塊)的輸入數(shù)據(jù)量。在熵編碼器103能夠在與預定編碼單元相對應的處理時間之內對輸入數(shù)據(jù)進行熵編碼的情況下,復用的數(shù)據(jù)選擇器109控制開關121選擇熵編碼器103的輸出數(shù)據(jù)。結果,經由開關121將熵編碼器103的輸出數(shù)據(jù)提供給復用器110。復用的數(shù)據(jù)選擇器109進一步控制開關122選擇逆變換器/逆量化器104的輸出數(shù)據(jù)。結果,經由開關122將逆變換器/逆量化器104的輸出數(shù)據(jù)提供給緩沖器105。
[0034]在熵編碼器103不能在該處理時間之內對輸入數(shù)據(jù)進行熵編碼的情況下,復用的數(shù)據(jù)選擇器109控制開關121選擇PCM編碼器107通過對像素比特長度增加單元101的輸出數(shù)據(jù)進行PCM編碼而獲得的輸出數(shù)據(jù)。結果,經由開關121將PCM編碼器107的輸出數(shù)據(jù)提供給復用器110。復用的數(shù)據(jù)選擇器109進一步控制開關122選擇PCM解碼器108通過對PCM編碼器107的輸出數(shù)據(jù)進行PCM解碼而獲得的輸出數(shù)據(jù)。結果,經由開關122將PCM解碼器108的輸出數(shù)據(jù)提供給復用器110。
[0035]緩沖器105存儲經由開關122提供的重構圖像。每幀的重構圖像被稱為重構畫面。
[0036]復用器110將像素比特長度增加信息與熵編碼器103的輸出數(shù)據(jù)和PCM編碼器107的輸出數(shù)據(jù)復用,并且輸出復用結果。
[0037]典型的視頻編碼裝置基于上述操作創(chuàng)建比特流。
[0038]在使用上述典型技術的情況下,既能夠通過像素比特長度擴展,增強幀內預測或幀間預測的運算精度,又能夠保證用于視頻編碼裝置或視頻解碼裝置的固定處理時間。
[0039]但是,在上述典型技術中,對像素比特長度增加的圖像進行了PCM編碼,這導致了PCM編碼的輸出數(shù)據(jù)增加了像素比特長度增加量卻沒有獲得PSNR(峰值信噪比)改進的問題。例如,在bit_depth_luma是8個比特并且increased_bit_depth_luma是8個比特的情況下,PCM編碼的輸出數(shù)據(jù)是16個比特,這是8比特輸入圖像的兩倍。
[0040]鑒于此,本發(fā)明的一個目的在于在基于像素比特長度增加和PCM編碼的視頻編碼中,抑制PCM編碼的輸出數(shù)據(jù)增加。
[0041 ]對問題的解決方案
[0042]根據(jù)本發(fā)明的一種視頻解碼裝置包括:熵解碼單元,其對比特流中包括的圖像的已變換數(shù)據(jù)進行熵解碼;非壓縮解碼單元,其對該比特流中包括的圖像的經非壓縮編碼的數(shù)據(jù)進行非壓縮解碼;像素比特長度增加單元,其增加由該非壓縮編碼單元產生的經解碼的圖像的像素比特長度;以及解碼控制單元,其控制該熵解碼單元和該非壓縮解碼單元,其中該像素比特長度增加單元利用與向該熵解碼單元的輸入數(shù)據(jù)相對應的圖像的像素比特長度來量化與向該非壓縮解碼單元的輸入數(shù)據(jù)相對應的圖像的像素比特長度。
[0043]根據(jù)本發(fā)明的一種視頻解碼方法包括:對比特流中包括的圖像的已變換數(shù)據(jù)進行熵解碼;對該比特流中包括的圖像的經非壓縮編碼的數(shù)據(jù)進行非壓縮解碼;控制該熵解碼和該非壓縮解碼;以及增加與向該非壓縮編碼的輸入數(shù)據(jù)相對應的圖像的像素比特長度,以使得與向該非壓縮解碼的輸入數(shù)據(jù)相對應的圖像的像素比特長度利用與向該熵解碼的輸入數(shù)據(jù)相對應的圖像的像素比特長度而被量化。
[0044]根據(jù)本發(fā)明的一種存儲視頻解碼程序的計算機可讀信息記錄介質,該視頻解碼程序在被處理器執(zhí)行時執(zhí)行:對比特流中包括的圖像的已變換數(shù)據(jù)進行熵解碼的處理;對該比特流中的圖像的經非壓縮編碼的數(shù)據(jù)進行非壓縮解碼的處理;控制該熵解碼和該非壓縮解碼的處理;以及增加與向該非壓縮編碼的輸入數(shù)據(jù)相對應的圖像的像素比特長度以使得與向該非壓縮解碼的輸入數(shù)據(jù)相對應的圖像的像素比特長度利用與向該熵解碼的輸入數(shù)據(jù)相對應的圖像的像素比特長度而被量化的處理。
[0045]本發(fā)明的有利效果
[0046]根據(jù)本發(fā)明,能夠在基于像素比