Hevc無損視頻編碼的預測模式選擇方法及相應的編碼方法

文檔序號：7818669閱讀：1022來源：國知局

Hevc無損視頻編碼的預測模式選擇方法及相應的編碼方法
【專利摘要】本發(fā)明提出一種HEVC無損視頻編碼的預測模式選擇方法及相應的編碼方法，所述選擇方法首先初始化該視頻幀的每個LCU的幀內預測和幀間預測用于RDO的拉格朗日乘數并進行幀內預測和幀間預測，選出最佳模式用于編碼，計算編碼該幀所需比特率，作為初始的參考比特率，然后改變該幀K個LCU的所述乘數再選出最佳模式用于編碼，計算當前比特率，計算當前比特率與參考比特率之間的差值，根據預定的規(guī)則接受或拒絕改變后的乘數，并且在接受時將當前比特率作為參考比特率，判斷是否無需再改變乘數，當不需要，則結束，否則返回進行迭代。本發(fā)明的方法對HEVC原有的編碼結構改動很小，消除了原始標準中QP對無損模式編碼效率帶來的不利影響，編碼比特率有很大降低。
【專利說明】HEVC無損視頻編碼的預測模式選擇方法及相應的編碼方法

【技術領域】
[0001] 本發(fā)明涉及視頻編碼領域，更具體地，涉及ffiVC無損視頻編碼的預測模式選擇方法及使基于該方法的視頻編碼方法。

【背景技術】
[0002] 近年來，隨著通信技術、多媒體技術的不斷發(fā)展，人們對于視頻等多媒體通信的需求也越來越高。然而，視頻的數據量巨大，未經過編碼壓縮的視頻數據基本無法在現有信道中傳輸。為了滿足上面的各種要求，國際上先后提出了各種視頻編碼方案。從上個世紀九十年代以來，國際電信聯盟遠程通信標準化組織ITU. T和國際標準化組織ISO聯合制定了一系列關于視頻壓縮編解碼的國際標準和建議，其中，ITU提出的H. 26X系列視頻壓縮標準和IS0/IEC JTC推出的MPEG系列國際標準影響最大。2013年1月，視頻編碼標準化組織 JCT-VC(Joint Collaborative Team on Video Coding)正式發(fā)布最新一代視頻編碼國際標準-高性能視頻標準HEVC(High Efficiency Video Coding)，在相同視頻主觀質量下，其比特率大約為上一代視頻編碼標準H. 264/AVC的50%。
[0003]HEVC的編碼基本框架和先前的H. 264/AVC標準類似，依然采用混合編碼模式。整個編碼過程主要分為：預測、變換、量化、熵編碼四步。預測部分分為幀內預測和幀間預測兩大類。幀內預測利用當前幀已重建像素作為參考像素進行初步預測，幀間預測利用前面或后面幀重建的像素值作為參考。然后將所得的預測值與當前塊原始像素值相減，進而得到殘差，殘差經過變換量化得到變換系數，最后將變換系數經過熵編碼而得到最后的碼流。不管是幀間預測，還是幀內預測，都需要用到重建圖像的信息，因而在編碼過程中，還需要將殘差圖像進行反變換量化，再將該殘差圖像與預測值相加，最后經過一個環(huán)路濾波濾除視頻圖像中的噪聲，同時可避免塊效應等視頻圖像劣化影響。
[0004] 在HEVC標準中，存在有損壓縮和無損壓縮兩大類編碼模式。對于互聯網中傳輸的大部分視頻，進行適當的有損壓縮可以很好地降低比特率，從而提高傳輸的效率。而對于醫(yī) 學視頻、遙感視頻、指紋等領域，無損壓縮也存在很大的應用。在HEVC標準中，無損壓縮作為有損壓縮的擴展部分存在。由于量化存在失真，且在ffiVC中變換和量化結合在了一起進行，因而其變換過程也存在失真，因而在ffiVC無損壓縮編碼中，將變換量化過程關閉。另夕卜，由于編碼前后像素無失真，因而不需要進行環(huán)路濾波，ffiVC無損壓縮操作也因此跳過了環(huán)路濾波過程。也就是說，在目前的HEVC無損壓縮操作中，僅存在預測和熵編碼兩部分。可見，預測的好壞將直接影響ffiVC無損壓縮的性能。
[0005] 如上文提到的，HEVC的預測分為幀內預測和幀間預測。對于幀內預測，預測的方向多達35種模式。其中每一種模式對應著一種幀內預測方向，具體如圖1所示。如此精細的模式，便于找到一種最好去除幀內冗余的模式，從而最大化地實現幀內編碼性能的提高。在 HEVC中，采用率失真優(yōu)化（rate distortion optimization，RD0)來選擇最佳模式，即選擇一個具有最小的RD cost(率失真代價，rate distortion cost)的模式作為預測模式。RD cost的計算如公式（1)所示：
[0006] RD cost = D+入 R (1)
[0007] 其中，D表示重建圖像塊與原始圖像塊的失真度，R表示該模式下編碼該預測塊所需的比特率（包括編碼殘差和編碼預測模式所需的比特率），而A為拉格朗日乘數，用于權衡比特率在該RD cost中的權重，可通過計算公式（2)獲得：
[0008] A = QpfactorX2(QM2)/3 (2)
[0009]其中，QP為量化參數（quantization parameter)，用于指示不同的量化步長，QP 越大，則量化步長就越大，即產生的量化失真就越大，Qpfactor為量化系數，在該公式中為一常數，由幀類型等具體編碼情況決定。
[0010] 由公式（1)可見，每計算一個RD cost，需要計算D和R兩部分，特別是計算D時需要對殘差圖像（預測圖像與原始圖像之差）進行變換量化、反變換量化，重建得到重建圖像塊，再計算失真度，其運算量已經很高。而如果在選擇最佳模式時，直接對這35種模式一一計算其率失真，其運算量將非常高。為了降低運算量，HEVC先采用粗略的方式計算RD cost 來選出幾個較好的候選模式，然后再對這幾個候選模式進行準確的RD cost計算，以選出最好的模式。所謂粗略的方式是指使用殘差圖像塊的簡單Hadamard變換來替代復雜的失真度D的計算，從而有效降低復雜度。
[0011] 而對于幀間預測，編碼器在參考幀預測塊位置的周圍尋找與預測塊最為相似的圖像塊。為了找到最匹配的圖像塊，ffiVC中運動矢量的精度達到了 1/4像素。同樣的，在比較參考幀哪個位置的圖像塊作為參考塊時，也是尋找具有最小RD cost的位置。與幀內預測類似的，如果在64X64的范圍內尋找最優(yōu)圖像塊，而精度為1/4像素，那將計算16384次的RD cost，其運算量同樣非常大。為了減少運算量，在運動搜索時，HEVC使用計算絕對差值和SAD(sum of abstract distortion)方法替代實際失真度的計算進行粗略搜索。
[0012] 在當前的許多應用中，對視頻進行無損壓縮的需求越來越大，由于HEVC的無損編碼模式可以提供較高的壓縮率，其在視頻無損壓縮編碼的應用也將越來越廣泛。在ffiVC 標準的主流應用中，如機頂盒、視頻監(jiān)控等，要求很高的編碼效率，因而不得不以產生一些失真作為代價，也就是說，主流應用多為有損壓縮。然而，在HEVC有損壓縮標準之上，再開發(fā)一套全新的編碼工具來獲得盡可能好的無損編碼效率顯然不切實際。因此，在進行HEVC 無損編碼方案設計時，我們應遵循這樣的設計原則：盡可能地利用已有的ffiVC有損編碼結構，提出的無損編碼方案對原始的有損編碼結構改動盡可能小，同時考慮編碼效率和復雜度的平衡。
[0013] 由上面的介紹可知，HEVC無損壓縮相對有損壓縮，僅僅是跳過變換、量化、環(huán)路濾波三個部分，而預測和熵編碼的策略均保持不變。有損壓縮需要均衡重建視頻質量和編碼比特率進行編碼。不同于有損壓縮，在無損壓縮中，公式（1)中的D最終為零，因而不存在重建視頻質量下降的問題，則其編碼唯一的目標就是在可允許的編解碼復雜度下，盡可能地降低比特率。無損壓縮中，若準確計算D，則最后得到的失真D為零，此時，不管A為多少，最小化RD cost與最小化比特率R是等價的，因而此時的原始有損壓縮的策略仍然適用于無損壓縮。然而，不管是幀內預測還是幀間預測，都不可能對每個模式精確計算RD cost，必須用到上文提到的粗略選擇策略。有損壓縮時，經過粗略計算得到的D與實際的D相差不大，而無損壓縮時，粗略計算得到的D與實際為零的D相差較大，則此時按照公式（1)、（2) 獲得的候選模式中不一定包含實際最優(yōu)模式，因而其最終編碼性能就不一定為最優(yōu)。因而必須重新定義公式（1)、（2)，以期待獲得更好的無損壓縮性能。
[0014] 另外，在有損壓縮時，我們可以通過調節(jié)QP獲得不同質量和不同比特率的碼流，以滿足不同應用場景的需求。這是因為，一方面，調整QP可以獲得不同A，從而調節(jié)RD cost中比特率和重建圖像質量之間的權衡關系。另一方面，也是最重要的一方面，QP越小，量化誤差就越小，解碼重建的視頻圖像質量就越好，但是編碼產生的碼流比特率就越高。所以，在有損壓縮中，若其他編碼條件一樣，比特率隨著QP的增加而降低，而視頻圖像解碼重建質量隨著QP的增加而降低。但是，在無損壓縮中，已經不存在量化，除了調節(jié)X，QP其實已經沒有其他作用。圖2是無損壓縮編碼中序列Racehorse比特率隨QP變化情況（HM 10. 0)的曲線圖，由圖2可以發(fā)現，在無損壓縮時，編碼碼流的比特率與QP呈非單調關系，不管是QP最小時（編碼視頻為8比特時為0,10比特時為-12)還是最大時（編碼視頻為 8比特時為51，10比特時為39)，均無法達到最小比特率。因而對于無損壓縮，QP這個編碼參數的作用已經不一樣，其與A的對應關系已不再如公式（2)所示那樣，需要重新確定。

【發(fā)明內容】

[0015] 有鑒于此，本發(fā)明的目的在于提供一種用于HEVC無損視頻編碼的預測模式選擇方法，以重新調整編碼預測過程中針對眾多模式的粗略選擇策略，最大程度地降低無損壓縮比特率。
[0016] 為了實現上述目的，本發(fā)明提供了 1、一種HEVC無損視頻編碼的預測模式選擇方法，包括依次進行的以下步驟：
[0017] S1、對于一個視頻幀，將視頻幀的每個LCU的幀內預測和幀間預測用于RD0的拉格朗日乘數/^和為^初始化，并進行幀內預測和幀間預測，選擇最佳幀內預測模式和最佳幀間預測模式，從最佳幀內預測模式和最佳幀間預測模式中選出最佳模式用于編碼，計算編碼該幀所需比特率，作為初始的參考比特率R〇, i、j表示IXU的位置坐標；S2、改變所述視頻幀的K個LCU的所述和/^&，進行幀內預測和幀間預測，選擇最佳幀內預測模式和最佳幀間預測模式，從最佳幀內預測模式和最佳幀間預測模式中選出最佳模式用于編碼，計算編碼該視頻幀所需的比特率，作為當前比特率R'，K為自然數；S3、計算當前比特率與參考比特率之間的差值AR，根據預定的規(guī)則接受或拒絕改變后的所述zi/fa和為if，并且在接受時將當前比特率作為參考比特率；S4、判斷是否無需再改變所述^和為，當無需再改變時，則將當前的作為最終的和，否則返回步驟S2。
[0018] 優(yōu)選地，在步驟S1中，所述拉格朗日乘數為a和/^初始化為；，所述 Ca取值范圍為[3,8]，所述取值范圍為[0.5,1.5]。
[0019] 優(yōu)選地，在步驟S1中，對于幀內預測，使用最小化公式（8)中的.代價準則從多種幀內預測模式中選擇候選模式，再根據公式（1)從候選模式中選擇最佳幀內預測模式，公式如下所示：

【權利要求】
1. 一種HEVC無損視頻編碼的預測模式選擇方法，包括依次進行的以下步驟： 51、對于一個視頻幀，將視頻幀的每個LCU的幀內預測和幀間預測用于RDO的拉格朗日乘數和47"初始化，并進行幀內預測和幀間預測，選擇最佳幀內預測模式和最佳幀間預測模式，從最佳幀內預測模式和最佳幀間預測模式中選出最佳模式用于編碼，計算編碼該中貞所需比特率，作為初始的參考比特率R〇,i、j表示IXU的位置坐標； 52、改變所述視頻幀的K個LCU的所述，進行幀內預測和幀間預測，選擇最佳幀內預測模式和最佳幀間預測模式，從最佳幀內預測模式和最佳幀間預測模式中選出最佳模式用于編碼，計算編碼該視頻幀所需的比特率，作為當前比特率R'，K為自然數； 53、計算當前比特率與參考比特率之間的差值AR，根據預定的規(guī)則接受或拒絕改變后的所述為1；；1"1和Cfe，并且在接受時將當前比特率作為參考比特率； 54、判斷是否無需再改變所述，當無需再改變時，則將當前的作為最終的，否則返回步驟S2。
2. 根據權利要求1所述的HEVC無損視頻編碼的預測模式選擇方法，其特征在于，在步驟Sl中，所述拉格朗日乘數初始化為所述取值范圍為[3， 8]，所述Cta取值范圍為[0. 5,1. 5]。
3. 根據權利要求1所述的HEVC無損視頻編碼的預測模式選擇方法，其特征在于，在步驟Sl中，對于幀內預測，使用最小化公式（8)中的代價準則從多種幀內預測模式中選擇候選模式，再根據公式（1)從候選模式中選擇最佳幀內預測模式，公式如下所示： 4Γ=Α-+岑 (8) RDcost=D+λR(I) 其中，Jtra表示幀內預測的粗略率失真代價，DintM為幀內預測的預測殘差失真；RintM 表示幀內預測中編碼除殘差信息外的其他預測信息所需比特率；λ為拉格朗日乘數；D為中貞內預測的實際殘差失真，R為實際編碼比特率，RDcost表不實際率失真代價。
4. 根據權利要求1所述的HEVC無損視頻編碼的預測模式選擇方法，其特征在于，在步驟Sl中，對于幀間預測，使用最小化公式（9)中的代價準則選取最優(yōu)MV和對應參考幀，再根據公式（1)從各個幀間模式中選擇最佳的幀間預測模式，公式如下所示： =Anter(9) RDcost=D+λR(I) 其中，表示幀間預測的粗略率失真代價，DintCT為幀間預測的預測殘差失真，Rinte 表示幀間預測中編碼除殘差信息外的其他預測信息所需比特率，λ為拉格朗日乘數，D為中貞內預測的實際殘差失真；R為實際編碼比特率，RDcost表不實際率失真代價。
5. 根據權利要求1所述的HEVC無損視頻編碼的預測模式選擇方法，其特征在于，在步驟S2中，K為所述視頻幀每一列所含LCU的個數。
6. 根據權利要求1所述的HEVC無損視頻編碼的預測模式選擇方法，其特征在于，在步驟S3中，若ΛR彡0,則接受改變后的所述Ifa和；^ter，否則以exp (-ΛR/IO的概率接受所
7. 根據權利要求1所述的HEVC無損視頻編碼的預測模式選擇方法，其特征在于，步驟 S3為：記錄迭代次數Ti以及迭代過程中連續(xù)拒絕所的次數Tr，若迭代次數 Ti達到一個迭代次數閾值THi，或者連續(xù)拒絕次數Tr達到一個連續(xù)拒絕次數閾值THr，則將當前的作為最終的Cr^Cter。
8. 根據權利要求7所述的HEVC無損視頻編碼的預測模式選擇方法，其特征在于，所述 THi取值范圍為[1，1000]，所述THr取值范圍為[1，50]。
9. 根據權利要求7所述的HEVC無損視頻編碼的預測模式選擇方法，其特征在于，在步驟Sl還包括對所述迭代次數Ti和連續(xù)拒絕次數Tr初始化為0。
10. -種HEVC無損視頻編碼方法，其特征在于，包括權利要求1-9中任一項所述的 HEVC無損視頻編碼的預測模式選擇方法。
【文檔編號】H04N19/147GK104320657SQ201410609275
【公開日】2015年1月28日申請日期:2014年10月31日優(yōu)先權日:2014年10月31日
【發(fā)明者】李厚強, 陳方棟申請人:中國科學技術大學

完整全部詳細技術資料下載