Hevc無損視頻編碼的預測模式選擇方法及相應的編碼方法
【專利摘要】本發(fā)明提出一種HEVC無損視頻編碼的預測模式選擇方法及相應的編碼方法,所述選擇方法首先初始化該視頻幀的每個LCU的幀內預測和幀間預測用于RDO的拉格朗日乘數并進行幀內預測和幀間預測,選出最佳模式用于編碼,計算編碼該幀所需比特率,作為初始的參考比特率,然后改變該幀K個LCU的所述乘數再選出最佳模式用于編碼,計算當前比特率,計算當前比特率與參考比特率之間的差值,根據預定的規(guī)則接受或拒絕改變后的乘數,并且在接受時將當前比特率作為參考比特率,判斷是否無需再改變乘數,當不需要,則結束,否則返回進行迭代。本發(fā)明的方法對HEVC原有的編碼結構改動很小,消除了原始標準中QP對無損模式編碼效率帶來的不利影響,編碼比特率有很大降低。
【專利說明】HEVC無損視頻編碼的預測模式選擇方法及相應的編碼方 法
【技術領域】
[0001] 本發(fā)明涉及視頻編碼領域,更具體地,涉及ffiVC無損視頻編碼的預測模式選擇方 法及使基于該方法的視頻編碼方法。
【背景技術】
[0002] 近年來,隨著通信技術、多媒體技術的不斷發(fā)展,人們對于視頻等多媒體通信的需 求也越來越高。然而,視頻的數據量巨大,未經過編碼壓縮的視頻數據基本無法在現有信 道中傳輸。為了滿足上面的各種要求,國際上先后提出了各種視頻編碼方案。從上個世紀 九十年代以來,國際電信聯盟遠程通信標準化組織ITU. T和國際標準化組織ISO聯合制定 了一系列關于視頻壓縮編解碼的國際標準和建議,其中,ITU提出的H. 26X系列視頻壓縮標 準和IS0/IEC JTC推出的MPEG系列國際標準影響最大。2013年1月,視頻編碼標準化組織 JCT-VC(Joint Collaborative Team on Video Coding)正式發(fā)布最新一代視頻編碼國際標 準-高性能視頻標準HEVC(High Efficiency Video Coding),在相同視頻主觀質量下,其 比特率大約為上一代視頻編碼標準H. 264/AVC的50%。
[0003]HEVC的編碼基本框架和先前的H. 264/AVC標準類似,依然采用混合編碼模式。整 個編碼過程主要分為:預測、變換、量化、熵編碼四步。預測部分分為幀內預測和幀間預測兩 大類。幀內預測利用當前幀已重建像素作為參考像素進行初步預測,幀間預測利用前面或 后面幀重建的像素值作為參考。然后將所得的預測值與當前塊原始像素值相減,進而得到 殘差,殘差經過變換量化得到變換系數,最后將變換系數經過熵編碼而得到最后的碼流。不 管是幀間預測,還是幀內預測,都需要用到重建圖像的信息,因而在編碼過程中,還需要將 殘差圖像進行反變換量化,再將該殘差圖像與預測值相加,最后經過一個環(huán)路濾波濾除視 頻圖像中的噪聲,同時可避免塊效應等視頻圖像劣化影響。
[0004] 在HEVC標準中,存在有損壓縮和無損壓縮兩大類編碼模式。對于互聯網中傳輸的 大部分視頻,進行適當的有損壓縮可以很好地降低比特率,從而提高傳輸的效率。而對于醫(yī) 學視頻、遙感視頻、指紋等領域,無損壓縮也存在很大的應用。在HEVC標準中,無損壓縮作 為有損壓縮的擴展部分存在。由于量化存在失真,且在ffiVC中變換和量化結合在了一起進 行,因而其變換過程也存在失真,因而在ffiVC無損壓縮編碼中,將變換量化過程關閉。另 夕卜,由于編碼前后像素無失真,因而不需要進行環(huán)路濾波,ffiVC無損壓縮操作也因此跳過了 環(huán)路濾波過程。也就是說,在目前的HEVC無損壓縮操作中,僅存在預測和熵編碼兩部分。可 見,預測的好壞將直接影響ffiVC無損壓縮的性能。
[0005] 如上文提到的,HEVC的預測分為幀內預測和幀間預測。對于幀內預測,預測的方向 多達35種模式。其中每一種模式對應著一種幀內預測方向,具體如圖1所示。如此精細的 模式,便于找到一種最好去除幀內冗余的模式,從而最大化地實現幀內編碼性能的提高。在 HEVC中,采用率失真優(yōu)化(rate distortion optimization,RD0)來選擇最佳模式,即選擇 一個具有最小的RD cost(率失真代價,rate distortion cost)的模式作為預測模式。RD cost的計算如公式(1)所示:
[0006] RD cost = D+入 R (1)
[0007] 其中,D表示重建圖像塊與原始圖像塊的失真度,R表示該模式下編碼該預測塊所 需的比特率(包括編碼殘差和編碼預測模式所需的比特率),而A為拉格朗日乘數,用于權 衡比特率在該RD cost中的權重,可通過計算公式(2)獲得:
[0008] A = QpfactorX2(QM2)/3 (2)
[0009]其中,QP為量化參數(quantization parameter),用于指示不同的量化步長,QP 越大,則量化步長就越大,即產生的量化失真就越大,Qpfactor為量化系數,在該公式中為 一常數,由幀類型等具體編碼情況決定。
[0010] 由公式(1)可見,每計算一個RD cost,需要計算D和R兩部分,特別是計算D時需 要對殘差圖像(預測圖像與原始圖像之差)進行變換量化、反變換量化,重建得到重建圖像 塊,再計算失真度,其運算量已經很高。而如果在選擇最佳模式時,直接對這35種模式一一 計算其率失真,其運算量將非常高。為了降低運算量,HEVC先采用粗略的方式計算RD cost 來選出幾個較好的候選模式,然后再對這幾個候選模式進行準確的RD cost計算,以選出最 好的模式。所謂粗略的方式是指使用殘差圖像塊的簡單Hadamard變換來替代復雜的失真 度D的計算,從而有效降低復雜度。
[0011] 而對于幀間預測,編碼器在參考幀預測塊位置的周圍尋找與預測塊最為相似的圖 像塊。為了找到最匹配的圖像塊,ffiVC中運動矢量的精度達到了 1/4像素。同樣的,在比 較參考幀哪個位置的圖像塊作為參考塊時,也是尋找具有最小RD cost的位置。與幀內預 測類似的,如果在64X64的范圍內尋找最優(yōu)圖像塊,而精度為1/4像素,那將計算16384次 的RD cost,其運算量同樣非常大。為了減少運算量,在運動搜索時,HEVC使用計算絕對差 值和SAD(sum of abstract distortion)方法替代實際失真度的計算進行粗略搜索。
[0012] 在當前的許多應用中,對視頻進行無損壓縮的需求越來越大,由于HEVC的無損編 碼模式可以提供較高的壓縮率,其在視頻無損壓縮編碼的應用也將越來越廣泛。在ffiVC 標準的主流應用中,如機頂盒、視頻監(jiān)控等,要求很高的編碼效率,因而不得不以產生一些 失真作為代價,也就是說,主流應用多為有損壓縮。然而,在HEVC有損壓縮標準之上,再開 發(fā)一套全新的編碼工具來獲得盡可能好的無損編碼效率顯然不切實際。因此,在進行HEVC 無損編碼方案設計時,我們應遵循這樣的設計原則:盡可能地利用已有的ffiVC有損編碼結 構,提出的無損編碼方案對原始的有損編碼結構改動盡可能小,同時考慮編碼效率和復雜 度的平衡。
[0013] 由上面的介紹可知,HEVC無損壓縮相對有損壓縮,僅僅是跳過變換、量化、環(huán)路濾 波三個部分,而預測和熵編碼的策略均保持不變。有損壓縮需要均衡重建視頻質量和編碼 比特率進行編碼。不同于有損壓縮,在無損壓縮中,公式(1)中的D最終為零,因而不存在重 建視頻質量下降的問題,則其編碼唯一的目標就是在可允許的編解碼復雜度下,盡可能地 降低比特率。無損壓縮中,若準確計算D,則最后得到的失真D為零,此時,不管A為多少, 最小化RD cost與最小化比特率R是等價的,因而此時的原始有損壓縮的策略仍然適用于 無損壓縮。然而,不管是幀內預測還是幀間預測,都不可能對每個模式精確計算RD cost,必 須用到上文提到的粗略選擇策略。有損壓縮時,經過粗略計算得到的D與實際的D相差不 大,而無損壓縮時,粗略計算得到的D與實際為零的D相差較大,則此時按照公式(1)、(2) 獲得的候選模式中不一定包含實際最優(yōu)模式,因而其最終編碼性能就不一定為最優(yōu)。因而 必須重新定義公式(1)、(2),以期待獲得更好的無損壓縮性能。
[0014] 另外,在有損壓縮時,我們可以通過調節(jié)QP獲得不同質量和不同比特率的碼流, 以滿足不同應用場景的需求。這是因為,一方面,調整QP可以獲得不同A,從而調節(jié)RD cost中比特率和重建圖像質量之間的權衡關系。另一方面,也是最重要的一方面,QP越小, 量化誤差就越小,解碼重建的視頻圖像質量就越好,但是編碼產生的碼流比特率就越高。所 以,在有損壓縮中,若其他編碼條件一樣,比特率隨著QP的增加而降低,而視頻圖像解碼重 建質量隨著QP的增加而降低。但是,在無損壓縮中,已經不存在量化,除了調節(jié)X,QP其 實已經沒有其他作用。圖2是無損壓縮編碼中序列Racehorse比特率隨QP變化情況(HM 10. 0)的曲線圖,由圖2可以發(fā)現,在無損壓縮時,編碼碼流的比特率與QP呈非單調關系, 不管是QP最小時(編碼視頻為8比特時為0,10比特時為-12)還是最大時(編碼視頻為 8比特時為51,10比特時為39),均無法達到最小比特率。因而對于無損壓縮,QP這個編碼 參數的作用已經不一樣,其與A的對應關系已不再如公式(2)所示那樣,需要重新確定。
【發(fā)明內容】
[0015] 有鑒于此,本發(fā)明的目的在于提供一種用于HEVC無損視頻編碼的預測模式選擇 方法,以重新調整編碼預測過程中針對眾多模式的粗略選擇策略,最大程度地降低無損壓 縮比特率。
[0016] 為了實現上述目的,本發(fā)明提供了 1、一種HEVC無損視頻編碼的預測模式選擇方 法,包括依次進行的以下步驟:
[0017] S1、對于一個視頻幀,將視頻幀的每個LCU的幀內預測和幀間預測用于RD0的拉格 朗日乘數/^和為^初始化,并進行幀內預測和幀間預測,選擇最佳幀內預測模式和最佳 幀間預測模式,從最佳幀內預測模式和最佳幀間預測模式中選出最佳模式用于編碼,計算 編碼該幀所需比特率,作為初始的參考比特率R〇, i、j表示IXU的位置坐標;S2、改變所述視 頻幀的K個LCU的所述和/^&,進行幀內預測和幀間預測,選擇最佳幀內預測模式和最 佳幀間預測模式,從最佳幀內預測模式和最佳幀間預測模式中選出最佳模式用于編碼,計 算編碼該視頻幀所需的比特率,作為當前比特率R',K為自然數;S3、計算當前比特率與參 考比特率之間的差值AR,根據預定的規(guī)則接受或拒絕改變后的所述zi/fa和為if,并且在 接受時將當前比特率作為參考比特率;S4、判斷是否無需再改變所述^和為,當無需 再改變時,則將當前的作為最終的和,否則返回步驟S2。
[0018] 優(yōu)選地,在步驟S1中,所述拉格朗日乘數為a和/^初始化為;,所述 Ca取值范圍為[3,8],所述取值范圍為[0.5,1.5]。
[0019] 優(yōu)選地,在步驟S1中,對于幀內預測,使用最小化公式(8)中的.代價準則從多 種幀內預測模式中選擇候選模式,再根據公式(1)從候選模式中選擇最佳幀內預測模式, 公式如下所示:
【權利要求】
1. 一種HEVC無損視頻編碼的預測模式選擇方法,包括依次進行的以下步驟: 51、 對于一個視頻幀,將視頻幀的每個LCU的幀內預測和幀間預測用于RDO的拉格朗日 乘數和47"初始化,并進行幀內預測和幀間預測,選擇最佳幀內預測模式和最佳幀間 預測模式,從最佳幀內預測模式和最佳幀間預測模式中選出最佳模式用于編碼,計算編碼 該中貞所需比特率,作為初始的參考比特率R〇,i、j表示IXU的位置坐標; 52、 改變所述視頻幀的K個LCU的所述,進行幀內預測和幀間預測,選擇 最佳幀內預測模式和最佳幀間預測模式,從最佳幀內預測模式和最佳幀間預測模式中選出 最佳模式用于編碼,計算編碼該視頻幀所需的比特率,作為當前比特率R',K為自然數; 53、 計算當前比特率與參考比特率之間的差值AR,根據預定的規(guī)則接受或拒絕改變后 的所述為1;;1"1和Cfe,并且在接受時將當前比特率作為參考比特率; 54、 判斷是否無需再改變所述,當無需再改變時,則將當前的 作為最終的,否則返回步驟S2。
2. 根據權利要求1所述的HEVC無損視頻編碼的預測模式選擇方法,其特征在于,在步 驟Sl中,所述拉格朗日乘數初始化為所述取值范圍為[3, 8],所述Cta取值范圍為[0. 5,1. 5]。
3. 根據權利要求1所述的HEVC無損視頻編碼的預測模式選擇方法,其特征在于,在步 驟Sl中,對于幀內預測,使用最小化公式(8)中的代價準則從多種幀內預測模式中選 擇候選模式,再根據公式(1)從候選模式中選擇最佳幀內預測模式,公式如下所示: 4Γ=Α-+岑 (8) RDcost=D+λR(I) 其中,Jtra表示幀內預測的粗略率失真代價,DintM為幀內預測的預測殘差失真;RintM 表示幀內預測中編碼除殘差信息外的其他預測信息所需比特率;λ為拉格朗日乘數;D為 中貞內預測的實際殘差失真,R為實際編碼比特率,RDcost表不實際率失真代價。
4. 根據權利要求1所述的HEVC無損視頻編碼的預測模式選擇方法,其特征在于,在步 驟Sl中,對于幀間預測,使用最小化公式(9)中的代價準則選取最優(yōu)MV和對應參考 幀,再根據公式(1)從各個幀間模式中選擇最佳的幀間預測模式,公式如下所示: =Anter(9) RDcost=D+λR(I) 其中,表示幀間預測的粗略率失真代價,DintCT為幀間預測的預測殘差失真,Rinte 表示幀間預測中編碼除殘差信息外的其他預測信息所需比特率,λ為拉格朗日乘數,D為 中貞內預測的實際殘差失真;R為實際編碼比特率,RDcost表不實際率失真代價。
5. 根據權利要求1所述的HEVC無損視頻編碼的預測模式選擇方法,其特征在于,在步 驟S2中,K為所述視頻幀每一列所含LCU的個數。
6. 根據權利要求1所述的HEVC無損視頻編碼的預測模式選擇方法,其特征在于,在步 驟S3中,若ΛR彡0,則接受改變后的所述Ifa和;^ter,否則以exp (-ΛR/IO的概率接受所
7. 根據權利要求1所述的HEVC無損視頻編碼的預測模式選擇方法,其特征在于,步驟 S3為:記錄迭代次數Ti以及迭代過程中連續(xù)拒絕所的次數Tr,若迭代次數 Ti達到一個迭代次數閾值THi,或者連續(xù)拒絕次數Tr達到一個連續(xù)拒絕次數閾值THr,則將 當前的作為最終的Cr^Cter。
8. 根據權利要求7所述的HEVC無損視頻編碼的預測模式選擇方法,其特征在于,所述 THi取值范圍為[1,1000],所述THr取值范圍為[1,50]。
9. 根據權利要求7所述的HEVC無損視頻編碼的預測模式選擇方法,其特征在于,在步 驟Sl還包括對所述迭代次數Ti和連續(xù)拒絕次數Tr初始化為0。
10. -種HEVC無損視頻編碼方法,其特征在于,包括權利要求1-9中任一項所述的 HEVC無損視頻編碼的預測模式選擇方法。
【文檔編號】H04N19/147GK104320657SQ201410609275
【公開日】2015年1月28日 申請日期:2014年10月31日 優(yōu)先權日:2014年10月31日
【發(fā)明者】李厚強, 陳方棟 申請人:中國科學技術大學