一種用于高效視頻編碼反變換運算的并行結構構造方法
【專利摘要】高效視頻編碼反變換運算的并行結構構造方法,針對HEVC編碼中的反變換算法,對反變換進行并行化分析。利用2×4二維處理元上對4×4的TU進行反變換運算的并行處理,2×4二維處理元以并行方式依次完成基于奇偶分解運算垂直和水平反變換運算。本發(fā)明可以有效地降低了反變換的計算復雜度,縮短了編解碼時間,加快了編解碼處理過程。
【專利說明】
-種用于高效視頻編碼反變換運算的并行結構構造方法
技術領域
[0001] 本發(fā)明設及視頻編碼技術領域,具體設及一種高效視頻編碼(Hi曲Efficiency Video Coding,簡稱肥VC)標準中反變換算法的并行化。 技術背景
[0002] 隨著高清、超高清視頻(分辨率達4KX2K、8KX4K)應用正越來越多地充斥著人們 的視野,視頻應用的多樣化和海量的視頻數(shù)據(jù)急需新的編碼技術來盡可能去除視頻數(shù)據(jù)中 的冗余成分,減少表征視頻的數(shù)據(jù)量。為此,2013年11月國際電信聯(lián)盟的視頻編碼專家組 ITU/VCEG和國際運動圖像專家組IS0-IEC/MPEG組建的聯(lián)合工作組(Joint Colkborative Team on Video Coding, JCT-VC)正式發(fā)布了新一代視頻編碼標準一H. 265/肥VC。
[0003] 相比于W往的視頻編碼標準,H. 265/肥VC的編碼性能有了很大的提升。但是, H. 265/肥VC相對于H. 264/AVC標準需要耗費大量的計算代價。提高編碼效率的常用方法已 經(jīng)不能滿足H. 265/肥VC視頻編碼標準的要求,所W需要尋找一種可W提高H. 265/肥VC計 算速度的方法。
[0004] H. 265/肥VC參考軟件還需要進行優(yōu)化才能達到實時應用的要求,可W通過優(yōu)化軟 件代碼和優(yōu)化算法層面實現(xiàn),除此之外,還可W利用其它硬件或者軟件資源來進一步提高 運算速度。
[0005] H. 265/肥VC標準中的變換和反變換算法的處理對象是一帖圖像中相互獨立的 TU,其屬于運算密集型算法,處理大量的重復運算,而且數(shù)據(jù)流之間的依賴關系十分規(guī)整, 具有大量的并行性。如何快速有效地進行反變換算法對降低其計算復雜度十分重要。
【發(fā)明內容】
[0006] 本發(fā)明目的是針對上述問題,提出一種用于高效視頻編碼反變換運算的并行結構 構造方法。本發(fā)明在不降低編碼效率的情況下可W大大降低視頻編碼計算的復雜度。
[0007] 為實現(xiàn)上述目的,本發(fā)明采用的技術方法如下:一種用于高效視頻編碼反變換運 算的并行結構構造方法。其特征在于:在鄰接互連的2X4二維處理元陣列(PE00-PE13)上 對4X4的TU進行反變換運算的并行處理。
[0008] 將 4X4 的反量化數(shù)據(jù)(X00 和 X02、X20 和 X22、X10 和 X12、X30 和 X32、X01 和 X03、 X21和X23、Xll和X13、X31和X33)從內存分別加載到處理元陣列(PE00-PE13)的數(shù)據(jù)寄 存器中,W并行方式依次完成基于奇偶分解運算的垂直和水平反變換; 其基于奇偶分解運算的垂直反變換計算方法:處理元陣列(PE00-PE13)分別對反量化 數(shù)據(jù)進行加載,等數(shù)據(jù)加載完成,執(zhí)行奇偶分解運算,分別對輸入數(shù)據(jù)(X00和X02、X20和 X22、XlO 和 X12、X30 和 X32、XOl 和 X03、X21 和 X23、Xll 和 X13、X31 和 X33)進行逐級移位 和加減運算,得到垂直反變換的中間變量(MOO和MOl、M20和M21、MlO和Mil、M30和M31、 M02 和 M03、M22 和 M23、M12 和 M13、M32 和 M33); 垂直方向相鄰處理元(陽00和陽10,陽Ol和陽11、陽02和陽12、陽03和陽13)之間 對中間變量(M00-M33)通過加減運算得到垂直反變換結果(zoo和ZOl、Z20和Z21、Zio和 Z11、Z30 和 Z31、Z02 和 Z03、Z22 和 Z23、Z12 和 Z13、Z32 和 Z33); 基于奇偶分解運算的水平反變換計算方法:水平方向相鄰處理元(陽00和PE01,PE02 和陽03、PElO和陽11、PE12和陽13)之間對垂直反變換結果(Z00-Z33)通過移位和加減運 算得到水平反變換的中間變量(N00和N0UN20和N2UN10和N1UN30和N3UN02和N03、 N22 和 N23、N12 和 N13、N32 和 N33); 水平方向間隔處理元(陽00和陽02,陽Ol和陽03、PE10和陽12、PE11和陽13)之間對 中間變量(N00-N33)通過加減運算得到最終的反變換結果(Y00-Y33)。
[0009] 本發(fā)明提出了一種用于高效視頻編碼反變換運算的并行結構構造方法,有效縮短 反變換算法的處理時間,加快了編解碼過程,且可W快速有效的進行反變換,同時降低了計 算的復雜度。
【附圖說明】
[0010] 圖1為鄰接互連的2X4二維處理元陣列。
[0011] 圖2為4X4反量化系數(shù)加載圖。
[0012] 圖3為垂直反變換的中間變量流程圖。
[0013] 圖4為垂直反變換的中間變量共享方式圖。
[0014] 圖5為水平反變換的中間變量流程圖。
[0015] 圖6為水平反變換的中間變量共享方式圖。
【具體實施方式】
[0016] 2X4二維處理元陣列陽00-PE13,運8個處理元通過近鄰互連組成二維處理元陣 列。
[0017] 變換單元燈ransform化it,簡寫TU)是H. 265/肥VC中的一個基本概念。一般來 說,TU大小可W為4X 4到64X64。在編碼的過程中,TU是進行變換量化和反變換反量化 的基本單元。
[0018] 本發(fā)明提供的一種用于高效視頻編碼反變換運算的并行結構構造方法,其包含的 具體實現(xiàn)步驟為: 第一步:由于視頻陣列處理器采用鄰接互連的數(shù)據(jù)傳輸方式,所W考慮到PE間共享數(shù) 據(jù)的傳輸距離問題,將4X4的反量化系數(shù)X加載到PEOO至PE13中的數(shù)據(jù)寄存器中,其中 XOO和X02存放在陽00中,X20和X22存放在陽Ol中,XlO和X12存放在陽02中,X30和 X32存放在陽03中,XOl和X03存放在陽10中,Xll和X13存放在陽11中,X21和X23存 放在陽12中,X31和X33存放在陽13中。
[0019] 第二步:根據(jù)公式(1)和公式(2)分別配置陽00、PE01、陽02、陽03和陽10、PE11、 陽12、陽13的指令,計算出垂直反變換的各中間變量MO、Ml、M2和M3,其中陽00通過對XOO 和X02進行移位加法和減法運算分別得到MOO和MOl,PEOl通過對X20和X22進行移位加 法和減法運算分別得到M20和M21,PE02通過對XlO和X12進行移位加法和減法運算分別 得到MlO和M11,PE03通過對X30和X32進行移位加法和減法運算分別得到M30和M31。
[0020] 堪i.
口) 第S步:根據(jù)公式(3),通過垂直方向相鄰PE之間共享寄存器數(shù)據(jù)完成反變換中的1 維變換。PEOO和PElO通過對共享數(shù)據(jù)MOl和M03進行減法和加法運算分別得到ZOO、Z30 和Z10、Z20 ;陽Ol和陽11通過對共享數(shù)據(jù)M21和M23進行減法和加法運算分別得到Z02、 Z32和Z12、Z22 ;PE02和PE12通過對共享數(shù)據(jù)Mll和M13進行減法和加法運算分別得到 Z0UZ31和Z1UZ21 ;陽03和陽13通過對共享數(shù)據(jù)M31和M33進行減法和加法運算分別得 到 Z03、Z13 和 Z23、Z33。
[0021]
I議 第五步:根據(jù)公式(4)和公式(5)分別配置陽00、PE01、陽10、PE11和陽02、PE03、陽12、 PE13的指令,計算出水平反變換的各中間變量NO、N1、N2和N3,其中PEOO和PEOl通過對 共享數(shù)據(jù)Z02和Z30進行移位加法和減法運算分別得到N00、N01和M30、N31,PE02和PE03 通過對共享數(shù)據(jù)Z03和Z31進行移位加法和減法運算分別得到N02、N03和N32、N33, PElO 和PEll通過對共享數(shù)據(jù)Z12和Z20進行移位加法和減法運算分別得到N10、Nll和N20、 N21,PE12和PE13通過對共享數(shù)據(jù)Z13和Z21進行移位加法和減法運算分別得到N12、N13 和 N22、N23。
[0022] 誦f 錢參 第六步:根據(jù)公式(6),通過水平方向相鄰PE之間共享寄存器數(shù)據(jù)得到反變換的最終 結果,其中PEOO和PE02通過對共享數(shù)據(jù)N03和NOl進行減法和加法運算分別得到Y00、Y03 和YOU Y02 ;PE01和PE03通過對共享數(shù)據(jù)N33和N31進行減法和加法運算分別得到Y30、 Y33和Y31、Y32 ;PE10和PE12通過對共享數(shù)據(jù)N13和Nll進行減法和加法運算分別得到 Y10、Y13和Y1UY12 ;陽11和陽13通過對共享數(shù)據(jù)N23和N21進行減法和加法運算分別得 到 Y20、Y23 和 Y2UY22。
[0023]
'纖穿: 最后應說明的是:顯然,上述實施僅僅是為清楚地說明本發(fā)明所作的舉例,而并非對實 施方式的限定。對于所述領域的普通技術人員來說,凡是依據(jù)本發(fā)明的技術實質對W上實 施例所做的任何簡單修改,等同變化與修飾,均仍屬本發(fā)明技術方案的保護范圍。
【主權項】
1. 一種用于高效視頻編碼反變換運算的并行結構構造方法,其特征在于:在鄰接互連 的2X4二維處理元陣列(PE00-PE13 )上對4X4的TU進行反變換運算的并行處理。2. 根據(jù)權利要求書1所述的一種用于高效視頻編碼反變換運算的并行結構構造方法, 其特征在于:將4X4的反量化數(shù)據(jù)(X00和X02、X20和X22、X10和X12、X30和X32、X01和 X03、X21和X23、XII和X13、X31和X33)從內存分別加載到處理元陣列(PE00-PE13)的數(shù) 據(jù)寄存器中,以并行方式依次完成基于奇偶分解運算的垂直和水平反變換。3. 根據(jù)權利要求書2所述的一種用于高效視頻編碼反變換運算的并行結構構造方法, 其基于奇偶分解運算的垂直反變換特征在于:處理元陣列(PE00-PE13)分別對反量化數(shù)據(jù) 進行加載,等數(shù)據(jù)加載完成,執(zhí)行奇偶分解運算,分別對輸入數(shù)據(jù)(X00和X02、X20和X22、 X10和X12、X30和X32、X01和X03、X21和X23、X11和X13、X31和X33)進行逐級移位和加 減運算,得到垂直反變換的中間變量(M00和M01、M20和M21、M10和Mil、M30和M31、M02 和M03、M22和M23、M12和M13、M32和M33);垂直方向相鄰處理元(PEOO和PE10, PE01和 PE1UPE02和PE12、PE03和PE13)之間對中間變量(M00-M33)通過加減運算得到垂直反變 換結果(ZOO 和 Z0UZ20 和 Z2UZ10 和 Z1UZ30 和 Z3UZ02 和 Z03、Z22 和 Z23、Z12 和 Z13、 Z32 和 Z33)。4. 根據(jù)權利要求書2、3所述的一種用于高效視頻編碼反變換運算的并行結構構造方 法,其基于奇偶分解運算的水平反變換特征在于:水平方向相鄰處理元(ΡΕ00和PE01,PE02 和PE03、PE10和PE1UPE12和PE13)之間對垂直反變換結果(Z00-Z33)通過移位和加減運 算得到水平反變換的中間變量(N00和N0UN20和N2UN10和N1UN30和N3UN02和N03、 N22 和 N23、N12 和 N13、N32 和 N33);水平方向間隔處理元(ΡΕ00 和 PE02,PE01 和 PE03、PE10 和PE12、PE11和PE13)之間對中間變量(N00-N33)通過加減運算得到最終的反變換結果 (Y00-Y33)。
【文檔編號】H04N19/436GK105847840SQ201510795422
【公開日】2016年8月10日
【申請日】2015年11月18日
【發(fā)明人】劉鎮(zhèn)弢, 王杏軍, 蔣林, 劉有耀
【申請人】西安郵電大學