用于可伸縮視頻編碼的層間運動向量縮放的制作方法

文檔序號：9333054閱讀：381來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>電子通信裝置的制造及其應(yīng)用技術(shù)

用于可伸縮視頻編碼的層間運動向量縮放的制作方法
【專利說明】
[0001] 交叉引用
[0002] 本發(fā)明主張在2013年3月12日提出的申請?zhí)枮?1/777,250、標(biāo)題為"Methods ofMotionVectorScalingwithFrameCroppingforScalableVideoCoding" 的美國臨時專利申請案的優(yōu)先權(quán)；主張在2013年3月19日提出的申請?zhí)枮?1/803, 222、標(biāo) 題為"MethodsofMotionVectorScalingandPixelPositionMappingwithFrame CroppingforScalableVideoCoding"的美國臨時申請案的優(yōu)先權(quán)；主張在2013年4 月 22 日提出的申請?zhí)枮?61/814, 591、標(biāo)題為"Methodsofsimplifiedmotionvector scalingandpixelpositionmappingforscalablevideocoding'，的美國臨時申請案的優(yōu)先權(quán)；以及主張在2013年7月15日提出的申請?zhí)枮?1/846, 128、標(biāo)題為"Methodsof Inter-layerMotionVectorScalingandInter-layerPixelPositionMappingwith PhaseShiftforScalableVideoCoding"的美國臨時申請案的優(yōu)先權(quán)。因此在全文中合并參考這些美國臨時專利申請案。
技術(shù)領(lǐng)域
[0003] 本發(fā)明是有關(guān)于可伸縮視頻編碼，特別是有關(guān)于層間（inter-layer)運動向量縮放和層間像素位置映射。
【背景技術(shù)】
[0004] 壓縮的數(shù)字視頻已經(jīng)廣泛地應(yīng)用于各種應(yīng)用中。例如，對于數(shù)字網(wǎng)絡(luò)的視頻流和對于數(shù)字通道的視頻傳輸。通常，單一的視頻內(nèi)容可以通過不同特性的網(wǎng)絡(luò)來傳輸。舉例來說，現(xiàn)場直播的體育賽事可以載入高寬帶數(shù)據(jù)流格式，并通過收費視頻服務(wù)的寬帶網(wǎng)絡(luò)傳輸。在這樣的應(yīng)用中，壓縮的視頻通常保存高分辨率和高品質(zhì)，以使得視頻內(nèi)容適合于高清晰度設(shè)備，例如，高清晰度電視或高清晰度顯示器。相同的內(nèi)容也可以載入蜂窩數(shù)據(jù)網(wǎng)絡(luò)，以使得該內(nèi)容可以在便攜式設(shè)備（例如，智能手機或通過網(wǎng)絡(luò)連接的便攜式媒體設(shè)備）上進行觀看。在此應(yīng)用中，由于網(wǎng)絡(luò)帶寬問題和在智能手機或便攜式設(shè)備上的低分辨率顯示，視頻內(nèi)容通常被壓縮為低分辨率和低比特率。因此，對于不同的網(wǎng)絡(luò)環(huán)境和不同的應(yīng)用，視頻分辨率和視頻品質(zhì)的要求是完全不同的。即使對于相同類型的網(wǎng)絡(luò)，用戶可能由于不同的網(wǎng)絡(luò)基礎(chǔ)設(shè)施和網(wǎng)絡(luò)流量狀況而感受到不同的可用帶寬。因此，用戶可能希望當(dāng)可用帶寬較寬時，接收高品質(zhì)視頻，當(dāng)網(wǎng)絡(luò)擁塞發(fā)生時，接收較低品質(zhì)但是很流暢的視頻。在另一種情況下，高端媒體播放器可以處理的高分辨率和高比特率的已壓縮視頻，然而由于限制的計算資源，低成本的媒體播放器僅能夠處理低分辨率和低比特率的已壓縮視頻。相應(yīng)地，需要以可伸縮的方法構(gòu)造壓縮的視頻，以使得可以從相同的已壓縮比特流處得到不同的時空分辨率及/或不同品質(zhì)的視頻。
[0005]IS0/IECMPEG和ITU-TVCEG的聯(lián)合視頻工作組（jointvideoteam,JVT)標(biāo)準(zhǔn)化對于H. 264/AVC標(biāo)準(zhǔn)的可伸縮視頻編碼擴展。H. 264/AVC可伸縮視頻編碼比特流包括從低幀率、低分辨率、和低品質(zhì)到高幀率、高清晰度和高品質(zhì)的視頻信息。此種單一的比特流能夠適應(yīng)各種應(yīng)用并能夠在不同配置的設(shè)備上顯示。相應(yīng)地，H.264/AVC可伸縮視頻編碼適用于各種視頻應(yīng)用，例如，視頻廣播、視頻數(shù)據(jù)流、以及視頻監(jiān)控，以適合網(wǎng)絡(luò)基礎(chǔ)設(shè)施，交通條件，用戶偏好等。
[0006] 在可伸縮視頻編碼中，提供三種可伸縮類型，即時間可伸縮，空間可伸縮和品質(zhì)可伸縮?？缮炜s視頻編碼采用多層編碼結(jié)構(gòu)來實現(xiàn)三維可伸縮。可伸縮視頻編碼的主要目標(biāo) 是產(chǎn)生一個可伸縮比特流，以容易和迅速地適應(yīng)各種傳輸信道、不同的顯示能力、和不同的計算資源相關(guān)的比特率要求，而無需反式編碼（trans-coding)或重編碼（re-encoding)。可伸縮視頻編碼設(shè)計的一個重要特征是，在比特流層（bitstreamlevel)提供這種可伸縮性。換言之，對于取得縮減空間及/或時間分辨率的視頻的比特流，可以簡單地通過從需要打算解碼的視頻的可伸縮比特流中提取網(wǎng)絡(luò)抽象層（以下簡稱為NAL)單元（或網(wǎng)絡(luò)數(shù)據(jù) 包）而獲得。可另外減小用于品質(zhì)精化的NAL單元從而減小比特率及/或降低相應(yīng)視頻品質(zhì)。在可伸縮視頻編碼中，時間可伸縮通過層級B圖片編碼結(jié)構(gòu)來提供。信噪比（以下簡稱為SNR)可伸縮通過編碼較高品質(zhì)的、包括細化系數(shù)（refinementcoefficients)的增強層來實現(xiàn)。
[0007] 如圖1所示，在可伸縮視頻編碼中，基于金字塔編碼（pyramidcoding)方案支持空間可伸縮。在具有空間可伸縮性的可伸縮視頻編碼系統(tǒng)中，首先下采樣視頻序列，以獲得不同的空間分辨率（層）的較小圖片。例如，原始分辨率的圖片110可以通過空間抽取120 處理，而獲得分辨率降低的圖片111。如圖1所示，分辨率降低的圖片111可進一步通過空間抽取121處理，而獲得分辨率進一步減小的圖象112。除二階（dyadic)空間分辨率之外，該空間分辨率在每一層減小一半，可伸縮視頻編碼還支持任意分辨率的比率，這被稱為擴展空間可縮放（extendedspatialscalability，ESS)。圖1中的可伸縮視頻編碼系統(tǒng)描述了三層空間可伸縮系統(tǒng)的示意圖，其中第〇層對應(yīng)于具有最低空間分辨率的圖片，第2層對應(yīng)于具有最高空間分辨率的圖片。不需要參考其他層，可以編碼第〇層，即單層的編碼。例如，使用編碼運動補償和幀內(nèi)預(yù)測130編碼最底層圖片112。
[0008] 運動補償和幀內(nèi)預(yù)測130將生成語法元素和編碼相關(guān)信息（例如，運動信息），以進一步用于熵編碼140。圖1實際上描述了一個聯(lián)合可伸縮視頻編碼系統(tǒng)，該系統(tǒng)提供空間可伸縮和品質(zhì)可伸縮（也稱為SNR可伸縮）。該系統(tǒng)也可提供時間可伸縮，這并沒有明確顯示出來。對于每一個單層編碼，編碼殘差（residualcodingerrors)可以使用SNR增強層編碼150而改善。圖1中SNR增強層可以提供多個品質(zhì)層（level)(品質(zhì)可伸縮）。支持分辨率層的每一個品質(zhì)層，可以由各自的單層運動補償和幀內(nèi)預(yù)測進行編碼，例如非可伸縮編碼系統(tǒng)。基于一個或多個的較低空間層，也可以使用層間編碼來編碼每個較高空間層。舉例來說，在宏塊或其他區(qū)塊單元的基礎(chǔ)上，使用根據(jù)第〇層視頻的層間預(yù)測或者使用單層編碼，來自適應(yīng)編碼第1層視頻。同樣地，使用基于重構(gòu)的第1層視頻的層間預(yù)測或使用單層編碼，來自適應(yīng)編碼第2層視頻。如圖1所示，第1層圖片111可以通過運動補償和幀內(nèi)預(yù)測131、基本層熵編碼141和SNR增強層編碼151來編碼。如圖1所示，運動補償和幀內(nèi)預(yù)測131也利用重建的基本層視頻數(shù)據(jù)，其中在空間第1層中的編碼塊可使用重建的基本層視頻數(shù)據(jù)作為附加的幀內(nèi)預(yù)測數(shù)據(jù)（即，不涉及運動補償）。相似地，第2層圖片 110可以通過運動補償和幀內(nèi)預(yù)測132、基本層熵編碼142和SNR增強層編碼152來編碼。來自所有空間層的基本層比特流和SNR增強層比特流通過復(fù)用器160復(fù)用產(chǎn)生可伸縮的比特流。由于層間編碼，可以提高編碼效率。此外，編碼空間第1層需要的信息取決于重建的第0層（層間預(yù)測）。可伸縮視頻編碼系統(tǒng)中較高層被稱為增強層。H. 264可伸縮視頻編碼提供三種類型的層間預(yù)測工具：層間運動預(yù)測、層間紋理預(yù)測（也稱為層間幀內(nèi)預(yù)測）、以及層間殘差預(yù)測。
[0009] 在可伸縮視頻編碼中，增強層（EL)可以重新使用在基本層（BL)中的運動信息，以減少層間運動數(shù)據(jù)冗余。例如，增強層宏塊編碼可以使用一個標(biāo)志，例如在mb_type之前的標(biāo)志base_mode_flag被確定為指示增強層運動信息是否是直接來自于基本層。如果標(biāo)志 baSe_m〇de_flag等于1時，增強層宏塊的分割數(shù)據(jù)以及相關(guān)的參考索引和運動向量來自基本層中同一位置的8X8區(qū)塊相應(yīng)的數(shù)據(jù)?；緦拥膮⒖紙D片索引直接用于增強層。增強層的運動向量是自與基本層相關(guān)的數(shù)據(jù)來進行縮放的。此外，已縮放的基本層運動向量可以被用作增強層的附加的運動向量預(yù)測子（predictor)。
[0010] 層間殘差預(yù)測使用上采樣的基本層殘差信息，以減少所需編碼增強層殘差的信息。可使用雙線性濾波器來區(qū)塊式（block-wise)上采樣基本層的同一位置的殘差，以及基本層的同一位置的殘差可用作在增強層中對應(yīng)宏塊的殘差的預(yù)測。參考層殘差的上采樣以變換區(qū)塊為基礎(chǔ)來完成，以確保濾波沒有穿越變換區(qū)塊的邊界。
[0011] 層間幀內(nèi)預(yù)測降低增強層的冗余紋理信息。通過區(qū)塊式上采樣同一位置的基本層重建信號，來產(chǎn)生增強層的預(yù)測。在層間紋理預(yù)測上采樣過程中，分別將4抽頭和2抽頭 FIR濾波器應(yīng)用于亮度和色度組分。不同于層間殘差預(yù)測，層間幀內(nèi)預(yù)測的濾波總是穿越子區(qū)塊的邊界。為簡化解碼，層間幀內(nèi)預(yù)測可以僅應(yīng)用基本層中的幀內(nèi)編碼宏塊。
[0012] 在可伸縮視頻編碼中，增強層中的區(qū)塊的運動信息可利用基本層中對應(yīng)區(qū)塊的運動信息。舉例來說，如圖2所示，與在基本層中對應(yīng)的位置a~h相關(guān)的運動信息可用于推導(dǎo)層間預(yù)測。在圖2中，區(qū)塊210對應(yīng)于增強層中的當(dāng)前區(qū)塊以及區(qū)塊220為基本層中對應(yīng)的區(qū)塊。在基本層中位置a、位置b、位置g和位置h處的運動信息為在增強層中位置A、位置B、位置G和位置H處對應(yīng)的運動信息。位置c、位置d、位置e、位置f處的運動信息為在增強層中位置C、位置D、位置E和位置F處對應(yīng)的運動信息。位置A、位置B、位置G和位置H為在增強層中的當(dāng)前區(qū)塊的四個角的像素，以及位置C、位置D，位置E和位置F和在增強層中的當(dāng)前區(qū)塊的四個中心像素。
[0013] 不僅在基本層中對應(yīng)區(qū)塊的運動信息而且在基本層中對應(yīng)區(qū)塊的相鄰區(qū)塊的運動信息可以用作增強層的層間候選，而包括于合并/先進運動向量預(yù)測候選清單中。如圖2 所示，在基本層中的相鄰候選，包括相鄰基本層區(qū)塊的t(右下）、a0 (左下）、al(左）、b0 (右上）、bl(上），和b2 (左上），可用作增強層的候選，而包括在合并/先進運動向量預(yù)測候選的導(dǎo)出中。同一位置的增強層相鄰區(qū)塊分別對應(yīng)于相鄰增強層區(qū)塊的T(右下），A0 (左下）、A1 (左），B0 (右上），B1 (頂部）和B2 (左上）。
[0014] 高效率視頻編碼（High-EfficiencyVideoCoding,HEVC)為由聯(lián)合視頻編碼組 (JCT-VC)開發(fā)的新的國際視頻編碼標(biāo)準(zhǔn)。HEVC的可伸縮擴展（即，SHVC)也在開發(fā)中。在 HEVC中，空間和時間范圍內(nèi)的相鄰區(qū)塊的運動信息用于推導(dǎo)合并和運動向量預(yù)測候選。運動信息包括幀間預(yù)測方向（inter_pred_idc)、參考索引（refldx)、運動向量、運動向量預(yù) 測子、運動向量預(yù)測子索引、合并索引、合并候選等。在空間運動向量預(yù)測子的推導(dǎo)過程中，運動向量預(yù)測子可自指向作為目標(biāo)參考圖片的相同參考圖片的運動向量來得到，或自指向不同參考圖片的運動向量來得到。當(dāng)運動向量預(yù)測子自指向不同參考圖片的運動向量而得到時，該運動向量被縮放至目標(biāo)參考圖片并作為最終運動向量預(yù)測子。在空間和時間運動向量預(yù)測子的推導(dǎo)過程中，需要運用除法（division)來縮放運動向量?；诋?dāng)前圖片和目標(biāo)圖片之間的距離和在同位圖片和對于同位區(qū)塊的參考圖片之間的距離的比例來計算縮放因子。在運動向量縮放過程中，由公式（1)來定義縮放因子：
[0015]ScalingFactor=(POCcurr-POCref)/(POCcol-P0Ccol_ref) =tb/td, (1)
[0016] 其中，td為在同位圖片和由同位區(qū)塊的運動向量指向的參考圖片之間的圖片順序計數(shù)距離，以及tb為當(dāng)前圖片和目標(biāo)參考圖片之間的圖片順序計數(shù)距離。用于空間運動向量預(yù)測子推導(dǎo)的縮放因子可用相似的方法來得到。在ffiVC中，縮放因子按如下所示公式來計算：
[0017]X= (2~14+|td/2|)/td，以及（2)
[0018]ScalingFactor=clip(-4096, 4095, (tbXX+32) >>6)〇(3)
[0019] 然后，被縮放的運動向量按如下所示的公式來得到：
[0020] ScaledMV=sign(ScalingFactorXMV)X
[0021] ((abs(ScalingFactorXMV)+127))>>8 (4)
[0022] 在SHVC測試模型1. 0(SHM_1. 0)中，層間紋理預(yù)測可在兩個方案中實現(xiàn)。第一方案使用編碼單元級信令（signaling)來指示此編碼單元預(yù)測子是否來自已上采樣的基本層紋理。其中，幀內(nèi)基本層模式Intra_BLmode用于發(fā)送選擇。第二方案將已上采樣的基本層紋理包括于參考幀清單中。換句話說，與已上采樣的基本層紋理相關(guān)的參考圖片被分配一個參考圖片索引，即參考圖片索引Refldx。此方案被稱為參考圖片索引Refldx模式。與參考圖片相關(guān)的運動向量也被存儲并用于幀間預(yù)測。

完整全部詳細技術(shù)資料下載

當(dāng)前第1頁1 2 3 4 5 6

該技術(shù)已申請專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：莊子德;陳慶曄;黃毓文;
技術(shù)所有人：聯(lián)發(fā)科技股份有限公司;
我是此專利的發(fā)明人

該領(lǐng)域下的技術(shù)專家
如您需求助技術(shù)專家，請點此查看客服電話進行咨詢。
1、王老師：1.數(shù)字信號處理 2.傳感器技術(shù)及應(yīng)用 3.機電一體化產(chǎn)品開發(fā) 4.機械工程測試技術(shù) 5.逆向工程技術(shù)研究
2、王老師：1.機器人 2.嵌入式控制系統(tǒng)開發(fā)
3、孫老師：1.振動信號時頻分析理論與測試系統(tǒng)設(shè)計 2.汽車檢測系統(tǒng)設(shè)計 3.汽車電子控制系統(tǒng)設(shè)計
4、畢老師：機構(gòu)動力學(xué)與控制
5、袁老師：1.計算機視覺 2.無線網(wǎng)絡(luò)及物聯(lián)網(wǎng)
如您是高校老師，可以點此聯(lián)系我們加入專家?guī)臁?/a>

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評論。精彩留言會獲得點贊！

精彩留言，會給你點贊！

可伸縮視頻編碼相關(guān)技術(shù)

可伸縮視頻編碼時間維相關(guān)技術(shù)

向量量化編碼相關(guān)技術(shù)

fisher向量編碼相關(guān)技術(shù)

伸縮縫相關(guān)技術(shù)

国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

用于可伸縮視頻編碼的層間運動向量縮放的制作方法